Statystyka

Struktury jednowymiarowe.
Statyst.met.analizy i ich rozkłądy
Dwa typy porównań: 1) dwóch lub wiecej
różnych zbiorowości pod wzgl tej samej cechy,
2)rozkładu 2-lub wiecej cech w tej samej zbiorowo.
Cechy mierzalne analizujemy przy wykorzystaniu
miar statystycznych:
1.przecietnych(średnie lub miary położenia
lub tendencji centralnych)
2.rozproszenia(zmienności,zróznicowania,dyspersji)
3.asymetrii(skosności),4.koncentracji.
Dobór odpowiednich parametrów opisowych zalezy od
rozkładu empirycznego danej cechy, bo on odzwierciedla strukt.zbiorow.
Rozkłady –cecha skokowa:
rysunki!!!!


Rozkłady-cecha ciągła

Rozkł. Jednomodalne- krzywa liczebności lub diagram ma jedno maksimum
dzielimy je na symetry.,umiarkow.asymetry.,skrajnie asymet.
W rozkl.symetr.jednomod. liczebności odpowiadajace wartością zmiennej rozkłądają
się symetrycznie wokół liczebności największej.
Rozkład normalny-jest rozk.symetryczn.,o 1 maksim. Ma on sciśle okreslona kurtozę tj.
koncentracje wartości zmiennej wokół średniej arytmetycz.Rozkłąd ten ma duże znaczenie
w statystyce, gdyz wiele cechjest takim rozkłądem.
Rozkłady platokurtyczne, czyli spaszczone, leptokurtyczne wysmukłe-one są symetryczne ale
nie normalne.
Rozk.umiark.asymetryczne- prostopadłą do osi odciętych poprowadzona z punktu max dzieli powierzch.
pod krzywą na 2 nierówne części.Jeżeli większa pow.wraz z dłuższym ramieniem krzywej znajduje sie
po prawej stronie punk.max i min. to rozk.jest prawoskośny ; i odwrotnie.
Roz.skrajnie asymetrycz.- posiadają tylko 1 ramię.Są jednostronne wzg cechy o max liczebnoś.
Niektóre mogą mieć rozkład niejako kompozycje,tzn określa sie je mianem rozk.U lub siodłowych.
Roz.bimodalny- jeśli krzywa liczebności lub diagram ma 2 maksima.
Rozk.wielomodlane-mające 2 maxima.
Rozk.symet.i umiarkow.asymetrycz.charakteryzu.zbiorowz.jednorodna za wzg na daną zmienna.
Natomiast rozk.asymetr.wielomod.i siodłowe dotycz.zbiorowosci których cechy sa znacznie zróżnicow.



Średnie(przeciętne).Wyróżnia sie: klasyczne,pozycyjne.
Klasyczne- są obliczane w oparciu o wszystkie wartości danego szeregu.
1. Śred.arytmetycz.-suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzielonej
przez liczbę tych jednostek

wzór
(przyjmuje sie ze otwarty przedzial mozna domknąc gdy liczba jendostek w tym przedziale nie przykracza
5% ogólnej liczebności).


Właśności średn.arytmetycz.:
1. Spełnia nierówność ze : x min < X< x max!!!!
2. Suma odchyleń poszczególnej wartości zmiennej od sredn.arytm.=0
3. Jeśli wszystkie wartości zmiennej pomniejsz.,powieksz.,podzielimy,pomnozymy,
o pewna stałą to śred.arty. będzie równa sumie ,różnicy,ilorazowi,iloczynowi sredn.arytm.wyjsciowych zmiennych tej stałej.
4. Suma wartości zmiennej=iloczynowi śr.ary. i liczebności zbiorowości.
wzór
5. Sred.aryt. prawidłowo charakteryz.średni poziom w przypad.rozk.symetryczn.lub umiarkow.asymetr.
Sred.arytm jest miara prawidlową tylko w odniesieniu do zbior.jednorodnych. W miare wzrostu asymetrii sred.arytm traci swoją wartość poznawczą.
W takim rozkł średni poziom zmiennych nalezy chrakteryzo przy uzyciu przeciętn.pozycyjnych.
Sred.arytm. w róznych przedziałach:
a) szer. rozdzielczy punktowy
wzór
b) rozdzielczy przedziałowy- najpierw trzeba wyliczyc środki przedziałów
wzór

Jeżeli zamiast liczebności bezwzgl. wykorzystane zostaną w oblicz %wskaź struktu. wówczas wzór nastepujący
wzór

Sredn.arytm. nie mozna obliczyc przy otwartych przedziałach, wtedy śr.harmoniczną

2. Sredn.harmoniczna- jest to odwrotność sredn.arytmetycz. z odwrotności wartości zmiennych.


H= wzór!!!!!!!!
Przy obliczaniu H z szeregu rozdzielczych konieczność stosowania wag (liczebności)
wzór!!!!!
wg wzoru konkretne warianty cechy x zastępujemy środkami przedziałów

3. Sred.geometryczna- jest pierwiastkiem n stopnia z iloczynu n wartości badanej cechy
wzór!!!!!

a gdy wartośi zmiennej występują z różną częstotliwością to jest wzór:
wzór

Sred.harmon. ma zastosowanie przy badaniu tempa zmian zjawisk w czasie czyli przy analiz. dynamik.

Pozycyjne- sa wartościami wyrazów w szeregu wyrózn. się pod pewnym wzg.????
4. Dominanta –to taka wartość zmiennej która występuję najczęściej w danym rozkładzie empirycznym.
W szeregach domin, jest wartością cechy której odpowiada największa liczebność.
wzór+ opisy



Wyznaczenie domin. jest uzasadnione gdy szereg spełnia warunki: 1. rozkł empir.posiada 1 ośrodek dominuj.
2. Asymetria rozkłady jest umiarkowana. 3. Przedział klasowy dominanty oraz 2 sąsiednie maja jednakowe rozpiętości.

5. KWANTYLE- każdy z kwantyli dzieli zbiorowość uporządkowaną na 2 części pod wzg liczebności.
a) kw.1– dzieli zbiorow. na 2 części: na 25%jednostek ma wartości niższe a 75% wyższe od kwartyla 1.
b) kw.2 ( mediana) – dzieli zbiorow. na 2 części: 50% jednost ma wartości niższe a 50% wyższe od kwartyla2.
wzór!!!!!

c) kw.3- dzieli na 2 częś.: 75% na niższe a 25 % wyższe wartości od kw 3.



Miary dyspersji

1. Wariancji – to średnia arytm. z kwadratów odchyleń poszczegól. wartości cechy od średn. arytm. całej zbiorowości.
szereg wzory!!!!!!

szereg punktowy

szereg przedziałowy

Własności wariancji:

2. Odchylenie standardowe ( S) - mierzy średnią rozpiętość w połowie obszaru zmienności.
Jest to pierwiastek kwadratowy wariancji. Określa o ile wszystkie jednostki danej zbiorowości różnią się średnio ze wzg na wartość badanej zmiennej od śred. aryt tej zmiennej. S można wykorzystać do budowy typowego obszaru badanej cechy. W tym obszarze mieści się ok 2/3 jednost.badanej zb.statyst. gdyż jest on zawarty w granicach dwóch odchyleń stand. (x-s; x+s)
Pomiędzy odchylen ćwiartkow przecietnego, standartowy zachodzi relacja Q
Z odchylen. standar. wiąże się reguła 3-ech sigm, tzn wystąpienie obserwacji o wartości cechy spoza przedziału ( X-3S; X+3S) jest mała przwaga w przypadku rozkładu asymetrii tylko 1/3 wykracza poza przedział przez średn arytm. i 1 odchyl.stand. a jedynie ok 5% obserw. poza przedział 2 sigm. poza granicę 3 sigm tzn. poza przedział ( X-3S; X+3S) wykracza ok 0,3% obserwacji.

Powyższe , omówione miary dyspersji sa miarami bezwzględnymi, wykluczają możliwość porównywa różnych zbiorowo. rozpatrywanych ze wzg na ta samą cechę. Dlatego też stosuje się współczynnik zmienności- jest to iloraz bezwzględ. miary dyspersji do odpow. wartości średnich i wyrazony w %. Można go obliczać kilkoma metodami.
* oparte o odchyl. przeciętne i śred. arytm.
wzór!!
* oparte o pozycyjne
wzór!!
wzór!!
interpret.: jeżeli współcz. zm. przyjmuje duże wartości liczbowe z przedziału od 0-100% to świadczy o niejednorodności zbiorowości. Jednostki –elementy składowe takiej zbiorowości nie została ukształtowane przez ten sam zesp. przyczyn główn. Umownie jeśli V jest większy od 20% to zbiorowość jest znacznie zróżnicowana
pod wzg badanej cechy.

Miary asymetrii
To takie charakterystyki opisowe rozkładów cechy mierzalnej które służą do uogólniającego pomiaru zarówno kierunku asymetrii(prawostronnej i lewostronnej) jak i jej siły,
wykresy!!!

W szeregu asymetrycz. śred arytm. , mediana, dominanta odbiegają tym więcej im asymetria jest większa.
Położenie miar tendencji centralnej w szer.asymet..
Współczynnik asymetrii:

wzory!!!!!!

Miara ta wyraża się liczbą dodatnią o ile śred arytm jest > od dominanty, prawe ramię krzywe jest dłuższe max jest przesunięte w lewo, liczbę ujemną gdy śred arytm jest < od dominanty, max przesuniete w prawo lewe ramię .
znak „+” odpowiada prawostronnej asymetrii, „- „ lewej asym..
W szeregu symetrycznym X=D współczynn. asymet.=0
Współ asym. tylko w wyjątkowych sytuacjach( przy silnej asymetrii rozkł przekracza +1 lub –1.
Inna miara skośna- w szereg symetry różnica miedzy kw III a medianą jest taka sama jak różnica pomiędzy medianą a kw I.
W szereg asymetry te róznice będą się rózniły tym bardziej im większa asymetria

wzór
Jeśli szereg jest symetrycz to otrzymana liczba=0 dodatnia będzie przy asym prawostron i ujemna przy lewostron.. Moduł współcz asymetr swiadczy o sile asymetr. dodatkową zaleta jets to ze przyjumje wartości od
–1 do 1.


Miary koncentracji
Badają nierównomierne rozłożenie ogólnej sumy wartości pomiedzy poszczegól jednostki populacji. skrajny przypadek koncentracji zachodzi wówczas gdy całą sumą wartości.
Matomiast dla rozkłądw wysmukłych leptokurtycznych k>3 a dla rozk spłaszczonych tzw. platokurtycznych k<3

wzór
* inter;pr. K’ informuje czy koncentracja wartości zmiennej wokół średniej w danym rozkładzie jest < czy > niz zbiorowości o rozkł normalnym.
Najlepsza formą opisu konc sum wartości jest tabelaryczny opis który zestawia obok siebie skumulowane częstości i skumulowane stosunkowe sumy wartości lub prezentacje graficzne tzw krzywa koncentracji.
Krzywa koncentr. Przebiega tym bliżej przetkanej im słabsza jest koncentracja a tym dalej im silniejsza jest koncentr.
Rysuki!!!!!!!!
Wzory


* Drugi rodzaj. Koncen. Jest skupienie poszczeg. Wartości zmiennej wokół sredniej . Mirą takiego skupienia jest współczyn. skupienia tzw kurtoza


Wzory


Inter.: Im większa końcowa wartość cechy wokół średniej tym wyższa jest wartość współcz. k

Statystyka

Statystyka.

Geneza słowa „statystyka"

Słowo statystyka po raz pierwszy znajdujemy u J. F. von Bielfelda (Anglia) w książce „The Elements of Universal Erudition" (Elementy uniwesalnej erudycji). Termin statystyka pochodzi od łacińskiego słowa...

Statystyka

Statystyka teoria - Pluta

BŁAD PIERWSZEGO RODZAJU – możliwy do popełnienia przy weryfikacji hipotezy statystycznej błąd polegający na odrzuceniu testowanej hipotezy prawdziwej
BŁĄD DRUGIEGO RODZAJU – możliwy do popełnienia przy sprawdzaniu hipotezy statysty...

Statystyka

Statystyka matematyczna

Przez zmienną losową rozumiemy zmienną, która w wyniku doświadczenia może przyjąć wartość z pewnego zbioru liczb rzeczywistych i to z określonym prawdopodobieństwem.
Zmienną losową nazywamy każdą funkcję mierzalną określoną n...

Biologia

Statystyka

1.Co to jest statystyka?
Zajmuje się metodami zbierania, opracowywania i analizy danych o zjawiskach masowych. Wykrywa prawidłowości kształtujące te zjawiska. Formułuje uogólnienia na podstawie wyników i analiz, przewiduje zjawiska i bud...

Statystyka

Miary tendencji centralnej- statystyka

Miary tendencji centralnej i ich podział
Tendencja centralna w zbiorowości, to wskazanie wartości badanej cechy w zbiorowości statystycznej, wokół której skupione są wartości cech wszystkich jednostek wchodzących w skład tej zbiorowo...

Statystyka

Statystyka- ściąga

11.POJĘCIE, PODZIAŁ CECH STATYSTYCZNYCH, WARIANTY CECH. Statystyka(stan rzeczy)- nauka zajmująca się metodami badania, badaniami zjawisk o charakterze masowym. Przedmiotem statystyki są zbiorowości odpowiedniej liczbie jednostek, statystyka za...