Upload
karol-wolski
View
7.810
Download
1
Embed Size (px)
DESCRIPTION
Citation preview
Podstawy statystyki dla psychologów
Zajęcia 10. Wprowadzenie do wnioskowania
statystycznego Karol Wolski
Wnioskowanie statystyczne
• Wnioskowanie statystyczne to wyprowadzanie wniosku o parametrze populacyjnym na podstawie statystyki z próby
• Jego istotą jest odkrycie, jakie wartości z próby są możliwe i z jakim prawdopodobieństwem mogą się one pojawić.
Hipoteza zerowa i alternatywna
• Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. – H0 : 𝜇𝑋 = 100
• Hipoteza alternatywna (H1)/ (HA)- hipoteza przeciwstawna do weryfikowanej. – H1 : 𝜇𝑋 ≠ 100
– H2 : 𝜇𝑋 > 100
– H3 : 𝜇𝑋 < 100
Kiedy odrzucamy H0
• Uzyskana przez nas średnia w próbie prawie nigdy nie będzie taka sama jak średnia w populacji
• Dlatego aby odrzucić H0 musi posłużyć się jakimś kryterium wskazującym nam jakie wartości 𝑋 będą pojawiały się bardzo często a jakie bardzo rzadko, kiedy H0 jest prawdziwa.
Kiedy odrzucamy H0
• Tym kryterium jest Poziom istotności (𝜶 – alfa) – jest to wartość prawdopodobieństwa, którą
wykorzystujemy jako kryterium w decyzjach, czy prawdopodobieństwo pojawienia się przez przypadek statystyki otrzymanej w próbie jest niskie, wtedy gdy hipoteza zerowa jest prawdziwa (w rezultacie hipoteza zerowa zostaje odrzucona)
– Określa maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001
Kiedy odrzucamy H0
• Rozpatrzmy następujący przykład
– H0 : 𝜇𝑋 = 85
– H1 : 𝜇𝑋 ≠ 85
– Alfa=0,05
– 𝑋 = 90
– n=100
– 𝜎𝑋 = 20
Kiedy odrzucamy H0
• Aby przetestować naszą hipotezę musimy przekształcić naszą średnią 𝑋 = 90 na wynik z oraz odnieść ją do rozkładu
Kiedy odrzucamy H0
• Zatem
• 𝑧 =𝑋 −𝜇𝑋
𝜎𝑋 =
𝑋 −𝜇𝑋 𝜎𝑋𝑛
=90−85
20/ 100=
5
2= +2,5
Kiedy odrzucamy H0
• Uzyskana wartość z jest wyższa niż wartość krytyczna
• Można więc odrzucić hipotezę zerową i przyjąć hipotezę alternatywną
• Nie ma podstaw aby uważać, że średnia w populacji, z której pochodzi próba jest równa 85. Średnia ta jest najprawdopodobniej wyższa.
• Wniosek dotyczy populacji, z której została pobrana próba (reprezentatywna), nie zaś samej próby
Kiedy odrzucamy H0
• Problemy, wybór poziomu Alfa jest arbitralny, kiedy wybierzemy inny niż 0,05 nasza hipoteza zerowe może nie zostać odrzucona
• To, że H0 nie zostanie odrzucona, NIE oznacza, że najprawdopodobniej jest ona prawdziwa. Oznacza to jedynie, że nie mamy wystarczających podstaw aby ją odrzucić
• Odrzucenie H0 oznacza, że nie wydaje się uzasadniona wiara w to, że hipoteza ta jest prawdziwa.
Test jednostronny i dwustronny
• Dwustronny (niekierunkowy) – hipoteza alternatywna stwierdza, że parametr populacyjny może być albo mniejszy albo większy od wartości określonej przez hipotezę zerową (obszar odrzucenia podzielony i rozmieszczony symetrycznie po obu krańcach rozkładu)
• Kierunkowy (jednostronny) - hipoteza alternatywna stwierdza, że parametr populacyjny różni się od wartości określonej przez hipotezę zerową w jednym konkretnym kierunku (cały obszar odrzucenia po jednej stronie rozkładu)
Test jednostronny i dwustronny
Założenia testowania hipotez o średniej pojedynczej
• Próba wybrana z populacji jest próbą losową • Losowanie zgodne ze schematem losowania
zwrotnego • Rozkład wartości 𝑋 z próby jest zgodny z krzywą
normalną • Znane jest odchylenie standardowe wyników w
populacji (niezbędne do policzenia 𝜎𝑋 )
– wzór 𝜎 = 𝑋−𝜇 2
𝑁
– Problem w tym, że rzadko znamy tę wartość…. A jak ją znamy, to znamy i średnią w populacji
Szacowanie błędu standardowego średniej
• 𝑧 =𝑋 −𝜇𝑋
𝜎𝑋 =
𝑋 −𝜇𝑋 𝜎𝑋𝑛
=𝑋 −𝜇𝑋 ????
𝑛
• Skąd zatem wziąć odchylenie st. Populacji?
• Z pomocą przychodzi nam nasza ukochana wariancja (estymator nieobciążony):
• 𝑠2 = 𝑋−𝑋 2
𝑛 −1=
𝑆𝑆𝑋
𝑛 −1
• s= 𝑋−𝑋 2
𝑛 −1
Szacowanie błędu standardowego średniej
• Wartość 𝜎 zastępujemy zatem s i dzięki temu otrzymujemy oszacowanie błędu standardowego średniej
• 𝑠𝑋 =𝑠𝑋
𝑛
• A teraz niespodzianka… jeśli we wzorze na
𝑧 =𝑋 −𝜇𝑋
𝜎𝑋 wartość 𝜎𝑋 zastąpimy 𝑠𝑋 to
otrzymamy nową statystykę - t
Rozkład t
• t=𝑋 −𝜇𝑋
𝑠𝑋
• t=ś𝑟𝑒𝑑𝑛𝑖𝑎 𝑜𝑡𝑟𝑧𝑦𝑚𝑎𝑛𝑎 𝑤 𝑝𝑟ó𝑏𝑖𝑒 −ℎ𝑖𝑝.ś𝑟.𝑝𝑜𝑝.
𝑜𝑠𝑧𝑎𝑐𝑜𝑤𝑎𝑛𝑖𝑒 𝑏łę𝑑𝑢 𝑠𝑡.ś𝑟𝑒𝑑𝑛𝑖𝑒𝑗
• t=𝑧𝑚𝑖𝑒𝑛𝑛𝑎 𝑜 𝑟𝑜𝑧𝑘ł 𝑛𝑜𝑟𝑚.−𝑠𝑡𝑎ł𝑎
𝑧𝑚𝑖𝑒𝑛𝑛𝑎
• Rozkład t NIE jest rozkładem normalnym, nazywamy go rozkładem t Studenta
Rozkład t - cechy
• Im większa próba tym rozkład t będzie bliższy rozkładowi z
• Przy nieskończenie dużej próbie t=z
• Kształt rozkładu t zależy od wielkości próby a dokładnie od liczby stopni swobody (df)
• W przypadku testowania hipotez o pojedynczej średniej df=n-1
Rozkład t - cechy
Rozkład z a rozkład t
• Podobieństwa
– Oba mają średnią równą zero
– Są symetryczne
– Są jednomodalne
• Różnice, rozkład t w porównaniu z z jest:
– Platykurtyczny – ma smuklejszy wierzchołek i ma większą koncentrację obserwacji na krańcach rozkładu
– Ma większe odchylenie standardowe
– Zależy od liczby stopni swobody
Rozkład t - cechy
• Dla nieskończonej liczby stopni swobody krytyczna wartość t=z=+- 1,96 (Dla alfa=0,05)
• Im mniejsza liczba df tym większa wartość krytyczna t
Rozkład t
• Rozkład t wykorzystujemy tak samo jak rozkład z, pozwala on nam umiejscowić daną średnią w rozkładzie, a przez to wnioskować o populacji
• Jego zaletą jest to, że nie jest wymagana znajomość 𝜎𝑋
• Do oceny położenia danego wyniku t w rozkładzie używamy tablic statystycznych
– http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_t-Studenta