Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowania statystycznego

Podstawy statystyki dla psychologów

Zajęcia 10. Wprowadzenie do wnioskowania

statystycznego Karol Wolski

Wnioskowanie statystyczne

• Wnioskowanie statystyczne to wyprowadzanie wniosku o parametrze populacyjnym na podstawie statystyki z próby

• Jego istotą jest odkrycie, jakie wartości z próby są możliwe i z jakim prawdopodobieństwem mogą się one pojawić.

Hipoteza zerowa i alternatywna

• Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. – H0 : 𝜇𝑋 = 100

• Hipoteza alternatywna (H1)/ (HA)- hipoteza przeciwstawna do weryfikowanej. – H1 : 𝜇𝑋 ≠ 100

– H2 : 𝜇𝑋 > 100

– H3 : 𝜇𝑋 < 100

Kiedy odrzucamy H0

• Uzyskana przez nas średnia w próbie prawie nigdy nie będzie taka sama jak średnia w populacji

• Dlatego aby odrzucić H0 musi posłużyć się jakimś kryterium wskazującym nam jakie wartości 𝑋 będą pojawiały się bardzo często a jakie bardzo rzadko, kiedy H0 jest prawdziwa.

Kiedy odrzucamy H0

• Tym kryterium jest Poziom istotności (𝜶 – alfa) – jest to wartość prawdopodobieństwa, którą

wykorzystujemy jako kryterium w decyzjach, czy prawdopodobieństwo pojawienia się przez przypadek statystyki otrzymanej w próbie jest niskie, wtedy gdy hipoteza zerowa jest prawdziwa (w rezultacie hipoteza zerowa zostaje odrzucona)

– Określa maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001

Kiedy odrzucamy H0

• Rozpatrzmy następujący przykład

– H0 : 𝜇𝑋 = 85

– H1 : 𝜇𝑋 ≠ 85

– Alfa=0,05

– 𝑋 = 90

– n=100

– 𝜎𝑋 = 20

Kiedy odrzucamy H0

• Aby przetestować naszą hipotezę musimy przekształcić naszą średnią 𝑋 = 90 na wynik z oraz odnieść ją do rozkładu

Kiedy odrzucamy H0

• Zatem

• 𝑧 =𝑋 −𝜇𝑋

𝜎𝑋 =

𝑋 −𝜇𝑋 𝜎𝑋𝑛

=90−85

20/ 100=

5

2= +2,5

Kiedy odrzucamy H0

• Uzyskana wartość z jest wyższa niż wartość krytyczna

• Można więc odrzucić hipotezę zerową i przyjąć hipotezę alternatywną

• Nie ma podstaw aby uważać, że średnia w populacji, z której pochodzi próba jest równa 85. Średnia ta jest najprawdopodobniej wyższa.

• Wniosek dotyczy populacji, z której została pobrana próba (reprezentatywna), nie zaś samej próby

Kiedy odrzucamy H0

• Problemy, wybór poziomu Alfa jest arbitralny, kiedy wybierzemy inny niż 0,05 nasza hipoteza zerowe może nie zostać odrzucona

• To, że H0 nie zostanie odrzucona, NIE oznacza, że najprawdopodobniej jest ona prawdziwa. Oznacza to jedynie, że nie mamy wystarczających podstaw aby ją odrzucić

• Odrzucenie H0 oznacza, że nie wydaje się uzasadniona wiara w to, że hipoteza ta jest prawdziwa.

Test jednostronny i dwustronny

• Dwustronny (niekierunkowy) – hipoteza alternatywna stwierdza, że parametr populacyjny może być albo mniejszy albo większy od wartości określonej przez hipotezę zerową (obszar odrzucenia podzielony i rozmieszczony symetrycznie po obu krańcach rozkładu)

• Kierunkowy (jednostronny) - hipoteza alternatywna stwierdza, że parametr populacyjny różni się od wartości określonej przez hipotezę zerową w jednym konkretnym kierunku (cały obszar odrzucenia po jednej stronie rozkładu)

Test jednostronny i dwustronny

Założenia testowania hipotez o średniej pojedynczej

• Próba wybrana z populacji jest próbą losową • Losowanie zgodne ze schematem losowania

zwrotnego • Rozkład wartości 𝑋 z próby jest zgodny z krzywą

normalną • Znane jest odchylenie standardowe wyników w

populacji (niezbędne do policzenia 𝜎𝑋 )

– wzór 𝜎 = 𝑋−𝜇 2

𝑁

– Problem w tym, że rzadko znamy tę wartość…. A jak ją znamy, to znamy i średnią w populacji

Szacowanie błędu standardowego średniej

• 𝑧 =𝑋 −𝜇𝑋

𝜎𝑋 =

𝑋 −𝜇𝑋 𝜎𝑋𝑛

=𝑋 −𝜇𝑋 ????

𝑛

• Skąd zatem wziąć odchylenie st. Populacji?

• Z pomocą przychodzi nam nasza ukochana wariancja (estymator nieobciążony):

• 𝑠2 = 𝑋−𝑋 2

𝑛 −1=

𝑆𝑆𝑋

𝑛 −1

• s= 𝑋−𝑋 2

𝑛 −1

Szacowanie błędu standardowego średniej

• Wartość 𝜎 zastępujemy zatem s i dzięki temu otrzymujemy oszacowanie błędu standardowego średniej

• 𝑠𝑋 =𝑠𝑋

𝑛

• A teraz niespodzianka… jeśli we wzorze na

𝑧 =𝑋 −𝜇𝑋

𝜎𝑋 wartość 𝜎𝑋 zastąpimy 𝑠𝑋 to

otrzymamy nową statystykę - t

Rozkład t

• t=𝑋 −𝜇𝑋

𝑠𝑋

• t=ś𝑟𝑒𝑑𝑛𝑖𝑎 𝑜𝑡𝑟𝑧𝑦𝑚𝑎𝑛𝑎 𝑤 𝑝𝑟ó𝑏𝑖𝑒 −ℎ𝑖𝑝.ś𝑟.𝑝𝑜𝑝.

𝑜𝑠𝑧𝑎𝑐𝑜𝑤𝑎𝑛𝑖𝑒 𝑏łę𝑑𝑢 𝑠𝑡.ś𝑟𝑒𝑑𝑛𝑖𝑒𝑗

• t=𝑧𝑚𝑖𝑒𝑛𝑛𝑎 𝑜 𝑟𝑜𝑧𝑘ł 𝑛𝑜𝑟𝑚.−𝑠𝑡𝑎ł𝑎

𝑧𝑚𝑖𝑒𝑛𝑛𝑎

• Rozkład t NIE jest rozkładem normalnym, nazywamy go rozkładem t Studenta

Rozkład t - cechy

• Im większa próba tym rozkład t będzie bliższy rozkładowi z

• Przy nieskończenie dużej próbie t=z

• Kształt rozkładu t zależy od wielkości próby a dokładnie od liczby stopni swobody (df)

• W przypadku testowania hipotez o pojedynczej średniej df=n-1

Rozkład t - cechy

Rozkład z a rozkład t

• Podobieństwa

– Oba mają średnią równą zero

– Są symetryczne

– Są jednomodalne

• Różnice, rozkład t w porównaniu z z jest:

– Platykurtyczny – ma smuklejszy wierzchołek i ma większą koncentrację obserwacji na krańcach rozkładu

– Ma większe odchylenie standardowe

– Zależy od liczby stopni swobody

Rozkład t - cechy

• Dla nieskończonej liczby stopni swobody krytyczna wartość t=z=+- 1,96 (Dla alfa=0,05)

• Im mniejsza liczba df tym większa wartość krytyczna t

Rozkład t

• Rozkład t wykorzystujemy tak samo jak rozkład z, pozwala on nam umiejscowić daną średnią w rozkładzie, a przez to wnioskować o populacji

• Jego zaletą jest to, że nie jest wymagana znajomość 𝜎𝑋

• Do oceny położenia danego wyniku t w rozkładzie używamy tablic statystycznych

– http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_t-Studenta

http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu_t-Studenta




Documents

Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowania statystycznego