22
ANALIZA DWUZMIENNOWA CZYLI ABC KOREALCJI

Stat10 analiza dwuzmiennowa

Embed Size (px)

Citation preview

Page 1: Stat10 analiza dwuzmiennowa

ANALIZA DWUZMIENNOWA

CZYLIABC KOREALCJI

Page 2: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

ANALIZA DWUZMIENNOWA

Centralne pytanie:

Czy między badanymi zmiennymi występuje związek (w próbie)?

WAŻNE: Związek ten nie musi mieć charakteru przyczynowo-

skutkowego; Jest to po prostu skojarzenie liczbowe pewnego typu;

Page 3: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

3

ZALEŻNOŚĆ

dr Victoria Kamasa

Osoba badana

Kolejne miejsce na liście wg wykształcenia tzw. ranga

Kolejne miejsce na liście wg zasobu słownictwa tzw. ranga

o16,5  

o26,5  

o35  

o43,5  

o52  

o63,5  

o71  

Page 4: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

CO TO OZNACZA W PRAKTYCE?

Wniosek:Jeżeli istnieje zależność – jesteśmy w stanie

przewidzieć przybliżone rozkłady dla poszczególnych zmiennych;

I odwrotnie:Na podstawie różnicy między tym, co

„oczekiwane” (przy założeniu, że zachodzi zależność),

a tym co otrzymane można badać siłę zależności.

Page 5: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik ρ - Spearmana

Inna nazwa: współczynnik korelacji rangowej Spearmana

Zastosowanie:Zmienne porządkowe i interwałowe.

Logika:Jeżeli jest zupełna korelacja dodatnia, to

kolejność (ustawiana na podstawie wartości danej zmiennej) będzie taka sama dla obu

zmiennych.

Page 6: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik ρ - Spearmana

Zaczynamy od rangowania zmiennychczyli:

Dla każdej z analizowanych zmiennych:1. Porządkujemy obserwacje wg wartości zmiennej – od

najmniejszej do największej2. Przypisujemy im numer miejsca, na którym się znajdują

Jeżeli kilka obserwacji ma tę samą wartość – przypisujemy im średnią z numerów wszystkich miejsc, które zajmują

EXCEL:=POZYCJA.ŚR(komórka;zakres;1)

Page 7: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik ρ - Spearmana

Osoby badane:Wykształcenie

zawodoweWykształcenie

wyższeWykształcenie

średnie Wykształcenie gimnazjalne

Wykształcenie podstawowe

Wykształcenie wyższe

Wykształcenie zawodowe

Kolejność:Wykształcenie podstawowe

Wykształcenie gimnazjalne

Wykształcenie zawodowe

Wykształcenie zawodowe

Wykształcenie średnie

Wykształcenie wyższe

Wykształcenie wyższe

Rangi:

1

2

3,5

3,5

56,56,5

Przykład rangowania

Page 8: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik ρ - Spearmana

Obliczenia:

d – różnica pomiędzy rangą dla zmiennej pierwszej a drugiejN – liczba obserwacji

Page 9: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik ρ - Spearmana

Interpretacja wyniku:Kierunek związku:

Wartość dodatnia – zależność wprostproporcjonalna Wartość ujemna – zależność odwrotnieproporcjonalna

Siła związku: | ρ| < 0,3 – zależność słaba, brak zależności | ρ| < 0,5 – zależność średnia | ρ| > 0,5 – zależność silna

Page 10: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

10

ZADANIE 1

dr Victoria Kamasa

Badano zależność między liczbą gestów użytych w czasie jednej jednostki dialogowej (Z1), a wiekiem, a którym badana osoba utraciła wzrok (mierzonym na skali porządkowej) (Z2). Uzyskano następujące wyniki:

  Z1 Z2o1 4 1o2 4 3o3 7 4o4 25 2o5 7 1o6 17 5o7 16 2o8 9 1o9 21 4o10 7 5

Page 11: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

Zastosowanie:Dwie zmienne nominalne

(ewentualnie: nominalna + porządkowa)

Logika:Jeżeli nie ma żadnej korelacji mogę poprawnie

w przybliżeniu oszacować wartości w poszczególnych polach tablicy krzyżowej.

Page 12: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

12

PRZEWIDYWANIE

dr Victoria Kamasa

  Wysoka barwa głosu

Niska barwa głosu

Suma

Kobiety     50

Mężczyźni     50

suma 50 50 100

Page 13: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

Etapy obliczania:

1. Obliczenie wartości oczekiwanych

2. Obliczenie współczynnika pomocniczego – chi kwadrat (χ2)

3. Obliczenie wartości współczynnika

4. Interpretacja wyniku

Page 14: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

1. Liczebności oczekiwane:

Przykład:w1 w2 w3 suma

Z1 21*15/70 24*15/70 25*15/70 15

Z2 21*30/70 24*30/70 25*30/70 30

Z3 21*25/70 24*25/70 25*25/70 25

suma 21 24 25 70

EXCEL (z surowych danych):=> tabela przestawna

Page 15: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

2. Współczynnik pomocniczy - chi kwadrat (χ2)

Eij – liczebność oczekiwana dla danego pola w tabelinij – liczebność faktyczna dla danego pola w tabeli

O – ang. observed (liczebność faktyczna)E – ang. expected (liczebność oczekiwana)

Page 16: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

3. Wartość współczynnika:

k, p – ilość wartości poszczególnych zmiennychN – ilość badanych jednostek

Page 17: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

Współczynnik V - Cramera

4. Interpretacja:

Siła związku: V< 0,3 – słaby związek, brak związku;

V< 0,5 – umiarkowany związek V> 0,5 – silny związek

Page 18: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

18

ZADANIE 2

dr Victoria Kamasa

Badano zależność między regionem

pochodzenia a częstotliwością

używania wyrazów gwarowych.

  Często

Średnio

Rzadko

 Suma

Wschód 4 8 2 14

Zachód 8 7 5 20

Centrum 11 7 3 21

Północ 9 4 5 18

Południe 3 11 13 27

  Suma 35 37 28 100

Page 19: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

19

ZADANIE 3

dr Victoria Kamasa

Badano zależność między subiektywną oceną częstości wyrazu (Z1), a subiektywną oceną jego emocjonalnego nacechowania (Z2). Dla sześciu badanych wyrazów uzyskano następujące rangi:

  Z1 Z2w1 2 6w2 5 5w3 5 3,5w4 5 1,5w5 2 1,5w6 2 3,5

Page 20: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

20

ZADANIE 4

dr Victoria Kamasa

Badano częstość występowania typów słowotwórczych w systemie i w tekstach reportaży.

końcówka

Częstość w procentach

w systemie

w tekstach reportaż

y

-ka 45 42

-ina 32 23

-owa 16 23

- a 7 12

Page 21: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

21

ZADANIE 5

dr Victoria Kamasa

Badano zależność między kategorią gramatyczną a częstością występowania w wierszach Zbigniewa Herberta.

  Często

Średnio

Rzadko

 Suma

 Rzeczownik 17 8 21 46

 Przymiotnik 9 4 5 18

 Czasownik 16 11 9 36

  Suma 42 23 35 100

Page 22: Stat10 analiza dwuzmiennowa

www.logic.amu.edu.pl

22

ZADANIE 6

dr Victoria Kamasa

Badano zależność między wykształceniem a zasobem słownictwa. Przyjęto następujące oznaczenia:wykształcenie   Zasób

słownictwa 

Podstawowe 1 Bardzo mały 1

Gimnazjalne 2 Raczej mały 2

Zawodowe 3 Średni 3

Średnie 4 Raczej duży 4

Wyższe 5 Bardzo duży 5

 wykształcenie

Zasób słownictwa

o1 1 2o2 2 1o3 3 4o4 3 3o5 3 2o6 4 3o7 4 4o8 5 5o9 5 5o10 5 4