Upload
tomek-urban
View
31
Download
0
Embed Size (px)
Citation preview
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 1/51
Korelacje
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 2/51
Korelacja
• Korelacja to związek między zmiennymi- sytuacja, w której zmianom wartości
jednej zmiennej towarzyszy zmiana
wartości drugiej – skorelowanej z niązmiennej.• Miarą siły i kierunku oraz kształtu związku
jest współczynnik korelacji (dla
zmiennych porządkowych i ilościowych)lub współczynnik kontyngencji (dlazmiennych nominalnych)
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 3/51
Korelacja
• Należy zwrócić uwagę, że nawet wysokawartość współczynnika korelacji(kontyngencji) nie świadczy o związku
przyczynowo – skutkowym, ale jedynie owspółwystępowaniu cech, czywspółzmienności.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 4/51
Współczynnik r Pearsona
• Do pomiaru siły związku międzyzmiennymi interwałowymi służyć możewspółczynnik korelacji r Pearsona.
• Przyjmuje on wartości do -1 (dla bardzosilnych związków ujemnych) do + 1 (dlabardzo silnych związków dodatnich(Uwaga stosuje się go wyłącznie do
interpretacji związków liniowych)
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 5/51
Silny związek dodatni r ~ 1
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 6/51
Silny związek ujemny r ~ -1
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 7/51
Brak związku - r ~ 0
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 8/51
Brak związku liniowego - r ~ 0
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 9/51
Związek między zmiennymiilościowymi
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 10/51
Związek między zmiennymiilościowymi
• Obliczamy kowariancję według wzoru:
88,610
8,68))((
cov
N
Y Y X X
xy
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 11/51
Związek między zmiennymiilościowymi
• Kowariancja jest matematycznymwskaźnikiem współzmienności.Wystandaryzowanie jej pozwala na
uzyskanie współczynnika r Pearsona,który umożliwia ocenę kierunku i siłyzwiązku między zmiennymi.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 12/51
Związek między zmiennymiilościowymi
• Współczynnik r Pearsona
y x
xy
s s
r cov
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 13/51
Związek między zmiennymiilościowymi
• Odchylenia standardowe dla zmiennej x i ymożemy obliczyć ze skróconego wzoru:
22
N
X
N
X s x
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 14/51
Związek między zmiennymiilościowymi
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 15/51
Związek między zmiennymiilościowymi
87,210
55
10
385222
N
X
N
X s x
40,210
40,84
10
84,769222
N
Y
N
Y s y
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 16/51
Związek między zmiennymiilościowymi
99,0
40,2*87,2
88,6cov
y x
xy
s s
r
Otrzymana wartość świadczy obardzo silnym związku dodatnim
między zmiennymi X i Y .
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 17/51
Związek między zmiennymiilościowymi
])(][)([
))((
2222 y y N x x N
y x xy N r
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 18/51
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 19/51
99,040,575*825
688
)712340,7698)(30253850(
46425330
)40,8484,769*10)(55385*10(
40,84*55533*10
])(][)([
))((
22
2222
r
r
r
y y N x x N
y x xy N r
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 20/51
Związek między zmiennymiilościowymi
• Kwadrat współczynnika korelacjinazywany jest WSPÓŁCZYNNIKIEMDETERMINACJI – pokazuje ona w jakim
stopniu zmienność jednej zmiennejwyjaśniana jest przez drugą zmienną.
• W naszym przykładzie r 2 = (0,99)2=0,98lub 98 %
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 21/51
Dane porządkowe
• Dla danych porządkowych korzystamy np..ze współczynnika r s Spearmana –opartego na różnicach rang pomiarów.
• Przed obliczeniem r s Spearmana należypomiary PORANGOWAĆ.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 22/51
Dane porządkowe
)1(
6
1 2
2
nn
d
r
i
s
gdzie di – różnice między rangami w
parach, a n to liczba par.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 23/51
Dane porządkowe
• Współczynnik r s Spearmanapodobnie jak r Pearsonaprzyjmuje wartości do -1 (dlabardzo silnych związkówujemnych) do + 1 (dla bardzosilnych związków dodatnich.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 24/51
Współczynnik r s Spearmana
• Badano, czy istnieje związek międzyśrednią ocen z ostatniego semestru, aodczuwaną satysfakcją ze studiów.
• Obie zmienne wyrażone są na skaliporządkowej i przyjmują następującewartości:
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 25/51
Współczynnik r s Spearmana
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 26/51
Porangowano pomiary
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 27/51
Rangi wpisano do tabeli
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 28/51
Współczynnik r s Spearmana
71,0990
285
1
)1100(10
50,47*61
)1(
61
2
2
s
i
s
r
nn
d r
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 29/51
Współczynnik r s Spearmana
• Uzyskany wynik wskazuje naumiarkowanie silny związek dodatnimiędzy zmiennymi:
• r s=0,71• r s2=0,50
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 30/51
Korelacje w SPSSKorelacje
Bieżącewynagrodz
enieStaż pracy(miesiące)
Wykształcenie(w latach
nauki)
Początkowewynagrodze
nie
Korelacja Pearsona 1 ,084 ,661(**) ,880(**)
Istotność (dwustronna),067 ,000 ,000
Bieżące wynagrodzenie
N 474 474 474 474
Korelacja Pearsona ,084 1 ,047 -,020
Istotność (dwustronna) ,067 ,303 ,668
Staż pracy (miesiące)
N 474 474 474 474
Korelacja Pearsona ,661(**) ,047 1 ,633(**)
Istotność (dwustronna) ,000 ,303 ,000
Wykształcenie (w latachnauki)
N474 474 474 474
Korelacja Pearsona ,880(**) -,020 ,633(**) 1
Istotność (dwustronna) ,000 ,668 ,000
Początkowewynagrodzenie
N 474 474 474 474
** Korelacja jest istotna na poziomie 0.01 (dwustronnie).
Gdy istotność dla współczynnika korelacji jest większa od 0,05 –
stwierdzamy, iż pomiędzy zmiennymi nie ma związku – nie interpretujemynieistniejącego związku !Gdy istotność jest mniejsza/równa od 0,05 – mówimy o istnieniuzwiązku i staramy się go opisać (jego siłę, kierunek ), a przy zmiennychnominalnych charakter związku.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 31/51
Poziom istotności
• Przed rozpoczęciem interpretacjiwspółczynnika korelacji badacz musirównież dokonać oceny poziomu
istotności dla danego współczynnikakorelacji. Hipoteza zerowa, którątestujemy, mówi o tym, że wartość
współczynnika korelacji wynosi 0(czyli nie ma związku międzyzmiennymi).
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 32/51
Rodzaje błędów
błąd drugiegorodzajuOK.Przyjęcie H0
Odrzucenie H0
błąd pierwszegorodzaju
H0 jestprawdziwa
OK.
Ho jest fałszywa
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 33/51
Poziom istotności
• Poziom – prawdopodobieństwopopełnienia błędu pierwszego rodzaju
= poziom istotności testu
• Graniczny poziom istotności stosowanym.in. w naukach społecznych wynosi
0,05.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 34/51
Poziom istotności
8,1902,0
899,099,01
21099,01
222
r
N r t
2
1
2
r
N r t
• Weryfikacja hipotezy zerowej odbywa się przy pomocystatystyki testowej wyrażonej wzorem:
W naszym przykładzie (dla r Pearsona) wartość ta wyniesie:
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 35/51
Poziom istotności
• Obliczoną statystykę t porównujemy zwartością t krytyczną odczytaną z tablicrozkładu t Studenta. Do odczytania
wartości potrzebna jest nam liczba stopniswobody (df), która jest równa
• df= 10-2 = 8
• Odczytana z tablic wartość krytyczna t dla
df= 8 i p=0,05 jest równa 2,306.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 36/51
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 37/51
Poziom istotności
• Hipotezę zerową (r=0) odrzucamy wówczas, gdyspełniony jest warunek:
• Jak widać powyżej obliczone t =19,8 jestwiększe od krytycznego t =2,306 , oznacza to,że możemy odrzucić hipotezę zerową, czyliobliczony współczynnik korelacji jest istotny(prawdopodobieństwo popełnienia błędu jestniższe od założonego p=0,05).
kryt obl t t
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 38/51
Poziom istotności
• Analogicznie postępujemy w przypadkudanych porządkowych. Wartość tobliczamy z wzoru:
• Obliczoną wartość porównujemy z tkrytycznym odczytanym z tablic rozkładu ti podejmujemy decyzję w sposób opisanypowyżej.
21
2
s
s
r
N r t
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 39/51
Dane nominalne
• Badano sympatie polityczne w trzechwojewództwach. Respondenci wskazywalina swoją ulubioną partię.
• Sprawdź, czy istnieje związek międzymiejscem zamieszkania, a sympatiami
politycznymi
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 40/51
Dane nominalne
201515Wojew.3
52025Wojew.2
151510Wojew.1
Opcja COpcja BOpcja A
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 41/51
Dane nominalne• Obliczamy wartości oczekiwane dla
poszczególnych komórek
• Np.:c+f+i
i
f
c
g+h+ihg
Nb+e+ha+d+g
d+e+f ed
a+b+cba
N g d acbaea))((
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 42/51
14,79suma:
2,2832,605,7114,2920i
0,468,18-2,8617,8615h
0,468,18-2,8617,8615g
6,0486,30-9,2914,295f 0,264,582,1417,8620e
2,8550,987,1417,8625d
1,1212,743,5711,4315c
0,040,500,7114,2915b
1,2918,40-4,2914,2910a
(o-e)2/e(o-e)2(o-e)eo
D i l
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 43/51
Dane nominalne
Im większe różnice między wartościamioczekiwanymi (o), a obserwowanymi (e) tymsilniejszy związek między zmiennymi .
• Suma ostatniej kolumny to wartość 2 – jegowartość nie pozwala na bezpośrednieoszacowanie siły związku, dlatego na jegopodstawie obliczamy współczynniki
kontyngencji Fi Yula i V Cramera
D i l
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 44/51
Dane nominalne• Dla tablic czteropolowych stosujemy współczynnik Fi
(φ) Yula. Przyjmuje on wartości od 0 (brak do związku)
do 1 (silny związek)
• N – liczba osób w tabeli N
2
Dane nominalne
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 45/51
Dane nominalne
• W przypadku tablic o większej liczbie pólstosujemy współczynnik V Cramera, któryinterpretujemy podobnie jak φYula.
• min (w-1:k-1) oznacza mniejszą z dwóch
wartości: liczba wierszy minus 1 lub liczbakolumn minus 1
)1;1min(
2
k w N V
Dane nominalne
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 46/51
Dane nominalne
• W naszym przykładzie tabela jest 9 -polowa, zatem do oceny związku międzymiejscem zamieszkania a preferencjamipolitycznymi należy użyć współczynnikkontyngencji V Cramera.
Dane nominalne
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 47/51
Dane nominalne
23,02*14079,14
)1;1min(
2
k w N V
Obliczona wartość współczynnika V świadczy obardzo słabym związku między zmiennymi.
Należy pamiętać, iż w przypadku danych nominalnych przyinterpretacji należy również opisać charakter związku – np. wwojewództwie 1 przeważają zwolennicy opcji B i C, a wwojewództwie 2 zwolennicy opcji A
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 48/51
Poziom istotności
• Podobnie jak w przypadkuwspółczynników korelacji musimyokreślić poziom istotności
obliczonego współczynnika.• Pomocny nam będzie rozkład chi
kwadrat, w którym odczytamy
wartość krytyczną statystyki testowej.
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 49/51
Poziom istotności
• W tablicy rozkładu 2 odczytujemy wartość2
dla liczby stopni swobody:
• df=(w-1*k-1) = (3-1)*(3-1) = 4
• Odczytana wartość 2 wynosi: 9,488
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 50/51
5/17/2018 Korelacje New - slidepdf.com
http://slidepdf.com/reader/full/korelacje-new 51/51
Poziom istotności
• Wartość 2wynosi 9,488
• Wartość 2obl wynosi 14,79
• Jak widać 2
obl > 2
• oznacza to, że możemy odrzucić hipotezęzerową, czyli obliczony współczynnikkontyngencji jest istotny (prawdopodobieństwo
popełnienia błędu jest niższe od założonegop=0,05).