55
Analiza bivariată

12 Analiza bivariata

Embed Size (px)

Citation preview

Page 1: 12 Analiza bivariata

Analiza bivariată

Page 2: 12 Analiza bivariata

Analiza bivariată

Constă în studierea datelor şi în testarea ipotezelor când cercetarea are în vedere investigarea simultană a relaţiilor dintre două variabile.

Cea mai simplă metodă de analiză o constituie tabelarea încrucişată (prin tabelele de contingenţă).

Page 3: 12 Analiza bivariata

Realizarea tabelelor de contingentă în SPSS

Page 4: 12 Analiza bivariata

Selectarea variabilelor pentru realizarea tabelelor de contingenţă

Pentru realizarea unor prezentări grafice

Pentru realizarea unor teste statistice

Pentru realizarea tabelelor de contingenta

Page 5: 12 Analiza bivariata

Setarea tipului de frecvenţă

Page 6: 12 Analiza bivariata

Frecvente absolute

Page 7: 12 Analiza bivariata
Page 8: 12 Analiza bivariata
Page 9: 12 Analiza bivariata
Page 10: 12 Analiza bivariata

Analiza bivariată

Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.

Page 11: 12 Analiza bivariata

Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.

Au ca obiect cunoaşterea deosebirilor, deci a diferenţelor de atitudine, de comportament, de caracteristici, dintre indivizii care compun două grupuri care pot fi independente sau perechi(dependente).

Testul unei diferenţe reprezintă o cercetare a ipotezei care indică că două sau mai multe grupuri diferă sub aspectul mărimii unei variabile exprimată ca medie sau ca procent.

Page 12: 12 Analiza bivariata

A. Teste de comparare a diferenţelor dintre două populaţii (grupuri)

Testul z şi testul t de comparare a mediilor provenite de la două eşantioane independente

Page 13: 12 Analiza bivariata

Se are în vedere cunoaşterea semnificaţiei statistice a diferenţei existente între cele două medii, în cazul unei variabile măsurate metric.

Eşantioanele la nivelul cărora se calculează cele două medii pot fi:

de dimensiuni mari (>30), situaţie în care luăm în considerare distribuţia z

de dimensiuni mici (≤ 30) când trebuie să apelăm la distribuţia t

Page 14: 12 Analiza bivariata

Situaţia 1: cele două eşantioane sunt de dimensiuni mari, respectiv n1 şi n2 > 30 iar varianţele populaţiilor sunt

cunoscute şi nu diferă semnificativ între ele. Se formulează ipoteza nulă şi se optează pentru

una din cele trei forme ale ipotezei alternative. Ipoteza nulă arată că între cele două medii

provenite de la cele două populaţii independente nu există nici o diferenţă; deci, populaţiile sunt identice din punct de vedere statistic având în vedere parametrul medie pentru variabila cercetată:

H0 : μ1 = μ2H1 : μ1 ≠ μ2H1 : μ1 > μ2H1 : μ1 < μ2

Page 15: 12 Analiza bivariata

Se determină raportul critic:

Unde: reprezintă valorile medii ale primului şi

ale celui de al doilea eşantion abaterea standard comună a

diferenţelor mediilor.

2121

212121.xxxx

xxxxCR

deoarece μ1 - μ2 = 0 când H0 este adevărată

21 şi xx

21 xx

Page 16: 12 Analiza bivariata

Dacă abaterile standard σ1 şi σ2 sunt cunoscute iar n1 şi n2 arată mărimea celor două eşantioane, ambele mai mari ca 30, atunci:

2

22

1

21

21 nnxx

Page 17: 12 Analiza bivariata

Dacă abaterile standard nu sunt cunoscute, atunci abaterea standard a diferenţelor mediilor se aproximează prin:

1n

s

1n

2

2

2

1

2

1

2x1x

ˆ

Unde:

s1 şi s2 sunt abaterile standard calculate pe baza primului şi respectiv, celui de al doilea eşantion;

Page 18: 12 Analiza bivariata

Regula de decizie

Dacă optăm pentru un nivel de semnificaţie α = 0,05 şi pentru un test bilateral, atunci valorile z care vor delimita regiunea de acceptare-respingere a ipotezei nule vor fi –1,96 şi +1,96.

se acceptă H0 dacă valoarea raportului critic se va situa între –1,96 şi +1,96 inclusiv;

se repige H0 dacă RC < -1,96 sau dacă RC > 1,96.

Page 19: 12 Analiza bivariata

Dacă cele două eşantioane independente sunt de dimensiuni reduse (n1 ≤ 30 , n2 ≤30) se va folosi distribuţia t

Page 20: 12 Analiza bivariata

Situatia 1: în ipoteza că cele două eşantioane provin de la populaţii repartizate normal

şi în ipoteza că varianţele celor două populaţii sunt egale.

21

21

xxobs

xxt

21

11ˆ

21 nnScxx

2

11

21

22

212

1

nn

nsnsSc

Unde:

În acest caz variabila definită mai sus urmează o repartiţie Student cu:

Raportul critic va fi:

d.f.= n1 + n2 - 2

Page 21: 12 Analiza bivariata

Regula de decizie va fi:

se respinge ipoteza nulă dacă tobs > tα; df din tabelul distribuţiei t;

se acceptă ipoteza nulă dacă tobs ≤ tα; df

Page 22: 12 Analiza bivariata

Situatia 2: Dacă cele două populaţii au varianţe diferite În acest caz abaterea standard a diferenţelor mediilor se va aproxima:

2

22

1

21

2x1x n

s

n

ˆ

1n

r1

1n

r

1

2

2

1

2

2

22

1

21

1

21

n

s

n

s

n

s

r

d.f.=

Numărul gradelor de libertate se va determina astfel:

21

21

xxobs

xxt

Raportul critic va fi:

Abaterea standard a diferenţelor mediilor se va aproxima:

Page 23: 12 Analiza bivariata

TESTUL z DE COMPARARE A MEDIILOR A DOUĂ EŞANTIOANE INDEPENDENTEexemplu

Page 24: 12 Analiza bivariata
Page 25: 12 Analiza bivariata
Page 26: 12 Analiza bivariata
Page 27: 12 Analiza bivariata

Din două grupe de studenţi ai aceleiaşi specializări s-au constituit două eşantioane reduse (n1 = 6 şi n2 = 7) studenţii respectivi indicând în ore cât timp alocă fiecare în parte pentru studiul individual într-o săptămână normală de şcoală (nu în preajma sau în timpul sesiunii). Se doreşte a se cunoaşte dacă între studenţii celor două grupe se manifestă diferenţe semnificative în privinţa variabilei cercetate.

Prelucrarea cu SPSS Exemplul 1

Page 28: 12 Analiza bivariata

Stabilirea ipotezelor

Nivelul de semnificaţie este de 0,05.

H0 : μ1 = μ2

media timpului alocat studiului individual de către studenţii primei grupe este egală cu cea a studenţilor din a doua grupă

H1 : μ1 ≠ μ 2

cele două medii nu sunt egale

Page 29: 12 Analiza bivariata

Datele primare obţinute sunt următoarele (în ore):grupa 1 : 7; 9; 6; 11; 5; 8.grupa 2 : 10; 8; 7; 6; 9; 12; 9.

Page 30: 12 Analiza bivariata

Se constată că media săptămânală a timpului individual de studiu este 7,7 ore la prima grupă şi 8,7 ore la a doua grupă.

Testul F ne indică faptul că varianţele la nivelul celor două grupe sunt egale deoarece nivelul de semnificaţie indicat (0,767) este mai mare decât nivelul de semnificaţie avut în vedere (0,05) şi, ca urmare, trebuie să acceptăm ipoteza nulă a varianţelor egale. În acest context testul t va avea valabilitate.

Page 31: 12 Analiza bivariata

valorile t calculat sunt: –0,913 în condiţiile în care se presupune existenţa

varianţelor egale şi –0,906 în condiţiile în care se presupune inegalitatea

varianţelor.

Valoarea critică a lui t la nivelul de semnificaţie de 0,05 şi la 11 grade de libertate este ± 2,201

Page 32: 12 Analiza bivariata

O alta posibilitate de a lua deciza

0,381, este mai mare decât nivelul de semificaţie α = 0,05, atunci se acceptă ipoteza nulă.

Dacă este mai mic, ipoteza nulă se respinge.

Page 33: 12 Analiza bivariata

Prelucrarea cu SPSS Exemplu

Există diferenţe între bărbaţi şi femei în ceea ce priveşte aprecierea modului in care in prezent se realizeaza curatenia în oraş?

ipotezele sunt: H0 : μ1 = μ2 H1 : μ1 ≠ μ 2

SPSS-ul realizează totdeauna testul T (Student)

Page 34: 12 Analiza bivariata
Page 35: 12 Analiza bivariata
Page 36: 12 Analiza bivariata

Sig.(2-tailed) mai mic decât 0.05, se respinge H0 si se accepta H1.

Exista diferente semnificative intre apreciarile facute de femei si barbati.

Page 37: 12 Analiza bivariata

Testarea diferenţelor dintre medii în cazul eşantioanelor perechi.

Realizarea testului presupune:1. formularea ipotezei nule care arată

inexistenţa unei diferenţe între medii înainte de un anumit eveniment şi cele obţinute după :

H0 : µ1 = μ2 H1 : μ 1 ≠ μ2 ;

Page 38: 12 Analiza bivariata

2. stabilirea diferenţei di dintre cele două scoruri corespunzătoare fiecărui cuplu de observări din cele n existente;

3. calculul mediei şi a dispersiei diferenţelor:

4. determinarea abaterii standard a

diferenţelor, sd , ca radical din dispersie;

n

dd

n

ii

1

1

1

2

2

n

dds

n

ii

d

Page 39: 12 Analiza bivariata

calculul raportului critic pe baza relaţiei:

n

sd

n

sd

RCdd

21

deoarece μ1 - μ2 = 0 când H0 este adevărată

Page 40: 12 Analiza bivariata

stabilirea regulii de decizie privind ipoteza nulă:

se acceptă ipoteza nulă dacă valoarea raportului critic determinată în contextul distribuţiei z sau t este mai mică decât valoarea teoretică din tabelul distribuţiei respective;

se respinge ipoteza nulă dacă valoarea RC este mai mare.

Page 41: 12 Analiza bivariata

Exemplu:

In cazul unei firme se organizează un curs de perfecţionare pentru un număr de 16 persoane. Persoanele sunt supuse unui test înainte şi după curs. Rezultatele sunt următoarele:

n

dd

n

ii

1

Page 42: 12 Analiza bivariata

1

1

2

2

n

dds

n

ii

d =234/15=15,6

sd=3,95

n

sd

n

sd

RCdd

21 =-2/3.95/4=-2,025

Tc=-2,131

RC>=Tc, se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare

Page 43: 12 Analiza bivariata

Prelucrarea cu SPSS

Page 44: 12 Analiza bivariata

Sig. >0,05

se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare

Page 45: 12 Analiza bivariata

Testarea diferenţelor dintre două procente

a)stabilirea ipotezei nule şi a uneia din ipotezele alternative posibile:

H0 : 1 = 2

H1 : 1 ≠ 2

H1 : 1 > 2

H1 : 1 < 2

Page 46: 12 Analiza bivariata

determinarea raportului critic:

2121

212121

pppp

ppppRC

unde: p1 = procentul din eşantionul grupului 1

p2 = procentul din eşantionul grupului 2

π1-π2 = procentul presupus al populaţiei 1 minus procentul presupus al

populaţiei 2

21 pp = abaterea standard a diferenţelor dintre procente

Page 47: 12 Analiza bivariata

21

2121

11ˆ

nnqpSσ

pppp

Page 48: 12 Analiza bivariata

Pentru a calcula estimatorul comun se foloseşte relaţia:

21

2211

nn

pnpnp

Page 49: 12 Analiza bivariata

Regula de decizie: dacă se merge pe un test bilateral, în

condiţiile distribuţiei z, ipoteza nulă se va accepta dacă valoarea raportului critic se va încadra între limita pozitivă şi cea negativă a valorilor teoretice ale lui z în funcţie de nivelul de semnificaţie ales. Ipoteza nulă se va respinge dacă valoarea raportului critic va fi mai mică decât limita negativă sau mai mare decât limita pozitivă a valorilor critice z.

Page 50: 12 Analiza bivariata

Exemplu

Page 51: 12 Analiza bivariata
Page 52: 12 Analiza bivariata
Page 53: 12 Analiza bivariata
Page 54: 12 Analiza bivariata
Page 55: 12 Analiza bivariata