8
M. Popa – Aplicaţii SPSS (Testele t) 1/8 Actualizat la: 16.03.2006/8:54:18 AM Testele t Testul t este în esenţă o procedură de testare a semnificaţiei diferenţei dintre două medii. Ca urmare, el este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport). Distribuţia teoretică de referinţă (distribuţia de nul) este cea normală, pentru eşantioane mai mari de 30 de subiecţi, şi distribuţia t (Student), pentru eşantioane mai mici de 30 de subiecţi. Chiar dacă formulele de calcul sunt diferite, forma de prezentare a rezultatelor şi raţionamentul decizional sunt similare pentru ambele situaţii. Tipuri de teste t 1. Testul t pentru un eşantion. 2. Testul t pentru eşantioane independente 3. Testul t pentru eşantioane dependente Condiţii de aplicare Condiţia teoretică de bază pentru testele t este normalitatea distribuţiei de eşantionare. Rezultatul testului devine nesigur dacă distribuţia variabilei se abate de la forma normală, mai ales dacă volumul eşantionului este mai mic de 40 de subiecţi (Gardner, 1975, Moore, 1995). În temeiul teoremei limitei centrale, cu cât volumul eşantionului este mai mare, cu atât normalitatea distribuţiei de eşantionare este mai sigură, iar impactul unei eventuale anormalităţi a distribuţiei asupra testului t, mai mic. 1. Testul z (t) pentru media unui singur eşantion Utilizare Testul z pentru un singur eşantion este utilizat pentru se testa diferenţa dintre media unui eşantion faţă de media cunoscută a populaţiei din care face parte (de exemplu, în ce măsură diferă înălţimea femeilor diagnosticate cu depresie cronică de înălţimea femeilor în general?). De asemenea, acest test poate fi utilizat pentru a testa diferenţa unei medii faţă de o constantă oarecare, care prezintă interes pentru cercetător (de exemplu, media QI=117 a unui eşantion de candidaţi respinşi, diferă semnificativ de media QI=125 a candidaţilor admişi la un examen de selecţie?). Utilizarea acestui test statistic este condiţionată de cunoaşterea mediei populaţiei. Dacă populaţia are o extindere mare, acest lucru este dificil de realizat (în afara cazurilor în care există studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele psihologice ale căror medie pentru populaţie este cunoscută, este inteligenţa, exprimată în unităţi QI (μ=100). Testul poate fi utilizat, însă, şi atunci când populaţia are o extindere mai redusă. De exemplu, dacă a fost evaluat nivelul de satisfacţie într-o organizaţie, se poate testa diferenţa dintre nivelul de satisfacţie la nivelul unei secţii faţă de media satisfacţiei la nivelul întregii organizaţii (populaţie). De asemenea, acest test poate fi utilizat pentru a testa semnificaţia diferenţei dintre media eşantionului şi orice altă valoare care prezintă interes pentru cercetător.

Testul T

Embed Size (px)

DESCRIPTION

Curs SPSS

Citation preview

  • M. Popa Aplicaii SPSS (Testele t)

    1/8 Actualizat la: 16.03.2006/8:54:18 AM

    Testele t Testul t este n esen o procedur de testare a semnificaiei diferenei dintre dou medii. Ca urmare, el este potrivit atunci cnd variabila dependent este msurat pe scal cantitativ (interval-raport). Distribuia teoretic de referin (distribuia de nul) este cea normal, pentru eantioane mai mari de 30 de subieci, i distribuia t (Student), pentru eantioane mai mici de 30 de subieci. Chiar dac formulele de calcul sunt diferite, forma de prezentare a rezultatelor i raionamentul decizional sunt similare pentru ambele situaii.

    Tipuri de teste t 1. Testul t pentru un eantion. 2. Testul t pentru eantioane independente 3. Testul t pentru eantioane dependente

    Condiii de aplicare Condiia teoretic de baz pentru testele t este normalitatea distribuiei de eantionare.

    Rezultatul testului devine nesigur dac distribuia variabilei se abate de la forma normal, mai ales dac volumul eantionului este mai mic de 40 de subieci (Gardner, 1975, Moore, 1995). n temeiul teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea distribuiei de eantionare este mai sigur, iar impactul unei eventuale anormaliti a distribuiei asupra testului t, mai mic.

    1. Testul z (t) pentru media unui singur eantion

    Utilizare

    Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media unui eantion fa de media cunoscut a populaiei din care face parte (de exemplu, n ce msur difer nlimea femeilor diagnosticate cu depresie cronic de nlimea femeilor n general?). De asemenea, acest test poate fi utilizat pentru a testa diferena unei medii fa de o constant oarecare, care prezint interes pentru cercettor (de exemplu, media QI=117 a unui eantion de candidai respini, difer semnificativ de media QI=125 a candidailor admii la un examen de selecie?). Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei. Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor n care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele psihologice ale cror medie pentru populaie este cunoscut, este inteligena, exprimat n uniti QI (=100). Testul poate fi utilizat, ns, i atunci cnd populaia are o extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media satisfaciei la nivelul ntregii organizaii (populaie). De asemenea, acest test poate fi utilizat pentru a testa semnificaia diferenei dintre media eantionului i orice alt valoare care prezint interes pentru cercettor.

  • M. Popa Aplicaii SPSS (Testele t)

    2/8 Actualizat la: 16.03.2006/8:54:18 AM

    Aranjarea datelor

    Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric (vezi imaginea de mai jos). n exemplul urmtor vom testa semnificaia diferenei dintre media unui eantion de cinci valori QI n raport cu media populaiei (QI=100)1 Procedura: Statistics-Compare Means-One Sample T Test

    Variabila testat

    Caseta principal Variabila testat este trecut n lista Test Variable(s) n zona Test Value se nscrie media populaiei, sau alt valoare de referin (100 n cazul nostru)

    Caseta Options permite alegerea pragului de semnificaie. Confidence Interval 95% este echivalent cu p=0.05 i este valoarea implicit pentru toate testele statistice

    Rezultate Imaginea de mai jos prezint cele dou tabele din Viewer cu rezultatele procedurii:

    Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std, eroarea standard a mediei).

    Al doilea tabel include rezultatele testului statistic, pe coloane, dup cum urmeaz: o QI Numele variabilei (dac variabila este etichetat, este afiat eticheta); o t 6.254 Valoarea calculat a testului t. Valoarea n sine nu se interpreteaz n

    nici un fel, iar cnd se raporteaz sunt suficiente primele dou zecimale;

    1 Exemplul are un caracter didactic, motiv pentru care nu ne interesm de normalitatea distribuiei.

  • M. Popa Aplicaii SPSS (Testele t)

    3/8 Actualizat la: 16.03.2006/8:54:18 AM

    o df Gradele de libertate (degrees of freedom), calculate ca N-1. Acestea trebuiesc raportate, dar acest lucru poate fi omis dac este menionat volumul eantionului,

    o Sig. (2-tailed) Probabilitatea asociat valorii calculate a lui t (simbolizat n mod uzual cu p). n acest caz, p=0.003 semnific faptul c pe distribuia teoretic t exist o probabilitate de 0.003 (sau 3 la mie) de a se obine din ntmplare o valoare a lui t egal sau mai mare de 6.254. Dac n situaia calculrii manuale comparam valoarea calculat a lui t cu o valoare critic, corespunztoare pragului alfa (0,05), n condiiile utilizrii SPSS se compar direct valoarea p=0,003 cu pragul alfa=0.05 pentru a se lua decizia statistic. Atunci cnd p este mai mic sau cel mult egal cu alfa, ipoteza de nul se respinge. Este evident c raportul dintre p i alfa trebuie s fie invers dect cel dintre t calculat i t critic, dac avem n vedere c p este cu att mai mic cu ct t este mai mare. Dac p este mai mare dect alfa, ipoteza de nul se accept. n cazul de fa, p(0,003)

  • M. Popa Aplicaii SPSS (Testele t)

    4/8 Actualizat la: 16.03.2006/8:54:18 AM

    acest caz, scorul la sociabilitate este variabila dependent, msurat pe scal cantitativ (interval/raport), iar mediul de educare este variabila independent, exprimat pe scal nominal dihotomic (familie/instituie de ocrotire)

    Condiii

    Teoretic, testul t poate fi utilizat pentru eantioane orict de mici dac distribuia de eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele dou grupuri nu difer semnificativ. n ce privete condiia egalitii varianei, ea este testat cu un test specific. Unul dintre acestea este testul Levene, iar n funcie de rezultatul su programul calculeaz testul t pe dou ci, aa cum vom vedea mai jos.

    Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la teste neparametrice, astfel:

    Testul z pentru proporii (compararea procentului de sociabili din cele dou grupuri)

    Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate n valori de rang

    Aranjarea datelor

    Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul. Variabila independent poate fi de tip string (codificnd cele dou grupuri cu valori de genul A i B) sau de tip numeric (cu codificarea convenional 1 i 2). Din principiu, ns, recomandm cea de a doua variant.

    Procedura: Statistics-Compare means-Indpendent Samples T Test

    n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot fi testate mai multe variabile simultan), iar variabila independent (grup), n zona Grouping Variable. n acest moment programul ataeaz variabilei dependente dou semne de ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri. Concomitent se activeaz butonul Define Groups a crui acionare deschide caseta secundar Define Groups, unde se introduc valorile care definesc cele dou grupuri comparate (ordinea lor nu este relevant). Dup acionarea butonului Continue, caseta principal devine complet i se poate aciona OK pentru efectuarea testului.

  • M. Popa Aplicaii SPSS (Testele t)

    5/8 Actualizat la: 16.03.2006/8:54:18 AM

    Rezultate afiate n Viewer

    n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri. Se va

    observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.

    Al doilea tabel are dou linii:

    Pe prima linie avem rezultatele testului t pentru situaia n care variana celor dou grupuri comparate este egal. Egalitatea varianelor este testat cu testul Levene. Dac probabilitatea asociat testului Levene este mai mare de p=0.05, atunci nseamn c varianele sunt egale, iar rezultatul testului t se citete pe prima linie. n cazul nostru, avem p=0.666, ceea ce nseamn c acceptm egalitatea varianelor i citim pe aceast linie rezultatul: t=-2.42, df=12, p=0.045. Pe a doua linie avem rezultatele testului t pentru situaia n care nu s-ar ntruni condiia de omogenitate a varianei celor dou grupuri. Dac semnificaia testului Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast linie.

    Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii, conform creia copiii crescui n mediu familial sunt mai sociabili dect cei crescui n mediu instituional (m1=22.00, m2=17.71, t=-2.42, df=12, p=0.045).

  • M. Popa Aplicaii SPSS (Testele t)

    6/8 Actualizat la: 16.03.2006/8:54:18 AM

    3. Testul t pentru diferena dintre mediile a dou eantioane dependente (perechi)

    Utilizare Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea

    semnificaiei variaiei unei anumite caracteristici, la aceeai subieci, n dou situaii diferite (de exemplu, nainte i dup aciunea unei anumite condiii), ori n dou contexte diferite, indiferent de momentul manifestrii acestora. Avantajul major al acestui model statistic este acela c surprinde variaia numit intrasubiect, prin faptul c baza de calcul este diferena dintre dou valori msurate pentru fiecare subiect n parte.

    Exemplu: Un grup de subieci efectueaz operaii aritmetice n condiii de linite i, ulterior, n

    condiii de zgomot puternic. Ipoteza cercetrii este c n condiii de zgomot performana este mai redus. Performana la test, msurat prin numrul de operaii corecte, este variabila dependent, msurat pe o scal de raport. Contextul n care se desfoar experimentul (linite-zgomot), reprezint variabila independent, msurat pe o scal nominal, categorial, dihotomic, ale crei valori convenionale pot fi 1, respectiv 2.

    Condiii i n acest caz condiia de aplicare a testului t este normalitatea distribuiei de diferene

    dintre mediile unui numr infinit de eantioane perechi (linite-zgomot). Din fericire, teorema limitei centrale garanteaz normalizarea distribuiei de eantionare pe msur ce volumul eantioanelor crete. n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale).

    Aranjarea datelor Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip I/R,

    care primesc cte o valoare pentru fiecare subiect.

  • M. Popa Aplicaii SPSS (Testele t)

    7/8 Actualizat la: 16.03.2006/8:54:18 AM

    Procedura: Statistics-Compare Means-Paired Sample T Test...

    Se selecteaz cu cte un clic de mouse, pe rnd, fiecare dintre cele dou variabile. Astfel se constituie perechea de variabile n zona Current selection.

    O dat constituit, perechea de variabile se trece n lista Paired Variables cu butonul de transfer (). Pot fi create mai multe perechi de variabile i prelucrate simultan.

    Caseta Options permite alegerea pragului de semnificaie, dac dorim schimbarea celui

    implicit (p=0.05). Rezultate Rezultatele sunt prezentate n trei tabele, ca n imaginea de mai jos: n tabelul Paired Samples Statistics sunt afiate mediile celor dou grupuri

    comparate (Mean), numrul subiecilor din fiecare grup (N), abaterea standard pentru fiecare grup (Std. Deviation) i eroarea standard a mediei fiecrui grup (Std. Error Mean).

    Tabelul Paired Samples Correlations prezint corelaia dintre cele doua variabile:

    r=0.74, p=0.013, N=10. Evaluarea corelaiei liniare dintre cele dou variabile este legitim n acest context de date, dar ofer o informaie diferit de testul diferenei dintre medii i, n mod obinuit, este ignorat n acest context. Alegerea testului de corelaie sau a testului t se decide n funcie de obiectivul cercetrii. Dac ne intereseaz msura n care performan crete (sau scade) n funcie de condiia de zgomot, atunci testul t este cel potrivit.

    Tabelul Paired Samples Test prezint rezultatele testului t, astfel:

    - Diferena dintre medii (Mean)=53 - Abaterea standard a diferenei (Std. Deviation)=33.02

  • M. Popa Aplicaii SPSS (Testele t)

    8/8 Actualizat la: 16.03.2006/8:54:18 AM

    - Intervalul de ncredere al diferenie (95% Confidence Interval of the Difference): limita inferioar (Lower)=29.38, limita superioar (Upper)=76.62. Dat fiind numrul foarte mic al subiecilor (N=10), este de neles de ce intervalul de ncredere este att de mare, ceea ce nseamn c diferena real, la nivelul populaiei, este estimat cu precizie sczut de ctre cercetarea noastr.

    - Valoarea calculat a testului t (t)=5.07 - Gradele de libertate (df)=9 (N-1) - Probabilitatea p (Sig. 2-tailed)=0.001.

    Concluzia cercetrii i raportarea rezultatelor

    Avnd n vedere c p