Upload
paula-rehana
View
246
Download
2
Embed Size (px)
Citation preview
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 1/24
Bazele Constructiei Testelor Psihologice
I. Constructia Testelor Psihologice
1. Consideratii generale privind constructia testelor psihologice
Aurel Stan – Testul psihologic
Reprezinta un domeniu devenit distinct in ultimele decenii care presupune o
anumita specializare pe care din pacate nu toti psihologii o au la indemana. Aceasta
specializare se refera atat la una dintre etapele cele mai importante ale constructiei
testelor psihologice si anume redactarea itemilor cat si la derularea unui ansamblu de
proceduri si luare pe durata constructiei a unor decizii importante care se vor reflecat in
validitatea testului psihologic. Activitatea de constructie a unui test psihologic reprezinta
o activitate stiintifica in cel mai adevarat sens al cuvantului – de cele mai multe ori se
desfasoara in echipa ptr ca implica eforturi foarte mari atat teoretice cat si de natura
metodologica, eforturi care se intind pe durata a mai multor ani. In interiorul comunitatii
celor care sunt antrenati in constructia testelor psihologice exista o anumita diviziune amuncii in sesnul ca unii psihologi sunt specializati in managementul calitatii de redactare
a itemilor, altii sunt specializati in controlul mai ales statistic dar si evaluativ a calitatii
psihometrice ale itemilor, ale scalelor sale. O alta etapa importanta este informatizarea
testelor atat sub aspectul implementarii lor pe computer cat si in sensul construirii unor
adevarate banci de itemi, din care peridioc pot fi extrase seturi in vedre construrii de noi
probe paralele.
Desi exista la ora actuala, cu o anumita consacrare, diversi algoritimi privitori la
constructia testelor care prezinta si descriu in amanunt etapele de constructie a testelor
psihologice, de la un autor la altu, exista diverse nuantari care sunt determinate in primul
rand de tipul de test psihologic avut in vedere, prin urmare dincolo de existenta unor principii generale privitoare la constructia testelor psihologice, exista deosebiri in ceea ce
priveste constructia testelor psihologice din domeniul ocupational comparativ cu
domeniul educational, ori cu domeniul clinic. O alta diferentiere importanta privind
principiile de constructie a testelor psihologice exista intre testele psihologice de
aptitudini si capacitati pe de-o parte si inventarele de personalitate. O alta diferentiere
trebuie efectuata intre testele psihologice propriu-zise in care sunt introduse si
chestionarele de personalitate si testele de cunostinte. Testele de cunostinte sunt pe larg
utilizate, mai ales in SUA, in vederea evaluarii ratei de progres in invatare atat in scoala
elementare, in liceu sau in facultate. Mai precis urmarea unui anumit traseu educational
este conditionata de promovare acestor teste de cunostinte. Testele de cunostinte alaturi
de testele bazate pe proba de lucru fac parte din categoria predictorilor alaturi de testele
psihologice utilizati in predictia performantei profesionale. Sunt posibile anumite
distinctii chiar in interiorul psihodiagnosticului ocupational privitor la metodologia de
constructie a testelor de aptitudini comparativ cu aceea specifica cvonstruirii testelor
situationale.
1
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 2/24
Bazele Constructiei Testelor Psihologice
Putem vorbi de o anumita specializare a constructorului testelor psihologice fie in
domeniul educational, fie in domeniul ocupational, intrucat dincolo de niste principii care
sunt comuni tuturor testelor exista specificitatii care se refelcta puternic in caract testelor
psihologice. Astazi unii autori de trate privind constructia testelor psihologice recurg la
aceasta nuantare privitaoare la distinctia intre caract psihometrice a tesetlor psiuhologice
si validitatea interpretarii a rez testului psihologice. Aceasta validitate este dependenta
atat de gradul de antrenament al psihologului in administrarea, scorarea si interpretarea
testului respectiv cat si de catre informatiile pe care le constine manualul testului
privitoare la etapele de constructie a acestuia deoarece toate se reflecta in validitatea,
fidelitatea, sensibilitatea testului respectiv.
2. Problematica constructiei testelor, a particularitailor acestora in functie
de categoria instrumentelor de testare si de domeniul in care se aplica
In constructia testelor psihologice se are in vedere testele psihologice cum ar fi: testele de
aptitudini si testele care evalueaza trasaturile de personalitate, structura acesteia si diversele
dezordini psihice. Includem inventarele de personalitate aici deoarece prin structura lor
constituie instrumentul metodologic asemenea testelor de capacitate.
A doua categorie, testele de cunostinte acumulate in concordanta cu programa
educationala in scoli generale, licee, facultati, trebuie sa respecte intocmai standardele
constructiei, administrarii si implementarii testelor psihologice in vederea reliabilitatii
masuratorilor pentru ca numai astfel aplicarea acestor instrumente constituie luarea unei
decizii corecte la orice nivel.
Problematica constructiei testelor psihologice si a testelor in general, include principiiteoretico-metodologice ale adaptarii testelor dintr-o cultura si limba intr-o alta cultura si
limba.
Teoretizarea problematicii adaptarii lingvistice si culturale a testelor psihologice este cu
atat mai justificata cu cat multa vreme, cam pana in deceniul al -IX-lea al secolului trecut,
multi autori au considerat suficienta traducerea corecta intr-o alta limba decat cea de origine a
anumitor teste de aptitudini si mai ales anumitor inventare de personalitate.
(Ronald K. Hambleton si Merenda – “ Adaptarea testelor psihologice si educationale
pentru evaluarea comparativa a mai multor culturi”)
3. Principii teoretico-metodologice privind constructia inventarelor depersonalitate
Pervin – Personality Assessment
M.Minulescu – Invetarele de Personalitate – pag.31-66
John Willy – Vol.10 Handbook of Psihological Assessment
2
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 3/24
Bazele Constructiei Testelor Psihologice
Inventarele de personalitate ridica constructorilor de teste o problema foarte
serioasa anume aceea a dificultatilor in a transpune in itemii acestor instrumente situatii
fata de care self-ratingul respondentilor sa aiba loc ca si cum acestia s-ar afla intr-o
situatie reala. Din pacate acesta este un deziderat, iar eforturile metodologice ale
constructiei de inventare cauta sa micsoreze aceasta dificultate. Crombach sustine ca este
o mare deosebire intre un item de inventare de personalitate care evoca situatia frustranta,
ca de exemplu palmuirea de catre un interlocutor, si situatia reala. In realitate in item se
comporta ca si cum existand mereu posibilitatea ca in raspunsurile lor sa nu angajeze
toate contunuturile psihice care ar putea fi mobilizate intr-o situatie reala de fapt. A doua
mare dificultate mai putin insurmontabila decatr prima este aceea referitoare la
identificarea unor criterii obiective de validare a inventarelor. Pentru testele de capacitati
si de aptitudini validarea printr-un criteriu extern nu intampina atatea dificultati asa cum
nu intampina dificultati realizarea unor itemi in care subiectii sa se comporte aidoma
situatiilor reale. Intr-un test de aptitudine tehnica intuirea modului de functionare a unui
mecanism cu roti dintate nu se diferentiaza cu nimic cu situatia reala in care subiectul ar trebui sa faca acelasi lucru in fata unui dispozitiv compus din roti dintate.
In constructia testelor psihologice Meggarji, in 1972, a mentionat urmatoarele
metode in urma unei sinteze a modalitatii in care au fost construite mai multe inventare
de personalitate: CPI, MMPI, s.a. Acestea sunt:
a.metoda rationala numita metoda intuitiva
b.metoda bazata pe criteriul extern/metoda empirica
c.metoda bazata pe criteriul intern, adica pe analiza factoriala.
a.= valorifica din plin experienta psihologului in constructia inventarelor de
personalitate respectiv in scrierea itemilor. Aceasta intuitie este sustinuta de o bogata
cultura psihologica generala si de aprofundate cuniostine in domeniul personalitatii si alinventarelor de personalitate. Aceasta metoda uneori este combinata cu metoda
empirica/metoda bazata pe criteriul extern, adica itemii odata redactati sunt controlati din
punct de vedere a puterii lor discriminative prin diferite statistici – una dintre ele consta
in a corela scorurile obtinute pe un esantion la fiecare item cu scorurile la chestionarul
intreg in felul acesta se verifica daca itemii contribuie in mod semnificativa la varianta
generala a inventarului.
Unul dintre dezideratele majore ale constructiei inventarelor de personalitate
caruia incearca sa-i raspund toate cele trei metode mentionate este acela de a fundamenta
scala sau inventarul pe un singur factor. Daca itemii chestionarului vor fi saturati intr-un
singur factor atunci semnificatia unui scor la chestionar isi va pastra semnificatia de la un
individ la altul. Sau altfel spus: de exemplu scorul x obtinut de un subiect la o scala de
extraversie va fi comparabil cu scorul y obtinut de un alt subiect la aceiasi scala. Din
pacate cel mai adesea acest deziderat nu pot fi implinit prin metoda intuitiva, daca ea se
bazeaza exclusiv pe intuitia constructorului si nu apeleaza la statistici avansate cum este
aceea a analizei factoriale. Succesiunea pasilor in derularea acestei metode de constructie
este urmatoarea:
3
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 4/24
Bazele Constructiei Testelor Psihologice
1.definirea domeniului, respectiv a continutului itemilor – inseamna ca psihologul
in cazul unui test de aptitudini se va focaliza pe una dintre aptitudinile mentale descrise
de Thurstone, respectiv aptitudine numerica, fluenta verbala, aptitudine spatiala, viteza
perceptiva, etc.
2.redactarea unui numar dublu de itemi decat cel care urmeaza sa intre in
componenta scalei respective – constructorul se bizuie pe experienta sa acumulata pe
parcursul realizarii altor instrumente similare, el se bizuie si pe cunostintele sale
privitaore la domeniul de continut pe care il abordeaza (redactarea unor itemi pentru un
chestionar de anxietate presupune din partea constructorului cunoasterea in profunzime a
teoriile despre anxietatea atat de natura dinamica cat si de orientare cognitivista; el se
sprijina pe experienta sa anterioara in redactarea unor itemi care se adreseaza anxietatii).
3.apelul la un grup de experti care vor aprecia masura in care itemii respectivi
sunt potriviti sa masoare ceea ce se intentioneaza sa se masoare. Avantajul acestei metode
rezida in faptul ca fondeaza constructia itemilor pe o conceptie unitara, pe un construct
unitar asa cum el este impartasit de catre cel care construieste testul. Ca dezavantaj principal al acestei metode este faptul ca are un control mai slab al validitatii externe,
bazate pe criteriu, singurul tip de validitate pe care il gestioneaza mai bine este acela al
validitatii de continut.
b.= are o larga utilizare in constructia inventarelor de personalitate utilizate mai
ales in depistarea cazurilor care prezinta contraindicatii, fie in legatura cu exercitarea
unui job, fie in domeniul clinic sau in domeniul educational. Aceasta metoda consta in
utilizarea a doua sau a mai multe grupuri contrastante de subiecti care trebuie sa fie
asemanatoare din cat mai multe puncte de vedere si deosebite din punct de vedere al
constructului care urmeaza sa fie masurat. Daca este de exemplu o scala pentru
psihodiagnosticul comportamentului maniacal vor putea fi utilizate 2 grupuri unulconstituit din perspane care se incadreaza in aceasta categorie altul format din eprsoane
normale. Aceste grupuri trebuie sa fie asemanatoare din punct de vedere al varstei,
genului, dar vor trebui sa fie cat mai diferite din punct de vedere al comportamentului
maniacal. Etapele de aplicare ale acestei metode in constructia inventarelor de
personalitate sunt:
1.definirea si delimitarea domeniului de continut
2.redactarea unui esantion, a unei colectii de itemi mai mare decat numarul
itemilor care va fi inclus in chestionar. Acesti itemi pot sa fie, fie o parte din ei redactati
prin metoda intuitiva, fie pot sa fie imprumutati de la alte inventare. Inca de pe la
inceputul secolului trecut au fost construiti itemi care prin diverse imprumuturi s-au
perpetuat de prin secolul VII-VIII.
3.acestia sunt administrati pe un esantion numit esantion de pilotare sau pilot. Va
fi determinat scorul obtinut de fiecare subiect la fiecare item. Vor fi pastrati in viitorul
chestionar acei itemi care din punct de vedere statistic (testul t si testul ipotezei de nul) se
dovedesc a fi rezolvati diferit de catre subiectii din grupul manical comparativ cu
subiectii din grupul normal.
4
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 5/24
Bazele Constructiei Testelor Psihologice
4.urmeaza alte faze prin care itemii selectionati vor fi aplicati pe un esantion
normativ in vedere verificarii caracteristicilor psihometrice, a stabilirii normelor, in
vederea interpretarii calitative a scorurilor la teste.
Principala dificultate cu care se confrunta aceasta metoda este aceea ca itemii sunt
selectionati nu pe baza semnificatiei lor psihologice, si pe baza puterii lor de a discrimina
gurpurile contrastante. Scorul obtinut de catre un subiect la scala maniacala nu are o
semnificatie psihologica ci doar ne spune ca el este similar cu scorul pe care persoanele
cu comportament manical il obtin la aceasta scala. Cu alte cuvinte nici aceasta metoda nu
are ca rezultat un chestionar unifactorial, altfel spus itemii selectionati prin aceasta
metoda oarba, empirica, bazata pe corelatia lor cu un criteriu extern, nu sunt saturati, nu
tintesc un singur factor, ci eventual 2,3 factori, din aceasta cauza scorul X obtinut de doi
indivizi la aceeasi scala este posibil sa nu aiba aceeasi semnificatie, pentru ca daca cel
putin 2 factori sunt implicati poate aparea situatia ca subiectul 1 - factorul 1=4, factorul
2=6, subiectul 2 - factorul=5, iar factorul 2=5, unde factorul 1 s-ar putea sa fie
ciclotinmia, iar factorul 2 extraversia.Fundamentarea unui chestionar pe un criteriu extern conduce la o situatie
extravaganta in care itemii chestionarului respectiv au vizibilitate redusa si respectiv o
semnificatie contrara a aceea pe care ar presupune-o constructorul masurat. Sa
presupunem ca este vorba de un chestionar de anxietate – este de asteptat ca itemii,
potrivit teoriei anxietatii, sa se refere la iminenta unui pericol resimtit de subiect, la
incapacitatea lui de a-i face fata, la caracterul neprecizat al pericolului, la existenta unor
simptome vegetative – tremur, palpitatii, accelerarea batailor inimii. Probabil asa ar
proceda constuctorul acestui test daca ar adopta metoda intuitiva, dimpotriva in cazul
metodei empirice bazata pe criteriul extern daca itemul „am beneficiat de multa
intelegere si libertate din partea parintilor in copilaria mea” se dovedeste ca raspunsul sauda este mai frecvent in randul grupului persoanelor anxioase si foarte putin frecvent in
randul persoanelor normale, in baza acestei legaturi statistice cu anxietatea el va fi retinut
si introdus in acest chestionar. Din punct de vedere al semnificatiei psihologice nu poate
fi afirmata nicio legatura intre smenificatia acestui itemi si constructorul masurat,
anxietatea. Avantajul acestei metode furnizeaza itemi greu de falsificat intrucat
persoanele testate nu intuiesc sensul favorabil al raspunsului.
De obicei chestionarele clinice sunt construite pe aceasta baza, prin raportarea la
un ciretriu extern si deci prin utilizarea unor gruprui contrastante. Este insa foarte dificil
sa reusim sa constituim aceste grupuri pentru ca nu facem decat sa perpetuam dificultati
care exista chiar in interiorul sistemelor de clasificare al bolilor psihice.
c.= urmand aceiasi pasi pana la inclusiv redactarea unuei colectii ipotetice de
itemi, metoda bazata pe criteriul intern consta in a verifica puterea descriminativa a
itemilor precum si consistenta interna a scalei prin determinarea saturatiei itemilor intr-un
anumit factor. Dupa ce au fost redactati itemii sunt administrati unui esantion in vederea
calcului corelatiilor dintre fiecare itemi cu toti ceilalti. Matricea corelatiilor este apoi
analizata factorial, adica rotita pana cand itemii ajung sa formeaza clusteri/ciorchini,
5
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 6/24
Bazele Constructiei Testelor Psihologice
adica factori. Cea mai buna metoda de grupare a itemilor o constituie metoda de analiza
factoriala in componente principale. Urmeaza dupa aceea faza de rotire a factorilor
extrasi dupa metoda varimex pana cand numarul acestor factori este comprimat la
maximum. In acest caz criteriul de selectie al itemilor, adica vor fi pastrati in chestionar,
cei care au saturatia cea mai mare in factorul care corespunde constructului pe care vrem
sa-l masuram. Daca este vorba de un chestionar de anxietate, toti itemii care sunt puternic
saturati in acest factor vor constitui viitorul chestionar. Are mare avantaj ca permite
identificare acelor itemi care contribuie la o consistenta interna ridicata a inventarului.
Deobicei constructorii rareori utilizeaza o singura metoda, si de cele mai multe ori cele
trei metode sunt imbinate in functie de nevoile si obiectivele urmarite de catre
constructor.
4. Pasii esentiali ai constructiei Testelor Psihologice
1. determinarea trasaturii, a abilitatii, a starii emotionale a tulburarii care ne intereseaza si
nu in ultimul rand a atitudinii - In problematica constructiei si adaptarii testelor psihologice
trebuie inclusa si problema sondajelor de opinie atunci cand acestea sunt utilizate de psiholog.
Pentru a obiectiva preferinte, atitudini, este necesar sa se satisfaca aceleasi exigente de natura
psihometrica pe care de obicei le adresam testelor psihologice. Abilitatile se refera la latura
instrumentala a personalitatii, respectiv la acele aptitudini care au fost obiectivate in
performanta. Ex.: aptitudini muzicale, de inteligenta, aptitudine tehnica, matematica,
comprehensiune a scrisului. Cand vorbim de trasaturi ale personalitatii, ne gandim in principal
la acele dimensiuni care exprima modurile constante de comportament in conduita oamenilor
in general. Exemplu: Yung: extroversiunea, psihismul, devianta, creativitatea; Modelul Big
Five2. alegerea manierei in care constructul ales va fi masurat - prin construct intelegem
notiunea care desemneaza una din dimensiunile enuntate mai sus. In general, o masuratoare
adecvata a conceptului trebuie sa fie efectuata asupra unui esantion de comportament intrucat
comportamentul in intregime nu este accesibil. Pe de alta parte, conceptul respectiv va fi testat
mai degraba indirect decat direct, datorita unor limitari de ordin practic si etic. Exemplu:
masurarea agresivitatii. Cea mai buna cale ar fi sa introducem persoana testata intr-o situatie
de frustrare, dar cea mai buna cale este de a ne bizui pe capacitatea individului de a relata
despre propriile sale experiente legate de cum s-a comportat in cutare si cutare situatie
frustranta. In cursul acestei etape, constructorul de test trebuie sa-si puna problema daca testul
va fi administrat in scris sau oral, daca raspunsurile vor fi discrete sau de tipul DA/NU
(raspunsurile discrete sunt specifice scalelor de masurare care implica mai multe variante).
Exista si optiunea ca raspunsurile sa fie deschise daca acestea pot fi evaluate reliabil (cu
exactitate). De asemenea, in legatura cu raspunsurile la itemi, constructorul trebuie sa ia
decizia daca ele vor fi orale, scrise sau nonverbale.
3. stabilirea daca constructul ce urmeaza a fi masurat are una sau mai multe dimensiuni si
cum ar putea acel construct fi impartit in mai multe dimensiuni
6
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 7/24
Bazele Constructiei Testelor Psihologice
4. scrierea itemilor - daca este evaluata o trasatura de personalitate sau o stare emotionala,
atunci itemii ar trebui sa fie concordanti cu teoria sau cu descrierea care este data caracteristii
ce urmaeaza a fi evaluate. Se apeleaza la cativa experti pentru a genera acesti itemi. Daca este
insa masurat nivelul de cunoastere intr-un anumit domeniu, atunci trebuie apelat la manuale si
tratate ale domeniului respectiv sau la experti. In legatura cu redactarea itemilor exista o
discutie extrem de ampla asupra careia vom mai reveni.
5. apelarea la experti dupa generarea itemilor pentru a evalua calitatea acestora in vederea
retinerii doar acelora care intrunesc rangurile cele mai inalte - In general acesti experti trebuie
sa provina din domeniile pe care testul le are in vedere. Exemplu: itemii pentru masurarea
depresiei ar trebui evaluati de catre experti in domeniul sanatatii mentale (psihologii
clinicieni)
6. pilotarea sau pretestarea testului - Esantionul utilizat pentru pilotare ar trebui sa
reprezinte o extractie reprezentativa din populatia cu care persoana testata in viitor va fi
comparata. Odata administrat testul pe esantionul pilot, se intrepirnd urmatorele operatiuni:
a) determinarea corelatiei dintre fiecare item si scorul general. In cazul in care testul arein compozitia sa alte subteste, aceasta procedura trebuie realizata inclusiv la nivelul fiecarui
subtest pentru a fi inlaturati itemii care nu coreleaza semnificativ cu scorul total;
b) eliminarea itemilor prea facili sau prea dificili. Aceasta procedura va maximiza
consistenta interna a testului. Consistenta interna constituie o masura a fidelitatii testului;
c) se calculeaza coeficientul Alfa-Kronbach. Aceasta statistica exprima masura in care un
subtest sau testul insusi cand nu are in componenta alte subteste, masoara un singur construct,
respectiv gradul in care toti itemii masoara aceeasi abilitate sau trasatura.(> 0,70)
7. validarea si crosvalidarea testului - Validarea reprezinta corelarea performantelor
obtinute pe un esantion la test cu performantele aceluiasi esantion la o activitate (notele la
matematica pentru un test de inteligenta scolara). Crosvalidarea reprezinta utilizarea unui altesantion extras din aceeasi populatie prin care sa se realizeze o noua validare.
8. calcularea datelor normative - Se calculeaza o serie de statistici (tendinte centrale,
medie, abatere) care permit convertirea scorurilor individuale la test in exprimari calitative
bazate pe compararea scorului individual cu performanta esantionului normativ.
5. Constructia testelor psihologice de aptitudini si a testelor de
cunostinte
Numarul de pasi in constructia testelor psihologice, prezentati de diversi autori,
variaza si aceasta deoarece unii dintre ei sunt mai rigurosi in a detalia toate fazele pe carele implica constructia acestor itemi. Un algoritm cu nurmar redus de pasi privind
constructia testelor psihologice, contine urmatoarele etape:
1.precizarea scopului testarii (testarea aptitudinii spatiale, testarea iteligentei,
testarea cunostintelor asimilate de catre studentii in inginerie la finalul celui de-al doilea
an de studiu). Se precizeaza domeniul pe care-l vizeaza viitorul test (ocupational, clinic,
educational)
7
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 8/24
Bazele Constructiei Testelor Psihologice
2.definirea continutului – in cadrul unui test de cunostinte se delimiteaza
domeniul de continut pe care testul il va avea in vedere.
3.redactarea itemilor
4.pilotarea itemilor – in aceasta faza este fixat instructajul testului si se determina
tipurile de raspuns impreuna cu modalitate de scorare
5.administrarea testului pe un esantion normativ prilej cu care sunt controlat
caracteristicile psihometrice ale testului. In acest stadiu este selectionat esantionul de
itemi, astfel incat acesta sa satisfacta exigentele validitatii de continut – ceea ce inseamna
ca itemii trebui sa fie reprezentativi pentru constructul masurat.
6.redactarea manualului testului in care sunt condensate toate informatiile
necesare pentru a asigura si justifica validitatea, fidelitatea si sensibilitatea testelor
Algoritm de constructie a testelor psihologice compus din 12 etape:
1.stabilirea planului general al constructiei testului – etapa extrem de importanta
deoarece in aceasta etapa este definit scopul, dar si domeniul pe care il va tinti viitorul
test, sunt fixate etapele care vor fi parcurse in constructia testului, sunt fixateresponsabilitatii in cadrul echipei odata cu termenele de indeplinire a acestora. In aceasta
faza sunt luate in considerare principalele tipuri de amenintari la adresa validitatii carora
etapele de constructie ale noului test vor terbui sa identifice diverse solutii. Toate
proiectiile privitoare la constructia testului care sunt efectuate in aceasta faza au o
implicatie fundamentala asupra felului in care testul va satisface cerintele de natura
psihometrica, precum si rezultatele pe care le va produce odata cu aplicatia lui vor sustine
validitatea interpretarii.
2.definirea domeniului continutului - in functie de modul in care decurge aceasta
etapa, decat de bine este fixat continut, se va asigura validitatea de continut, adica
reprezentativitatea itemilor pentru constructul masurat3.stabilirea specificatiilor testului – se refera la forma itemilor, daca sunt de natura
materiala (sau grafica – plansele testului cuburilor Kohs) sau de natura verbala (itemii
oricarui test de inteligenta verbala). Un rol important in aceasta faza il are stabilirea
caracterului tipului de raspuns la itemi – daca acestia sunt de tip eseu cu raspuns liber sau
cu raspuns la alegre. Fundamentale pentru constructia testului este decizia daca numarul
variantelor de raspuns va fi mai mare decat 2, adica mai multe decat raspunsurile
dihotomice – adevarat/fals, da/nu, corect/incorect. Numarul variantelor de raspuns trimite
la un anumit tip de relatia pe care itemii il vor avea cu criteriul de validare – se stie ca
itemii dihotomici au o relatie nonlineara cu criteriul de validare. Aceasta inseamna ca
statisticile utilizate in studiul relatiei de covariere intre performanta la test si performanta
la criteriu vor fi diferite - coeficientul de corelatie Pearson pentru raspunsurile
trihotomice sau pentru itemii cu mai multe variante de raspunsuri si coeficientul de
corelatie Spearman pentru itemii cu raspunsuri dihotomice. Specificatiile legate de test se
refera de asemenea la numarul de itemi estimat a fi inclusi in test, se refera de asemenea
la formatul acestora – daca stimulul si raspunsul vor fi redactate pe aceeasi pagina.
Deciziile pe care constructorul le face in aceasta privitor la specificatiile testului sunt
8
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 9/24
Bazele Constructiei Testelor Psihologice
fundamentale pentru maniera in care va decurge constructia lui in etapele viitoare si
pentru rezultatele si demersul constructiv va satisface cerintele de natura psihometrica.
4.elaborarea itemilor – in randul constructurilor de teste exista specialisti care sunt
specializati in redactarea itemilor. Reprezinta poate faza cea mai creativa a constructiei
testelor respective. Cu cat itemii vor fi mai bine redactati cu atat amploarea si
complexitatea activ desfasurate in etapele urmatoare vor fi mai reduse. Itemii trebuie sa
reprezinte materailizari, operationalizarii ale constructului masurat. Ei trebuie sa satisfaca
in primul rand cirteriul validitatii de continut. Talentul de a scrie itemi nu este innascut.
El se bazeaza pe cultura psihologica, pe cunoasterea in profunzime a domeniului de
continut si pe antrenament. In occident antrenamentul in constructia itemilor se realizeaza
in cadrul unor workshopuri. Se realizeaza prin antrenament, prin tutorial si prin feedback.
5.stabilirea designului testului – elementele de design se refera la modalitatea de
redactare, modalitatea de incadrare in pagina a itemilor, dar se refera si la designul
experimentelor care vor urma in fazele urmatoare pentru studiere colectiei ipotetice de
itemi. Vom folosi spre exemplu un design experimental bazat pe gruprui independente,adica grupuri contrastante, sau vom prefera corelarea rezultatelor la test cu scorurile
obtinute la criteriu?
6.productia testului – se refera la activitatile care privesc procesarea, redactarea,
tiparirea testului respectiv. In aceasta faza testul capata forma de caiet sau forma unei
colectii de sarcini sau forma unor tablouri asa cum este cazul itemilor de performanta din
cadrul bateriei Wechsler, unde trebuie puse elementele necesare pentru a realiza un desen
– acesti itemi se numesc construire de obiect.
7.administrarea testului – implica faza de pilotarea in care sunt puse la punct
anumite detalii privitoare la formatul itemilor, la tipurile de rapuns, la instructaj, la
exemplele furnizate pentru intelegerea sarcinilor; si faza de testare propriu-zisa a unuiesantion mult mai consistent in vederea constituirii unei baze de date pe care sa fie
aplicate statisticile ncesare care vor aigura validitatea, fidelitatea si sensibilitatea testului
– calculul indicilor de start, trasarea poligonului de frecvente sau a histiogramei, analiza
de regresie, analiza factoriala, analiza de cluster s.a.
8.scorarea raspunsurilor – modalitatea de scorare a raspunsurilor are consecinte
asupra caracteristicilor psihometrice, de aceea scorarea raspunsurilor presupune
demersuri de natura evaluativa, cat si de natura statistica. In alegerea modalitatii de
scorare un rol important il joaca frecventa scorurilor prilej cu care se urmareste daca
aceasta distributie estimeaza normalitatea. Scorarea raspunsurilor trebuie efectuata de asa
natura incat procentajul P de reusita la fiecare item sa se situeze intre 20-80%. Daca
procentajul de reusita este sub 20% atunci itemul este mai dificil decat limita de la care el
devine selectiv. Peste 80% itemul este prea usor si de asemenea este prea putin selectiv.
Intr-o prima etapa se utilizeaza experti care evalueaza nivelul de adecvare al scorarii la
obiectivele pe care le urmareste masurarea cu acel test.
9.stabilirea scorurilor de admisibilitate – in cazul multor teste de aptitudini, dar
mai ales in cazul testelor de cunostinte, stabilirea scorului de admisibilitate are ca tinta
9
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 10/24
Bazele Constructiei Testelor Psihologice
fixarea unui anumit prag sub care cei testati vor fi respinsi. In stabilirea pragurilor de
admisibilitate se utilizeaza atat metode de natura evaluativa – apelul la experti, cat si
metode statistice – analiza de regresie prin care un anumit criteriu de performanta este
estimat in functie de scorurile obtinute la test.
10.prezentarea rezultatelor testului – sub aceasta denumire este inglobata o
intreaga gama de activitati de sinteza prin care toate etapele si rezultatele obtinute in
etapele de constructie a testului sunt redactate pentru a putea pune la dispozitia
utilizatorilor toate informatiile necesare care sa contribuie la cresterea interpretarii
testului. In mare parte din rezultatele acestei activitati vor fi incluse in manualul testului.
11.banca de itemi – ideea realizarii unei banci de itemi care sa gestioneze in
functie de varietatea de criterii si intr-o maniera flexibila toti itemi elaborati in faza 4 de
elaborare a testului a capatat consistenta odata cu accesul larg al constructorilor de teste
la facilitatile IT. O banca de itemi este cu atat mai utila cu cat ea va sta la baza realizarii
unor versiuni paralele ale testului deja elaborat. Versiunile paralele sunt utilizate atunci
cand se pune problema retaestarii anumitor grupuri de persoane in domeniul clinic dar siin alte domenii fara ca efectul de facilitare (efectul imbunatatirii raspunsurilor ca urmare
a cresterii sentimentului de familiaritate cu testul respectiv si al invatarii itemilor) sa
genereze influente perturbatoare. Problema realizarii unei banci de itemi este cu mai
multa acuitate valabila in cazul testelor de cunostinte unde efectul de facilitare este mai
puternic. O banca de itemi nu este super flow in cazul inventarelor de personalitate, mai
ales in cazul unor itemi vizibili, unde o noua retestare ridica problema alterarii
raspunsurilor. Realizarea unei banci de date nu se refera doar la stocarea itemilor ci la
accesarea lor ori de cate ori este nevoie, accesare ce se realizeaza in functie de niste
facilitati de randomizare. Realizarea unei banci de itemi pune problema posibilitatii de a
sorta itemii din perspectiva mai multor criterii considerate simultane. In cazul unui test deinteligenta criteriile posibile – itemi nonverbali cu raspunsuri la alegere de tip
adevarat/fals cu grad de dificultate mediu etc. O alta problema pe care o ridica elaborare
unei banci de date este securitatea acestora- reglementarea accesului membrilor echipei,
cat si a accesului altor persoane, liberul acces poate sa duca la invalidarea testului.
12.raportul final – reprezinta modalitatea de redactare intr-o forma coerenta a
rezeultatelor celor 11 etape. O parte consistenta in raport o ocupa prezentarea rezultatelor, dar
si istoricul realizarii testului – obiectivele asumate in faza de stabilirea a planului general,
modul in care au fost repartizate sarcinile, cu scopul de a furniza in cadrul manualului testului
toate informatiile necesare care sa sustina validitatea instrumentului si a interpretarii.
II. Adaptarea multiculturala a testelor psihologice
Datorita intensificarii schimburilor culturale intre tarile comunitatii europene,
occidentale, lumii contemporane, circulatia testelor atat psihologice cat si educationale, s-a
intensificat considerabil. Ratiunea acestei extinderi multiculturale a utilizatii testelor, o
constituie pe de o parte nevoia unei tari de a imprumuta astfel de instrumente si de a se
10
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 11/24
Bazele Constructiei Testelor Psihologice
apropia astfel de nivelul unor tari cu traditie in domeniu, pe de alta parte nevoia si interesul pe
care comunitatea stiintifica de pretudindeni il manifesta in raport cu comparatiile
multiculturale.
Studiul diferentelor multiculturale are rolul atat de a surprinde specificul anumitor culturi,
dar si de a facilita o mai buna comunicare intre culturi.
Exemplu: cea de-a III-a Conferinta Internationala de Matematica a stabilit elaborarea unor
teste de stiinta si de matematica la nivelul a 45 de tari si a peste 35 de limbi nationale.
Multa vreme adaptarea testelor psihologice a fost confundata cu traducerea acestora.
Adaptarea unui test psihologic include toate activitatile incepand cu decizia daca un test ar
putea masura acelasi construct intr-o limba si cultura diferita, la selectarea traducatorilor, la
decizia privind realizarea unor pregatiri prin care testul se doreste sa fie utilizat intr-o a 2-a
limba. Dimpotriva, traducerea este doar unul din pasii procesului de adaptare. Chiar si in
cazul cand vorbim doar de traducere este mai potrivit termenul de adaptare intrucat traducerea
nu se face mecanic, ci presupune identificarea de concepte de cuvinte care din punct de
vedere cultural, psihologic si lingvistic sunt echivalente in a doua limba si cultura. Prinurmare, o traducere literara a unui test, atunci cand aceasta este o etapa in cadrul procesului
mai amplu de adaptare, merge dincolo de simpla traducere literara. Aceasta idee este intarita
de faptul ca utilizarea unor constructe neechivalente reprezinta o sursa de eroare in cercetarile
crosculturale efectuate cu teste incorect sau insuficient adaptate.
Exemplu: constructul calitatea vietii. Intr-o tara constructul ar putea include posesia unor
bunuri materiale (masini, case etc.), in timp ce intr-o alta cultura, acest construct ar putea
include putin mai mult decat necesarul de hrana pentru supravietuire si asistenta medicala.
Cel care adapteaza un test trebuie sa-si puna problema daca un anumit construct poate fi
sensibil in compara doua culturi diferite. Are constructul masurat un alt inteles in alta
cultura?. Pentru aceasta au fost propuse mai multe abordari: Hamleton: prin intervievarea sau observarea oamenilor din cele doua culturi sau
intrebandu-i pe altii (experti) despre cele doua culturi. O astfel de abordare este subiectiva si
de aceea este nevoie de utilizarea unor multiple surse de dovezi ale conceptului ce urmeaza a
fi masurat. Un bun exemplu privind implicatiile unui test ineficient de bine adaptat la noua
cultura in comparatie cu cultura de provenienta, il constituie o cercetare intreprinsa de
Richard Wolf (1990) pe studenti americani si pe studenti nevorbitori de limba engleza.
Studentii americani au fost solicitati sa identifice similaritatea sau nesimilaritatea unor
termeni- sanguinic/pesimist. La studentii vorbitori de limba engleza performanta a fost de
54%. La studentii nevorbitori de limba engleza performanta a fost de 98%. S-a constatat ca
tara nevorbitoare de limba engleza nu avea in uz cuvantul sanguin, el fiind interpretat cu
optimist . Acesta din urma, fiind interpretat mai usor, subliniaza pericolul in a trage concluzii
in lipsa unei evidente puternice ca procesul de adaptare a testului respectiv a avut ca rezultat 2
teste echivalente.
Datorita importantei problematicii realizarii unor teste intru totul paralele, teoria si
metodologia adaptarii intr-o alta cultura a testelor psihologice, a cunoscut o crestere a
complexitatii considerabile in ultimele doua decenii.
11
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 12/24
Bazele Constructiei Testelor Psihologice
Un rol important in partea teoretica metodologica a adaptarii testelor o ocupa discutarea
erorilor care pot sa apara in procesul de adaptare.
1. Diferentele culturale si de limbaj care pot afecta scorurile la teste
a. Echivalenta constructelor - Se refera la maniera in care constructul masurat este corect
operationalizat in fiecare limba sau cultura. Ex: calitatea vietii (vezi mai sus)
b. Administrarea testului - Comunicarea dintre examinator si persoana examinata poate
naste serioase amenintari la adresa validitatii. Cele mai multe probleme apar atunci cand
instructiunile care preced testul nu sunt clar communicate. O cale de a elimina aceste
probleme este de a ne asigura ca instructiunile la un test sunt clare si suficient de explicative.
O problema importanta o constituie examinatorul insusi. Astfel:
- sa fie recrutat din comunitatile tinta;
-sa fie familiarizat cu cultura limba si dialectul;
-sa aiba experienta si aptitudini adecvate;-sa fie constient de importanta intocmai a tuturor procedurilor prevazute in manual;
-sa se asigure un training adecvat personalului.
c. Formatul testului - Se refera la diferentele interculturale privitoare la formatul itemilor.
Exemplu: In SUA itemii cu alegere multipla au fost foarte extensiv utilizati. In alte culturi,
mai ales cele de limba engleza, nu se poate presupune ca exista o familiaritate similara
privitoare la itemii cu alegeri multiple. Aici s-a pus accent pe intrebarile cu raspuns scurt si de
tip eseu. Elevii si studentii din afara culturilor de acest tip sunt dezavantajati, in comparatie cu
cei din SUA. Solutia ar fi un format al itemilor familiar celor doua culturi.
d. Viteza de lucru la test - Se presupune ca examinatorii vor lucra mai repede la testele cu
timp impus decat la cele cu timp liber. Este posibil ca in anumite culturi sa nu existe osuficienta experienta a populatiei pentru testele cu timp impus. Intr-un studiu (1990) pe
populatia olandeza si pe populatia de culoare, s-a constatat ca testele cu timp impus
inregistrau scoruri deformate. Pe de alta parte este un fapt comun ca in testele de aptitudini
intalnim itemi rezolvati corect mai degraba la final decat la inceput. Asta se datoreaza faptului
ca unele persoane au performante mai scazute la citit si din aceasta cauza fie raman in urma
celorlalti, fie nu le finalizeaza. Cea mai buna solutie este de a minimiza importanta vitezei de
rezolvare a testului, acolo unde viteza nu este o parte relevanta a constructului care este
masurat.
Exemplu: in problemele de rationament analtic, viteza nu este o parte integranta. Aici nu
exista alta cale decat a explicita persoanelor testate ca trebuie sa lucreze foarte repede.
e. Probleme tehnice de design si de metoda - Exista 5 factori tehnici care pot influenta
validitatea testelor adaptate pentru alta limba sau cultura:
1) testul insusi;
2) translatorul (selectia si antrenamentul acestuia);
3) procesul de traducere;
12
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 13/24
Bazele Constructiei Testelor Psihologice
4) designurile pentru adaptarea testelor;
5) modalitatea de colectare si de analiza a datelor pentru a stabili echivalenta formei
adaptate cu forma initiala.
1)= anumite aspecte pot fi dificil de tradus, dar pot fi luate in considerare prin formularea
unor specificatii la nivelul instructajului sau chiar in redactarea itemilor. Exemplu: intrebarile
referitoare la bani ar trebui eliminate intrucat acestia difera de la tara la tara si sunt greu de
facut echivalente; hocheiul pe ghiata pentru tarile calde; folosirea unor timpi ai verbelor fara
echivalenta in cealalta limba; scalele inventarelor de personaliate- trebuie alese situatii care
vor fi adaptate usor (behavior poate sa nu aibe nici un inteles in alta limba).
2)= procesul de traducere este o functie a calitatii traducatorului si a costului pe care
acesta il ridica. Este recomandata utilizarea mai multor traducatori pentru ca unul singur
aduce o anumita perspectiva pentru anumite expresii. Traducatorii ar trebui sa urmeze un
training in domeniul construirii testelor pentru a fi familiarizati cu principiile de baza ale
constructiei testelor.
3)= probleme de traducere intervin mai ales atunci cand testul urmeaza sa fie tradus intr-un dialect. Chiar si cand este vorba de 2 tari diferite ar trebui sa se tina seama de frecventa
cuvintelor in lima.
4)= sunt utilizate 2 designuri mai frecvente: traducerea si retroversiunea termenilor. In
cadrul designului un singur translator sau un grup de translatori adapteaza testul de la limba
sursa la limba tinta. Apoi echivalenta celor doua versiuni este judecata de un alt grup de
traducatori. Reviziile pot fi facute pentru a corecta problemele identificate uneori, un pas final
il constituie ca o alta persoana care nu este translator sa citeasca versiunea adaptata a testului
pentru a se face eventualele corecturi. Cel mai mare dezavantaj al acestui design este ca
aprecierile sunt facute cu echivalenta versiunii sursa si a celei tinta. Validitatea judecatii poate
fi marita utilizand un grup mai mic de persoane examinate care vor furniza interpretarile lor.Designul retroversiei este cel mai cunoscut design de evaluare. In cadrul acestuia unul
sau mai multi traducatori adapteaza un test din limba sursa in limba tinta. Alt traducator va
retraduce noua versiune din limba tinta in limba sursa. Atunci originalul si ultima versiune vor
fi comparate si judecate. In masura in care cele 2 versiuni sunt similare in limba sursa se
obtine o echivalenta intre acestea.
5)= sunt utilizate 3 modalitati:
a) aceeasi subiecti primesc ambele versiuni (originala si adaptata) cu conditia sa fie
subiecti bilinguali. Avantajul este acela ca diferenta pe care ar putea sa o introduca ca pe o
variabila straina utilizarea unor grupuri diferite este eliminata.
b) Varianta originala sau varianta sursa este administrata unor subiecti din cultura sursa.
Lor li se administreaza intr-o a 2-a etapa versiunea retro. Prezinta avantaj faptul ca atat
varianta originala cat si varianta tinta, fiind administrate unor subiecti ai culturii de origine,
permite studiul diferentelor intre cele doua variante din perspectiva versiunii originale.
c) Subiectilor din cultura de origine li se administreaza versiunea tinta, iar unor subiecti
din cultura tinta li se administreaza versiunea adaptata. Dificultatea consta in a face
echivalente cele doua grupuri.
13
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 14/24
Bazele Constructiei Testelor Psihologice
f. factori care afecteaza interpretarea rezultatelor - Interpretarea rezultatelor studiilor
interculturale poate fi afectata de:
- curricula;
- politicile educationale;
- standardele de sanatate si de viata;
- valorile culturale ale celor 2 culturi, populatii.
Exemplu: similaritatea curriculei. In masura in care exista diferente in curricule,
performantele intre diferite culturi pot fi eronate daca nu se tine cont de aceste diferente.
Westburi (1992) observa ca, la studiul international pe domeniul matematicii, rezultatele
elevilor americani sunt mai slabe la fiecare clasa, la fiecare aspect al matematicii cuprins la
test, comparativ cu rezultatele elevilor japonezi la aceleasi teste. Acest lucru s-a datorat
diferentelor curriculare intre tari. Acolo unde nu existau diferente curriculare, rezultatele erau
asemanatoare. Motivatia studentilor/elevilor afecteaza si ea performanta rezultatelor. Astfel
pot fi multi studenti de culoare din Africa de Sud care au ca scop atingerea minimului de scor
pentru promovare.
2. Indrumari practice pentru adaptarea testelor
Urmatoarele indrumari au fost propuse de un comitet international si sunt citate de
Hamleton in opera citata in 1996.
1. Indrumari privind contextul adaptarii testelor la o cultura si limba diferite:
a) efectele diferentelor culturale care nu au o importanta covarsitoare pentru scopurile
principale ale adaptarii. Ar trebui totusi sa fie minimizate intr-o cat mai mare masura.
Ratiunea acestei recomandari rezida in faptul ca exista multi factori care afecteaza
comparatiile crosculturale, ei trebuind sa fie luati in considerare ori de cate ori doua grupuricu background lingvistic si cultural diferit sunt comparate.
Caz special : dezvoltarea sau adaptarea unui test sau interpretarea scorurilor ;
b) gradul de suprapunere a constructului masurat de test , masurat in cele doua populatii
(sursa si tinta) ar trebui sa fie evaluat. Ratiune: diferentele dintre culturi si limbi diferite
depind nu doar de traditii, norme, valori ci si de conceptii diferite despre lume.
2. Indrumari privitoare la dezvoltarea si adaptarea testelor.
Editorii, ca si constructorii de teste, ar trebui sa se asigure daca procesul de adaptare tine
cont de diferentele culturale si lingvistice luate in considerare. Ei ar trebui sa furnizeze dovezi
ca limba utilizata in instructiunile, scorarea si itemii testului sunt potrivite pentru toate
populatiile culturale si lingvistice pentru care testul este proiectat.Ei ar trebui sa dovedeasca
faptul ca alegerea tehnicilor de testare, a formatului itemilor si a altor proceduri sunt cat de cat
familiare celor doua populatii implicate in procesul de constructie si adaptare. Privitor la
administarea testelor psihologice, exista recomandarea ca toate aspectele care tin de mediu si
care influenteaza administrarea unui test sa fie uniformizate in ambele populatii (sursa si
tinta). Privitor la interpretarea scorurilor ar trebui efectuata o documentare privitoare la
14
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 15/24
Bazele Constructiei Testelor Psihologice
schimbarile care pot sa apara impreuna cu dovada care sa sustina echivalenta versiunii
adaptate. In vederea atingerii obiectivului ca in procesul de adaptare diferentele culturale si
lingvistice au fost luate in considerare de regula, trebuie urmate etapele:
a) asigurarea ca traducatorii au experienta si calificarea necesara;
b) cunoasterea de catre traducatori a problemelor de baza ale adaptarii testelor pentru ca
altfel, subtilitatile si nuantele adaptarii testelor nu ar putea fi reflectate in procesele de
traducere.
Un proiect de adaptare a unui test este mai bine realizat de catre o echipa de specialisti
decat de unul singur. Un posibil design: utilizarea echipei de traducatori lucrand individual
sau in grupuri mici, apoi compararea traducerilor iar diferentele rezolvate in sensul unei
singure traduceri. Editorii si constructorii testelor ar trebui sa dovedeasca atat din punct de
vedere lingvistic cat si psihologic ca procesul de adaptare a condus la versiuni echivalente ale
testelor. Dezvoltatorii si editorii testelor ar trebui sa se asigure ca designul de colectare a
datelor permite utilizarea unor tehnici statistice adecvate care sa asigure echivalenta
versiunilor testului. Ei trebuie sa furnizeze informatii in manualul testului privitoare lavaliditatea versiunii adaptate si dovezi statistice cu privire la echivalenta itemilor.
3. Probleme de natura conceptuala si metodologica in adaptarea testelor
psihologice
Problema fundamentala o constituie asigurarea simultana a unei echivalente lingvistice
cat si a unei psihologii a itemilor. Din punct de vedere lingvistic, o versiune echivalenta a
testului sursa ar trebui sa reprezinte o traducere mot-a-mot a itemilor testului sursa pentru ca
numai astfel conceptul masurat de test e conservat si in limba tinta. Totusi, o astfel de
traducere poate sa nu asigure echivalenta psihologica. Aceasta echivalenta este la fel denecesara. Astfel, nu pot fi realizate instrumente inalt calitative in limita tinta. Una dintre
problemele pe care le genereaza necesitatea unei echivalente simultane este aceea privitoare la
BIAS si echivalenta. Termenii de BIAS si echivalenta au semnificatii diferite. BIAS este des
asociat cu prezenta unor factori nedoriti. O masura poate fi considerata a fi afectata
(BIASED) daca scorurile la test in versiunile din cele doua limbi sunt in mod diferit afectate
de o sursa de variatie nedorita. Un exemplu il constituie traducerea din limba engleza a
itemului de cunostinte generale “unde este mai probabil sa traiasca puiul cu pielita la
degete?”. Traducand in suedeza “pasare cu picioare inonatoare” genereaza un indice mai
puternic privitor la solutia corecta comparativ cu limba engleza.
Un alt exemplu: sondajul european privitor la valori unde scorul spaniol la un item ce
masoara loialitatea are in spaniola o conotatie usor diferita (credincios sexual).
Echivalenta este asociata cu aspecte ale masuratorii implicate in comparatii etnice. Si
aceasta are consecinte contaminative. Un item sau un instrument care este BIASED va genera
scorul neechivalent si ca atare scorurile nu vor putea fi comparabile. Cu toate acestea
15
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 16/24
Bazele Constructiei Testelor Psihologice
partinirea nu este o proprietate intrinseca a unui instrument intr-un anumit scop si cu un
anumit scop. Exista 3 tipuri de BIAS (contaminare).
Desi pot rezulta dintr-o varietate de surse, exista 3 BIAS-uri principale ce trebuie luate in
considerare:
1) BIAS-ul de construct (deformarea de construct);
2) BIAS-ul de metode (deformarea metodei);
3) BIAS-ul de item/deformari ale itemilor (Van der Visner)
1)= se refera la diferentele care privesc un anumit construct la nivelul unor grupuri culturale
diferite. De exemplu: elementele constitutive ale unui construct (comportamente, atitudini,
norme) nu pot fi identice in grupuri culturale diferite. Exemplu: Inteligenta. Cele mai multe
teste de inteligenta au o definitie implicita a acesteia ca fiind o gandire si o capacitate de a
gandi si relationa logic (Raven). Sau Weschler in scalele sale de inteligenta: cunoasterea
dobandita de un individ si memoria. Aceste diferente sunt cel mai adesea constatate cand
indivizii sunt pusi sa descrie caracteristicile unei persoane inteligente. Exemplu: studiile
efectuate in alte culturi decat cele vestice au raportat faptul ca conceptiile despre inteligentasunt mult mai largi si includ in alte culturi si aspecte sociale. (mamele din Kenya: un copil
inteligent este acela care isi cunoaste locul in familie, care cunoaste comportamentele
asteptate din partea lui si maniera de a se adresa altor oameni; Zambia: o persoana inteligenta
merge dincolo domeniul scolar cu care inteligenta e asociata in cultura occidentala).
Se pune problema esantionarii corecte a universului sensurilor pe care le implica un
concept, care este operationalizat intr-un instrument. TRIANDIS, 1978 a pretins ca
masuratorile efectuate in psihologie sufera de o reprezentare slaba a constructelor
operationalizate. Datorita unei operationalizari restrictive a constructului masurat de test, in
compararea a doua grupuri culturale intre care exista o mare distanta pot sa apara serioase
alterari.2)= se refera atat la instrumentul de masurare, cat si la administrarea acestuia.
a) Privitor la instrument este vorba de acele proprietati ale acestuia care nu au fost
studiate indeajuns dar care pot induce diferente in scorurile la test. Exemplu: gradul de
familiarizare al subiectului cu stimulii si raspunsurile (formatul raspunsului).
Serpel, 1979 a studiat atitudinile perceptive ale copiilor, figurile utilizate, metoda creion-
hartie, plastelina, prezenta mainilor si modelarea cu ajutorul unor fire de metal (foarte
populara in Zambia). Copiii din Anglia i-au depasit pe cei din Zambia la probele creion-
hartie, iar cei din Zambia i-au depasit pe cei din Anglia la proba de modelare cu fire de metal.
Aceasta inseamna ca familiarizarea cu un anumit tip de raspuns constituie o deformare a
scorurilor la test. Triandis, 1989 a gasit diferentele intre europeni, americani si hispanici
privitoare la utilizarea scalelor de evaluare cu 5 trepte si cea cu 10 trepte. Exemplu: hispanicii
tindeau sa utilizeze extremele la scalele cu 5 trepte, mai frecvent decat euro-americanii. Nu se
intampla la fel in scalele cu 10 trepte.
b) a 2-a categorie de BIAS de metoda se refera la administrarea testelor, mai exact la
instructajul sau probleme de comunicare intre examinator si persoana testata. Acest lucru se
16
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 17/24
Bazele Constructiei Testelor Psihologice
intampla cand se utilizeaza alta limba decat cea materna. Lipsa cunostintelor despre cultura
persoanelor testate duce la violarea instructajelor testelor.
Este deja cunoscut in psihologie influenta deosebita pe care o are asupra intervievatului
caracteristicile intervievatorului: varsta, genul, etnia. Trebuie concluzionat ca deformarile care
tin de instrumente pot avea un efect larg asupra scorurilor la teste. De asemenea, deformarile
in educatie sau care tin de o expunere anterioara la acel test pot afecta scorul la anumiti itemi
cu continut legat de scoala.
3)= se refera la amenintarile validitatii care afecteaza anumiti itemi in timp ce deformarile
constructorului si metodei afecteaza caracteristicile mai generale ale instrumentului. Afectarea
itemilor a fost comentata pentru prima data in 1968 de Cleary si Hilton, apoi a fost inlocuita
cu termenul “functionare diferentiala a itemilor”. Traducerea defectuoasa si conotatiile
diferite acordate unor cuvinte: Exemplu: agresivitatea explicata prin cearta, determinare si
pregatire pentru conflict. In dictionarul britanic agresivitatea reprezinta actul de a ataca fara
provocare, de a incepe o cearta. In principiu, asa cum arata Holland si colaboratorii un item
este considerat a fi deformat daca are acelasi scor la general, la test are acelasi scor asteptat laun item anume. Pentru analiza surselor de deformare a itemilor se divizeaza cele 2 esantioane
din cele 2 culturi intr-un numar de grupuri constituite pe nivele de scoruri.
Exemplu: in primul grup american introducem subiecti cu scorul egal cu unitatea. In mod
similar, in grupul olandez introducem persoanele cu scorul egal cu 1. Apoi urmatoarele
grupuri cuprind scorurile egale cu 2. Astfel putem compara scorurile esantionului american cu
cel olandez cu acelasi nivel de scor si nu comparam scorurile medii. De exemplu, itemul
despre presedintele american va fi deformat daca subiectii americani si olandezi cu acelsi scor
la test nu vor avea acelasi scor mediu la acel item.
Mellenbergh, in 1982 a propus distinctia intre deformarea uniforma si neuniforma. Un
item este uniform deformat daca diferentele sunt mai mari sau mai mici, constante la toatenivelele de performanta.
Deformari ale esantionului/incompatibilitatea esantioanelor implicate in procesul de
adaptare al testului la o alta cultura – este vorba de inegalitatile privitoare la
reprezentativitatea esantionului pentru culturile din care ele sunt extrase. Exemplu: profesorii
care isi fac studiile pe studenti (nu oricine poate intra la Harward)
4. Probleme de natura etica in adaptarea Testelor Psihologice
1) Autorii de teste pot dezvolta un test care ulterior va fi adaptat cu autorizarea lor.
Adaptarea poate fi realizata fie cu fie fara implicarea lor cu asistenta specializata;
2) Companiile care publica si distribuie testele care ulterior vor fi adaptate numai cu
autorizarea lor, pot fi implicate sau nu in adaptarea la o alta cultura a testului respectiv;
17
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 18/24
Bazele Constructiei Testelor Psihologice
3) Autorii unui test pot sau nu sa fie implicati in publicarea unei versiuni ulterioare a unui
test. Exemplu: editiile ulterioare ale WISC au 26 de adaptari oficiale dar este utilizat in 34 de
tari ceea ce conduce la idea existentei unor versiuni neautorizate;
4) In dezvoltarea testelor psihologice sunt antrenati profesionisti cu experienta care apoi
dezvolta asfel de teste in alte limbi si culturi. Exemplu: staff-ul Microsoft produce peste 45 de
teste anual in 16 limbi pentru utilizarea in peste 75 de tari;
5) O componenta importanta a sistemului de adaptare a testului la alta cultura o constituie
formatorii de specialisti in domeniul testelor;
6) In acelasi sistem trebuie implicate alte grupuri cum sunt cele ale consumatorilor de
teste psihologice. Persoanele si organizatiile ce consuma informatiile provenite din aplicarea
testelor in vederea luarii deciziilor.
Reglementarile si standardele etice se refera in general la urmatoarele probleme:
Standarde tehnice: au rolul de a promova bunele practici pentru adaptarea testelor si
determinarea echivalentei scorurilor la acestea;
Deprinderile si aptitudinile profesionale: categoria de standarde ce ia in dezbatere
calitatea persoanelor care utilizeaza teste adaptate;
Standarde morale: nevoia de a actiona intr-o maniera etica si profesionista din partea
celor care utilizeaza testele, responsabilitatea, asigurarea materialelor necesare utilizarii
testelor, confidentialitatea rezultatelor.
O serie de principii etice generale privesc urmatoarele domenii:
1) beneficiul si avantajul persoanelor testate;
2) fidelitate si responsabilitate;
3) integritate, justitie si respect pentru demnitatea oamenilor;
5. Metode statistice folosite pentru identificarea greselilor in procesul de
adaptare a Testelor
1) Tehnici statistice pentru evaluarea echivalentei constructelor – cercetarile
crosculturale pentru a evalua echivalenta constructelor operationalizate in instrumente pot
utiliza statistici inainte si dupa testarea esantioanelor.
a) Evaluarea echivalentei constructelor inainte de test – este vorba de efectuarea
acestei analize in absenta datelor rezultate din testare. Acest lucru este posibil prin colectarea
de date despre aceasta echivalenta de construct de la experti care reprezinta diverse culturi si
limbi (ex: engleza si romana). Triandis, 1985 = mici esantioane de evaluatori au evaluatsimilaritatea intelesului unor perechi de itemi utilizati intr-o anumita evaluare.
Autorii au utilizat scale multi-dimensionale pentru a desprinde caracteristicile pe care
expertii le-au utilizat in a evalua similaritatea. Daca aceste caracteristici sunt prezente la toti
evaluatorii, obtinem o dovada preliminara a echivalentei constructelor. Daca experti
apartinand unor culturi diferite utilizeaza caracteristici diferite, atunci se poate folosi
informatia pentru a modifica una sau ambele versiuni ale evaluarii.
18
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 19/24
Bazele Constructiei Testelor Psihologice
b) Evaluarea echivalentei dupa efectuarea testarii – in acest caz exista cel putin 4
abordari:
Analiza factoriala exploratorie;
Analiza factoriala confirmatoare;
Scalarea multidimensionala; Comparatii in retele normologice.
Analiza factoriala exploratorie este cea mai frecvent utilizata metoda statistica pentru a
evalua daca un construct este intalnit in aceeasi forma si cu aceeasi frecventa in culturi
diferite. Metoda consta in efectuarea analizei factoriale a scorurilor la itemi sau la test
separate pentru fiecare scop. Apoi se inspecteaza vizual cele 2 matrici care contin incarcarile
factorilor. Desi aceasta abordare este intuitiva, prin intermediul urmatoarelor reguli de decizie
se poate aprecia daca cele 2 structuri sunt echivalente.
Analiza factoriala confirmatorie – este avansata cu titlul de ipoteza o anumita structura
apriorica examinarii datelor. Structura presupusa este inglobata intr-un model matematic, o
ecuatie si este constransa sa fie aceeasi in cele 2 grupuri. Cu alte cuvinte, echivalareaconstructului este confirmata daca incarcarea factoriala este aceeasi in ambele grupuri.
Scalarea multidimensionala – la fel ca analiza factoriala exploratorie, scalarea
multidimensionala nu necesita o structura factoriala specifica aprioric. Totusi, asemenea
analizei factoriale confirmate, datele obtinute din cele 2 esantioane pot fi analizate simultan.
Se utilizeaza un model matematic de analiza. Se urmareste identificarea unei structuri comune
in cele doua grupuri. Ulterior, se urmareste modificarea structurii comune astfel incat aceasta
sa se muleze pe datele fiecarui grup. Scalarea mutidimensionala furnizeaza mijloacele pentru
a descoperi dimensiunea care se afla la baza raspunsurilor subiectilor si pentru a evalua daca
aceasta este aceeasi in cele 2 grupuri (sursa si tinta).
Compararea unor retele normologice - metodele trecute in revista anterior permit sa se
verifice daca acelasi construct psihologic este masurat in cele 2 colectii de rezultate la test,
respectiv daca poate fi identificata aceeasi structura a datelor (incarcarea factorilor) in cele 2
versiuni ale instrumentelor. Totusi, similaritatea structurii nu implica in mod necesar
echivalenta constructului. Echivalenta structurala este necesara, dar nu suficienta. De aceea
multi cercetatori au sugerat sa se mearga dincolo de aceasta si au propus necesitatea unei
abordari mai globale care implica investigarea relatiilor intre scorurile la test pe de o parte si
anumite variabile banuite a fi legate la constructul masurat.
Cronbach si Mill (1955) au introdus termenul de retea normologica pentru a sublinia
faptul ca un test nu poate fi validat folosind un singur criteriu. Privitor la evaluareacrosculturala, interrelatiile existente intre scorurile la test si alte variabile ar trebui sa fie
aceleasi in ambele culturi si in ambele variante. Compararea retelelor normologice in diferite
versiuni ale testului reprezinta o evaluare riguroasa a echivalentei constructului. Pentru a
realiza acest lucru este necesar sa se identifice variantele externe care influenteaza
masuratorile.
19
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 20/24
Bazele Constructiei Testelor Psihologice
6. Strategii statistice pentru a evalua deformarile metodei
Wiswer si Tanter afirma ca exista 3 tipuri de deformari ale metodei:
1) Deformarea esantionului- se refera la diferenta dintre grupurile literare si cele
lingvistice;
2) Deformarea instrumentului – deformarea intr-o masurare comparativ intre cele 2
grupuri (familiarizarea cu formatul testului);
3) Deformarea administrarii testului- se refera la problemele de administrare
(procedurile de standardizare a administrarii). Exemplu: administrarea gresita intr-un grup
datorita instructiunii incorect traduse sau intelese.
Analiza deformarii esantionului se realizeaza in scopul de a controla o serie de variabile
perturbatoare care pot oferi explicatii alternative, altele decat cele avansate in ipoteza
cercetarii, anume ca diferenta intre grupuri, intr-adevar se datoreaza nivelului diferit al
capacitatii sau caracterizarii masurate. In acest scop se utilizeaza urmatoarele metode:
a) analiza de varianta; b) utilizarea unor designuri sau blocuri randomizate;
c) analiza de regresie;
d) corelatia partiala;.
Evaluarea deformarilor instrumentului si administarea acestuia apeleaza la 3 strategii
statistice:
1) masurarea acelorasi trasaturi in toate grupurile implicate in cercetare . Daca
diferentele existente intre grupuri nu sunt constante de-a lungul variabilelor testului, se poate
incrimina existenta unei deformari;
2) utilizarea unor informatii colaterale in vederea evaluarii deformarii instrumentului
sau a evaluarii. Analiza unei variabile aflate in legatura cu constructul operationalizat in test.Daca diferentele observate in grupurile implicate sunt inconsistente, neconcordanta cu
diferentele observate la scorurile la test conduce la deformarea instrumentului sau a
administrarii.
7. Tehnici statistice pentru evaluarea deformarii itemilor
Stepen Sireci face distinctia intre impactul itemului si functia diferentiala a itemului
(DIF). Impactul itemului conduce la o diferenta semnificativa intre grupurile implicate in
cercetare privitoare la un item. Exemplu: un grup are o proportie mai mare de examinati care a
raspuns corect la un grup decat celalat grup, asfel ca impactul itemilor poate fi apreciat
datorita diferentelor existente sau sa se datoreze deformarilor suferite de acel item.
Analiza DIF incearca sa precizeze daca impactul itemului de datoreaza diferentierii de
performanta intre cele 2 grupuri sau se datoreaza deformarilor itemilor. Pentru aceasta
analiza, examinatorii sunt egalizati pe baza capacitatii, aptitudinii masurate de test. Subiectii
20
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 21/24
Bazele Constructiei Testelor Psihologice
apartinand acestor 2 grupuri diferite, egale din punct de vedere al performantei, ar trebui sa
raspunda in mod similar. In caz contrar, itemul functioneaza diferit in cele 2 grupuri.
Analiza impactului itemului si DIF sunt elemente de natura statistica. Analiza deformarii
itemului este un demers calitativ. Un item este deformat la nivelul unui grup daca subiectii din
acel grup obtin rezultate mai slabe decat grupul similar. De asemenea, ratiunea acestei
performante mai slabe tine de constructul operationalizat in instrumentul de masurare. Pentru
a afirma ca exista o deformare a itemului ar trebui identificata o caracteristica a acestuia care
este prezenta intr-un grup si nu este prezenta in celalalt. Exemplu: un concept familiar pentru
un singur grup. Statisticile utilizate utilizate in deformarea itemilor cauta sa identifice itemii
care functioneaza diferit in grupurile considerate grupuri care trebuie egalizate din punct de
vedere al capacitatii caracteristicii masurate.
Odata ce itemii deformati au fost identificati, ei sunt supusi unor analize calitative in
scopul explicarii diferentei constatate. Atunci cand explicatiile acestei diferente par sa nu
aduca argumente ca itemii intr-adevar masoara caracteristica operationalizata, itemii sunt
catalogati ca fiind deformati.
8. Metodele utilizate in analiza functionarii diferentiate a itemilor:
1) metoda delta plot (tabelul D);
2) metoda randomizarii;
3) metoda regresiei;
4) metoda Hi patrat (Lord);
5) teoria raspusurilor la itemi (TRI)
1)= se aplica pentru itemii cu raspuns dihotomic. In studiu sunt implicate 2 grupuri: unul
provenind din cultura tinta, altul provenind din cultura sursa. La nivelul ambelor se calculeazavaloarea P (proportia subiectilor care au raspuns corect la item sau afirmativ daca este un test
de capacitate). Se creeaza un tabel cu dubla intare, unde pe ordonata se trec valorile lui P
pentru un grup cultural, iar pe abscisa valorile lui P pentru celalat grup cultural. Utilizand
aceste 2 axe, fiecare item va fi reprezentat ca un punct de intersectie a 2 valori (P dintr-o
cultura si P din alta cultura). Daca dificultatile itemilor sunt identice in cele 2 grupuri, atunci
itemii, respectiv punctele care ii reprezinta, se vor dispune pe o linie care este inclinata la 45
grade de linia orizontala. Chiar in cazul cand itemii prezinta aceeasi dificultate, o anumita
abatere de la linia dreapta este de asteptat datorita unor erori de esantionare. Daca un item este
mult mai dificil sau daca anumite persoane sunt de acord cu propozitia respectiva, intr-un
grup acel item se va situa mai departe de linia dreapta. El va fi considerat ca avand un
potential de deformare. Daca linia nu trece prin sistemul de origine al celor 2 axe, aceasta
reflecta diferentele fata de medie. Itemii care au fost identificati ca avand o functionare
diferentiata, au fost reprezentati cu puncte negre si se situeaza in afara liniilor drepte. Ei
urmeaza sa faca obiectul unor analize pentru a fi modificati sau indepartati.
21
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 22/24
Bazele Constructiei Testelor Psihologice
2)= Indexul de standardizare a fost propus in 1986 de Dorans si Kulik. El se bazeaza pe o
valoare P conditionata. Aceasta valoare implica calcularea valorii P pentru fiecare item,
valoare care este pusa in relatie cu scorul total la test.
Exemplu: persoanele examinate prin versiuni lingvistice diferite ale aceluiasi item ar
putea fi egalizate din punct de vedere al scorului total la test. Apoi pentru subiectii cu acelasi
scor la test este calculata si comparata proportia de examinati care au raspuns corect. Daca
itemul nu are probleme ar trebui ca cele 2 grupuri sa performeze asemanator. Acest proces
este repetat pentru toate scorurile generale obtinute.
5)= Si aceasta metoda se aplica in special itemilor cu raspuns dihotomic. Esentialul ei
este de a evalua daca poate fi utilizat un set comun de parametri ai itemului pentru a descrie
daca acel item functioneaza asemanator in grupurile culturale luate in considerare. Utilizarea
TRI pentru studiul comparabilitatii si echivalentei itemilor pentru aptitudine scolara si a
adapatarii sale pentru populatia spaniola. In primul desen se observa ca in cele 2 grupuri
itemul respectiv functioneaza diferit. Paradoxal, performantele grupului latin sunt mai mari
decat in grupul american ca urmare a analizei itemilor. Curbele pentru cele 2 grupuri in al 2-lea desen sunt identice. Aceasta arata ca indivizii de la toate nivelele trasaturii latente din
ambele grupuri, au aceeasi probabilitate de a da un raspuns corect la item. Ca atare el este
comun celor 2 variante ale testului.
9. Utilizarea subiectilor bilingvi in evaluarea versiunilor culturale diferite
ale unui test
O alta metoda de evaluare a echivalentei a 2 versiuni diferite ale unui test, o constituie
administrarea versiunilor unui grup de subiecti care au competente egal dovedite in ambele
limbi. Ratiunea acestei metode este aceea ca utilizand un singur grup de subiecti sunteliminate efectele datorate diferentelor intre grupuri. Pe de alta parte se dobandeste o
echivalenta inalta a celor 2 masuratori. Exista asfel mult mai multe sanse ca diferentele de
performanta intre cele 2 grupuri sa se datoreze mai degraba testului insusi si nu diverselor
surse de deformare. De obicei subiectii bilingvi sunt selectionati cu ajutorul unor teste
speciale care evalueaza competenta intr-o limba sau alta. Dincolo de avantajele reale ale
acestei metode, exista si o serie de inconveniente.
Unul dintre dezavantaje este acela ca subiectii bilingvi vor performa mai bine in limba
materna decat in cealalta limba chiar daca cele 2 versiuni ale itemului sunt echivalente. Un al
2-lea dezavantaj il constituie faptul ca persoanele bilingve nu sunt totusi identice din punct de
vedere al atitudinilor lingvistice, al eficacitatii si al background-ului. In general, subiectii
bilingvi sunt utilizati pentru a identifica itemii ancora. Ei sunt implicati intr-un design de
cercetare menit sa evalueze diferentele de limbaj. Se utilizeaza un set de itemi care sunt
considerati echivalenti in cele 2 limbi (itemii ancora). In cazul acestor itemi, diferentele de
performanta intre 2 grupuri pot fi utilizate in vederea ajustarii scorurilor la una din cele 2
22
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 23/24
Bazele Constructiei Testelor Psihologice
forme paralele ale testului. De asemenea, ei mai pot fi utilizati in vederea realizarii unei scale
comune celor 2 versiuni.
Exemplu: WAIS contra EIWA (testul WAIS adaptat pentru populatia hispanica in SUA).
Imediat de la aplicarea lui, psihologii au observat diferente notabile intre WAIS ai EIWA. La
EIWA se obtineau scoruri mai mari la anumite subteste. Dupa 20 de ani au fost publicate
diferentele inregistrate. Diferenta de scoruri a implicat si implica diverse opinii privind sursa
lor. Probabil aceste diferente ar putea reflecta senzitivitatea culturala a hispanicilor, adica ar fi
vorba de estimari mult mai valide a inteligentei decat altele facute cu WAIS. Ar putea fi
credibila pentru ca WAIS aplicat in alta limba ar putea inregistra tot felul de deformari ceea
ce ar determina ca EIWA sa fie credibil.
Pe de alta parte poate fi valabila si alternativa a IQ-urilor estimate. Se datoreaza faptului
ca sunt masurate caracteristici psihologice diferite intr-o anumita masura decat in WAIS. O a
3-a opinie contesta pretentiile de validitate ale lui EIWA. Este posibil ca EIWA sa fi fost de la
inceput supralicitata datorita faptului ca provenea dintr-o baterie cu o licitatie deosebita ca
WAIS.
10. Analiza modului de realizare a esantionului
Autorii suspicioneaza faptul ca ar putea exista probleme legate de standardizarea
esantionului, anume ca el a fost realizat in concordanta cu rezultatul recensamantului din
1960, spre deosebire de structura actuala a populatiei americane. In 1966-1967 esantionul
normativ a fost realizat prin stratificare, adica s-a introdus in mod proportional urmatoarele
criterii ale subiectilor hispanici: varsta, sex, regiune geografica, ocupatie, educatie, rezidenta
urbano-rurala.
Analiza gradului de suprapunere intre datele de recensamant (1960) si structuraesantionului (HI patrat) arata ca factorul sex a fost in mod adecvat respectat. Totusi, o lucrare
de disertatie (1969) a investigat relatia intre scorurile la EIWA si zona de rezidenta in Puerto-
Rico. S-a descoperit ca barbatii performau mai bine decat femeile, subiectii din zona rurala
performau mai bine decat cei din zona urbana. Cu cat nivelul de educatie era mai mare, cu atat
rezultatele erau mai bune (performanta la test ridicata). Toate acestea arata ca pot fi
incriminate anumite surse de BAES la nivelul de construct. Un alt studiu arata ca, in ciuda
diferentelor de continut intre EIWA si WAIS, exista o inalta concordanta din punct de vedere
psihometric. Dimensiunea intelectuala de baza din WAIS este si in structura EIWA.
Alte studii au fost realizate pe persoane cu diverse afectiuni cum sunt starile anxioase.
Doi cercetatori, Martinez si Spilberger au administrat aceluiasi esantion de subiecti (40 de
pacienti psihiatrici) testul STAI. A fost confirmata predictia ca persoanele cu nivel ridicat de
anxietate vor performa mai slab la EIWA.
Cercetatorii Hambleton si Merenda au luat in considerare in analiza echivalentei celor 2
baterii de teste de inteligenta, teme privitoare la echivalenta traducerii si adaptarii
instrumentului precum si studierea validitatii concurente realizand o metaanaliza a celor 2
23
7/30/2019 Bazele Constructiei Testelor Psihologice - Curs
http://slidepdf.com/reader/full/bazele-constructiei-testelor-psihologice-curs 24/24
Bazele Constructiei Testelor Psihologice
studii intreprinse in aceasta directie. Lopez si Romero (1988) au realizat una dintre cele mai
serioase examinari a structurii EIWA. Obiectivul a fost acela de a identifica diferentele
specifice intre EIWA si WAIS privitoare la administrare, continut si scorare si la
caracteristicile standardizate ale esantionului. Cei doi autori au constatat ca exista doar 5
subteste in EIWA care au proceduri de administrare identice ca si WAIS, restul difera (de
exemplu nr de itemi de la care se incepe proba sau numarul de esecuri de la care proba
inceteaza sa fie administrata). Doar doua subteste sunt complet identice (DIGIT SPAN si
subtestul de asamblare de obiecte). Au fost gasite diferente majore cu privire la modalitatea de
scorare. Plecand de la aceste rezultate prezentate de diversi autori, a fost realizat un studiu
privitor la gradul de echivalenta intre cele 2 variante ale testului in ceea ce priveste
metodologia si procedurile utilizate de autori.
Exemplu: Un grup de subiecti cu varste intre 17 – 59 ani. Acestia erau persoane normale,
fara simptome psihiatrice. Principalul criteriu de selectie a fost cel referitor la competente
lingvistice. Ei au inclus in studiu persoane care aveau acelasi nivel de competenta in limba
engleza si limba spaniola. Administrarea testului - Subiectii au fost examinati atat cu EIWA cat si cu WAIS –R.
designul experimental a fost unul cu masuratori repetate. Pentru a contracara efectul de
procentare s-a procedat astfel: ½ din lotul de subiecti a primit pentru testare EIWA, iar
cealalta jumatate a primit WAIS. Administarea s-a facut la un interval de 1-2 saptamani.
Rezultatele testarii - Rezultatele au fost supuse analizei factoriale prin metoda Hotelling.
S-au constatat diferente semnificative.
Concluziile testarii - Se repeta ideea ca scorurile mai mari la EIWA sunt datorate
nivelului de motivare mai mare la populatia hispanica. Diferentele apar datorita faptului ca
cele 2 teste masoara trasaturi psihologice diferite, concluzionand faptul ca exista probleme cu
EIWA. Standardizarea esantionului a prezentat diferente la nivelul regiunii, al educatiei si lacel cultural. Au fost constatate probleme legate de standardizare si fidelizare.