AF_&_AI_costruzione_test [modalità compatibilità]Vantaggi del
metodo
Rispetto ad altri metodi per costruire test, le procedure basate
sull’AF permettono di individuare punteggi chiaramente
interpretabili dal punto di vista teorico.
Questo perché la AF ha una stretta parentela con la teoria classica
dei test. Altri metodi più empirici non permettono di
comprendere il perché delle differenze fra i punteggi.
Test sviluppati con buone AF permettono di interpretare il
punteggio di ogni soggetto come il suo “livello” sul costrutto
indagato
Dimensionalità In genere, si utilizza l’analisi fattoriale
per
costruire test unifattoriali Ad ogni punteggio corrisponde un
solo
costrutto. Il punteggio è univocamente interpretabile.
Vi sono però degli inventari o batterie che includono più test,
ognuno di essi unifattoriale.
Tali fattori vengono spesso indagati tramite un’analisi congiunta
di tutte le misure della batteria, ed una successiva rotazione dei
fattori emersi.
Si spera ogni fattore corrisponda al costrutto atteso.
Come ottenere un test unifattoriale Un modo è quello di sviluppare
uno
strumento che intenda misurare un unico costrutto. L’analisi
fattoriale degli item andrà alla ricerca
di un unico fattore. Ma ricordiamo che il primo fattore è
spesso
inquinato da metodo ed errore.
È spesso più utile includere nell’inventario vari costrutti.
L’analisi fattoriale degli item, seguita da
rotazione avrà il compito di confermare la presenza dei
fattori.
Questa procedura sembra più efficiente di quella basata su distinte
analisi unifattoriali
Gli item Campionamento o creazione degli item:
La batteria iniziale di item deve coprire in modo opportuno ognuno
dei costrutti teorici da testare.
Bisogna avere in mente di ottenere un test finale per ogni
costrutto di circa 5-20 item (indicativamente).
All’inizio abbondare con gli item. Alcuni item si riveleranno
inadatti Considerare una batteria di partenza con un numero
di item doppio per ogni costrutto rispetto alla lunghezza
desiderata per il test finale.
Caratteristiche degli item Riflettere attentamente sulla scala di
risposta
da prevedere. Molti test usano scale dicotomiche.
A volte ciò è ovvio e necessario: risposte giusto- sbagliato
Altre volte è una scelta arbitraria che limita la finezza
dell’informazione utilizzabile.
Le scale di risposta a intervalli equivalenti, con minimo 5
posizioni, dovrebbero venire privilegiate.
Bisogna tenere però conto di alcuni fattori. Difficoltà d’uso della
scala di risposta
• Considerare l’età e le capacità cognitive dei soggetti.
Adeguatezza teorica della scala di risposta rispetto alle
caratteristiche del costrutto.
Caratteristiche degli item Considerare il potere discriminativo
degli item Item troppo facili o difficili non sono utili.
Per item dicotomici, la difficoltà può essere espressa tramite la
probabilità p di osservare una risposta giusta.
Per item politomici, bisogna avere distribuzioni non troppo
distorte.
Oltre alla difficoltà, bisogna considerare la desiderabilità
sociale.
Ciò è particolarmente importante Nei test di personalità Nelle
misure di sintomi Nell’indagine di comportamenti devianti In ogni
strumento usato a fini di selezione
Campionamento dei soggetti Numerosità
Più grande è un campione, e meglio è. Purtroppo abbiamo sempre
pochi soldi, poco tempo,
né soldi né tempo. Idealmente dobbiamo considerare 5 soggetti per
item Per test lunghi, possiamo accettare 3 soggetti per
item. Caratteristiche del campione
Se il sesso è considerato una variabile importante per determinare
la dimensionalità o i punteggi del test, considerare due campioni
differenziati per genere.
La rappresentatività non è un problema cruciale. È invece
importante la variabilità del campione.
L’analisi Utilizzare la matrice di correlazione adatta al
tipo di item impiegati. Individuare il numero di fattori
teoricamente
sottostante alla batteria. Ruotare i fattori in modo
opportuno.
Rotazione obliqua: • Più generale, spesso teoricamente più sensata,
ma
praticamente più complessa da interpretare.
Rotazione ortogonale: • Caso particolare, forte assunzione teorica
(a volte non
sostenibile); più semplice interpretare fattori fra loro
indipendenti.
A volte è saggio, sebbene poco elegante, provare entrambe le
rotazioni.
Selezione degli item Un buon item deve:
Saturare nel fattore atteso Mostrare una saturazione elevata
(indicativamente > .30). Essere fattorialmente puro. Comportarsi
allo stesso modo in diversi
sottocampioni di interesse. Gli item che non mostrano tali
caratteristiche vanno: Buttati (spesso) Riconvertiti (a
volte)
Selezione degli item - Problemi Saturazioni doppie, o triple
Spesso l’item va buttato: è confuso
Saturazioni troppo basse L’item è estraneo ai fattori estratti: si
butta
L’item satura parecchio, ma dove non dovrebbe. Se l’item è
teoricamente coerente con la
dimensione su cui inaspettatamente satura, riconvertirlo.
Se non riusciamo a spiegarci il motivo della saturazione inattesa,
l’item si butta.
Selezione degli item - Problemi L’item si comporta in modo
diverso
attraverso sottocampioni (es: sesso).
In genere è più comodo avere un test composto in modo identico per
sottopopolazioni diverse. • Se misuro l’intelligenza, perché dovrei
avere test
diversi per maschi e femmine?
A volte però è necessario preparare versioni diverse del test,
tarate specificamente su alcune sotto-popolazioni. • Non posso
utilizzare lo stesso test di intelligenza
per gli analfabeti e gli alfabetizzati.
Dopo aver individuato una buona struttura fattoriale… Non si passa
subito alla
standardizzazione. Prima bisogna compiere alcuni passaggi
di controllo della bontà della soluzione fattoriale raggiunta.
Attendibilità di ogni test Replica della struttura fattoriale su
campioni
indipendenti. Validazione dei fattori.
soluzione fattoriale, occorre controllare l’attendibilità di ognuno
dei test considerati.
Se ogni fattore è sufficientemente forte, le attendibilità saranno
in genere soddisfacenti. Un fattore forte suggerisce buona
coerenza
interna. Al contrario, una buona attendibilità di un test non
garantisce la sua unifattorialità. L’attendibilità risente però del
numero di item
del test. Fattori composti da pochi item, sebbene forti,
spesso mostreranno scarsa attendibilità.
Replica dei risultati Come in ogni tecnica statistica, i
risultati
dell’analisi fattoriale dipendono in parte dalle caratteristiche
del campione. Il rischio è di raffinare la modellare la
struttura
fattoriale sulle caratteristiche del campione. L’obiettivo però è
ottenere una struttura dei
test applicabile a nuovi campioni. Come minimo va controllata la
replicabilità fra
maschi e femmine. Non è male anche tentare una replica
attraverso
diverse fasce di età. Molti test sono di provenienza
anglosassone:
va controllata la replicabilità della struttura nel paese in cui si
sta adattando il test.
Validità di costrutto L’AF ci informa sul numero di “cose”
misurate, e sulla coerenza e precisione con cui le abbiamo
misurate.
Non ci informa sul senso dei costrutti testati.
Va provata la validità (di costrutto e predittiva) dei test
sviluppati tramite AF. Validità di costrutto: posizionare i nuovi
test
in uno spazio di costrutti noti. • Tale indagine può essere
condotta tramite AF.
Validità predittiva: fondamentale nei test diagnostici e di
orientamento. • Può essere indagata tramite ANOVA,
regressione…
fondamentali: L’ampiezza del campione normativo. La sua
rappresentatività.
Teoricamente è necessario avere chiaro il tipo di individui cui è
destinato il test. A volte è sufficiente un unico insieme di
norme, valide per la popolazione generale. A volte è necessario
sviluppare norme
diverse per differenti sottopopolazioni.
Analisi degli item nella costruzione dei test
Cos’è Si basa sulla raccolta di una batteria di item,
che deve mostrare una forte correlazione con il totale del
test.
Pregi Si tratta di una procedura più semplice per
costruire un test, rispetto all’AF. Si basa sulla raccolta di una
batteria di item, che
deve mostrare una forte correlazione con il totale del test.
Si tratta quindi di un procedimento che tende a produrre test
attendibili.
Svantaggi l’elevata attendibilità non garantisce purezza
fattoriale, né validità di costrutto.
Item e campione Item
Per il campionamento degli item, vale quanto detto per l’AF.
Nell’analisi degli item, visto che non li fattorizziamo, è
necessaria maggiore cura nella creazione e scelta di item
teoricamente puri (misure di un unico costrutto).
Soggetti. La statistica utilizzata, la correlazione, è meno
esigente quanto a numerosità rispetto alla AF. Questo è un grande
vantaggio qualora si disponga
di piccoli campioni. Ciò però non significa che l’analisi degli
item elimina
tutti i problemi insiti nell’avere a che fare con piccoli
campioni.
Conclusioni L’analisi fattoriale è un metodo più sicuro,
informativo ed efficace per la costruzione di test.
Se i campioni sono piccoli, può convenire rivolgersi all’analisi
degli item.
Un buon compromesso è dato dall’applicazione successiva di analisi
degli item e dell’analisi fattoriale. L’analisi degli item permette
di sfrondare gli item
sicuramente poco attendibili L’analisi fattoriale è adatta a
controllare e raffinare
la dimensionalità degli item selezionati. Bisognerebbe comunque
applicare l’analisi fattoriale