Campionamento Campione: parte dellinsieme universo interessato dallipotesi di ricerca Popolazione di riferimento: insieme dei casi potenzialmente reperibili

Campionamento• Campione: parte dell’insieme

universo interessato dall’ipotesi di ricerca

• Popolazione di riferimento: insieme dei casi potenzialmente reperibili (universo)

• Determinato dall’ipotesi di ricerca e dalle variabili in gioco

• Determinante rispetto all’analisi e all’interpretazione dei risultati

Campionamento

Caratteristiche da perseguire nella scelta del campione:

• adeguatezza rispetto all’ipotesi di partenza

• rappresentatività rispetto alla popolazione

• controllo della distorsione• affidabilità

Campionamento

Fattori di distorsione della stima campionaria:

• influenza i risultati della ricerca• non è controllabile dal disegno

sperimentale• determinata dalla tecnica di

campionamento utilizzata

CampionamentoCampionamento

Paradosso centrale del campionamento (Stuart, 1996)

impossibilità di conoscere dall’esame del campione se sia

esso scevro di distorsioni


Distorsione da selezione

• Il campione è adeguato se e solo se non è influenzato da altre variabili che non siano quelle in studio

• Per assicurarci questa situazione occorre attuare un meccanismo di selezione casuale


Campionamento casuale

• consiste nella scelta di una campione attraverso un meccanismo casuale

• attraverso questo metodo è possibile conoscere le probabilità di selezione del campione

Tecniche di Campionamento

Il campione casuale

• è privo di distorsioni dovute alla selezione

• è l’unico tipo di campione sul quale è possibile fare inferenza statistica

Tecniche di Tecniche di CampionamentoCampionamento

• Esistono diverse tecniche di campionamento

• Rimane fondamentale la spiegazione delle procedure di selezione che determinano i risultati della ricerca


Campionamento casuale semplice

permette di selezionare un campione dalla popolazione in

modo da avere la stessa probabilità per ogni possibile campione


Campionamento stratificato

suddivide il campione in strati, ovvero in sottogruppi, le cui

proporzioni corrispondono alla suddivisione della popolazione


• per formare gli strati in modo casuale bisogna estrarre un campione casuale semplice da ogni strato

• incrementa la precisione del campionamento

• la corretta stratificazione dipende solo dalle conoscenze e dall’abilità dello sperimentatore

Tecniche di Campionamento: Tecniche di Campionamento: Campionamento stratificato

Campionamento a grappoli

• nella prima fase la popolazione è suddivisa in gruppi - chiamati grappoli o cluster – ciascuno dei quali non ha caratteristiche diverse dagli altri

• nella seconda fase da tutti i grappoli ne viene selezionato casualmente uno


• La differenza fra gli strati e i grappoli sta nel fatto che mentre la selezione casuale degli strati avviene a livello della popolazione la selezione casule dei grappoli avviene a livello di unità della popolazione

• comporta una perdita di precisione che può essere in taluni casi giustificata da ragioni economiche

• Naturalmente maggior variabilità esiste all’interno dei grappoli corrisponde a maggior precisione di campionamento

Tecniche di Campionamento: Tecniche di Campionamento:

Campionamento a grappoli

Campionamento a stadi

• Dopo aver selezionato due o più grappoli si seleziona all’interno di essi un individuo sempre attraverso un campionamento casuale semplice

• Oltre al caso descritto di due stadi si possono verificare ripartizioni a più stadi che determinano una maggior flessibilità del progetto a discapito della rappresentatività del campione


Campionamento

Numerosità campionaria

• Va determinata a priori

Dipende : da H0 e da H1

dalla potenza del test

dalla minima differenza apprezzabile

dalla varianza casuale

da alpha

Confronto fra le tecniche di campionamento

• Casuale semplice: è alla base delle altre tecniche, è attuabile quando la popolazione è omogenea rispetto alla variabile in studio

• Stratificato: applica un metodo più preciso ma meno casuale

• A grappoli e a stadi: applica un metodo più casuale ma meno preciso

Fallacia nella Stima Campionaria e nel Test

Statistico

• Ambiguità

Fallacia• Errore

“Una fallacia è un X che sembra Y, ma è Z” (Johnson, 1987)

Campione e Inferenza Statistica

• E’ attraverso il campione che posso fare inferenze in campo statistico

• Non esiste inferenza senza fallacie così come non esiste campionamento senza errore

• Controllo dell’errore attraverso il metodo

Campione Rappresentativo

• Rappresenta la popolazione alla quale si riferisce ma non lo è né per caratteristiche né per numerosità.

• Campione Rappresentativo:»Controllo distorsione nella selezione Casualità»Corrispondenza fra campione e popolazione

Precisione

Questione di Metodo

• Errori non campionari sono eliminabili

• Errore campionario controllabile in quanto misurabile

• Piano di campionamento: modalità di selezione e parametri/stimatori da misurare

Precisione e Casualità

Tanto più cerchiamo di controllare la precisione tanto più facilmente possiamo selezionare un campione non casuale

La rappresentatività è data dalla differenza tra stima campionaria e parametro della popolazione

“The surer you want to be the less you have to demand”

(Alan Stuart, 1968)

Errori legati alla Dimensione del Campione

La dimensione ottimale del campione è quella per cui l’errore di campionamento non va oltre una certa soglia

Efficienza: precisione per unità di costo

Può esser controllata solo nel caso del campionamento probabilistico

Omogeneità e Numerosità

• Più n si avvicina a N più l’errore di campionamento diminuisce

• Maggiore è la variabilità della stima campionaria minore è l’affidabilità

Esempi di fallacie collegate a distorsioni nel

campionamento

– Principio inficiato: Casualità

– Principio inficiato: Idoneità

– Principio inficiato: Numerosità adeguata

Fallacia e Principio di Casualità

Se il campionamento non è probabilistico non può esser considerato rappresentativo della popolazione studiata.

Le conclusioni a cui portano i risultati del campione non saranno facilmente identificabili in una variabile.

Esempio: applicazione di più test statistici sullo stesso campione per diverse dimostrazioni

Disegno sperimentale: si ipotizza la diversità fra tre campioni indipendenti riguardo i punteggi ottenuti in un questionario che misura il QI

Gruppo 1 Gruppo 2 Gruppo 3

99 102 89

100 103 92

98 107 75

96 102 87

101 110 90

90 100 99

89 103 98

T test: Confronto: 1 con 2, 1 con 3, 3 con 2. Tre risultati diversi ciascuno dei quali non è

indipendente dall’altro:T1= -3.45 p=0.005, T2 = 1.742 p>0.05,

T3=4.21 p=0.001

Anova: crea matematicamente confronti indipendenti e dà un unico risultato:

F= 10.23, p<0.001

VAR00001

96.1429 7 4.81070

103.8571 7 3.43650

90.0000 7 8.00000

96.6667 21 7.96450

1.00

2.00

3.00

Totale

Media N Deviazione std.

Applicazione di test univariati su esperimenti

multivariati

Disegno sperimentale è multivariato ovvero le variabili sono fra loro interdipendenti:

Esempio: due scale di misurazione dell’intelligenza

Supponiamo di confrontare due gruppi in base ai punteggi ottenuti alle due scale

98.818 2.301 94.002 103.634

93.900 2.413 88.849 98.951

102.273 1.872 98.354 106.191

95.600 1.964 91.490 99.710

1.00

2.00

1.00

2.00

Variabile dipendente

VAR00001

VAR00002

Media Errore std. Limite inferioreLimite

superiore

Intervallo di confidenza 95%

Dai test univariati abbiamo due risultati diversi: F1= 2.1 p>0.05 F2 = 6.04 p=0.024

Che possono avere solo valore descrittivo

Dal test multivariato ho un unico risultatoCalcolato sulla base dell’interdipendenza

fra le due variabili F = 4.17 p=0.032 Che ha valore dimostrativo

Fallacia e Principio di Idoneità

Quando le variabili misurate sul campione sono troppo eterogenee i risultati non danno nessuna indicazione oppure danno indicazioni fallaci rispetto alla popolazione generale

Esempi: regressione su gruppi non omogenei, paradosso di Simpson

Regressione su gruppi non omogenei

y = 2.2161x - 2.9788

R2 = 0.9285

0

5

10

15

20

25

30

0 2 4 6 8 10 12 14 16

Misura della relazione fra due parametri X e Y in campione composto da due popolazioni diverse con valori medi nei due parametri diversi

Il coefficiente R2 è altissimo e la relazione è significativa dal punto di vista dell’analisi statistica che non tiene conto della diversità fra le due subpopolazioni

Paradosso di Simpson

Immaginiamo di dover confrontare l’efficacia di due diverse terapie (Terapia A, Terapia B) nel miglioramento di un particolare stato patologico

Tutti i soggetti Migliorati Non migliorati

Percentualedi migliorati

Terapia A 20 20 50

Terapia B 24 16 60

La terapia B è la più efficace perché produce miglioramento nel 60% dei casi, mentre la terapia A arriva solo al 50%.

… Considerando la differenza fra maschi e

femmine nelle due terapie…

Solo maschi Migliorati Non migliorati Percentualedi migliorati

Terapia A 12 18 40

Terapia B 3 7 30

Solo femmine Migliorati Non migliorati Percentualedi migliorati

Terapia A 8 2 80

Terapia B 21 9 70

sia nei maschi che nelle femmine è la terapia A a produrre una percentuale maggiore di miglioramenti e non la terapia B

Fallacia e Adeguatezza della Numerosità

Quando il campione non è sufficientemente numeroso per quel tipo di variabile presa in esame e per quel tipo di differenza che si vuole misurare si può concludere erroneamente che non ci siano differenze.

Esempio: numerosità non sufficiente

Fallacia e principio della causalità

Attraverso il test statistico non è possibile stabilire relazioni causali ma solo differenze. Il test è tutto sbilanciato nel senso di falsificare H0.

Esempio: due eventi prossimi in senso temporale vengono considerati l’uno la causa dell’altro.

Utilizzando un campione opportuno per dimensioni e rappresentatività qualsiasi idea sarebbe dimostrata. Ma siamo interessati a dimostrare idee qualsiasi o differenze interessanti dal punto di vista clinico?

Stabilire a priori le caratteristiche del campione significa assicurare la validità delle idee che si intende dimostrare

“Post hoc, ergo propter hoc”

Campionamento

• Mappa concettuale• Domande in itinere

Validità nella ricerca

Nell’ambito ricerca sperimentale:

caratteristiche di

falsificabilità, generalizzabilità, replicabilità o appropriatezza nella descrizione e nell’utilizzo dei test statistici

Validità di un test

In ambito psicometrico: attributo del test che permette di stabilire se il test stesso misura quello che effettivamente vuol misurare.

caratteristiche:la struttura del test deve essere unitaria e le relazioni fra il test e altri test che misurano costrutti teorici analoghi.

ValiditàValidità interna

• sono stabilite in modo appropriato le relazioni fra le variabili in studio

• sono escluse dal disegno sperimentale quelle variabili confondenti

Validità

Esempi di minaccia alla validità interna:

• Effetto regressione (studi longitudinali)

• L’effetto apprendimento: alcuni fenomeni se studiati in momenti successivi sono influenzati dalla consapevolezza del compito e dalla conoscenza della prova

• maturazione degli individui

Validità

Compito dello sperimentatore è quello di misurare l’effetto del fenomeno sia in relazione al ripetersi delle prove che indipendentemente dalle ripetizioni

ValiditàEsempio: disegno sperimentale di Solomon per il controllo dell’effetto trattamento, apprendimento e maturazione.

Suddivisione in gruppi:• Il primo gruppo (I gruppo – sperimentale) è

sottoposto a pretest-trattamento e posttest• Il secondo gruppo (II gruppo - di controllo) è

sottoposto a pretest e posttest senza trattamento• Il terzo gruppo (III gruppo - sperimentale) è

sottoposto a trattamento e post-test.• Il quarto gruppo (IV gruppo – di controllo) è

sottoposto solo a post-test.

Validitàa Variabili confondenti:

fonte di minaccia principale per la validità interna in quanto non controllabili dallo sperimentatore

sono spesso distinte in sistematiche e asistematiche.

ValiditàVariabili sistematiche

si riferiscono a quelle variabili che in ogni piano della ricerca agiscono in modo incontrollato.

Variabili asistematichesono caratteristiche di situazioni particolari di quel disegno di ricerca e solo di quello

Tuttavia … dipende sempre dal disegno di ricerca

ValiditàUn esempio di varibili asistematiche sono quelle legate

alla mortalità o ai drop-out dei soggetti del campione (studi longitudinali).

• Mortalità: perdita non recuperabile di soggetti del campione durante il corso della ricerca.

• Drop-out: o le mancate risposte a una parte della ricerca o la perdita recuperabile di soggetti nel corso della ricerca

analisi statistiche della popolazione che all’interno del campione non ha terminato la ricerca

Validità

Un esempio di analisi per controllare la mortalità e i drop-out è quella che viene definita Intention- to-treatment- analysis che, in modi diversi a seconda del metodo che viene seguito, confronta la popolazione di soggetti che ha terminato lo studio con quella che non lo ha terminato.

Validitàc Relazioni fra le variabili

• Nel disegno sperimentale il controllo della validità interna si effettua soprattutto sulla conoscenza delle relazioni fra le variabili

• Diversi sono i tipi di variabili che sono utilizzati nelle ricerche sperimentali. Solitamente si indagano gli effetti che una variabile definita fattore determina su una variabile definita dipendente.

Validità

• La distinzione fra variabili dipendenti e fattori deve essere indagata dallo sperimentatore in base all’ipotesi che vuole verificare. Sebbene alcuni casi presentino una chiara distinzione fra le variabili molte situazioni si caratterizzano per relazioni più ambigue.

Validità• I casi di chiara relazione causale fra variabile

dipendente e fattore sono dette relazioni genuine. Ne è un esempio la relazione fra altezza e peso.

• I casi in cui la relazione è genuina ma bidirezionale ovvero entrambe le variabili possono essere considerate influenti l’una sull’altra, sono definiti da una relazione mutua.

• Quando invece non sono chiare le definizioni fra le variabili allora la relazione si definisce spuria. (Un esempio è dato dall’utilizzo di farmaci in base alla gravità della patologia).

ValiditàValidità esterna

insieme di caratteristiche della ricerca che permettono di generalizzare i risultati ottenuti dalla ricerca alla popolazione generale che rappresenta il campione analizzato

Validità

Validità di costruttoriguarda la teoria di riferimento che si vuole testare tramite la ricerca.

Per verificare la validità del costrutto teorico alla base della ricerca occorre che sia possibile tradurre il costrutto stesso in variabili misurabili.

Diversi passi:• Elaborazione preoperativa del costrutto. • Misurazione. • Verifica adeguatezza in base alle variabili

sudiate. • Costrutti confondenti. Sono quei costrutti che

possono essere determinanti rispetto al costrutto in studio e che interferiscono con esso in modo non controllato dallo sperimentatore.

Validità

ValiditàValidità statistica o predittiva

si riferisce alla verifica statistica delle ipotesi sperimentali in ogni suo passo, dalla formulazione dell’ipotesi al controllo degli errori di I e II tipo e alla verifica della relazione fra le variabili dipendenti e i fattori

Sovrapposizione fra validità statistica e validità interna (validità predittiva)

ValiditàValidità ecologica• Il concetto di validità ecologica è stato

introdotto nell’ambito della ricerca psicologica per sottolineare l’importanza della distinzione fra comportamento investigato in laboratorio e comportamento reale del soggetto nella realtà abituale. Il valore di questo concetto è verificabile in alcune condizioni teoriche particolari nelle quali interessa valutare la differenza fra ambienti diversi di stimolazione.

Validità

Artefatti

al pari delle variabili confondenti sono fattori legati al soggetto o allo sperimentatore che inficiano i risultati della ricerca e che inducono a conclusioni erronee in modo non controllato dallo sperimentatore stesso.

Validità• a Fattori legati al ricercatore

• L’Effetto Rosenthal: lo sperimentatore in modo inconsapevole riesce a trasmettere al soggetto le proprie aspettative riguardo ai risultati della ricerca e quindi alterandone il comportamento a proprio favore.

• Questo effetto si elimina utilizzando un disegno sperimentale a doppio cieco ovvero tenendo all’oscuro chi conduce la ricerca delle ipotesi sperimentali.

Validità

• L’Effetto Pigmallione è lo studio dell’effetto Rosenthal nel campo dell’educazione. Grazie a questo effetto più un soggetto è percepito da chi lo valuta in senso positivo più sarà in grado di ottenere una valutazione positiva.

Validità

• Altri fattori non espliciti e legati a desiderabilità sociale

• Controllo: figure alternative che conducono la ricerca

Validitàb Fattori legati al soggetto• i soggetti sono fiduciosi quando si pongono in

modo genuino rispetto alla ricerca; • i soggetti buoni sono quelli che intendono

confermare quella che credono essere l’ipotesi dello sperimentatore;

• i soggetti negativi sono quelli che vogliono invece disconfermare lo sperimentatore;

• i soggetti apprensivi pensano di essere valutati dallo sperimentatore e quindi rispondono in modo da dare un’immagine positiva di sé.

Validità

c Fattori legati alla situazione sperimentaleRiguardano tutti quei comportamenti che il soggetto mette in atto a causa delle aspettative e delle modifiche che genera la situazione sperimentale che alterano la prestazione del soggetto nel compito.

• Esempio: Effetto placebo


• Americal Psychological Association quattro aspetti: il contenuto, la validità esterna, la validità rispetto a un criterio e il costrutto.

• Ogni questionario o test psicometrico deve essere sottoposto a una verifica della validità nella quale sono valutate le caratteristiche del test su un campione appositamente creato.


Validità di contenuto• La validità di contenuto misura quanto

gli item del test misurano dell’argomento che il test si propone di misurare.

• Per valutare la validità di contenuto ci si affida al giudizio di esperti e alla letteratura che sull’argomento ha elaborato materiale a riguardo.


Validità interna• la validità interna misura quanto gli item del

test misurano lo stesso costrutto, ovvero la loro correlazione. Ci si aspetta, infatti, che gli item di un test siano fortemente correlati fra loro.

• La validità interna viene solitamente valutata tramite l’analisi fattoriale che permette di identificare le dimensioni misurate dal questionario e la correlazione fra le dimensioni e gli item.


Validità rispetto a un criterio• La validità rispetto a un criterio misura

quanto il questionario è in relazione a altre misure (che fanno da criterio) che si ipotizza essere legate ad esso.

• Questa validità viene verificata tramite l’analisi della correlazione fra il questionario e il criterio ed è valutata tramite il coefficiente di correlazione che indica il tipo e la forza della relazione fra i due.


Validità rispetto a un criterio• Validità predittiva nella quale ha rilievo

la dimensione temporale, quindi è la forza con cui il test è in grado di prevedere il rendimento futuro del criterio.

• Validità concorrente nella quale il test e il criterio sono valutati allo stesso tempo


Validità di costruttoLa validità di costrutto si verifica tramite una serie di osservazioni e dati che forniscono una informazione sulle caratteristiche del costrutto


All’interno della validità di costrutto vengono distinte:

• validità convergente: esprime il grado di accordo tra due o più misure di uno stesso costrutto

• validità discriminante: valuta il grado di divergenza fra costrutti diversi

• Entrambi i tipi di validità vengono espressi tramite coefficienti di correlazione


• Mappa concettuale

• Domande in itinere

Attendibilità

misura l’accuratezza della misurazione

si esprime come capacità nella misura di produrre sempre gli stessi risultati in rapporto alla stima dell’errore casuale

Attendibilità

• Il coefficiente o indice di attendibilità misura il rapporto fra la precisione di misura e l’errore.

• Ha valori compresi tra 0 (massima inadeguatezza) e 1 (massima precisione).

• Può essere calcolato attraverso indici di correlazione diversi a seconda del tipo di dati che sono considerati.

Attendibilità Stime dell’attendibilità

Esistono diversi metodi per il calcolo degli indici di attendibilità ciascun dei quali produce risultati diversi in quanto basato su considerazioni teoriche particolari.

AttendibilitàTest paralleli: agli stessi soggetti sono somministrati due forme parallele di un test (ovvero che misurano lo stesso costrutto e hanno la stessa struttura) in tempi di somministrazione vicini tra loro.L’attendibilità è calcolata attraverso un indice di correlazione fra i due punteggi. limite: misura l’interscambiabilità dei due test che non sono mai realmente equivalenti

Attendibilità

Test-retest: agli stessi soggetti è somministrato lo stesso questionario ma in tempi diversi.È calcolata la correlazione fra le due misure. Questa attendibilità ha l’accezione di stabilità nel tempo. limite: decisione del tempo che intercorre fra una prova e l’altra che è difficile da stabilire e che inevitabilmente misurato sugli stessi soggetti dovrebbe esser considerato come misura ripetuta.

Attendibilità

Split-half: divide il test a metà e valuta la correlazione fra le due parti.Va applicato quando il test è suddivisibile in due parti equivalenti che misurano lo stesso costrutto. L’attendibilità deve essere considerata sul test completo quindi occorre correggere la stima effettuata sulle singole parti. limite: la divisione split-half è sempre arbitraria.

Attendibilità: coerenza interna

Coerenza interna: grado di accordo fra più misure riguardanti lo stesso costrutto teorico ottenute in una stessa somministrazione. Può esser calcolata come relazione fra gli items, fra gli items e il totale, fra gli items e le sottoscale e fra le sottoscale.

Indici di coerenza interna

Coefficiente di Kuder-Richardson (KR-20)si applica nel caso in cui gli items siano dicotomici valuta la coerenza interna del test

Alpha di CronbachSi applica con scale a intervalli equivalenti ed è il coefficiente più utilizzato in ambito psicometrico.Confronta la varianza prodotta dagli items con al varianza totale. Valuta quindi quanto sono intercorrelati fra loro gli items.


L2 di Guttman

• si pone in alternativa all’Alpha di Cronbach e misura anche la covarianza rispetto al primo


Attendibilità

Fattori che influenzano l’attendibilità

• lunghezza del test (ovvero numerosità degli items)

• numerosità del campione• rappresentatività del campione• modalità di somministrazione del test• tipologia degli item

Attendibilità

• Mappa concettuale• Domande in itinere• Esempio• Esempio Spss

Documents

Campionamento Campione: parte dellinsieme universo interessato dallipotesi di ricerca Popolazione di riferimento: insieme dei casi potenzialmente reperibili