86
Università degli Studi e Campus Facoltà di Scienze Psicologiche Corso Psicometria I Prof.ssa Simona Musacchio Ing. Gianluca Pizzuti Relatori

Seminario psicometria I

  • Upload
    msmpio

  • View
    2.082

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Seminario psicometria I

Università degli Studi e Campus

Facoltà di Scienze PsicologicheCorso Psicometria I

Prof.ssa Simona Musacchio

Ing. Gianluca Pizzuti

Relatori

Page 2: Seminario psicometria I

Introduzione

Cos' è la statistica?

Definizione Trilussa (nota di colore) La  statistica  fornisce  gli  strumenti  per 

analizzare i fenomeni collettivi (caratteristiche fisiche di un gruppo di soggetti).

Statistica descrittiva Popolazione globale/campione

Descrizione Sintesi numerica Analisi dei risultati

Statistica inferenziale Campione

 Stima delle caratteristiche Sintesi numerica Analisi dei risultati

Page 3: Seminario psicometria I

Campione statistico/Popolazione

Page 4: Seminario psicometria I

Il  campione  statistico  è  un  sottoinsieme  dell'universo  di riferimento,  caratterizzato  da  attributi  comuni  alla popolazione. 

La  popolazione  è  l'insieme  dei  soggetti  appartenenti  alla categoria oggetto di studio.

Page 5: Seminario psicometria I

Fasi dell'analisi statistica

1Definizione obiettivi Rilevazione

Elaborazione datiApplicazione degli 

esiti dell'analisi

Analisi statistica

Interpretazione dati

Page 6: Seminario psicometria I

Fasi dell'analisi statistica:definizione obiettivi

Individuazione obiettivi

Delimitazione  della  ricerca  nel  tempo  e  nello spazio

2

Page 7: Seminario psicometria I

Fasi dell'analisi statistica:rilevazione

3

L'osservazione  dei  fenomeni  mediante  opportuni tecniche e strumenti

L'oggetto  della  rilevazione  può  essere  l'intera popolazione o un campione di essa rappresentativo

Chi può fare la rilevazione?

Enti pubblici (Istat) ed Istituti privati

La  rilevazione  si  effettua  mediante  formulari strutturati ai fini dell'analisi

Page 8: Seminario psicometria I

Fasi dell'analisi statistica:elaborazione dati

4

Sintesi dei dati più significativi mediante  l'utilizzo di opportuni indici 

Page 9: Seminario psicometria I

Fasi dell'analisi statistica:presentazione ed interpretazione dei dati

Rappresentazione dei dati mediante tabelle, grafici ed indici

Spiegazione dei risultati

5

Page 10: Seminario psicometria I

Fasi dell'analisi statistica:applicazione degli esiti dell'analisi

La statistica non è fine a se stessa

6

Sta

tistic

aEconomia

..........

Output

Demografia

Medicina

Page 11: Seminario psicometria I

Indagine statistica: definizione

1 Il carattere oggetto di studio

2 La scala di misurazione del carattere

3 L'universo delle unità statistiche (popolazione)

4 L'ampiezza della rilevazione (totale o parziale)

Page 12: Seminario psicometria I

Unità statistica :definizione

Unità  statistica  :  elemento  base  della  popolazione  sul quale viene rilevata la caratteristica oggetto di studio●Unità semplici (persona, abitazione)●Unità composta (famiglia, edificio)●Unità  complesse,  insieme  di  unità  semplici 

differenti,considerati  nella  loro  globalità (rapporto coniugale, rapporto di lavoro)

      

Page 13: Seminario psicometria I

Carattere :definizione

Carattere  :  elemento  che  descrive  una popolazione od un campione

Modalità  :  valori  assunti  da  un  carattere  su un'unità statistica

Tipologia carattere ●Qualitativo  o  Mutabile  (rappresentato 

mediante attributi)●Quantitativo (rappresentato mediante numeri)      

Page 14: Seminario psicometria I

Variabile :definizione

Variabile :  rappresentata mediante numeri

Modalità  :  valori  assunti  da  un  carattere  su un'unità statistica

Tipologia carattere ●Qualitativo  o  Mutabile  (rappresentato 

mediante attributi)●Quantitativo (rappresentato mediante numeri)      

Page 15: Seminario psicometria I

Variabili: tipologia

Variabili Qualitative●Modalità nominali (es. stato civile)●Modalità ordinali (es. livello di istruzione)

Variabili Quantitative●Valori numerici (es. numero di figli)

Variabili indipendenti (manipolata dallo sperimentatore)

Variabili dipendenti (misurate dallo sperimentatore)

Variabili di disturbo

Page 16: Seminario psicometria I

Variabili: quantitative

Variabili Quantitative●Continue (numeri reali)●Discrete (numeri interi)

Page 17: Seminario psicometria I

Esempio di variabili dipendenti ed indipendenti

30 adolescenti vengono convocati per un test di memoria, a 15 di loro, prima  di  iniziare  la  prova  viene  detto  che  si  tratta  di  un  compito particolarmente difficile, agli altri 15 non viene data alcune indicazione. Indicare la variabile indipendente e quella dipendente.

VARIABILE INDIPENDENTE? Informazione sulla difficoltà della prova  VARIABILE DIPENDENTE? Punteggio test di memoria

Page 18: Seminario psicometria I

LA MISURAZIONE: definizione Misurazione

●Assegnare valori numerici ad eventi/oggetti secondo  le proprietà del sistema numerico (S.I.)

Scale di misurazione●Scala  nominale  (variabili  o  mutabili;  i    numeri  hanno 

valore di etichetta).  Operazioni di misurazione

– Raggruppamento in classi– Conteggio delle frequenze delle classi

●Scala  ordinale  (ordinamento  secondo  una  specifica caratteristica) Operazione di misurazione

– Confronti di ordine– Relazione di minore o maggiore

Page 19: Seminario psicometria I

LA MISURAZIONE: le scale ad intervalli

Scale ad intervalli●Caratteristiche

Fondo scala pari a 0 Unità di misura convenzionali Misurano la differenza tra eventi/oggetti L’ampiezza dell’intervallo è costante Operazioni di misura: addizione e sottrazione, trasformazione 

dei numeri (normalizzazione)

Esempi:●Scala  Celsius,  Kelvin,  Q.I.,  Test  di  atteggiamento  e  di 

personalità

Page 20: Seminario psicometria I

LA MISURAZIONE: le scale a rapporti Scale a rapporti 

●Caratteristiche Lo 0 equivale ad assenza di proprietà Non assumono valori negativi Operazioni di misura: addizione e sottrazione, trasformazione 

dei numeri (normalizzazione), moltiplicazione e divisione

Esempi:●Distanza, statura, peso

Page 21: Seminario psicometria I

Output delle misurazioni: DatiM

isur

a

Frequenza

DatiPunteggioVariabili quantitative

Variabili qualitative

Page 22: Seminario psicometria I

Le Frequenze

Definizione:●è il numero delle volte secondo cui una modalità di una 

variabile si presenta nella popolazione osservata

Frequenze classificazione:●Cumulate  (somma  progressiva  delle  frequenze  della 

distribuzione)●Relative  (frequenza  della  modalità/numero  totale  delle 

osservazioni)●Percentuali: freq.relat*100 (%)

Page 23: Seminario psicometria I

Esempio

Maschi 28 Femmine 22

Il totale delle osservazioni N=50Le frequenze relative dei maschi sono F. rel=28/50=0,56Le frequenze percentuali dei maschi sono F%0 28/50x100= 56%

22FEMMINE

28MASCHI

2228 == fm FF

1

Page 24: Seminario psicometria I

Le Classi

Definizione:●è un raggruppamento di dati in definiti intervalli●Ogni  intervallo  è  delimitato  da  un  estremo  inferiore  ed 

estremo superiore●La differenza tra sup­inf= ampiezza di classe

Regole di costruzione delle classi:●Non meno di 5 e non più di 20●Intervalli della medesima ampiezza●Ampiezze preferite 3, 5, 10 o multipli●Intervalli mutuamente esclusivi (es. 0­2, 3­5, 6­8….)●Punto  medio  centrale  =(sup+inf)/2  ­>costruzione 

poligono di frequenza

Page 25: Seminario psicometria I

Le Classi: rappresentazione grafica Definizione:

●Spesso  per  avere  una  visione  d'insieme  di  una distribuzione  di  frequenza  si  usa  rappresentarla  su grafici. 

●istogramma:  in  cui  sull'ascissa  sono  riportate  le modalità della distribuzione e sulle ordinate le rispettive frequenze assolute o relative.

Nel  caso  di  distribuzione    in  classi:  in  ascissa  vengono rappresentati  i  limiti  degli  intervalli  e  in  ordinata  le frequenze.

Page 26: Seminario psicometria I

Le Classi: rappresentazione grafica-Istogramma

0

10

20

30

40

50

60

70

80

90

1°Trim.

2°Trim.

3°Trim.

4°Trim.

Est

Ovest

Nord

Page 27: Seminario psicometria I

Le Classi: rappresentazione grafica-Poligono di frequenza Definizione:

●Poligono  di  frequenza:  in  cui  sull'ascissa  sono  riportate  le modalità (  il valore medio di ciascuna classe )e sull'ordinata le  frequenze  relative  cumulate  e  i  punti  trovati  si  uniscono con una spezzata

●Il  poligono  di  frequenza  si  utilizza  quando  il  ricercatore  è interessato  a  rappresentare  nello  stesso  grafico  più distribuzioni di frequenze relative a gruppi diversi.

Page 28: Seminario psicometria I

Le Classi: rappresentazione grafica-Poligono di frequenza

Poligono di frequenza

0

20

40

60

80

100

1° Trim. 2° Trim. 3° Trim. 4° Trim.

fr

maschifemmine

Page 29: Seminario psicometria I

Statistica descrittiva

Definizione:●I dati ottenuti durante uno studio empirico  (dati grezzi) 

possono  essere  sintetizzati  in  una  forma  analizzabile. L’ampio  numero  di  osservazioni  si  può  ridurre  in numero  più  piccolo  di  indici  statistici  (statistiche descrittive). 

●Le principali statistiche descrittive sono:

Misure della tendenza centrale: moda, mediana, media Misure della variabilità:range, differenza interquartile, 

deviazione standard e varianza.

Page 30: Seminario psicometria I

Statistica descrittiva-Moda

Definizione:

La moda è rappresentata dal valore più frequente della distribuzione osservata. Può essere espresso in ogni scala di misura (è l’unico indice di tendenza centrale per la scala nominale) Quando la moda è unica si parla di distribuzione unimodale, ma se ci sono due valori ugualmente frequenti la distribuzione è detta bimodale.

Page 31: Seminario psicometria I

Statistica descrittiva-Moda

Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 15, 19.  N = 13

●Il  15  si  presenta  più  frequentemente,  quindi  è  il  valore modale   La distribuzione è UNIMODALE

Esempio●10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 13, 19.  N = 13, 15

●Il  13  ed  il  15  si  presentano  più  frequentemente,  quindi sono i valori modali  La distribuzione è BIMODALE

Page 32: Seminario psicometria I

Statistica descrittiva-Mediana Definizione: MEDIANA −E’  rappresentata dal  valore che occupa  la posizione centrale della 

distribuzione (valore che divide in due parti uguali la distribuzione, al di sopra e al di sotto del quale si trovano il 50% dei casi)

la determinazione della mediana è diversa a seconda che sia n dispari o pari. Se n è dispari, la mediana e l'intensità individuata dal posto centrale:

C = (n+1) / 2

Ad esempio, la mediana dell'intensità 3, 15, 9, 2, 6,12, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 6, 9,12,15.

Siccome le intensità sono sette, numero dispari, il posto centrale è unico ed è pari a:

 C = (7+1) / 2 = 4 (posizione della mediana)

La  mediana  è  quindi,  l'intensità  individuata  dal  quarto  posto,  vale  a  dire  che essa è uguale a 6.

Page 33: Seminario psicometria I

Statistica descrittiva-Mediana Se  n  è  pari,  la  mediana  è  data  dalla  semisomma  delle  intensità 

corrispondenti ai due posti centrali: 

C = n / 2                       C = (n / 2) + 1 

Ad esempio, la mediana delle intensità 7, 16, 2, 3, 9, 12, 15, 5, si ottiene innanzitutto ordinando la serie: 2, 3, 5, 7, 9, 12, 15, 16. (n=8)

Visto che si tratta di 8 numeri, numeri pari, i posti centrali sono due e sono:

C = 4  (7 )      e          C = 5 (9) (posizioni della mediana)

Pertanto, la mediana è dalla semisomma delle intensità individuate dal quarto e dal quinto posto, vale a dire che essa è uguale a:

 Me = (7 + 9) / 2 = 8

Page 34: Seminario psicometria I

Statistica descrittiva-Media MEDIA (è il centro di gravità della distribuzione)        

● La  media  aritmetica  è  data  dalla  somma  delle  misure  osservate diviso il  numero delle osservazioni fatte (N)

● Si indica con M per i campioni e con μ per le popolazioni● Può  essere  calcolata  su  scale  di  misura  ad  intervalli  e  a  rapporti 

(scale METRICHE)

La media aritmetica è uguale alla somma dei  termini divisa per  il  loro numero. 

Se si  indicano gli n    termini di una serie con x1, x2, x3….. xn,  la media aritmetica sarà pari a:M = (x1 +  x2 +  x3 + ….. + xn )  / n

Se  ad  esempio  avessimo  i  valori  1,  2,  3,  7,  10,  13,  specificano  la formula sopra enunciata, si ottiene:

M = (1+2+3+7+10+13) / 6 = 36/6 = 6 La formula può essere meglio come:M = Σ Xi/N

     Oppure  M =   fi Xi/NΣ (in questo caso si moltiplica  la  frequenza di ogni classe per  il  valore 

medio di ogni classe) 

Page 35: Seminario psicometria I

Statistica descrittiva-Media-Esempio

M =   fi Xi/NΣ Valore=193/10

19310TOTALE

100520

57319

36218

VALORE*FREQ.FREQ.VOTI

1

Page 36: Seminario psicometria I

Statistica descrittiva-Indici di posizione Definizione: Gli indici  DI POSIZIONE indicano la posizione che un valore occupa all’interno di una distribuzione.

● QUARTILI● DECILI● PERCENTILI

● I percentili o quantili sono le intensità che dividono una distribuzione in due parti, lasciandola da una parte x% dei casi e dall’altra parte il rimanente (100 – x%).I quantili si dicono quartili se dividono la distribuzione in 4 parti uguali, tali che: il primo quartile lascia alla sinistra il 25% dei casi e alla sua destra il rimanente 75 % dei casi;il secondo quartile, che coincide con la mediana lascia alla sua sinistra il 50% dei casi ed alla destra il rimanente 50%; il terzo quartile lascia alla sua sinistra il 75% dei casi ed alla sua destra il rimanente 25%.

       1° quartile    2° quartile     3° quartile__________|__________|___________|__________ Per calcolarli occorre:1.  Ordinare in senso crescente la distribuzione    2.  Calcolare le frequenze cumulate    3.  Calcolare la      posizione del quartile con le seguenti formule:1° quartile  pos Q1= ((n+1)/4) *1° quartile  pos Q2= ((n+1)/4) *2 3° quartile  pos Q3= ((n+1)/4) *3 

Page 37: Seminario psicometria I

Statistica descrittiva-Indici di posizione-Quartili

Esempio●Pos Q1=n+1/4*1= 101+1/4*1=101+1/4*1=25.5●Corrisponde alla seconda posizione

101101469720577264512033121210101F.cum.Freq.

1

Page 38: Seminario psicometria I

Statistica descrittiva-Indici di posizione-Decili, centili o percentili

Esempio:●Decili=  nove  punti  che  dividono  la  distrib.  In  10  parti.

(pos D1= n+1/10*1;pos D3=n+1/10*3)●Percentili= 99 punti che dividono  la distrib.  In 100 parti 

(pos.P1= n+1/100*1)

Page 39: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità

Definizione:

●Le medie facilitano la comprensione della frequenza dei fenomeni  collettivi.  Per  una  più  esatta  conoscenza  di essi occorre però anche studiare la loro variabilità, cioè la  capacità  di  assumere  differenti  valori  quantitativi  in un  certo  periodo  di  tempo,  o  in  seguito  all’influenza  di un altro o altri fenomeni.

Page 40: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità-Campo variazione

Campo di variazione E’ una misura della variabilità dei dati. Esso si ottiene dalla differenza 

tra il valore massimo e quello minimo delle intensità di un fenomeno.

CV = Xmax­Xmin

Ad esempio se le intensità di un dato fenomeno sono le seguenti: 

29 24 20 28 22 22 23

Il campo di variazione sarà: 29 – 20 = 9

Page 41: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità-Differenza Interquartile

●Definizione

Differenza  interquartile:  è  un  indice  più  robusto  ai  valori anomali rispetto al campo di variazione. 

IQR=Q3­Q1

Page 42: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità-Varianza

●Definizione Scostamento semplice medio (SSM)

è la differenza tra un singolo punteggio e il punteggio medio Devianza è la somma degli scarti elevati al quadrato di ciascun 

punteggio dalla media Varianza: è la media dei quadrati degli scostamenti dalla media 

di tutti i soggetti e indica la distanza media di ciascun soggetto dalla media del campione.

Si indica con s2.

Scostamento quadratico medio o deviazione standard:

è la radice quadrata positiva della varianza 

Page 43: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità-Varianza

●Esempio

280499371074279611785007741­17634­27529­3741

SCARTI QUADRATI

SCARTI DALLA MEDIA

MEDIADATI GREZZI

Page 44: Seminario psicometria I

Statistica descrittiva-Indici di dispersione o variabilità-Deviazione Standard Calcolo

●Calcolo MEDIA= SX/N= 49/7=7

DEVIANZA= sommatoria degli scarti al quadrato= 28

VARIANZA= sommatoria degli scarti al quadrato/media=28/7=4

DEVIAZIONE STANDARD=la radice quadrata positiva della varianza= 2 

Page 45: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure

●Definizione naif

Per  poter  confrontare  in  maniera  adeguata  i  punteggi  ottenuti da  soggetti  diversi  in  situazioni  diverse,  non  possiamo accontentarci  di  guardare  il  punteggio  grezzo,  ma  dobbiamo fare  un  confronto  con  dei  punteggi,  detti  standardizzati,  che possano essere un riferimento generale.

Page 46: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure

Per effettuare il confronto, si usano delle trasformazioniche rendono confrontabili tra loro distribuzioni diverse. 2 tipi di trasformazioni:

●punti Z (in questo caso dobbiamo avere come riferimento la media e la deviazione standard)

●percentili, decili, quartili (riferimento posizione nel gruppo)

Page 47: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Z

Formula Z transform

sXX

Z ii

−=

Page 48: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Z

Esempio

Un bambino di 5 anni ha un punteggio 20 in test di lettura.Tuttavia, possiamo domandarci: la posizione nel test del  bambino di 5 anni è migliore rispetto al gruppo di 5 anni. Confrontiamo il punteggio del bambino con la media del suo gruppo (media=10;d.s.=5)Otteniamo che: il bambino è migliore rispetto alla media della classe.Standardizziamo il punteggio del bimbo (standardizzare una misura significa riferire la misura stessa a una scala standard con media e varianza note. La scala più comune è quella  della standard o z che ha la media  0 e varianza 1.

Page 49: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Z

25

1020 =−=−=s

XXZ i

i

Esempio Tale  trasformazione  si  ottiene  trasformando 

una serie  di  punteggi  xi  in  punteggi  zi  con  la seguente  formula:

Il  bimbo  sta  2  deviazioni  standard  sopra  la media.

Se la media del suo gruppo fosse stata di 25:

La  prestazione  del  bimbo  è  inferiore  alla media del gruppo.

15

2520 −=−=bZ

Page 50: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Percentili

Il  percentile  è  il  valore al  di  sotto  del  quale  si  trova una  certa percentuale di casi di una distribuzione.

Esempio:il 94 percentile è il valore al di sotto del quale si trova il 94% dei casi di una distribuzione.

Ad  esempio  si  considera  la  distrib.  delle  medie  dei  voti d’esame,  il  voto  29  corrisponde  al    94°  percentile  della distribuzione

Page 51: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo

Il calcolo dei vari percentili è analogo a quello per il calcolo della mediana, dividendo la numerosità totale invece che per due, per il numero di classi che sono individuate (10 per i decili, 100 per i centili, ecc.).

Per i decili il primo decile sarà dato dal valore corrispondente alla posizione n/10, il secondo dalla posizione 2*n/10,  il quinto da 5*n/10 (=nl2=Mediana),…….

il decimo da 10*n/10 (=n).

Page 52: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo

Si esprime il punteggio di un soggetto in relazione alla posizione occupata dal soggetto(So) nella distribuzione (cioè nel gruppo di cui fa parte). In particolare, si calcola la sua posizione come se il gruppo fosse formato da 100 soggetti(Ss).

Procedura (simile alla mediana):– si ordinano i Ss (da quello che ha preso il punteggio più

basso a quello che ha preso il punteggio più alto)– si vede che posizione occupa il So (per es., è il 30° in

un distribuzione di 50 Ss)– si vede che posizione il So occuperebbe se ci fossero

non 50 Ss ma 100 Ss.– è logico pensare che se il So è 30° su 50 Ss sarebbe

60° su 100 Ss.– si dice perciò che il So è al 60° percentile.

Page 53: Seminario psicometria I

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo

In altre parole, si fa una proporzione:30° : 50 = x : 100x = 30/50 ×  100 = 60°

Il percentile indica perciò la percentuale di Ss che hanno avuto un punteggio minore del So (e, per differenza, la percentuale di Ss che hanno avuto un punteggio superiore).

Un So è nel 25° percentile: significa che sotto di lui c’è il 25% dei Ss e sopra di lui il 75%.

Un soggetto al 50% percentile sta a metà. 

Page 54: Seminario psicometria I

Statistica Inferenziale

La  statistica  inferenziale  ha  come  obiettivo,  invece,  quello  di fare  affermazioni,  con  una  possibilità  di  errore  controllata, riguardo la natura teorica (la legge probabilistica) del fenomeno che si osserva. 

La  statistica  inferenziale  è  fortemente  legata  alla  teoria  della probabilità.

Page 55: Seminario psicometria I

Probabilità

• La probabilità che si verifichi un certo evento è uguale alla frequenza (relativa) con cui l’evento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.

• P(A) è la probabilità di verificarsi un evento A • Lim  limite per n che tende all’infinito ∞ e indica un numero 

molto grande• fA  frequenza con cui si è verificato l’evento A in un numero di 

prove n  

nf

AP A

nlim)(

∞→=

Page 56: Seminario psicometria I

Probabilità-Posteriori

Probabilità a posteriori: è data dal rapporto tra i risultati favorevoli e il totale delle prove effettuate, quando questo numero diventa infinitamente grande. Il concetto di probabilità a posteriori si riduce in definitiva a quello di frequenza relativa di un fenomeno, quando il numero di prove è finito (quella sopradetta).

Non è possibile definire la probabilità in base ad un’unica prova ma le prove devono essere molte e ripetute.Es: lanciando un dado 10 volte avremo la seguente sequenza (4752928145) la probabilità di ottenere la faccia 5; basata sulla frequenza relativa in 10 lanci, è di 2/10=0.20

Page 57: Seminario psicometria I

Probabilità-Teorica

Definizione: probabilità a priori o teorica: è il rapporto tra numero di casi favorevoli al verificarsi di un evento ed il totale degli eventi possibili, supposti equiprobabili. 

Riprendendo il caso del lancio di un dado non truccato, la probabilità dell'evento ­   esce 6 è uguale a 1/6.

Page 58: Seminario psicometria I

Probabilità-Concetti generali

 Evento: uno dei possibili risultati di una prova; se la prova consistesse nell’osservazione dell’esito del lancio del dado, l’evento sarebbe la faccia 5.

 La prob.di A si definisce con P(A), faccia 5.

 Tutte le altre facce esclusa la 5 hanno la prob.P(non A)

P(A) +P(non A)= 1

La somma delle probabilità di tutti gli eventi è uguale a 1 (probabilità dell’evento certo)

Page 59: Seminario psicometria I

Probabilità-Concetti generali-Principio della somma

•  La probabilità di verificarsi di due eventi mutualmente escludentisi è uguale alla somma delle probabilità di verificarsi  dei singoli eventi:

P(A  U   B) = P (A)   +  P (B) 

•  La probabilità che lanciando un dado si ottenga l’evento numero dispari (faccia 1,3,5)  sarà 

uguale: P1+P3+P5= 1/6+1/6+1/6=3/6= ½

Page 60: Seminario psicometria I

Probabilità-Concetti generali-Principio del prodotto Definizione:

Quando  due  eventi  si  verificano  simultaneamente  o  in successione :P (A e B)  = P (A)   *  P (B)

  la probabilità di avere 2 con due dadi è data dalla prob.di avere 1 con dado e 1 con l’altro.P (s=2)  = P (1)   *  P (1)= 1/6*1/6 = 1/36La combinazione 1+ 1 è solo una dei 36 eventi possibili che corrispondono  ai  36  diversi  modi  possibili    in  cui  si possono  combinare  le  6  facce  del  primo  dado  con  le  6 facce del secondo. 

Page 61: Seminario psicometria I

Probabilità-Concetti generali-Probabilità condizionata Definizione:

Abbiamo trattato di eventi indip., quando invece si tratta di eventi  non  indipen.  Ossia  quegli  eventi  che  il  verificarsi dell’uno modifica la prob. del verificarsi dell’altro. 

Ad  esempio  nel  lotto  l’aver  estratto  un  numero  (tra  i  90 possibili)  modifica  la  prob.  di  estrazione  del  numero successivo (1/89)

P (A B)  = P (A)   *  P (B/A)= P(B) P(A/B)

Page 62: Seminario psicometria I

Probabilità-Concetti generali-Probabilità condizionata

P (∅) = 0;

P (Ā) = 1­ P(A), dove Ā è not A

P (A U B)= P(A) +P(B) ­ P(A B)∩

Page 63: Seminario psicometria I

Probabilità-Concetti generali-Probabilità condizionata

Tra due eventi A e B può sussistere una relazione per la quale, sapendo che una prova ha generato un risultato che appartiene a B, si è indotti a modificare la valutazione del verificarsi di A. La probabilità dell'evento B, dato che si è verificato l'evento A, è il rapporto fra la probabilità del contemporaneo verificarsi di A e B e la probabilità di A, se questa è diversa da zero.

0)(;)(

)()(

0)(;)(

)()(

>∩=

>∩=

APAP

ABPABP

BPBP

BAPBAP

Page 64: Seminario psicometria I

Probabilità-Distribuzione normale

La  Curva  normale  è  la  curva  continua  rappresentativa delle distribuzioni che più frequentemente si incontrano in statistica

E’  simmetrica  e  unimodale.  Media,  moda  e  mediana coincidono.  I  valori  si  addensano  attorno  alla  media  (il 94,5dei valori sono posizionati entro  i due scarti quadrati medi  sopra  e  sotto  la  media.)  Per  descriverla  bastano  la media e la d.s.

Un  solo  valore  appare  con  la  frequenza  massima,  quella centrale,  e  sono  tanto  meno  frequenti  quanto  più  si allontanano dal valore centrale.  

Page 65: Seminario psicometria I

Probabilità-Distribuzione normale

Page 66: Seminario psicometria I

Probabilità-Distribuzione normale

Si applica a variab. Continue ossia che  la  funzione viene definita su  tutto  l’asse dei numeri  reali da  ­∞  a +∞  (sulle ascisse  si  trovano  tutti  i  valori  di  x  e  sulle  ordinate  le frequenze di ciascun valore)

La somma di tutte le prob. È uguale a 1 Espressa dall’integrale:

+∞

ƒ ƒ(x)dx=1­∞

Che esprime l’area racchiusa dalla distrib. a campana

Page 67: Seminario psicometria I

Probabilità-Distribuzione normale

    ­1/2 .( ­ )2/  2Χ μ σ

F(x)=1/ √2  e σ π

F(x)=frequenza di un dato valore di x X=qualsiasi valore nella distribuzione =media della distribuzioneμ

=deviazione standard della distrib.σ

=3,1416π

e=2,7183(base dei logaritmi neperiani)σ 2 µ  sono media e varianza della popolazione

Page 68: Seminario psicometria I

Probabilità-Distribuzione normale-Esempio L’area sottesa nel punto x esprime qual’è  la probababilità che 

si  presenti  un  valore  inferiore  o  superiore  a  x.  Per  esempio consideriamo  una  distribuzioni  di  voti  all’esame,  ci  sono  20 possibilità che uno studente abbia una media superiore al 27,5

Page 69: Seminario psicometria I

Probabilità-Distribuzione normale-Esempio Vogliamo sapere qual è la prob. , in una distrib. di Q.I. µ = 100 σ = 10, di 

ottenere un punteggio compreso tra 90 e 100:

X2=100

ƒ    ƒ(x)dx=?­x1=90

 Trasformiamo i punti grezzi in punti z: Z1= x­µ /σ = 90­100/10= ­1 Z2= 100­100/10=0

L’integrale diventa:   0

                                   ƒ f(z)dz=?                                                   ­1

L’area che ci interessa è l’area tra 0 e –1. Sulla tavola B troviamo l’area tra 0 e 1. Riga = I cifra decimale colonna= II cifra decimaleZ1=1        riga=1.0   col.=0     = .3413 la risposta che cercavamo

Page 70: Seminario psicometria I

Probabilità-Distribuzione binomiale

    

Ad  ogni  evento  si  associa  una  prob.  che  assume  una distribuzione che si definisce in base all’evento. X= evento e f(x) la sua distribuzione . In caso x assume 2 valori (testa e  croce),  eventi  indip.Se  eseguiamo  n  prove  avremo  una distrib. teorica definita binomiale.

Equazione: f(x)= n C x p x q n­x  

p= prob. che si verifichi l’evento Q= prob che non si verifichi l’evento n  C  x  =  numero  dei  modi  in  cui  si  possono  combinare  x 

successi (n­x) insuccessi in n prove 

Page 71: Seminario psicometria I

Probabilità-Distribuzione binomiale

    

n C x

Si  definisce  comb.  di  n  oggetti  a  r  a  r  ,  tutte  le  possibili repliche  che  si  costituiscono  con  n  oggetti  senza  tener conto dell’ordine degli oggetti stessi.

La combinazione formula: n C x  = {n

r}= n!/ r!  (n­r) != 

Il punto ! Si legge fattoriale e indica tutta la serie di numeri naturali.

Per es n=4    n!= 4= 4*3*2*1=24 4C 2  = {4

2}= 4!/ 2!(4­2)!= 4*3*2*1/ (2*1) (2*1)=6

Page 72: Seminario psicometria I

Probabilità-Distribuzione binomiale

    

La  distribuzione  Binomiale  si  applica  in  caso  di  variab. Discrete e dicotomiche.

È simmetrica se la prob, di verificarsi l’evento è p=0.50

p≠  0.50 non è asimmetrica

Per  la  variabili  continue  si  utilizza  la  distribuzione normale.

Page 73: Seminario psicometria I

Verifica delle ipotesi

La  popolazione:  l’insieme  degli  elementi  a  cui  si  rivolge  il ricercatore per la sua indagine.

Campione:  un  sottoinsieme  della  popolazione  che  ha  tutte  le caratteristiche  della  popolazione  da  cui  proviene  (campione rappresentativo)

Quando si lavora con dati del campione si ricorre alla stima dei parametri  (che  non  sono  altro  che  media,  varianza,  etc.) perché  non  si  conosce  la  distribuzione  della  popolazione  da cui  i soggetti provengono. Per ottenere queste  informazioni si utilizzano i parametri del campione.

Page 74: Seminario psicometria I

Verifica delle ipotesi-Campionamento

Il  campionamento  casuale  corrisponde  ad  un'estrazione  da una popolazione di un determinato numero di individui/oggetti. Il campionamento casuale può essere:

● Con  reinserimento:  se  ogni  elemento  estratto  viene reinserito  all’interno  della  popolazione  nella  quale  può essere  di  nuovo  estratto  (in  questo  caso  la  popolazione rimane la stessa) ;

● Senza  reinserimento:  la  popolazione  cambia  ad  ogni estrazione e con essa  la probabilità che ciascun elemento ha di essere estratto.

Page 75: Seminario psicometria I

Verifica delle ipotesi-Parametri indicatori

Il Parametro di  una popolazione è  la  caratteristica oggetto d’esame nella popolazione.

Indicatore  o  statistica  sintetizza  la  caratteristica  oggetto  d’esame  nel campione estratto casualmente dalla popolazione che ci interessa .

Es Una volta determinata l’ampiezza   n   del campione, restano definite   n   variabili casuali   X1, ognuna delle quali  rappresenta  l’i­esima estrazione, che, a sua volta, è suscettibile di assumere il valore x1. 

Una volta effettuato il campionamento si avranno a disposizione   n   valori per  le   n   variabili casuali e  la media di quel determinato campione sarà data  dalla  media  dei  valori  assunti  dalla  variabile  casuale.(indicatore  più diffuso)

Questa media non è altro che uno dei possibili valori che può assumere la variabile casuale, detta media del campione o media campionaria.

Page 76: Seminario psicometria I

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media Distribuzione  campionaria  della  media:  esempio  di  distribuzione 

campionaria NOTA (che quindi ha media, varianza e deviazione standard note) 

Si  chiama       ERRORE  STANDARD     la  deviazione  standard  delle distribuzioni campionarie.

Proprietà dei parametri della distribuzione campionaria delle medie 

La  media  delle  medie  del  campione  coincide  con  la  media  della popolazione  dalla  quale  i  campioni  sono  estratti.Anche  se  la  media  della distribuzione  campionaria  è  uguale  alla  media  della  popolazione  non  è detto  che  la  forma  sia  identica;  ciò  riguarda  l’ampiezza  del  campione: aumentando l’ampiezza dei campioni aumenta la media di ciascuno di essi diventando una stima più precisa della popolazione

Page 77: Seminario psicometria I

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media

Esiste  una  relazione  tra  la  variabilità  della  distribuzione campionaria delle medie, la variabilità della popolazione (  σ 2) e l’ampiezza  del  campione  (n).  Tale  relazione  si  esprime  con:   Var. (x) = σ2 /n ovvero   σ 2 x = σ2 /n  

All’aumentare di n la variabilità (o varianza) della distribuzione campionaria delle medie diminuisce fino a tendere a zero (per la legge dei grandi numeri)

Page 78: Seminario psicometria I

Verifica delle ipotesi-Esempio

Compito  del  ricercatore  è  quello  di  controllare  se  l’ipotesi formulata  è  da    considerare  verificata  o  meno.  Significa prendere una decisione.

Dopo  aver  estratto  un  campione,dopo  aver  sintetizzato  i  dati con  un  adeguato  indicatore,si  può  considerare  verificata l’ipotesi?  O  il  valore  ottenuto  sul  campione  è  suff.  vicino  al valore atteso in funzione dell’ipotesi?

Il  problema  diventa  un  problema  di  distanza  tra  il  valore ottenuto e il valore atteso:tale distanza può essere dovuta: 

Al caso l’ipotesi nulla è vera Non al caso l’ipotesi nulla è falsa

Page 79: Seminario psicometria I

Verifica delle ipotesi-Esempio

In  quest’ultimo  caso  si  può  formulare  un  ipotesi  alternativa quando si può dubitare dell’ipotesi nulla

Es: un ricercatore vuole sapere se topi affamati vanno sempre nel braccio sinistro di un labirinto a 2 vie, anche in assenza di cibo.

Ipot. Nulla: i topi sceglieranno in egual misura il braccio sinistro e quello destra (H0: p=.50)

Ip.  Alter.:i  topi  scelgono  il  braccio  sinistro  in  un  numero maggiore rispetto a quello destro che ci si potrebbe aspettare dal caso (H1>.50) 

Page 80: Seminario psicometria I

Verifica delle ipotesi-Esempio

Supponiamo  di  aver  estratto  un  campione  di  10  topi:  ci attendiamo che i topi scelgono il braccio sinistro:

0 =np= 10*.05= 5μ

Nel caso in cui l’ipot. Nulla sia vera. Effettuato  l’esperimento  i  topi  scelgono  6  volte  il  braccio 

sinistro. Sulle tavole della distribuzione binomiale  Leggiamo  la  prob.  di  un  risultato  di  6  con  n=10  p=.50 

otteniamo .20508 ossia una prob. del 20% di ottenere risultato 6. Per convenzione si sceglie con probabilità critica (  ) quella αpari al 5% (.05)

Page 81: Seminario psicometria I

Verifica delle ipotesi-Esempio

Tutti i risultati che hanno prob. Di verificarsi minori di tale livello sono considerati significativi ossia si accetta l’ipot. Alternativa.

Il  risultato 6 che corrisponde a una prob. 20% è  superiore al 5%. Accettiamo l’ipot. Nulla.

Page 82: Seminario psicometria I

Verifica delle ipotesi-Esempio-Regione Critica

I  livelli  di  probabilità  adottati  sono  0,05  0,01  e  0,001, generalmente  indicati    e  detti  livelli  di  significatività.  Essi αdeterminano la regione di rifiuto per l'ipotesi nulla.

Page 83: Seminario psicometria I

Verifica delle ipotesi-Errori

Si individuano due tipi di errori● rifiutare H0 quando è vera, errore di primo tipo

● accettare H0 quando è falsa, errore di secondo tipo

I  livelli  di  di  probabilità  critica  =  .050,.01,  .001  significa αrischiare  di  sbagliare  rifiutando  l’ipot.  Nulla  5  volte  su  100,  1 volta  su  100,  1  volta  su  1000.  Nell’ultimo  caso  l’errore  è minimo  anche  se  esiste  la  possibilità  di  accettare  l’ipot.nulla quando è vera l’ipot. Alternativa (errore di 2 tipo). 

Page 84: Seminario psicometria I

Verifica delle ipotesi-Errori-Livelli di probabilità

si  Chiamiamo    la  prob.di  accettare  l’ipotesi  nulla  quando  è βvera H1; ● 1­  si accetta H1 quando è vera (decisione corretta)β● 1­  si accetta Ho quando è vera (decisione corretta)α

 si accetta Ho quando è falsaα

La quantità 1­  si chiama β potenza del test ed esprime quindi la capacità di un test statistico riconoscere la falsità di H0 quando questa è effettivamente falsa. 

Page 85: Seminario psicometria I

TRYSTORMING…Just do it !!!

Page 86: Seminario psicometria I

Termine seminario

Studiare

Esercitarsi

Rilassarsi