Upload
corrado-innocenti
View
218
Download
0
Embed Size (px)
Citation preview
1
2
Inferenza Statistica
Le componenti teoriche dell’Inferenza Statistica sono:
la teoria dei campionila teoria della probabilità la teoria della stima dei parametrila teoria della verifica delle ipotesi
Il concetto di probabilità è espresso di frequente nella pratica quotidiana: un cliente ha la
probabilità di stare bene in un albergo a 5 stelle 95 volte su 100, una compagnia aerea 9 volte su
10 è puntuale… etc.
Probabilità
4
Incertezza e Probabilità
• esperienza relativa alle condizioni del tempo dei giorni precedenti
• tempo previsto nella stagione considerata
• previsioni meteo • saranno fatte valutazioni
probabilistiche per minimizzare possibili errori di previsione
Probabilità: l’accadere di un certo evento è più o meno verosimile in relazione ad altri eventi
Devono rientrare delle navi, come sarà il tempo?
5
Incertezza e Probabilità
Prova: esperimento in cui si riscontra incertezza nel risultato
Evento aleatorio: uno dei possibili risultati di una prova
la realizzazione delle prove darà poi luogo ad uno e ad un solo risultato tra i possibili previsti (modalità disgiunte) es. lancio di una moneta, dado, etc...
al momento in cui l’esperimento è compiuto,
il risultato possa essere noto, oppure no al ricercatore
Evento certo: si verifica sicuramente
Evento impossibile: non può mai realizzarsi
6
1) POSITIVITA’ : P(E)≥0
2) CERTEZZA: P(E)=1 se E vento certo
3) UNIONE: se A e B sono due eventi incompatibili (mutuamente esclusivi)
P(AUB)= P(A)+ P(B)
Impostazione Assiomatica (Kolmogorov)
7
In conclusione:
0 ≤ P(A) ≤ 1
la probabilità del verificarsi di due o più eventi incompatibili è pari alla somma delle singole probabilità
8
Si consideri il lancio di un dado di caratteristiche ignote e si calcoli la
probabilità che si verifichi l’evento (un qualsiasi possibile risultato del lancio):
“uscita di una faccia contraddistinta da un numero pari”
dall’osservazione del fenomeno risulta che:
al ripetersi dei lanci, le facce contraddistinte da numeri pari escono circa la metà delle volte rispetto alle facce dispari e che sempre più, al progressivo ripetersi del numero dei lanci, nell’uscire, tendono a stabilizzarsi sulla metà tendono a stabilizzarsi sulla metà delle voltedelle volte
allora si può affermare che:
al ripetersi dei lanci “sempre sotto le medesime condizioni”,
la probabilità (compresa tra 0 e 1)(compresa tra 0 e 1) che esca una faccia contraddistinta da un numero pari sarà 0,500,50
APPROCCIO FREQUENTISTA
9
Scuola frequentista
L’evento E è un possibile risultato di un esperimento ripetibile
n = numero di prove effettuate
m = numero di eventi che si sono verificati
F= frequenza assoluta
Al tendere del tempo all’infinito, m/n si stabilizza, esprimendo la probabilità di verificarsi dell’evento
n
EFEP n
n
)(lim)(
10
Variabile casuale
VARIABILE CASUALE X: qualsiasi caratteristica si presenti con modalità diverse x1, x2, x3,…, da soggetto a soggetto o, nello stesso soggetto, da un momento all’altro
Modalità: tutti i valori che la variabile può assumere
Variabile casuale: quantitativa (continua, discreta)
qualitativa (nominale, ordinale)
prima di una data prova, può assumere in ciascuna osservazione un valore qualsiasi, dopo la prova, essa assumerà, in ciascuna osservazione, uno ed un solo valore, detto “determinazione della variabile casuale”
VARIABILE DETERMINISTICA: variabile casuale dopo una determinata prova.
11
Distribuzione di probabilità
I valori possibili (modalità) di una variabile casuale sono riassunti in una distribuzione, definita “distribuzione di probabilità”
Nella distribuzione di probabilità sono mostrati tutti i possibili valori di una variabile casuale con le rispettive probabilità di verificarsi
12
Distribuzioni di frequenza e distribuzioni di probabilità
Una distribuzione di
frequenza mostra il risultato di ogni evento e la sua relativa frequenza
Una distribuzione di probabilità elenca ogni valore possibile con la relativa probabilità
Alcune distribuzioni di probabilità
Variabili discrete
Variabili continue
13
Binomiale
Poisson
Normale
Normale Standardizzata
t di Student
14
Distribuzione Binomiale
Variabile casuale discreta dicotomica
assume 1= successo con probabilità p
0= insuccesso con probabilità q=1-p uno ed un solo risultato tra i due possibili; la probabilità è la stessa per ogni prova tutte le prove sono indipendenti
Funzione di probabilità:
15
Distribuzioni di Poisson
p = probabilità che l’evento si verifichin = numero delle prove
p < 0,05 n > 100
Funzione di probabilità
Dove λ è il numero medio di eventi per intervallo di tempo
16
Distribuzione Normale
Variabile casuale continua
Molti dei dati rilevati tendono a distribuirsi secondo le caratteristiche della normalità
Più numerose saranno le osservazioni sulla variabile, più numerosi saranno i rettangoli componenti l’istogramma più il grafico si approssimerà ad una curva a campana
17
Distribuzione Normale e Normale standardizzata
Funzione di densità
Probelma:
Distribuzioni Probabilità del verificarsi di un evento
L’evento segue una distribuzione di probabilità
Come si calcola la probabilità?
La velocità di consegna da parte di un’azienda con sede a Barcellona, segue una distribuzione normale ed ha una media di 185,7 giorni ed una deviazione standard di 14,6 giorni. Qual’è la probabilità che se faccio un ordine questo sia in sede dopo 200 giorni?
18
19
Distribuzione Normale Standardizzata
den
sità
Esempio - Punteggi Standardizzati
La velocità di consegna ha una media di 185,7 giorni ed una deviazione standard di 14,6 giorni
ii
xz
Valori critici
20
Esempio - Punteggi Standardizzati
Ad un test, la media della durata di una batteria è 72 ore e la deviazione standard è 15 ore. Qual è la probabilità che acquistando una batteria, questa si scarichi dopo 60 ore ma prima di 90?
4,115
7293 ;8,0
15
7260
;
9360
zz
xz ii
Valori critici
21
Distribuzione t
la distribuzione t di Student è una distribuzione simmetrica,
con media 0 e con deviazione standard, caratterizzata dai
gradi di libertà.
Al variare della numerosità campionaria, varia il numero dei
gradi di libertà e, conseguentemente, varia la forma della
distribuzione
Gradi di libertà
1920: Fisher introduce i gradi di libertà
Esprimono il numero minimo di dati sufficienti a
valutare la quantità d'informazione contenuta.
Quando un dato non è indipendente, l'informazione
che esso fornisce è già contenuta implicitamente
negli altri. È possibile quindi calcolare le statistiche
utilizzando soltanto il numero di osservazioni
indipendenti, consentendo in questo modo di
ottenere una maggiore precisione nei risultati.
22
23
100 gradi di
libertà
9 gradi di libertà
95 %
95 %
SD96,1
SD262,2
24
Confronto tra la distribuzione t di Student e la curvaNormale Standardizzata
25