Upload
callisto-tonelli
View
217
Download
0
Embed Size (px)
Citation preview
Infe 02 - 1 / 28
Lezione 6Inferenzastatistica
Infe 02 - 2 / 28
parte 2Stime per punti e per intervalli della varianza
Infe 02 - 3 / 28
la varianza
Infe 02 - 4 / 28
la varianza, la tolleranza e lo scarto…
1 0 10
1+ 5%
Infe 02 - 5 / 28
la varianza , la tolleranza e lo scarto …
95 100 105
Infe 02 - 7 / 28
• estraendo da una popolazione per cui è definita la variabile
casuale X avente densità f (x) qualsiasi con media e
varianza 2 un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la
varianza campionaria corretta per stimare
il valore del parametro 2 relativo all’intera popolazione.
Varianza campionaria corretta e stima puntuale di 2
n
j
njn XXn
S1
222
1
1
• il valore ottenuto viene indicato come “stima puntuale di 2”
Infe 02 - 8 / 28
Varianza campionaria corretta e stima puntuale di 2
vnS 22
• come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
• estraendo da una popolazione per cui è definita la variabile
casuale X avente densità f (x) qualsiasi con media e
varianza 2 un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la
varianza campionaria corretta per stimare
il valore del parametro 2 relativo all’intera popolazione.
Infe 02 - 9 / 28
Ricordiamo che:
“ Estraendo da una popolazione infinita per cui è definita la
variabile casuale X avente distribuzione normale con
media e varianza 2
un campione di n elementi a cui corrisponde l’insieme di
variabili casuali { X1, X2, …, Xn },
la varianza campionaria corretta divisa per 2
fornisce una variabile casuale che segue una distribuzione
“modificata di chi-quadro” con n - 1 gradi di libertà ”
11
1
1
2
2
2
nXX
n
S n
j
njn
Incertezza dello stimatore Sn2
Infe 02 - 10 / 28
Incertezza dello stimatore Sn2
f ( C ² )
C ²
Infe 02 - 11 / 28
Chiediamoci ora:
“ Qual è la probabilità che, estraendo a caso un campione
di n elementi da una popolazione su cui è stata definita una X con distribuzione normale, il rapporto fra la varianza campionaria corretta e la varianza relativa all’intera popolazione
sia compreso nell’intervallo ? ” vv 1,1
v
nv
S11
2
2
P
11
1
1
2
2
2
nXX
n
S n
j
njn
Incertezza dello stimatore Sn2
Infe 02 - 12 / 28
vv C 11 2P
Incertezza dello stimatore Sn2
v
nv
S11
2
2
P
2
22
nS
C
Infe 02 - 13 / 28
vv CC 11 22 PP
Incertezza dello stimatore Sn2
v
nv
S11
2
2
P
2
22
nS
C
Infe 02 - 14 / 28
vv CC 11 22 PP
v
nv
S
112
2
P
Incertezza dello stimatore Sn2
222 11 vnv S P
Infe 02 - 15 / 28
Incertezza dello stimatore Sn2
• partendo dall’espressione della probabilità dell’evento:
• si sono ottenute le due espressioni equivalenti:
222
2
2
2
11
11
11
vnv
vv
vn
v
S
C
S
P
P
P
• che giustificano la seguente affermazione:
Infe 02 - 16 / 28
Estraendo a caso un campione di n elementi da una popolazione infinita per cui è definita una variabile casuale
X con distribuzione normale, media e varianza 2, c’è una probabilità pari a:
che il valore ottenuto della varianza campionaria corretta
sia compreso nell’intervallo
vv CC 11 22 PP
n
j
njn XXn
S1
22
1
1
22 1,1 vv
Incertezza dello stimatore Sn2
Infe 02 - 17 / 28
Intervallo di confidenza per la varianza campionaria corretta Sn
2
• Per il nostro scopo, cioè per individuare l’intervallo di confidenza della varianza, conviene sviluppare l’espressione dell’evento in modo diverso:
v
nv
S11
2
2
P
si può scrivere la forma equivalente:
222
111
n
v
n
v
SS
P
Infe 02 - 18 / 28
Intervallo di confidenza per la varianza campionaria corretta Sn
2
222
111
n
v
n
v
SS
P
baba
11
v
n
v
n SS
11
22
2
P
ricordando che:
Infe 02 - 19 / 28
Intervallo di confidenza per la varianza campionaria corretta Sn
2
si può scrivere la forma equivalente:
v
n
v
n
v
n
v
n
SS
SS
11
11
22
2
22
2
P
P
dalla:
Infe 02 - 20 / 28
• si è quindi ricavato che
• è uguale a
• o, in modo equivalente, è uguale a:
v
nv
S11
2
2
P
vv C 11 2P• è quindi possibile fare la seguente affermazione:
v
n
v
n SS
11
22
2
P
Intervallo di confidenza per la varianza campionaria corretta Sn
2
Infe 02 - 21 / 28
Intervallo di confidenza per la varianza campionaria corretta Sn
2
Estraendo a caso un campione di n elementi da una popolazione
infinita per cui è definita una variabile casuale X con distribuzione
normale, media e varianza 2, c’è una probabilità pari a:
che l’intervallo casuale:
contenga il valore della varianza 2 per l’intera popolazione.
vv CC 11 22 PP
v
n
v
n SSI
1,
1
22
I è chiamato intervallo di confidenza allo per la varianza
Infe 02 - 22 / 28
Intervallo di confidenza allo ... ?
• per bassi valori di n la f (C 2 ) non è simmetrica pertanto non è agevole individuare
il valore di v da cui si ottiene
un intervallo simmetrico con una prestabilita confidenza
0,100,05
da cui = 0,85 e non 0,90 !!!
– esempio: gdl = 10
C2 0,05 = 0,394 da cui:
v 0,6
Infe 02 - 23 / 28
Intervallo di confidenza allo 0,90
• per bassi valori di n la f (C 2 ) non è simmetrica:
si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili
C 2/ 2 e C 2
1- / 2
– esempio: gdl = 10
= 0,900,050,05
Infe 02 - 24 / 28
Intervallo di confidenza
• Qual è l’intervallo di confidenza della varianza per la intera
popolazione corrispondente ai due quantili C 2/2 e C 2
1 - /2
corrispondenti alla confidenza scelta?
corrisponde alla:
• varianza campionaria corretta:
22/
22
22/1
2
22/12
22
2/
C
S
C
S
CS
C
nn
n
P
P
n
jnjn XX
nS
1
22
1
1
Infe 02 - 25 / 28
Intervallo di confidenza
• Qual è l’intervallo di confidenza della varianza per la intera
popolazione corrispondente ai due quantili C 2/2 e C 2
1 - /2
corrispondenti alla confidenza scelta?
l’intervallo cercato è:
• varianza campionaria corretta:
2
2/1
2
22/1
2
, C
S
C
S nn
n
jnjn XX
nS
1
22
1
1
Infe 02 - 26 / 28
Stima intervallo di confidenza con 2
• varianza campionaria:
• avendo introdotto la distribuzione “chi-quadro”
è stato possibile affermare che la variabile aleatoria 2
segue tale distribuzione con n - 1 g.d.l..
n
i
nin XXn
S
1
22
1
1
n
i
nin XXSn
1
2
2
2
1
Infe 02 - 27 / 28
Stima intervallo di confidenza con 2
• varianza campionaria:
n
i
nin XXn
S
1
22
1
1
• se dispongo dei valori della 2
2
22
1 1χ
nn
Sn
1χ
1χ 2
22
2
2
inf,1sup,1
nS
nS
QnQn
nn
Infe 02 - 28 / 28
Intervallo di confidenza per la varianza campionaria corretta Sn
2
Estraendo a caso un campione di n elementi da una popolazione
infinita per cui è definita una variabile casuale X con distribuzione
normale, media e varianza 2, c’è una probabilità pari a:
che l’intervallo casuale:
contenga il valore della varianza 2 per l’intera popolazione.
2222
inf,1sup,1χχχχ
QnQn PP
1χ
,1χ 2
2
2
2
inf,1sup,1
nS
nS
IQnQn
nn
I è chiamato intervallo di confidenza allo per la varianza
Infe 02 - 29 / 28
Infe 02 - 30 / 28
E’ possibile sostenere che:
estraendo a caso un campione { X1, X2, …, Xn } con n finito da
una popolazione su cui è definita una variabile casuale X con
distribuzione normale, media e varianza 2 incognite, c’è una
probabilità pari a 1 - che l’intervallo casuale
con T variabile distribuita secondo la t di Student con n -1 g.d.l.
e con t1-/2 il valore del suo quantile (1 - /2)contenga il valore della media della popolazione.
I1- è l’intervallo di confidenza allo 1 - per la media
Intervalli di confidenza per media campionaria standardizzata con n finito e 2 sconosciuta
2/11 a
nn t
n
SXI
Infe 02 - 31 / 28
parte 4 esercizi su: stime per intervalli della varianza
Infe 02 - 32 / 28
Riassunto stimatori campionari
• varianza campionaria corretta:
n
jnjn XX
nS
1
22
1
1
• se si estrae da una popolazione su cui è definita la variabile
casuale X avente distribuzione normale un campione di n
elementi con immagini { X1, X2, …, Xn } (con n > 1) ,
• allora la variabile casuale 2 :
segue una distribuzione di tipo “chi-quadro” con n -1 gdl.
111
2
2
22
nXXS
nn
j
njn
Infe 02 - 33 / 28
f ( ² )
²
La variabile 2
n
j
njnXXS
n1
2
2
22 1
Infe 02 - 34 / 28
Riassunto stimatori campionari
• varianza campionaria corretta:
n
jnjn XX
nS
1
22
1
1
• se si estrae da una popolazione su cui è definita la variabile
casuale X avente distribuzione normale un campione di n
elementi con immagini { X1, X2, …, Xn } (con n > 1) ,
• allora la variabile casuale C 2 :
segue una distribuzione di tipo “modificata di chi-quadro”
con n -1 gradi di libertà.
11
1
1
2
2
22
nXX
n
SC
n
j
njn
Infe 02 - 35 / 28
La variabile C2
f ( C ² )
C ²
n
j
njnXX
n
SC
1
2
2
22
1
1
Infe 02 - 36 / 28
se la X ha distribuzione normale la probabilità cercata corrisponde alla :
Riassunto stimatori campionari
• Qual è la probabilità che il rapporto fra i valori della varianza
campionaria corretta Sn2 e della varianza 2 riferita all’intera
popolazione sia compreso nell’intervallo [ 1 - v , 1 + v ] ?
• varianza campionaria corretta:
v
nv
S11
2
2
P
n
jnjn XX
nS
1
22
1
1
vv C 11 2P
Infe 02 - 37 / 28
Riassunto stimatori campionari
• varianza campionaria corretta:
v
n
v
n
vn
v
SS
S
11
11
22
2
2
2
n
jnjn XX
nS
1
22
1
1
• Qual è la probabilità che il rapporto fra i valori della varianza
campionaria corretta Sn2 e della varianza 2 riferita all’intera
popolazione sia compreso nell’intervallo [ 1 - v , 1 + v ] ?
Infe 02 - 38 / 28
Riassunto stimatori campionari
• Qual è la probabilità che il rapporto fra i valori della varianza
campionaria corretta Sn2 e della varianza 2 riferita all’intera
popolazione sia compreso nell’intervallo [ 1 - v , 1 + v ] ?
• varianza campionaria corretta:
v
n
v
n SS
11
22
2
P
n
jnjn XX
nS
1
22
1
1
corrisponde alla area della regione campita in verde:
Infe 02 - 41 / 28
Riassunto stimatori campionari
• Qual è quindi la probabilità che il valore della varianza 2 riferita all’intera popolazione sia compreso nell’intervallo
• varianza campionaria corretta:
vC 12P
v
n
v
n SS
1,
1
22
n
jnjn XX
nS
1
22
1
1
• con le nostre tavole:
vC 12P
Infe 02 - 42 / 28
Riassunto stimatori campionari
• Qual è quindi la probabilità che il valore della varianza 2 riferita all’intera popolazione sia compreso nell’intervallo
• varianza campionaria corretta:
v
v
C
C
1
12
2
PP
v
n
v
n SS
1,
1
22
n
jnjn XX
nS
1
22
1
1
• con le nostre tavole:
Infe 02 - 43 / 28
Intervallo di confidenza allo ... ?
• per bassi valori di n la f (C 2 ) non è simmetrica pertanto non è agevole individuare
il valore di v da cui si ottiene
un intervallo simmetrico con una prestabilita confidenza
0,100,05
da cui = 0,85 e non 0,90 !!!
– esempio: gdl = 10
C2 0,05 = 0,394 da cui:
v 0,6
Infe 02 - 44 / 28
Intervallo di confidenza allo 0,90
• per bassi valori di n la f (C 2 ) non è simmetrica:
si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili
C 2/ 2 e C 2
1- / 2
– esempio: gdl = 10
= 0,900,050,05
Infe 02 - 45 / 28
Intervallo di confidenza
• Qual è l’intervallo di confidenza della varianza per la intera
popolazione corrispondente ai due quantili C 2/2 e C 2
1 - /2
corrispondenti alla confidenza scelta?
corrisponde alla:
• varianza campionaria corretta:
22/
22
22/1
2
22/12
22
2/
C
S
C
S
CS
C
nn
n
P
P
n
jnjn XX
nS
1
22
1
1
Infe 02 - 46 / 28
Intervallo di confidenza
• Qual è l’intervallo di confidenza della varianza per la intera
popolazione corrispondente ai due quantili C 2/2 e C 2
1 - /2
corrispondenti alla confidenza scelta?
l’intervallo cercato è:
• varianza campionaria corretta:
2
2/1
2
22/1
2
, C
S
C
S nn
n
jnjn XX
nS
1
22
1
1
Infe 02 - 47 / 28
Stima intervallo di confidenza con 2
• varianza campionaria:
• avendo introdotto la distribuzione “chi-quadro”
è stato possibile affermare che la variabile aleatoria 2
segue tale distribuzione con n - 1 g.d.l..
n
i
nin XXn
S
1
22
1
1
n
i
nin XXSn
1
2
2
2
1
Infe 02 - 48 / 28
Stima intervallo di confidenza con 2
• varianza campionaria:
n
i
nin XXn
S
1
22
1
1
• se dispongo dei valori della 2
2
22
1 1χ
nn
Sn
1χ
1χ 2
22
2
2
inf,1sup,1
nS
nS
QnQn
nn
Infe 02 - 49 / 28
Esercizio 6
Da questi valori si individuano gli estremi dell'intervallo di confidenza cercato mediante la:
Sostituendo nella espressione i valori della varianza campionaria corretta, dei quantili della C 2 e dei gradi di libertà si ottiene infine:
2inf
22
2sup
2
Q
n
Q
n
C
S
C
S
2169166,0
360
57,2
360140 2
57,2;166,0 2sup
2inf QQ CC