15
1 Unità 4 La curva gaussiana Variabili standardizzate

Unità 4

Embed Size (px)

DESCRIPTION

Unità 4. La curva gaussiana Variabili standardizzate. L’espressione matematica della distribuzione gaussiana è data da Osservazione. Questa funzione densità probabilità è completamente definita dai parametri  e  . - PowerPoint PPT Presentation

Citation preview

Page 1: Unità  4

1

Unità 4

La curva gaussiana

Variabili standardizzate

Page 2: Unità  4

2

L’espressione matematica della distribuzione gaussiana è data da

Osservazione.Osservazione. Questa funzione densità probabilità è completamente definita dai parametri e .

La curva corrispondente ha una forma a campana del tipo in figura sotto ed è simmetrica rispetto al valore medio.

xexf

x2

2

2

)(

2

1)(

X

0,68

0,16 0,16

Page 3: Unità  4

3

Essendo la curva simmetrica rispetto al valore medio, è chiaro che le aree sottese alla curva stessa fra – e e fra e +, valgono entrambi 0,5. In altre parole c’è una probabilità pari al 50% che la variabile casuale X assuma un valore più basso o più alto del valore medio.

Il valore medio coincide quindi con la mediana.

Il valore medio coincide anche con la moda.

Valore medio, moda e mediana coincidono.

X

0,68

0,16 0,16

Page 4: Unità  4

4

Le ascisse – e + individuano i due punti (punti di flesso) in cui la curva cambia la concavità.

L’area sottesa alla curva nell’intervallo [ – , + ] è circa il 68% dell’area sottesa a tutta la curva (vale infatti 0,6827).

A ciascuna delle due rimanenti code della curva corrisponde perciò un’area pari a circa 0,16.

L’area che sta sotto la curva nell’intervallo [–1,96, +1,96] vale 0,95; c’è cioè una probabilità del 95% che un’osservazione cada all’interno di questo intervallo.

Tale probabilità sale al 99% se si considera l’intervallo [–2,58, +2,58].

X

0,68

0,16 0,16

Page 5: Unità  4

5

Page 6: Unità  4

6

In generale la probabilità che un’osservazione cada all’interno di un generico intervallo [[ –– hh, ,  ++ hh ]], con h arbitrario, può essere facilmente dedotta da tabelle riportate nei principali manuali di statistica.

Il parametro (valore medio) (valore medio) individua la posizione occupata dalla curva nel piano. Infatti, tenendo costante e facendo variare , la curva trasla semplicemente lungo l’asse delle ascisse, come è mostrato in figura sotto.

x

Page 7: Unità  4

7

Il parametro parametro (deviazione standard) (deviazione standard) dà invece informazioni su come i valori sono più o meno dispersi attorno alla media.

Ciò è evidente guardando la figura sotto che riporta tre diverse curve gaussiane aventi lo stesso valore di , ma valori differenti per . All’aumentare di la curva diventa più piatta, poiché i valori sono più dispersi attorno alla media.

X

Page 8: Unità  4

8

LA STANDARDIZZAZIONE

La standardizzazione è un procedimento che riconduce una variabile aleatoria distribuita con media μμ e deviazione standard σ, ad una variabile aleatoria con distribuzione standard, ossia con media zero e deviazione standard pari a 1.

È particolarmente utile nel caso della variabile casuale normale per il calcolo della funzione densità di probabilità e dei percentili con le tavole della gaussiana standard.

Infatti i valori della distribuzione normale sono tabulati per media zero e varianza unitaria.

Page 9: Unità  4

9

Il procedimento prevede di sottrarre alla variabile aleatoria la sua media e dividere il tutto per la deviazione standard, passando così dalla variabile originaria XX ad una nuova variabile ZZ (Z-score o standard score):

X

Z

Z

Curva gaussiana standardizzata

Page 10: Unità  4

10

Area a destra

di Z

Area sottesa alla curva di Gauss standardizzata nella coda a destra di ZArea sottesa alla curva di Gauss standardizzata nella coda a destra di Z

Page 11: Unità  4

11

Area a sinistra

di Z

Area sottesa alla curva Area sottesa alla curva di Gauss standardizzata di Gauss standardizzata a sinistra di Za sinistra di Z

Page 12: Unità  4

12

Uso della tavola di probabilità gaussiana

Due sono gli usi della tavola di probabilità:

Definito un intervallo di valori per X, si vuole calcolare la probabilità che un valore x cada al suo interno.

Definita una probabilità, si vuole calcolare l’intervallo dei valori X che corrisponde a tale probabilità.

Page 13: Unità  4

13

Esercizio 1Esercizio 1

Si consideri una popolazione con altezza distribuita in maniera gaussiana con media (µ) pari a 172,5 cm e con deviazione standard (σ) pari a 6,25 cm.

Qual è la probabilità di incontrare un individuo estratto da tale popolazione di altezza superiore a cm 190?

Z = (190 – 172,5) / 6,25 = 2,8

Dalla tavola precedente risulta

P = 1 – 0,9974 = 0,0026P = 1 – 0,9974 = 0,0026

Quindi la probabilità di trovare un soggetto più alto di 190 cm è inferiore a 0,3%.

Page 14: Unità  4

14

Esercizio 2Esercizio 2

Qual è la probabilità di incontrare un individuo estratto dalla popolazione dell’esercizio 1 con un’altezza compresa tra cm 165 e175?

Z1= (165 – 172,5) / 6,25 = -1,2Z2= (175 – 172,5) / 6,25 = 0,4

P(Z1) = 0,115

P(Z2) = 0,345

P(165 ≤ X ≤ 175) =P(165 ≤ X ≤ 175) == P(-1,2 ≤ Z ≤ 0,4) = = P(-1,2 ≤ Z ≤ 0,4) = = 1- [0,115 + 0,345] = 0,54= 1- [0,115 + 0,345] = 0,54

Page 15: Unità  4

15

Esercizio 3Esercizio 3

Qual è quel valore di altezza che delimita il 5% superiore della distribuzione?

P = 0,05 z = 1,645

z = (x-172,5)/6,25 = 1,645

↓ ↓x = 172,5 + 6,25x = 172,5 + 6,25∙∙1,645 = 182,781,645 = 182,78

Circa il 5% della popolazione in studio ha un’altezza superiore di 182,78 cm.