Corso di biomatematica lezione 4: La funzione di Gauss Davide Grandi

Preview:

Citation preview

Corso di biomatematica Corso di biomatematica lezione 4:lezione 4:

La funzione di GaussLa funzione di Gauss

Davide Grandi

Sommario•Distribuzione di Gauss:•Rappresentazione matematica•integrali•valor medio•Stima della varianza•Somma in quadratura

Distribuzioni continue

Davide Grandi - Dottorato in Biologia

• Funzione di distribuzione normale o di Funzione di distribuzione normale o di GaussGauss

Partendo dall’idea di distribuzioni limite, abbiamo il

passaggio da una serie di valori discreti ad una funzione

continua (distribuzione di probabilità).Quindixi f(x)quindi avremo che f(x)dx saranno le misure

che cadono in un intervallo compreso tra x e x+ dx La sommatoria si sosituirà con l’integrale

Distribuzioni continue

Davide Grandi - Dottorato in Biologia

• Funzione di distribuzione normale o di Funzione di distribuzione normale o di GaussGauss

E avremo in particolare il valor medio

Ed inoltre la varianza sarà

Corrispondente allo scarto quadratico medio (detti i

gli scarti)

dxxxfx )(

dxxfxx )()( 22

N

i2

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

Valore vero di una grandezza: quello a cui ci si avvicina

sempre più facendo un gran numero di misure (vedi esempi

dei dadi)Se le misure sono soggette ad errori casuali

“piccoli” e posso trascurare gli errori sistematici, la loro

distribuzione può assumere la forma di una campana centrata

sul valore più probabile, in altre parole da funzione di

distribuzione di probabilità che meglio approssima la mia

distribuzione di dati può essere la funzione di Gauss:

expmx

2

)(2

2

21)(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

La curva è centrata sul valore x=m ed in corrispondenza di

esso assume il valore

La funzione è normalizzataposso partire dalla distribuzione

e trovare il coefficiente di normalizzazione dalla condizione

21

Nexfmx

2

)(2

2

)(

1)(

dxxf

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Teorema del limite centraleTeorema del limite centraleLe medie di campioni di dimensioni n

sufficientemente grandi estratti da una popolazione

comunque distribuita, seguono la legge di distribuzione normale

con media m e varianza 2/nDa questo si deduce immediatamente

l’importanza di studiare la distribuzione normale o

gaussianaIl teorema si può utilizzare anche nel limite

della somma di un numero relativamente piccolo di

variabili, dell’ordine della decina

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Integrali della funzioneIntegrali della funzioneL’integrale della funzione di Gauss non è

risolvibile matematicamente, ma attraverso metodi

numerici. La probabilità che una variabile aleatoria cada

in un intervallo centrato su m (valor medio) di larghezza è

data da:

dxxp

m

m

)(

m

m

dxmx

e 2

)(2

2

21

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Integrali della funzioneIntegrali della funzioneNel grafico si vede la probabilità che la mia

variabile aleatoria cada in un intervallo di larghezza

t centrato sempre sul valo medio m

Questo corrisponde al un limite di confidenza del 68% t=1,95% t=2 etc.

dxxp

tm

tm

)(

tm

tm

dxmx

e 2

)(2

2

21

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Integrali della funzioneIntegrali della funzioneRicapitolando:Probabilità che le misure siano comprese

tra 1. m – e m+ 68,27%2. m – 2 e m+ 2 95,45%3. m –3 e m+ 3 99,73%

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Distribuzione standardizzataDistribuzione standardizzataEseguendo la sostituzione X=(x – m)/

riduco alla stessaforma tutte le distribuzioni normali,

rendendo m=0 il valor medio (distribuzione centrata nello zero) e

prendo come unità di misura, ovvero ho una distribuzione con Gli scarti x – m diventano scarti ridotti (x – m)/ e la probabilità sarà

expx2

2

21)(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataricordiamo che ora abbiamo lo scarto

standardizzatoz=(x – m)/ • Data una popolazione di pesci di

lunghezza media m=35 cm e deviazione standard =5 cm

Calcoliamo la probabilità di averel 40 (a destra di z=1)l<40 (a sinistra di z=1)l<25 (a sinistra di z= – 2)l 40 e l 50 (tra z=1 e z=3)l 30 e l 40 (tra z=– 1 e z=1)

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataSapendo che area sottesa tra m e z=+1 è 34,13%a sinistra z= – 2 2,28%Avremo….

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataSapendo che area sottesa tra m e z=+1 è 34,13%a sinistra z= – 2 2,28%

Avremo….l 40 (a destra di z=1)

15,87%l<40 (a sinistra di z=1)

84,13%l<25 (a sinistra di z= – 2)

2,28%l 40 e l 50 (tra z=1 e z=3)

15,73%l 30 e l 40 (tra z=– 1 e z=1)

68,26%

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Applicazione alle distribuzioni discreteApplicazione alle distribuzioni discreteMolte distribuzioni discrete sono

approssimate dalla distribuzione gaussianaLe distribuzioni discrete forniscono

probabilità per singoli valori, cioè la probabilità di ottenere

esattamente il numero x, mentre con le distribuzioni continue si

calcola l’area sottesa, quindi per applicarlo a distribuzioni

discrete si deve omeglio “dovrebbe” calcolare l’area sottesa

nell’intervallo x 0,5

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Media come migliore stimaMedia come migliore stimaNon essendo mai nota la funzione f(x)

eventualmente gaussiana, abbiamo solo a che fare con le

misure (discrete){x1, x2, x3,……xn}e vorrei arrivare alla miglior stima di XSe fossero noti X e potrei risalire alla f(x)

e quindi anche alla probabilità di ottenere i valori x1, x2, x3,

……xn

Ovvero per ottenere x compreso tra x1 e x+dx1 abbiamo

dxedxxxxPXx

11 2)1(

112

2

21)(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Media come migliore stimaMedia come migliore stimaSemplificando avremo

La probabilità di ottenere l’intero insieme di N valori sarà il

prodotto delle probabilità, quindi

exPXxN

N 2

)(2

2

1)(

exxPXxi

NNX 2

)(

1,2

2

1).....(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Media come migliore stimaMedia come migliore stimaLe stime migliori per X e sono quelle più

probabili, ovvero quelle che massimizzano P(x..), cioè

dobbiamo minimizzare l’esponente, quindi dovremo avere

Ovvero

da cui

02

2

1

N

ii Xx

02

1

N

ii Xx XN

xiN

i 1

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Media come migliore stimaMedia come migliore stimaLa stima migliore per si ottiene derivando

rispetto a e ponendo la derivata uguale a zero, quindi

O sostituendo il valor medio al valore vero

N

XxN

ii

2

1

N

xxN

ii

2

1

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Stima dello scarto quadratico medioStima dello scarto quadratico medioPartendo da una serie di dati vogliamo

confrontarci con la distribuzione gaussiana, ovvero stimare i

parametri che la caratterizzano (m e ).Ricordiamo l’errore di una singola misura:

Dove zi è lo scarto dalla media della misura i-esima, al

quadrato avrò

zii

zzz iiii 2222

2

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Stima dello scarto quadratico medioStima dello scarto quadratico medioSommando otteniamo

Divido per N otteniamo

Ora abbiamo che (distribuzione gaussiana)

222 Nzii

222

2 Nz

Nii

2

222

NNii

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Stima dello scarto quadratico medioStima dello scarto quadratico medioOvvero

Ed infine

N

2

2

NN

zi 22

2

1

22

Nzi

1

2

Nzi

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Stima dello scarto quadratico medioStima dello scarto quadratico medioInoltre dalla relazione

Deduco l’errore della media che sarà dunque

E non semplicemente

N

2

2

)1(

2

NNzi

x N

i

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Somma in quadraturaSomma in quadraturaPer introdurre la propagazione degli errori

vediamo come ad esempio stimare l’errore nella misura di

una grandezza Z=X+Y date le misure delle due grandezze

X e Y e le rispettive deviazioni standard sono x e y .Date le due distribuzioni di probabilità

avremo:eyP y

Y2

)(2

2

)(

exP x

X2

)(2

2

)(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Somma in quadraturaSomma in quadraturaEssendo X e Y misurati indipendentemente,

la probabilità di ottenere X e Y è data dal prodotto delle

due, ovvero:

Ora possiamo calcolare la probabilità di ottenere X+Y si può

dimostrare che:

eyxP yx

YX

2

2

2

2

2

1

),(

eyxP

Zyx

YX

2)22(2

22

),(

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Somma in quadraturaSomma in quadraturaCioè che vale

Da cui

ovvero

),(),( zyxPyxP

edzzyxPyxP yx

YX

)22(2

2

),()(

22

yxz

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

• Media pesata e deviazione standardMedia pesata e deviazione standardRicordiamo la definizione IMPRECISA data

della media pesata e ridefiniamola correttamente, date

le incertezze i definiamo il peso i

da cui ottengo il valor medio

Davide Grandi - Dottorato in Biologia

2

1i

i

2

2

1i

i

i

p

x

x

Distribuzione Normale

Davide Grandi - Dottorato in Biologia

Ed ottengo l’espressione dell’errore che sarà:

Che per i = si riduce a

2

1

1

i

x

Nx

Recommended