53
Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi [email protected] Appunti completi disponibili su http://bb.math.unifi.it/~gandolfi/didindex.ht ml

Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Embed Size (px)

Citation preview

Page 1: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Calcolo delle probabilità per le scuole superiori

Laboratorio

Convegno "Il piacere di insegnare - il piacere di imparare la matematica"

Alberto [email protected]

Appunti completi disponibili su http://bb.math.unifi.it/~gandolfi/didindex.html

Page 2: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Eventi casuali • Il calcolo delle probabilità e la statistica costituiscono quella parte

della matematica e,  più in generale, della scienza che si occupa di fenomeni casuali.

Partiamo da due problemi.

• Problema 1: lanciando 1000 volte una moneta, quale sarebbe la vostra reazione di fronte a 510 teste? E a

492, 459, 423, 397, 354, 299, 212, 154, 22? • Problema 2: cercando la porta vincente tra 3, ne scegliamo una e

poi ci viene mostrata una porta non vincente tra le altre: conviene cambiare la nostra scelta? O preferiremmo che la porta fosse aperta prima di fare la scelta?

 

Page 3: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità

In questi problemi non si riesce a determinare con certezzal'esito tra varie possibili alternative.

Due cause possibili:- mancanza di informazioni - l'indeterminatezza connaturata. Ma non ci interessa: per l'indeterminatezza chiameremo talieventi "casuali". Per fare comunque previsioni introduciamo una nuova

quantità: la probabilità.

Page 4: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Caratteristiche della probabilità

- Non importa la sua vera natura: basta che sia misurabileed utile in casi interessanti. - Si determina attraverso processi logici. - E' un numero puro e si esprime in genere in frazioni di100 (tipo 30%) o con un numero in [0,1].  Quest'ultimo metodo è conveniente per le moltiplicazioni: il 3% del 40% èl'1,2%, facilmente ottenibile da 0,03x0,40=0,12.

Page 5: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Interpretazioni della probabilità

• Esistono varie scuole su come definire la probabilità:

 • - Frequentista • - Soggettiva • - Bayesiana • - Convenzionalismo

Page 6: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Obiettivi didattici

nell'insegnamento della probabilità: • deduzione logica di una teoria da alcune ipotesi

• fornitura di alcuni elementi per l'interpretazione del mondo reale, inclusi giochi, dati, sondaggi

• esemplificazione dell’uso di alcuni strumenti matematici presentati nel corso

Page 7: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Prima formalizzazione

• Iniziamo da una formulazione elementare, che può rimanere l’unica se si intende esporre una parte limitata della teoria.

• Con qualche esempio si vede la naturalezza dell’uso della terminologia insiemistica per descrivere le probabilità:

- Tutte le realizzazioni possibili sono un insieme S- Un evento è un sottoinsieme di S- La probabilità è una funzione P sui sottoinsiemi di S

Page 8: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità uniformi

Page 9: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Alcune proprietà elementarida derivare (o far derivare) rigorosamente

Page 10: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Calcolo combinatorio

Page 11: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità finite

• Per poter fare modelli di situazioni più generali si considerano casi in cui probabilità non sono tutte uguali.

• Si prendono come punti di partenza le prime tre proprietà dimostrate nel caso uniforme:

Page 12: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Costruzione delle probabilità finite

• La teoria è molto elementare e tutti gli esempi di spazi di probabilità finiti si costruiscono come segue:

Page 13: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità dell’unione di eventi

• Talvolta è utile dedurre la probabilità da quella di eventi più semplici.

Page 14: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità del complemento

• Nello stesso spirito di prima:

Page 15: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Indipendenza

Page 16: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Due direzioni dell’indipendenza

L’indipendenza naturalmente è utile quando

si usa senza verificarla. Questo pone

qualche problema di consistenza con

definizione precedente.

Per i corsi elementari accontentiamoci di dire che omettiamo la verifica.

Page 17: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Indipendenza dei complementi

• Un risultato elementare che verifica che la teoria si sta sviluppando coerentemente riguarda l’indipendenza dei complementi:

Page 18: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Riepilogo primi calcoli delle probabilità

Page 19: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Distribuzione di Bernoulli

• Con i metodi appena riassunti si ricava la distribuzione di Bernoulli o Binomiale (n,p):

Page 20: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Foglio di calcolo

• Usando le funzioni di un foglio elettronico di calcolo si possono calcolare alcune probabilità. Ad esempio il valore della distribuzione Binomiale(n, p). Qui di fianco i valori di p(k,2k,1/2).

k Prob k succ su 2k prove

10 0,176197

20 0,125371

30 0,102578

40 0,088928

50 0,079589

60 0,072685

70 0,067313

80 0,06298

90 0,059388

100 0,056348

110 0,053732

120 0,05145

130 0,049435

10 0,176197

100 0,056348

1000 0,017839

10000 0,005642

100000 0,001784

1000000 0,000564

10000000 0,000178

1E+08 5,64E-05

1E+09 1,78E-05

1E+10 #NUM!

1E+11 #NUM!

1E+12 #NUM!

Page 21: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Osservazioni sulle monete

• Anche il numero di teste che ci aspettiamo (n/2 su n) ha probabilità che tende a 0. Quindi queste espressioni non servono per il problema 1.

• E’ chiaro però che la probabilità di un numero di successi minore o uguale a k può non tendere a 0.

Riprenderemo la questione quando avremo più strumenti.

Page 22: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Interpretazioni della probabilità

• Vediamo i progressi fatti: sui problemi

(1) sappiamo scrivere le varie probabilità

(2) nessun progresso

Come interpretare le probabilità?

- A priori ci si aspetta che specifici eventi di probabilità piccola non si realizzino

- A posteriori: si sarà realizzato qualche evento di probabilità piccola, ma non era prevedibile quale.

Page 23: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità condizionate

• Talvolta interessa la probabilità di un evento sapendo che un altro si è realizzato.

Anche in questo caso ci sono due direzioni: a volte si ricava P(A|B) dalla situazione concreta e lo si usa per ottenere uno degli altri termini.

Page 24: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Probabilità totali o composte

Page 25: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Dimostrazione del teorema

Page 26: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Il problema del premio dietro alla porta

• Finalmente abbiamo gli strumenti per rispondere al problema 2:

Page 27: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Formula di Bayes

Formula di Bayes e probabilità condizionate sono usate ampiamente nei calcoli di genetica.

Page 28: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Variabili aleatorie

• Una funzione X definita su un insieme S su cui sia definita una probabilità P è detta variabile aleatoria

• La sua distribuzione è l’insieme dei valori x che assume e delle relative probabilità P(X=x).

Page 29: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Valore atteso

• Con qualche esempio si vede che il valore atteso o valor medio emerge sia come risultato medio dopo molte prove che come valutazione equa di un esperimento aleatorio.

Page 30: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Significato del valore atteso

Page 31: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Linearità del valore atteso

• Il valore atteso è lineare. • Questa dimostrazione si può cominciare ad omettere.

Page 32: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Indipendenza di variabili aleatorie

La verifica che questa definizione generalizza l’indipendenza di eventi è un po’ laboriosa dovendo considerare sottofamiglie di eventi e si omette.

Page 33: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Misure della deviazione dal valor medio

• Per valutare quanto in media una variabile aleatoria si discosta dal suo valore atteso si introduce la deviazione standard SD:

• per valutare la quale il primo passo è la varianza:

Page 34: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Additività della varianza

• Sorprendentemente, la varianza è additiva per variabili aleatorie indipendenti.

• (volendo si può presentare agli studenti una dimostrazione)

Page 35: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Deviazione standard per il numero di teste

Per cui per n lanci di una moneta, essendo p=1/2, la deviazione standard è ½

Questo suggerisce già qualcosa sul problema delle monete, ma prima di completare l’analisi introduciamo le variabili continue.

Page 36: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Variabili continue

• Finora si sono viste variabili aleatorie con un numero finito di valori. Vari esempi suggeriscono che a volte è utile considerare variabili che assumono valori sul continuo.

• Ad esempio se si spezza un bastoncino a caso o si considera l’orario di un arrivo.

Page 37: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Densità delle variabili continue

• Le variabili aleatorie continue sono ben descritte prendendo una densità di probabilità f, analoga alla densità di massa, che soddisfa:

• La probabilità poi si calcola con gli integrali

Page 38: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Esempi di variabili continue

Page 39: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Valore atteso di variabili continue

Page 40: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Funzione di distribuzione

• Un altro modo per descrivere una variabile aleatoria è la funzione di distribuzione. Non è un metodo intuitivo, ma talvolta è molto utile:

Page 41: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Simulazione di una variabile uniforme

Page 42: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Simulazione di variabili continue

Page 43: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Analisi di dati

• Per analizzare dati casuali (che interpretiamo come realizzazioni di variabili aleatorie) si utilizzano le stesse quantità calcolate però sui dati, e quindi dette empiriche:

indicate nei fogli di calcolo con funzioni tipo MEDIA,

DEV ST, VAR

• Il valor medio empirico è anche detto media empirica e può essere a sua volta pensato come funzione delle variabili aleatorie.

Page 44: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Convergenza della media empirica

Page 45: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Teorema centrale del limite

• Con qualche calcolo questo risultato permette di stimare molto accuratamente la probabilità che la somma di variabili indipendenti disti più di una data costante dal valore atteso.

Page 46: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Illustrazione grafica del TCL

• Ci sono molti siti in cui si può vedere come la distribuzione della somma di variabili indipendenti converge ad una normale.

• Per le variabili Bernoulli si veda per esempio http://cnx.org/content/m11198/latest/

Page 47: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Stima della deviazione dal valore atteso

Page 48: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Stima della deviazione della media empirica dal valore atteso

• Abbiamo visto che la media empirica approssima il valore atteso, ma il TCL permette di dare una stima più accurata:

• Questa osservazione si usa nei problemi di misura fornendo una stima di quanto la media empirica delle misurazioni disti dalla misura “vera”.

Page 49: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Variabili congiunte

• Spesso si considerano più variabili aleatorie allo stesso momento. Queste possono essere non essere indipendenti, e quindi occorre una trattazione delle distribuzioni congiunte.

• In un corso di scuola superiore conviene però limitarsi ad un caso semplice: una misura del grado di dipendenza di due variabili aleatorie.

Page 50: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Correlazione

• Date due variabili aleatorie X ed Y si introduce la covarianza:

• E poi la misura adimensionale della dipendenza, detta correlazione:

Page 51: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Proprietà della correlazione

• La correlazione soddisfa:

• Quando r=1 oppure r=-1 c’è dipendenza lineare tra X ed Y. Quando X ed Y sono indipendenti r=0. Per cui r misura la dipendenza di X ed Y

Page 52: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Correlazione empirica

• I fogli di calcolo forniscono di solito una funzione, a volte indicata con CORRELAZIONE che calcola questo valore sui dati.

Page 53: Calcolo delle probabilità per le scuole superiori Laboratorio Convegno "Il piacere di insegnare - il piacere di imparare la matematica" Alberto Gandolfi

Test: un modello per pesi ed altezze