55
1 Alessandro De Falco, INFN Cagliari 4/1/14 Probabilità e statistica Probabilità e statistica Teoria delle probabilità branca della matematica pura (assiomi->deduzioni) basata sulla conoscenza a priori della probabilità intrinseca di un evento Es.: nota la probabilità p di ottenere un certo valore col lancio di un dado, determinare P(k,n,p) Statistica branca della matematica applicata (induttiva) Es. p, non nota, viene misurata mediante esperimenti. Si ottiene la stima di un intervallo p 1 < p < p 2

Probabilità e statistica - INFN Cagliarigruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_01... · Probabilità e statistica Teoria delle probabilità branca della matematica

Embed Size (px)

Citation preview

1Alessandro De Falco, INFN Cagliari 4/1/14

Probabilità e statisticaProbabilità e statistica

Teoria delle probabilità

branca della matematica pura (assiomi->deduzioni)

basata sulla conoscenza a priori della probabilità intrinseca di un evento

✔ Es.: nota la probabilità p di ottenere un certo valore col lancio di un dado, determinare P(k,n,p)

Statistica

branca della matematica applicata (induttiva)

✔ Es. p, non nota, viene misurata mediante esperimenti. Si ottiene la stima di un intervallo p

1 < p < p

2

2Alessandro De Falco, INFN Cagliari 4/1/14

Definizione di probabilitàDefinizione di probabilità

Diverse definizioni, con approcci differenti

Definizione assiomatica (matematica)

Definizione classica

Definizione frequentista

Definizione soggettiva (bayesiana)

Ciascuna definizione ha aspetti positivi e limiti

Usare la definizione che si adatta al caso in studio

3Alessandro De Falco, INFN Cagliari 4/1/14

Probabilità: definizione assiomaticaProbabilità: definizione assiomatica

Definisco P(A) come un numero che soddisfa agli assiomi di Kolmogorov:

P A ≥0 A∈E E: spazio degli eventi

P ∪i=1

Ai=∑i=1

P A i se A i∩A j=∅ ∀ i≠ j

PE =1

A i∈E

4Alessandro De Falco, INFN Cagliari 4/1/14

La probabilità definita con gli assiomi di Kolmogorov gode delle seguenti proprietà:

P A=1−P A P ∅=0

P A≤P B se A⊆B

P A =1−P A infatti A∪A=E

dunque P E=P A∪A =P AP A

P A =P E−P A =1−P A

P ∅=0 infatti P ∅=P E=1−P E=0

P A≤P B se A⊆B infatti P B=P [B−A∪A]=P B−A P AP B−A ≥0

5Alessandro De Falco, INFN Cagliari 4/1/14

Possiamo facilmente generalizzare l'affermazione

P A∪B=P APB se A∩B=∅

nel modo seguente:

P A∪B=P APB−P A∩B

Infatti:

A∪B=A∪[B−A∩B]B=[B−A∩B]∪A∩B

Poichè ho espresso AUB e B in termini di insiemi disgiunti:

P A∪B=P AP [B−A∩B]P B=P [B−A∩B]∪P A∩B

sottraendo membro a membro, ho:

P A∪B=P APB−P A∩B

6Alessandro De Falco, INFN Cagliari 4/1/14

Gli assiomi di Kolmogorov ci permettono di fornire una formulazione matematica elegante e rigorosa, che però non fornisce alcuna informazione su P(A)

Dobbiamo quindi trovare un modo di determinare operativamente P

Come detto, abbiamo a disposizione diversi approcci

definizione classica (numero di casi favorevoli su numero di casi possibili)

Definizione frequentista (limite della frequenza dei successi, per un numero di prove che tende ad infinito)

Approccio bayesiano (probabilità soggettiva)

7Alessandro De Falco, INFN Cagliari 4/1/14

Definizione classicaDefinizione classica

La probabilità di un evento è definita come numero di casi favorevoli diviso per il numero di casi possibili

Si suppone che i casi possibili siano equiprobabili, o riconducibili alla condizione di equiprobabilità

P= kN

k=numero di casi favorevoliN=numero di casi possibili

8Alessandro De Falco, INFN Cagliari 4/1/14

Definizione classica: vantaggi e svantaggiDefinizione classica: vantaggi e svantaggi

Pregio: associamo la probabilità non a un comportamento collettivo (come nella definizione frequentista che verrà data tra breve) ma ad una proprietà intrinseca del singolo elemento

Implicazioni in QM: P deve essere una proprietà della particella

Potenziali difficoltà nell'individuare i casi equiprobabili

Problemi con le variabili continue

Esempio: Una caraffa contiene un bicchiere d'acqua e tra uno e due bicchieri di vino.Qual è il rapporto più probabile acqua/vino?

✔ tra 1 e 2 --> 3/2

Qual è il valore più probabile del rapporto vino/acqua?

✔ tra 1/2 e 1 --> 3/4 (ma 3/4 != 2/3)

Paradosso di Bertrand

9Alessandro De Falco, INFN Cagliari 4/1/14

Paradosso di Bertrand (1888)Paradosso di Bertrand (1888)Considero un triangolo equilatero inscritto in un cerchio. Qual è la probabilità che una corda presa a caso sia più lunga del lato del triangolo?

1- scelgo un estremo su un vertice (A) prendo l'altro a caso sulla circonferenza. Le corde che attraversano il triangolo (AB) sono più lunghe, le altre più corte (AB'). Le prime sono comprese in un angolo di 60o, su un totale di 180o. Dunque la probabilità è 1/3

A

B

B'

2- Prendo il raggio (OC) perpendicolare a un lato come in figura. Il lato divide il raggio in due parti uguali. Traccio la corda che ha per punto medio un punto a caso (A) del raggio. Se A sta tra O e B la corda è più lunga del lato. Poichè OB=1/2 OC, la probabilità è 1/2

AO

BC

3- Scelgo a caso un punto (A) dentro il cerchio, e prendo la corda che ha come punto medio A. Se A cade entro il cerchio inscritto nel triangolo (raggio metà di quello circoscritto) la corda è più lunga del lato. Poichè la probabilità è proporzionale all'area e dunque a r2 , la probabilità è 1/4

A

10Alessandro De Falco, INFN Cagliari 4/1/14

Il paradosso di Bertrand porta a tre conclusioni differenti tra loro, a partire da tre procedure differenti per scegliere una corda in modo 'casuale'

Possono essere ideate altre soluzioni corrispondenti a criteri 'casuali'

Esercizio: Eseguire una simulazione al computer che permetta di calcolare la probabilità che una corda estratta casualmente sia più lunga del lato del triangolo equilatero, secondo i seguenti criteri:

Estraggo in maniera casuale, con distribuzione piatta, le coordinate di due punti interni al cerchio; calcolo la lunghezza della corda e vedo se è maggiore del lato del triangolo equilatero inscritto. Ripeto il calcolo N volte e determino la frequenza con cui questa condizione è verificata

Eseguo l'esercizio analogo, sostituendo all'estrazione delle coordinate l'estrazione degli angoli

Stimare l'errore statistico con cui si determina il rapporto

y1

A

B

A

Bx

1

x2

y2

A

B

A

B 1

11Alessandro De Falco, INFN Cagliari 4/1/14

Definizione frequentistaDefinizione frequentista

Definiamo la probabilità nei termini del limite della frequenza di un evento A:

Criterio nettamente prevalente in ambito scientifico

L'esperienza mostra che la probabilità frequentista tende a convergere a quella classica (quando applicabile) per un numero grande di prove (legge dei grandi numeri)

Verifica dell'equiprobabilità dei casi

Con la definizione frequentista si stima un intervallo di confidenza

P A =limn∞

kn

0≤P A ≤1

12Alessandro De Falco, INFN Cagliari 4/1/14

Limiti nella definizione frequentistaLimiti nella definizione frequentista

La probabilità frequentista non può essere osservabile, perchè richiede un numero infinito di esperimenti

La probabilità secondo questa definizione è una proprietà del processo e dell'insieme considerato

Non si applica ad eventi unici:

Qual è la probabilità che domani piova?

Qual è la probabilità che una data squadra vinca una competizione sportiva?

13Alessandro De Falco, INFN Cagliari 4/1/14

NA

Probabilità condizionataProbabilità condizionata

A,B: due sottoinsiemi dello spazio campionario E

Siamo interessati solo agli elementi di A:

Qual è la probabilità di B relativa ad A?

Probabilità di B condizionata ad A

Ovviamente

PB∣A P A∩B=PB∣A P A

A BE

A

NB

NAB

NA

P A∩B=N AB

N

P A =N A

N

PB∣A =N AB

N A

14Alessandro De Falco, INFN Cagliari 4/1/14

Determino il segno di m=m(KL

0)-m(KS

0) studiando

(1) Produzione del K0:

(2) K0 rivelato mediante decadimento (ev. B)

(3) Evento “interessante”: scattering (ev. A)

Un esempio: sezione d'urto di scattering K0pUn esempio: sezione d'urto di scattering K0p

K0 p K0 p

K0 p K0 p

K0 −

KpK0

p

K0pK 0p

K0 −

K pK0 p

K0pK 0p (Ev A)

(Ev B)

-Determino come frazione degli eventi che danno una catena completa sul totale delle interazioni (1)-Calcolo conoscendo efficienza e accettanza del rivelatore, branching ratio per il decadimento (2), vita media del K. -Ricavo P(A)-Oss.

P A∩B

PB∣A

PB≠PB∣A

15Alessandro De Falco, INFN Cagliari 4/1/14

Nev non rivelati:N-(NA+NB-NAB)

Due sottoinsiemi A e B sono indipendenti se

In questo caso

Esempio 1: Rivelazione del 0 tramite il decadimento

Esempio 2: Efficienza di scanning

Variabili indipendentiVariabili indipendenti

PB∣A =PB

P A∩B=P A PB

0

NA

A BE

A

NB

NAB

NA

N: numero totale di eventiAssumo che: 1- Gli scanning siano indipendenti2- Tutti gli eventi abbiano la stessa

probabilità di rivelazione3- Il numero di eventi sia abbastanza

grande da permettere l'uso deimetodi statistici

16Alessandro De Falco, INFN Cagliari 4/1/14

Teorema di BayesTeorema di Bayes

Bi=n eventi mutuamente esclusivi che compongono lo spazio degli

eventi E: iP(B

i)=1

se A appartiene ad E,

PBi∣A=P A∣B i PBi

∑j=1

n

P A∣B jP B j

Teorema di Bayes

PBi∩A=P Bi∣A P A=P A∣BiP Bi

P A =∑j=0

n

P A∣B jPB j Probabilità marginale

17Alessandro De Falco, INFN Cagliari 4/1/14

Un test diagnostico risulta efficiente al 100%, ma dà 5% di falsi positiviE' stabilito che l'incidenza della malattia nella popolazione è 1%Qual è la probabilità che un individuo positivo al test sia realmente malato?

dal teorema di Bayes:

dunque, solo il 17% degli individui risultati positivi al test sono realmente malati

Esercizio: qual è la probabilità che il paziente sano risultato positivo al primo test lo risulti anche al secondo? E al terzo?

P P |S=0.05P N |S=0.95

P P |M =1P N | M =0

P M =0.01P S=0.99

P M |P=P P |M P M

P P | M P M P P |SP S=

0.010.010.0495

=0.168

Teorema di Bayes: esempio 1Teorema di Bayes: esempio 1

18Alessandro De Falco, INFN Cagliari 4/1/14

Ho delle monete di rame (R) e nickel (N) in tre cassetti Bi:

B1(R,R) B

2(R,N) B

3(N,N)

Scelgo in maniera casuale uno dei cassetti da cui estraggo una moneta di rame. Qual è la probabilità che anche l'altra moneta sia di rame?

L'evento A corrisponde alla prima estrazione della moneta di rame.

Abbiamo:

Inoltre assumiamo:

Dunque, secondo il teorema di Bayes:

Esercizio: Sono date due sorgenti radioattive S1 ed S2. S1(S2) emette nel 75% (33%) dei casi e nel restante 25%(67%). Una sorgente viene scelta casualmente tra le due, e il primo decadimento osservato è un . Qual è la probabilità che anche il secondo decadimento sia un ?

Teorema di Bayes: esempio 2Teorema di Bayes: esempio 2

P A∣B1=1 P A∣B2=1/2 P A∣B3=0

PB1=P B2=P B3=1/3

PB1∣A=P A∣B1P B1

∑ j=1

nP A∣B jPB j

=

1⋅13

131

120

=23

19Alessandro De Falco, INFN Cagliari 4/1/14

Teorema di Bayes: un'osservazione importante

Teorema di Bayes: un'osservazione importante

Nell'esempio precedente, la conoscenza del primo risultato (moneta di rame) condiziona la probabilità di ottenere un certo risultato nel secondo (altra moneta di rame)

Questo può aiutarci a ridefinire la probabilità di un evento, quando abbiamo acquisito più informazioni sul sistema

Questo aspetto è particolarmente importante nell'approccio bayesiano

20Alessandro De Falco, INFN Cagliari 4/1/14

Definizione soggettiva della probabilità: approccio Bayesiano

Definizione soggettiva della probabilità: approccio Bayesiano

21Alessandro De Falco, INFN Cagliari 4/1/14

L'approccio Bayesiano può essere usato per discriminare diverse ipotesi H

I mediante la misura M di una variabile fisica

P(HI) è la probabilità (soggettiva) che attibuiamo all'ipotesi, ovvero il

“grado di fiducia” che nutriamo nei confronti della teoria.

Varia da individuo a individuo

La conoscenza di nuovi elementi (-> misure) modifica il valore di P(H

I)

Un processo iterativo può eliminare l'elemento iniziale di soggettività

Definizione soggettiva della probabilità: approccio Bayesiano (2)

Definizione soggettiva della probabilità: approccio Bayesiano (2)

PH i∣M =PM∣H iP H i

∑i

P M∣H iP H i

22Alessandro De Falco, INFN Cagliari 4/1/14

Approccio bayesiano: un esempioApproccio bayesiano: un esempio

Un'urna contiene 5 palline, bianche e nere. Non si conosce la proporzioneValutare la probabilità che ci siano k palline nere, se dopo un'estrazione ho ottenuto una pallina nera. Valutare la stessa probabilità se dopo 5 oppure 10 estrazioni ho ottenuto sempre delle palline nere

Ipotesi Hk: ho k palline nere nell'urna (0<= k <=5)

........

Che probabilità a priori (prior) attribuisco a Hk?

Quanto i risultati sono sensibili a questo prior?

23Alessandro De Falco, INFN Cagliari 4/1/14

Approccio bayesiano: un esempio in fisica delle particelle

Approccio bayesiano: un esempio in fisica delle particelle

Identificazione delle particelle PID (Particle IDentification)

Diverse tecnologie per l'identificazione delle particelle efficaci a diversi valori del momento

Nei grandi esperimenti è normale trovare diversi rivelatori in grado di permettere il PID

Come si possono combinare le diverse informazioni?

24Alessandro De Falco, INFN Cagliari 4/1/14

25Alessandro De Falco, INFN Cagliari 4/1/14

Identificazione delle particelleIdentificazione delle particelle

Per conoscere la massa di una particella occorre conoscere energia e momento (o p e v, etc...)

p=Ep m2c4=E2−p2 c2

p=mv

oppure:

=1

1−v2/c2

E=mc2

...

occorre determinare simultaneamente due di queste quantità

26Alessandro De Falco, INFN Cagliari 4/1/14

Perdita di energia delle particelle cariche nella materia

Perdita di energia delle particelle cariche nella materia

E' possibile determinare l'identità di una particella anche misurando simultaneamente il momento e la perdita di energia nella materia o le caratteristiche dell'interazione

Oppure si può considerare la topologia dell'evento

Particella incidentez=carica =v/c, =(1-2)-1/2

Wmax=Massimo trasf. di energia in una collisione singola

Perdita di energia: eq. di Bethe-Bloch

Costanti fondamentalire=raggio classico dell'elettroneme=massa dell'elettroneNa=numero di Avogadroc=velocita' della luce

=0.1535MeV-cm2/g

Perdita di energia media per particelle cariche pesanti (fino ai muoni) Ionizzazione ed eccitazioneApprossimazione: elettroni liberi e a riposo; particella incidente (quasi) imperturbataValido per energie <100 GeV e >>z (z/137)

Mezzo assorbitoreI=potenziale medio di ionizzazione (I/Z ~ 10 eV per Z>~ 20)Z=numero atomico dell'assorbitoreA=massa atomica=densità

Dipendenza dal mezzo: densità (I) Dipendenza dalla particella incidente: z2, 1/2, (log 2)-dE/dx non dipende esplicitamente da MMinima ionizzazione: -dE/dx~2MeV cm2/g per ~3Risalita relativistica ad alte energie dovuta a log 2

W max=2m e c2η2

1+2 me /M √1+(βγ)2+(me/M )2≈2me c2(β γ)2

me≪M

−dEdx

=2π N A r e2 me c2

ρZA

z2

β2 [ ln (2m e γ2 v2 W max

I 2 )−2β2]

Correzioni all'equazione di Bethe-Bloch

Z

C

I

Wvmz

A

ZcmrN

dx

dE eeea

c

22)2

ln(2 2

2max

22

2

222

=Correzione di densità (dovuta alla schermatura indotta dall'interazione con gli altri elettroni del mezzo) IMPORTANTE AD ALTE ENERGIE2ln+, con dipendente dal materiale (cresce con la densità) riduce l'effetto della risalita relativistica

C: correzione (piccola) di “shell” da tenere in conto quando la velocità della particella incidente è <~ della velocità orbitale degli elettroni legati

Altre correzioni (di spin, di ordine superiore etc) sono piccole, tipicamente<1%

PDG

12

22)ln(

1K

dx

dE

1/2 domina a basso momento ln() domina a impulsi molto alti (“risalita relativistica”) mai molto importante (sempre<1)

-2.24-1.60-0.34ln()

89.025.42.961/2

0.110.200.58

pK

0.060.711.97ln()

1.881.241.021/2

0.730.900.99

pK

p=0.1 GeV/c

p=1.0 GeV/c

30Alessandro De Falco, INFN Cagliari 4/1/14

Le particelle rivelate possono essere identificate mediante il segnale caratteristico sui vari rivelatori. Altri sistemi, quando necessari, richiedono tecniche di rivelazione specifiche

Identificazione: topologia dell'eventoIdentificazione: topologia dell'evento

Gli spettrometri per muoni sono preceduti da un assorbitore di opportune dimensioni (in termini di X

0,

I) che permette il passaggio dei soli muoni.

31Alessandro De Falco, INFN Cagliari 4/1/14Alessandro De Falco Università/INFN Cagliari01/04/14 31

ALICE detectorALICE detector

Diverse tecniche di PID implementate per l'identificazione di particelle:dE/dx nella TPC, TOF (Time Of Flight), HMPID (RICH, Ring Imaging CHerenkov counters)...

32Alessandro De Falco, INFN Cagliari 4/1/14

Particle Identification

ALICE uses several particle identification methods (dE/dx, Cerenkov, Time-of-Flight, Transition Radiation), which allow charged hadrons to be identified to about 2-3 GeV/c, or 5 GeV/c for HMPID.

-

33Alessandro De Falco, INFN Cagliari 4/1/14

Particle Identification by dE/dx

– Energy loss (dE/dx) depends on the particle velocity.

– The mass of the particle can be identified by measuring simultaneously momentum and dE/dx (ion pairs produced)

– Particle identification possible in the non-relativistic region (large ionization differences)

– Major problem is the large Landau fluctuations on a single dE/dx sample.

» 60% for 4 cm track» 120% for 4 mm track

2)1(

2ln

1 2

2

2

2

2 J

mv

A

ZKz

dx

dE

Energy loss (Bethe-Bloch)

m mass of electronvz, charge and velocity of

incident particleJ mean ionization energy density effect term

34Alessandro De Falco, INFN Cagliari 4/1/14

dE/dx: Results

Per una buona risoluzione sulla dE/dx occorrono:

tracce lunghe (code di Landau meno importanti)numero elevato di tracce (compatibilmente con l'occupazione)buona calibrazione, basso rumore di fondo...

35Alessandro De Falco, INFN Cagliari 4/1/14

36Alessandro De Falco, INFN Cagliari 4/1/14

L'identificazione delle particelle cariche puo' essere effettuata attraverso il loro tempo di volo (TOF) misurato ad es. tra due scintillatori, noto il loro momento

Per impulsi sopra 1 GeV/c sono richiesti buona risoluzione temporale e una grande distanza L tra i rivelatori

La differenza di tempo tra due particelle aventi lo stesso momento p e masse m

1 e m

2 sarà (per p>>mc):

Usando scintillatori con T=300 ps, p=1 GeV

una separazione a 4 richiede L=3m(12 m per p=2 GeV) Prestazioni migliori possono essere ottenuteusando rivelatori con migliore risoluzione temporale.

Identificazione: TOF (bassi impulsi)Identificazione: TOF (bassi impulsi)

L=1 m t= L

1c−

L2c

=Lc 1

m12c2

p2 −1m2

2c2

p2 ≈m12−m2

2Lc2p2

Misura di TOF in ALICEMisura di TOF in ALICEDedicato all'identificazione delle particelle caricheAmpia copertura angolare (160 m2 di superficie coperta) Multi-gap RPCEventi ad alta molteplicitàRange di p:

pmin

~0.5 GeV (limite per la separazione /K ottenibile con la dE/dx nella TPC)p

max~2.5 GeV

38Alessandro De Falco, INFN Cagliari 4/1/14

Differential signal to FE card

active width 74 mm

130 mm

nylon screw to holdfishing-line spacer

honeycomb panel(10 mm thick)

Ext. glass + resistive coating(0.55 mm thick)

Int. glass plates (0.4 mm thick)

connection to bring cathode signal to central read-out PCB

Cathode PCB

5 gas gapsof 250 micron

Anode PCB

Cathode PCB

Mylar film

Alice TOFCross section of the double-stack MRPC

The detector can measure time-of-flight with a precision of around 60 ps, allowing separation of hadron species over a momentum range up to around 3 GeV/c

39Alessandro De Falco, INFN Cagliari 4/1/14

Effetto CerenkovEffetto CerenkovL'effetto Cerenkov consiste nell'emissione di fotoni da parte di una particella carica che attraversa un mezzo dielettrico con velocità v superiore a quella della luce nel mezzo (c/n).

Gli atomi eccitati vicini alla particella vengono polarizzati e emettono una radiazione coerente ad un angolo dato da:

La velocità di soglia è

All'aumentare della velocità oltreT aumenta

l'angolo di apertura fino al valore massimo

per

cos=1 n

T=1n

max=cos−11/n

=1

40Alessandro De Falco, INFN Cagliari 4/1/14

Fronti d'onda di HuygensFronti d'onda di Huygens

Posizione della particella in tre istanti di tempo: i piani tangenti alle sfere rappresentano l'onda e.m. piana che si propaga attraverso il mezzo ad un angolo rispetto alla traiettoria della particella

Senza radiazioneradiazione

Angolo della radiazione Cerenkov :

n

1cos

ct

(c/n)t In un tempo t il fronte d'onda percorre la distanza (c/n)t ma la particella percorre la distanza ct.

41Alessandro De Falco, INFN Cagliari 4/1/14

Identificazione mediante contatori Cerenkov

Tre tipi di contatori Cerenkov sono usati per identificare le particelle.Sono (in ordine di complessità):

Contatori a soglia (on/off device)Contatori differenziali (usano l'angolo della radiazioneCerenkov)Ring imaging counter (usano il “cono” di luce)

Ciascun tipo di contatore è progettato per lavorare in un certo range di momento.

Contatori a soglia: Identificano le particelle che danno luce Cerenkov.Utilizzabili per separare gli elettroni dalle particelle più pesanti (, K, p) Limiti: oltre un certo momento diverse particelle producono luce Cerenkov solitamente i contatori a soglia usano gas che implicano bassi livelli di luce -> Inefficienza, es. <n>=3: P(0)=e-3=5%! I fototubi devono essere schermati dal campo magnetico oltre qualche decina di gauss

42Alessandro De Falco, INFN Cagliari 4/1/14

Contatori differenziali

Usano l'angolo di emissione della radiazione Cerenkov Campionano la luce solo a certi angoliFissato il momento, cos è funzione della massa:

Not all light will make it to phototube

np

pm

Epnn

22

)/(11

cos

Utili nelle misure ad un determinato range di momento (buoni monitor di fascio, es. misurano il contenuto di or K del fascio).Limiti: Ottiche complicate. Problemi nei campi magnetici (i fototubi devono essere schermati da B>~10 gauss)

43Alessandro De Falco, INFN Cagliari 4/1/14

Ring Imaging Cerenkov Counters (RICH)

RICH counters usano il cono di luce Cerenkov.

nppm

n

2211 cos

1cos

r=LtanL

r

Per una particella con p=1GeV/c, L=1 m, e LiF come mezzo(n=1.392) troviamo:

deg r(m) 43.5 0.95K 36.7 0.75P 9.95 0.18

Misurando p e r possiamo identificare il tipo di particella.

Limiti: ottica molto complicata (Le proiezioni solitamente non sono cerchi) readout molto complicato (e.g. wire chamber readout, 105-106 channels) Sistema di gas complicato Pochi fotoni(10-20)-> pochi punti sui cerchi

Grande separazione /K/p

44Alessandro De Falco, INFN Cagliari 4/1/14

Identificazione delle particelle: TRDIdentificazione delle particelle: TRDTrattazione classica: vedi Jackson, Classical electrodynamics, cap. 14

Una particella carica che attraversa un mezzo con costante dielettrica variabile (una serie periodica di piani sottili separati da aria) emette una radiazione (radiazione di transizione) all'interfaccia tra i due materiali (Ginzburg & Frank, 1946).

Questa radiazione dipende dal fattore della particella, e permette di identificare le particelle ad alta energia ( = E/m > 1000)

L'intensità della radiazione ha un picco in avanti a ed è proporzionale a

W=23p P

2=

4N A Z

A me

frequenza di plasma del mezzo

45Alessandro De Falco, INFN Cagliari 4/1/14

Identificazione delle particelle: TRD

Identificazione delle particelle: TRD

L'emissione di radiazione avviene principalmente nella regione dei raggi X (2-20 keV) con una probabilità di ~1% per ciascun attraversamento.

I fogli devono avere uno spessore minimo (lunghezza di formazione)Per materiali plastici

Per fogli più sottili il numero dei fotoni scende rapidamente

L'assorbimento dei raggi X nel materiale radiatore va come Z3.5: radiatori a basso Z

I rivelatori sono composti tipicamente da qualche centinaio di radiatori accoppiati a camere a ionizzazione che rivelano i raggi X (solitamente si usa una miscela ricca di Xe)

D= c p

p≈3 1016 s−1 per =1 D=10 m

• Simulated emission spectrum of a CH2 foil stack

46Alessandro De Falco, INFN Cagliari 4/1/14

47Alessandro De Falco, INFN Cagliari 4/1/14

Come si esegue l'identificazione?Come si esegue l'identificazione?

Il metodo più comune consiste nell'applicare dei tagli (vedremo più avanti che cosa fare)

In questo contesto è interessante considerare in alternativa l'approccio Bayesiano

Per un singolo rivelatore, definisco:

w i | s=r s | iC i

∑k=e , , ...

r s | kCk

r s | i: probabilità condizionata di osservare in un rivelatore un segnale sse la particella è di tipo i=e , , ...

w i | s: probabilità condizionata che la particella sia di tipo i=e , , ...se questa ha originato il segnale s

Ci : probabilità di trovare la particella di tipo i=e , , ...nel rivelatore

48Alessandro De Falco, INFN Cagliari 4/1/14

In condizioni ragionevoli,

r(s|i) (“funzione di risposta”) dipende esclusivamente dalle proprietà del rivelatore e non da condizioni esterne, come i criteri di selezione delle tracce e dell'evento

viceversa, Ci (concentrazione relativa per la particella di tipo i) dipende

dai criteri di selezione e non dalle proprietà del rivelatore

Procedo in questo modo:

Ottengo la funzione di risposta del rivelatore

Assegno un set di valori r(s|i) a ciascuna traccia

Stimo le Ci basandomi sulla conoscenza a priori che viene da analisi

specifiche su sottocampioni di eventi e tracce

Ricavo w(i|s) usando il teorema di Bayes (slide precedente)

49Alessandro De Falco, INFN Cagliari 4/1/14

Ma come ottengo in concreto le r(s|i)?

Posso basarmi sulla risposta del rivelatore misurata o calcolata con simulazioni Monte-Carlo (torneremo sull'argomento) P.es. se la misura è effettuata con una TPC, s è la dE/dxPer ciascuna traccia, la r(s|i) sarà gaussiana (in prima approssimazione) con valore medio <dE/dx> calcolato mediante l'eq. di Bethe-Bloch e larghezza ≈k ⟨dE /dx ⟩

50Alessandro De Falco, INFN Cagliari 4/1/14

E come ottengo le Ci?

Nell'approccio più semplice posso assumere tutte le Ci uguali

Oppure, nell'esempio precedente, posso basarmi sull'abbondanza delle varie particelle nelle regioni dove queste sono facilmente distinguibili

51Alessandro De Falco, INFN Cagliari 4/1/14

E se ho diversi rivelatori invece di uno solo?Come posso combinare la risposta di rivelatori che hanno diversa capacità di identificazione a seconda del momento?

dE/dx vs p misurato con la TPC t vs p misurato col TOF

52Alessandro De Falco, INFN Cagliari 4/1/14

Se ho diversi rivelatori, considero la risposta globale dell'apparato formato dai diversi rivelatori

Nota:

se per un certo momento p il rivelatore j non è in grado di distinguere tra particelle diverse il contributo di quel rivelatore per quel momento si semplifica nella formula

Se diversi rivelatori sono in grado di separare le particelle, i loro contributi sono accumulati con gli opportuni pesi. La risposta combinata è migliore

R s |i= ∏j=1

Nr s j | i s

j: segnale sul rivelatore j-mo

W i | s=R s | iC i

∑k=e , , ...

r s | k C k

=

C i∏j=1

N

r s j | i

∑k=e , , ...

C k∏j=1

N

r s j | k

r s j |=r s j |=...

53Alessandro De Falco, INFN Cagliari 4/1/14

Eseguo una misura di un'osservabile mediante un apparato che rivela coppie di muoni.A causa dello smearing S e dell'accettanza A dell'apparato, che distorcono le misure, l'osservabile fisica(x

true) e quella misurata M(x

meas) non saranno

identiche, ma saranno legate dalla relazione:

xtrue

,xmeas

: variabili cinematiche (reali e misurate) dei muoni. S(x

meas|x

true) (smearing) esprime la probabilità che una coppia di muoni caratterizzata da x

true sia

ricostruita con valore xmeas.

Come ricavare informazioni sulla osservabile fisica (xtrue

)?

Metodo 1- Postulo una rappresentazione analitica di e ne determino i parametri con un fit, dopo avere calcolato la convoluzione con S(x

meas|x

true)A(x

true)

Metodo 2- Determino la matrice di deconvoluzione D(xtrue

|xmeas

) che esprime la probabilita' che un evento misurato con x

meas sia stato generato con x

true.

Siamo interessati al secondo approccio

Deconvoluzione: esempio di applicazione del metodo di Richardson-Lucy

Deconvoluzione: esempio di applicazione del metodo di Richardson-Lucy

M ( xmeas)=∫S ( xmeas∣xtrue)A(x true)ϕ( x true)dxtrue

54Alessandro De Falco, INFN Cagliari 4/1/14

Step 1: calcolo S e A mediante una simulazione dell'apparato sperimentaleConosco le interazioni tra i muoni e i materiali che compongono l'apparato, dunque simulando il tracciamento di N coppie di muoni nell'apparato ricavo la probabilita' di rivelare le coppie di muoni (accettanza) e lo smearing a cui sono sottoposti.

Step 2: Uso il teorema di Bayes

per ricavare la matrice di deconvoluzione:

P (A∣B)=P (B∣A)P (A)

P (B)

M ( xmeas)=∫ S (xmeas∣x true)O( x true)dx true O( x true)=A( x true)ϕ( x true)

O( x true)=∫Q (x true∣xmeas)M (x meas)dx meas

Q ed S sono posti in relazione del teorema di Bayes: Q( x true∣xmeas)=S ( xmeas∣x true)O (x true)

M ( xmeas)

Q dipende dalla conoscenza di O, che e' la grandezza che vogliamo determinare.Usiamo un approccio iterativo, postulando una forma iniziale per O e ricalcolando le grandezze O, Q, M finche' il calcolo non converge ad un valore costante.La forma iniziale di O in linea di principio e' arbitraria. Una scelta ragionevole consiste nell'usare i dati misurati come distribuzione di partenza.

55Alessandro De Falco, INFN Cagliari 4/1/14

M0(xmeas

): dati misurati

On(x true)=∫Q n−1

( x true∣xmeas)M 0(xmeas)dxmeas=∫

S ( xmeas∣x true)On−1

(x true)

M n−1( xmeas)

M 0( xmeas)dxmeas

Q n(x true∣xmeas)=

S (xmeas∣x true)On(x true)

M n( xmeas)

M n−1( x true)=∫ S (xmeas∣x true)O

n−1( x true) dx true

Gen (phys)

unfolded

Smeared (real) data