39
Scuola di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Fisica e Astrofisica Studio degli algoritmi di b-tagging per il canale H W + W - con il rivelatore CMS ad LHC. Analysis of the b-tagging algorithms for the H W + W - decay channel with the CMS detector at LHC. Relatore: Prof. Vitaliano Ciulli Correlatore: Dott. Lorenzo Viliani Candidato: Benedetta Camaiani Anno Accademico: 2017/2018

AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Scuola diScienze Matematiche

Fisiche e NaturaliCorso di Laurea in Fisica e

Astrofisica

Studio degli algoritmi di b-taggingper il canale H →W+W−

con il rivelatore CMS ad LHC.

Analysis of the b-tagging algorithmsfor the H →W+W− decay channelwith the CMS detector at LHC.

Relatore:Prof. Vitaliano Ciulli

Correlatore:Dott. Lorenzo Viliani

Candidato:Benedetta Camaiani

Anno Accademico: 2017/2018

Page 2: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria
Page 3: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Indice

1 Il Modello Standard e il Bosone di Higgs 41.1 Il Modello Standard . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Il Bosone di Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Il rivelatore CMS a LHC 102.1 Il Large Hadron Collider (LHC) e le collisioni p-p . . . . . . . . . 102.2 Compact Muon Solenoid (CMS) . . . . . . . . . . . . . . . . . . . 13

3 B-tagging per gli eventi di fondo 163.1 Il quark b e gli eventi di fondo . . . . . . . . . . . . . . . . . . . . 163.2 Ricostruzione degli eventi . . . . . . . . . . . . . . . . . . . . . . 17

3.2.1 Identificazione delle particelle . . . . . . . . . . . . . . . . 173.2.2 Ricostruzione dei jet . . . . . . . . . . . . . . . . . . . . . 17

3.3 Il b-tagging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.3.1 Algoritmi di b-tagging . . . . . . . . . . . . . . . . . . . . 18

3.4 Fattori di correzione . . . . . . . . . . . . . . . . . . . . . . . . . 21

4 Analisi dati 234.1 Tagli di selezione . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.2 Curve ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.3 Determinazione dell’algoritmo migliore . . . . . . . . . . . . . . . 284.4 Confronto tra simulazione e dati . . . . . . . . . . . . . . . . . . . 33

Bibliografia 37

Page 4: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Introduzione

Nel 2012 le collaborazioni CMS e ATLAS del Large Hadron Collider annuncianola scoperta del bosone di Higgs. Si tratta di una particella elementare, massiva escalare che segna il completamento del Modello Standard, teoria che descrive leparticelle elementari e le loro interazioni. Negli anni successivi si sono studiate leproprietà di questo nuovo bosone in diversi canali di produzione e decadimentonelle collisioni protone-protone ad una energia nel centro di massa di 7, 8 e 13TeV, al fine di verificare l’accordo con le previsioni teoriche.Di particolare interesse per l’esperimento CMS è il canale di decadimento com-pletamente leptonico H → W+W− → l+νl−ν̄, che prevede nello stato finale dueleptoni e due neutrini. Questo canale ha una probabilità molto elevata e uno statofinale chiaramente riconoscibile. Tuttavia questo stesso stato finale può deriva-re anche da processi diversi e quindi non riconducibili al bosone di Higgs, dettiprocessi di fondo. Uno dei principali tra questi è quello dovuto alla produzionedi coppie tt̄, il cui stato finale (tt̄→ W+W−bb̄) si differenzia da quello di segnalesolo per la presenza dei quark b, i quali danno luogo in un rivelatore ai cosiddettijet adronici.In questo lavoro di tesi, svolto nella collaborazione CMS, si affronta la problema-tica della selezione del canale di interesse rispetto a questo tipo di fondo, mediantela tecnica del b-tagging. Si tratta di una particolare tecnica di analisi che sfruttala presenza dei quark b negli eventi di fondo e, in particolare, le caratteristichepeculiari che questo tipo di quark, a seguito della sua grande massa e della sualunga vita media, conferisce ai jet adronici da lui stesso originati. Lo studio èincentrato su quattro diversi algoritmi di b-tagging, sviluppati e utilizzati dallacollaborazione CMS al fine di distinguere i jet prodotti da quark b (b-jet) daquelli prodotti da quark leggeri o da gluoni, generalmente presenti negli eventi disegnale. L’analisi è eseguita su un campione di dati simulati con tecniche MonteCarlo e di dati raccolti nell’anno 2017.In dettaglio la tesi è organizzata nella seguente maniera:

Nel capitolo 1, dopo una breve introduzione al Modello Standard, si descrivonoi principali canali di produzione e decadimento del bosone di Higgs, per i qualivengono inoltre riportati i processi di fondo maggiormente influenti.

Nel capitolo 2 viene data una descrizione generale dell’acceleratore LHC, dellacinematica delle collisioni protone-protone e infine dell’apparato sperimentale diCMS.

Nel capitolo 3 si introduce la procedura di b-tagging , si descrivono brevemente

Page 5: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

gli algoritmi utilizzati e i fattori correttivi che si ricavano dal confronto tra datie simulazioni Monte Carlo.

Nel capitolo 4 viene infine descritta l’analisi effettuata, la determinazione del-l’algoritmo con migliori performance tra i quattro considerati e il punto di lavoroottimale corrispondente. Si mostra infine, per un possibile punto di lavoro di unodegli algoritmi scelti, un confronto tra dati e simulazione.

Page 6: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Capitolo 1

Il Modello Standard e il Bosone diHiggs

1.1 Il Modello StandardIl Modello Standard (MS) è la teoria che descrive le particelle elementari e le lorointerazioni[1]. In questo modello le particelle sono raggruppate in due tipologieprincipali in base alla statistica a cui obbediscono: i fermioni, componenti fonda-mentali della materia aventi spin 1/2, e i bosoni, mediatori delle interazioni conspin intero. I primi sono ulteriormente divisi in due categorie:

• I quark, osservati per ora in 6 sapori o flavours (up, down, charm, strange,top, bottom), sono i costituenti degli adroni; sono dotati di carica elettricafrazionaria (+2/3 o -1/3 la carica dell’elettrone) e carica di colore; sonosoggetti a tutte le interazioni.

• I leptoni, distinti in elettrone, muone e tau, dotati di carica elettrica intera,e in neutrini ad essi associati (rispettivamente νe, νµ e ντ ); questi ultimiessendo elettricamente neutri interagiscono solo debolmente, mentre i primisono soggetti anche all’interazione elettromagnetica.

A ciascuna particella p corrisponde un’antiparticella con uguale massa e caricaelettrica di segno opposto, tipicamente indicata con p̄.I fermioni sono inoltre raggruppati in tre famiglie, ordinate secondo massa cre-scente (figura (1.1)).

Il MS è in grado di spiegare tre delle quattro interazioni fondamentali attual-mente note. Rimane infatti esclusa la gravità, che in fisica delle particelle puòessere trascurata data la sua minor intensità rispetto alle altre. Per avere un’ideadelle grandezze relative si riporta la seguente tabella:

forte elettromagnetica debole gravità1 10−2 10−7 10−39

4

Page 7: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 1. IL MODELLO STANDARD E IL BOSONE DI HIGGS 5

A livello quantistico, ognuna di queste forze è descritta dallo scambio deibosoni precedentemente nominati: il fotone γ (neutro) per l’interazione elettro-magnetica, i bosoni W± (carichi) e Z (neutro) per quella debole e infine ottogluoni (neutri ma dotati di carica di colore) per quella forte. Si citano infine igravitoni, bosoni ipotetici che si pensa medino l’interazione gravitazionale in unapossibile formulazione quantistica, non considerati nel Modello Standard.

Figura 1.1: Particelle elementari del Modello Standard.

La teoria che studia le interazioni forti tra quark e gluoni è la CromodinamicaQuantistica (QCD), che introduce il concetto di colore. Ad ogni quark è associatouno dei tre possibili colori verde, rosso o blu (di conseguenza ad un antiquark siassociano gli anticolori anti-verde, anti-rosso, anti-blu), mentre ai gluoni se neassociano due, un colore e un anticolore1 [2]. Una delle caratteristiche principalidella QCD è il cosiddetto confinamento di colore (o confinamento dei quark),cioè il fenomeno fisico per cui le particelle che hanno carica di colore diversada zero non possono essere isolate e perciò non sono osservabili singolarmente.L’interazione forte confina, infatti, i quark a formare coppie (mesoni) o tripletti(barioni), in modo tale che la carica di colore netta di questi stati sia neutra.Questo processo, che porta alla formazioni di adroni a partire da quark e gluoniliberi, prende il nome di adronizzazione: qualora in una data interazione venganoprodotte cariche di colore libere, queste sono "ricoperte" da altri quark così che,nello stato finale, si osserva uno stretto cono di particelle adroniche detto jet (ogetto). Individuare il tipo di quark da cui si è originato il jet è importante percomprendere i processi fisici che hanno avuto luogo in seguito ad una collisione esarà oggetto di studio di questa tesi.

1Vi sono otto gluoni indipendenti, invece delle nove combinazioni possibili di tre colori e treanticolori.

Page 8: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 1. IL MODELLO STANDARD E IL BOSONE DI HIGGS 6

1.2 Il Bosone di HiggsLa teoria che descrive le tre forze fondamentali, forte, elettromagnetica e debole,non ammette che i fermioni e i bosoni W± e Z possano avere massa. Tuttaviasperimentalmente si verifica che tali particelle hanno massa non nulla. Per risol-vere questo problema, è stato necessario introdurre il meccanismo di Higgs, checome conseguenza postula l’esistenza di una nuova particella scalare: il bosone diHiggs. In questo modo si può dare massa ai bosoni vettori e ai fermioni tramitel’accoppiamento con un campo scalare, denominato campo di Higgs. La teoriaprevede che il bosone di Higgs sia privo di carica elettrica e spin mentre non nepredice la massa, introdotta come paramentro libero nella teoria. Questa è statadeterminata sperimentalmente e risulta essere circa 125 GeV 2.I principali meccanismi di produzione del bosone di Higgs nelle collisioni protone-protone sono i seguenti:

• Gluon fusion : due gluoni si combinano per formare un loop di quark pesantivirtuali ed emettono un Higgs. Si tratta del processo con sezione d’urtomaggiore su tutto lo spettro di massa (figura (1.2)).

gg → H

• Vector Boson fusion (VBF) : due quark si scambiano bosoni virtuali W eZ che possono poi emettere un Higgs. È il secondo processo più importantein termini di sezione d’urto.

qq′ → qq′H

• Higgs Strahlung : in una collisione tra quark e antiquark, si forma un bosoneW o Z che irraggia un Higgs.

qq̄ → W/Z +H

• Produzione associata a tt̄ : due gluoni, a seguito della collisione, generanouna coppia tt̄ e un bosone di Higgs. Si tratta del processo meno probabile.

gg → tt̄H

Si riportano i principali diagrammi di Feynman di tali processi in figura (1.3).2Si utilizza il sistema di unità di misura naturali c = } = 1

Page 9: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 1. IL MODELLO STANDARD E IL BOSONE DI HIGGS 7

[GeV] HM100 200 300 400 500 1000

H+

X)

[pb

]

(pp

σ

­110

1

10

210= 14 TeVs

LH

C H

IGG

S X

S W

G 2

010

H (NNLO+NNLL QCD + NLO EW)

→pp

qqH (NNLO QCD + NLO EW)

→pp

WH (NNLO QCD + NLO EW

)

pp

ZH (NNLO QCD +NLO EW)

pp

ttH (NLO QCD)

pp

Figura 1.2: Andamento della sezione d’urto dei processi di produzione del bosonedi Higgs in funzione della sua massa ad un’energia nel centro di massa di 14 TeV[3].

(a) Gluon fusion (b) Vector Boson fusion

(c) Higgs Strahlung (d) Produzione associata a top

Figura 1.3: Diagrammi di Feynman per i principali meccanismi di produzione delbosone di Higgs.

Page 10: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 1. IL MODELLO STANDARD E IL BOSONE DI HIGGS 8

Il bosone di Higgs è una particelle instabile con vita media molto piccola perciòè possibile solo una rivelazione indiretta attraverso le particelle in cui decade. Aseconda della sua massa, si hanno differenti canali di decadimento dominanti:una coppia di fermioni, una coppia di bosoni W o Z (H → WW o H → ZZ),una coppia di fotoni (H → γγ), una coppia di gluoni (H → gg). In figura (1.4)si riportano le probabilità relative o branching ratio dei processi principali.

[GeV]HM90 200 300 400 500 1000

Hig

gs B

R +

Tota

l U

ncert

[%

]

­410

­310

­210

­110

1

LH

C H

IGG

S X

S W

G 2

013

bb

ττ

µµ

cc

ttgg

γγ γZ

WW

ZZ

Figura 1.4: Branching ratio dei principali canali di decadimento del bosone diHiggs in funzione della sua massa [3].

In questa tesi si prende come segnale il canale

H → W+W− → l+νl−ν̄

con nello stato finale due leptoni e o µ e due neutrini νe o νµ. Questo processo ha ilmaggior branching ratio (dopo quello bb̄ dominante a basse masse) ed è puramenteleptonico, per cui le particelle finali si distinguono con facilità nel rivelatore.La segnatura sperimentale dell’evento è quindi composta da due leptoni e o µisolati con carica opposta, da un’energia mancante dovuta alla non rivelazionedei neutrini e da un certo numero di jet, dovuti a quark o gluoni che possonoessere stati emessi nell’interazione.La stessa segnatura può essere dovuta anche a processi diversi, non riconducibilidel bosone di Higgs. Si tratta dei processi di fondo, ovvero eventi che presentanolo stesso stato finale del processo studiato ma che sono stati originati da fenomenifisici diversi da quello in esame.In questa analisi, il processo di fondo principale è quello dovuto agli eventi in cui,a seguito dell’interazione tra due quark, vengono prodotti due bosoni W senza

Page 11: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 1. IL MODELLO STANDARD E IL BOSONE DI HIGGS 9

che vi sia stata produzione di un Higgs:

qq′ → W+W−

Si tratta di un fondo irriducibile, ovvero il suo stato finale è indistinguibile da quel-lo del segnale a causa della presenza delle stesse particelle. Tuttavia il contributodovuto a questi processi può essere ridotto mediante opportuni tagli cinematici.Un altro fondo da tenere in considerazione è quello dovuto a tt̄, dove una coppiadi quark e antiquark top, prodotti a seguito di una collisione protone-protone,decadono in bosoni W e quark b. Pertanto lo stato finale è:

tt̄→ W+W−bb̄

Infine, un ulteriore fondo è quello dovuto ai processi di Drell-Yan, dove un quarke un antiquark producono un fotone o un bosone Z, che decadono poi in dueleptoni dello stesso tipo ma di carica opposta:

qq̄ → γ/Z → ll̄

Questo tipo di processo, a differenza del segnale, presenta sempre nello stato finaledue leptoni con lo stesso flavour. Per rimuovere quasi completamente questofondo è pertanto sufficiente richiedere che negli eventi di interesse siano presentidue leptoni con flavour diverso. Resta un piccolo contributo irriducibile dovutoal processo qq̄ → γ/Z → τ+τ−, con i due τ che decadono rispettivamente in unelettrone e un muone.Nel caso del fondo da tt̄ si può sfruttare invece la presenza dei quark b che nelrivelatore daranno luogo a dei b-jet. Questo argomento sarà approfondito piùavanti nel corso di questa tesi.

Page 12: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Capitolo 2

Il rivelatore CMS a LHC

2.1 Il Large Hadron Collider (LHC) e le colli-sioni p-p

Il Large Hadron Collider (o brevemente LHC ) è il più grande e potente accelera-tore di adroni esistente al mondo. Situato presso il CERN di Ginevra, consiste inun anello di 27 km, in cui vengono fatti circolare due fasci di protoni in direzioniopposte che sono fatti collidere in 4 punti specifici, dove sono situati i principaliesperimenti (ALICE, ATLAS, CMS e LHCb) [4] (Figura (2.1)). In un collisiona-tore l’energia disponibile per la creazione di nuove particelle è massima e coincidecon la somma delle energie dei due fasci. Infatti, in una generica collisione tradue particelle con quadrimpulsi pµ1 = (E1, ~p1) e pµ2 = (E2, ~p2), il quadrimpulsototale è dato dalla somma di questi ultimi e la massa invariante risulta essere√s =

√(E1 + E2)2 − |~p1 + ~p2|2. Nel limite ultrarelativistico e nell’ipotesi di urto

frontale, se le particelle sono uguali e hanno la stessa energia (E1 = E2 = Efascio)si ottiene √

s = 2Efascio

mentre nel caso di collisioni su bersaglio fisso si ha√s ∝

√Efascio. In un urto è

dunque possibile generare nuove particelle con massa invariante minore o ugualea√s. Ad LHC i fasci possono essere accelerati fino ad una energia massima di 7

TeV, corrispondente a√s = 14 TeV.

I protoni sono ottenuti a partire da idrogeno molecolare e, una volta prodotti,vengono accelerati tramite più stadi fino a 450 GeV per poi essere successivamen-te trasferiti a LHC dove, mediante cavità a radiofrequenza, raggiungono l’energiadi 7 TeV. I protoni circolano all’interno dei fasci in pacchetti (o bunch) ben defi-niti. In condizioni normali ogni fascio ha 2808 bunch, ognuno dei quali contienecirca 1011 protoni, la cui spaziatura temporale è di 25 ns corrispondente ad unafrequenza di 40 MHz. Inoltre, al fine di evitare collisioni con le molecole del gas,i tubi all’interno dei quali scorrono i fasci sono tenuti alla pressione di vuoto di10−13 atm.

10

Page 13: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 2. IL RIVELATORE CMS A LHC 11

Figura 2.1: Schema degli acceleratori e degli esperimenti ad LHC [4].

Oltre all’energia del fascio, un altro paramentro importante per definire leprestazioni di un collisionatore è la luminosità istantanea List. Essa indica ilnumero di collisioni prodotte in un rivelatore per unità di area e unità di tempoed è definita come:

List = fnbn1n2

4πσxσy

dove n1 e n2 sono il numero di protoni nei pacchetti dei due fasci, nb è il numerodi pacchetti in un fascio, f è la frequenza di rivoluzione di questi ultimi, σx eσy sono le dimensioni trasversali dei fasci. Ad LHC List' 1034cm−2s−1. Questaquantità è legate al numero di eventi di collisione per unità di tempo (R) dallarelazione:

R = List · σ

dove σ è la sezione d’urto di interazione.Se si integra la luminosità istantanea su tutta la durata di presa dati, si ottiene laluminosità integrata Lint, che è indice del numero totale di collisioni prodotte nelperiodo di integrazione. Si esprime come sezione d’urto inversa (cioè in picobarninversi pb−1, dove 1 barn=10−24cm−2) e serve per calcolare il numero totale dieventi N prodotti, dato da N = Lint · σ. Si nota che, se si è interessati a processia bassa sezione d’urto, è necessario avere un’alta luminosità integrata.

Page 14: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 2. IL RIVELATORE CMS A LHC 12

L’esperimento CMS ha raccolto tra il 2010 e il 2018 dati di collisione p-pa 7, 8 e 13 TeV, massima energia raggiunta finora da LHC, corrispondenti aduna luminosità integrata rispettivamente di 6.1 fb−1, 23.3 fb−1 e 159.0 fb−1 [5].Grazie alle alte energie in gioco ad LHC (dove per alte si intende Efasci >> 1

rp'

0.1975 GeV, con rp=1 fm raggio del protone), si riesce ad indagare la strutturadel protone. Infatti, quello che accade effettivamente è l’urto (o scattering) trai partoni, ovvero tra i costituenti dei protoni (gluoni o quark). Dal momentoche questi possono avere quadrimpulsi diversi, il sistema del centro di massa noncoincide con quello del laboratorio. Di conseguenza l’energia risultante è inferioreall’energia nel centro di massa dei due protoni Sprotoni = (P1 + P2)

2 ' 2P1 · P2.Infatti, ciascun partone trasporta una frazione del quadrimpulso del protone dicui fa parte, espressa dalla variabile di Bjorken x :

ppartone = xPprotone

L’energia disponibile per la collisione tra partoni sarà dunque:

√spartoni =

√(p1 + p2)2 =

√(x1P1 + x2P2)2 =

√(x21 + x22) ·m2

p + 2x1x2P1 · P2

√spartoni '

√x1x2Sprotoni

avendo trascurato la massa del protone mp. Si possono quindi creare nuove par-ticelle con M2 = spartoni.Per la descrizione della fisica ad LHC si adottano coordinate cilindriche. A partireda un sistema destrorso in cui l’asse z coincide con l’asse del fascio in senso antio-rario e l’asse x diretto verso il centro dell’anello, si definiscono l’angolo azimutaleφ sul piano xy a partire dall’asse x in senso orario e l’angolo θ a partire dall’assez. Poichè il centro di massa del sistema si muove lungo l’asse dei fasci, occorreeffettuare un boost di Lorentz in tale direzione ed è perciò utile utilizzare variabi-li che siano invarianti relativistici rispetto a questo tipo di trasformazione, qualil’impulso trasverso e la pseudorapidità. L’impulso trasvero pT è la proiezionedell’impulso sul piano trasverso all’asse dei fasci:

pT =√p2x + p2y

La pseudorapidità η è definita da:

η = −ln(tan(θ

2))

Questa si ottiene come limite ultrarelativistico della rapidità y così definità:

y =1

2ln(

E + pzE − pz

)

Sebbene la rapidità non sia invariante di Lorentz, intervalli di questa lo sono.Per quanto riguarda le particelle non rilevabili direttamente (come ad esempio i

Page 15: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 2. IL RIVELATORE CMS A LHC 13

neutrini), la loro presenza può essere dedotta dal non bilanciamento dell’impulsotrasverso. Infatti, poichè i fasci non hanno impulso trasverso, la cinematica nelpiano trasverso è chiusa dal momento che la somma di tutti i ~pT deve essere nulla.A questo scopo, si introduce l’energia trasversa mancante (MET ) definita comesomma vettoriale degli impulsi trasversi di tutte le particelle dell’evento cambiatadi segno:

~EmissT = −

∑i

~(pT )i

dove i corre sulle particelle presenti nello stato finale.Nella maggior parte delle collisioni a LHC si producono particelle a basso pT ,essendo questi i processi con sezione d’urto maggiore. Queste collisioni vengonodette soft o diminimum bias. Gli eventi di interesse sono quelli in cui si produconoparticelle ad alto pT , detti processi hard, che avvengono con minor frequenza.

2.2 Compact Muon Solenoid (CMS)CMS è uno dei quattro esperimenti principali situato ad LHC. L’apparato speri-mentale ha lunghezza complessiva di 21 m, diametro 15 m, massa 1.25 · 107kg e isuoi rivelatori coprono un angolo solido di quasi 4π attorno al punto di collisionedei fasci. CMS ha una struttura cilindrica, con asse di simmetria parallelo alladirezione dei fasci, di cui la parte centrale è detta barrel mentre le due estremitàlaterali sono dette endcap. Al suo interno vi è un magnete solenoidale super-conduttore che produce un campo magnetico di intensità quasi 4T. Le linee dicampo magnetico sono chiuse su un giogo di ritorno in ferro posto all’esterno delsolenoide dove è presente un campo magnetico di circa 2T.Come si osserva nelle figure (2.2) e (2.3), a partire dalla parte più interna sidistinguono vari dispositivi di rivelazione[6]:

• Tracciatore al silicio: fornisce una copertura fino a |η| < 2.5 ed è compostoda una prima parte in cui si hanno rivelatori a pixel ed una più esterna in cuisi utilizzano microstrips. A seguito delle interazioni elettromagnetiche congli elettroni del semiconduttore, le particelle cariche perdono energia secon-do la formula di Bethe-Bloch. Questa energia, se sufficiente, può provocarela formazione di coppie elettrone-lacuna che, una volta rivelate, permetto-no di risalire alla posizione da cui è passata la particella e all’energia daquesta rilasciata. Rivelando la posizione in più punti, si determina la tra-iettoria della particella dalla cui curvatura (dovuta alla presenza del campomagnetico) si ha una misura dell’impulso.

• Calorimetro elettromagnetico (ECAL): copre la regione con |η| < 3 e sitratta di un calorimetro omogeneo composto di circa 80000 cristalli scintil-lanti di tungsteno di piombo (PbWO4). Quando un fotone o un elettroneentrano nella zona di rivelazione, questi perdono energia rispettivamenteper creazione di coppie e+e− e bremsstrahlung. Tali processi si ripetono

Page 16: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 2. IL RIVELATORE CMS A LHC 14

Figura 2.2: Struttura interna dell’esperimento CMS.

iterativamente in uno schema a cascata portando alla creazione di uno scia-me elettromagnetico. L’evoluzione si ferma quando l’energia degli elettroniscende sotto l’"energia critica", oltre la quale diventano dominanti perditedi energia dovute a ionizzazione. L’energia viene rilasciata dalle molecoledel cristallo sottoforma di fotoni con lunghezza d’onda di 450 nm che sonoraccolti e trasformati in elettroni da fotodiodi a valanga (ADP) nella partedel barrel e da fototriodi della parte degli endcap.

• Calorimetro adronico (HCAL): estende la copertura fino a |η| < 5 e serve permisurare l’energia degli sciami adronici prodotti nelle collisioni. Si tratta diun calorimetro a campionamento formato da fogli di scintillatore plasticoalternati da strati di assorbitore in ottone. HCAL è diviso in HB (barrel)e HE (endcap), che si trovano all’interno del magnete solenoidale, e in HO(outer) e HF (forward) che si trovano all’esterno.

• Camere a muoni: addette alla rivelazione dei muoni che, essendo particelleminimamente ionizzanti, riescono a penetrare tutti gli strati precedetementedescritti. Si trovano all’esterno del magnete ed sono suddivise in quattroparti intervallate dal ferro che costituisce il gioco di ritorno del magnete.In totale ne sono presenti 1400 e sono tutte camere a gas, dato che devonocoprire un’area molto grande. Sono però di tipo diverso nel barrel e negliendcap, perchè in quest’ultimo i valori del campo magnetico e di flusso diparticelle sono molto maggiori.

Di primaria importanza è infine il sistema di trigger. Data la frequenza delle col-lisioni, è impossibile il salvataggio delle informazione relative a tutti gli eventi (sistima infatti che questo richiederebbe un flusso di dati di circa 100 TB/s). Percìò

Page 17: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 2. IL RIVELATORE CMS A LHC 15

Figura 2.3: Schema in sezione dei rivelatori di CMS

si rende necessaria una selezione in tempo reale degli eventi, in modo tale da re-stringersi a quelli contenenti i segnali di fisica cercati. In CMS il sistema di triggerè così strutturato: vi è un primo livello detto Level 1 Trigger (L1) che, sulla basedi informazioni provenienti da ECAL, HCAL e dalle camere a muoni, seleziona glieventi in base alla presenza o meno di particelle cariche ad alto impulso trasverso,jet adronici, numero di leptoni o altre richieste. Il rate di eventi viene così ridottoa 70-80kHz. Gli eventi selezionati passano poi all’High Level Trigger (HLT) che,sfruttando particolari algoritmi software, correla le informazioni provenienti dapiù rivelatori operando una ricostruzione parziale dell’evento. Il rate di eventiviene ridotto fino a 1 kHz. I dati che passano quest’ultima selezione vengonosalvati permanentemente e successivamente analizzati.

Page 18: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Capitolo 3

B-tagging per gli eventi di fondo

3.1 Il quark b e gli eventi di fondoUno dei fondi principali per il segnale H → W+W− è quello dovuto a tt̄, doveuna coppia di quark e antiquark top decade in due bosoni W di carica opposta eun quark e antiquark b:

tt̄→ W+W−bb̄

Al fine di distinguere questi eventi da quelli di interesse, si sfrutta la presenza delquark b.Il quark b, detto anche bottom o beauty, fu scoperto nel 1977 presso il Fermilabdi Chicago. Appartiene alla III famiglia in cui sono divisi i quark nel ModelloStandard e ha massa di circa 4.18 GeV. È dotato di spin, carica di colore e caricaelettrica (−1

3) ed è soggetto a tutte le interazioni fondamentali. Trattandosi di

una particella colorata, non può esistere singolarmente ma, una volta prodotta,va incontro al processo di adronizzazione con conseguente formazione di adroni.Gli adroni che contengono quark b, detti b-adroni, come ad esempio i mesoniB, sono caratterizzati dall’avere vite medie relativamente lunghe (circa 1.5 ps) egrandi masse (circa 5 GeV).

Andando quindi ad analizzare la segnatura sperimentale degli eventi di fon-do, questa sarà composta dai prodotti del decadimento dei due W e da due jetderivanti dall’adronizzazione dei quark b. Si potrebbe quindi pensare di definirecome processi di fondo tutti quegli eventi che presentano uno o più jet nello statofinale. Tuttavia, in linea del tutto generale, anche i processi di segnale possonodar luogo a jet provenienti da interazioni precedenti alla produzione dell’Higgs.Questa analisi risulterebbe quindi inefficace.Un altro principio sui cui si potrebbe basare il riconoscimento degli eventi di fondoè quello che sfrutta la massa invariante del quark top (mtop = 175 GeV). Anchequesto metodo risulta di difficile applicazione a causa della presenza dei neutrini,dovuti al decadimento dei bosoni W, che si manifesta come energia mancantenello stato finale.Generalmente i jet degli eventi di segnale sono originati da quark leggeri, cioè u,d e s, o gluoni (jet leggeri), per cui riconoscere a quale tipo di partone è dovuto

16

Page 19: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 17

un dato jet costituisce un criterio efficace per distinguere gli eventi di interesse daquelli di fondo. Occorre dunque ricostruire in ogni evento i singoli jet e cercarequelli che sono stati originati da quark b. Questo tipo di analisi prende il nomedi b-tagging.

3.2 Ricostruzione degli eventi

3.2.1 Identificazione delle particelle

La ricostruzione e l’identificazione delle particelle stabili originatesi in un even-to viene eseguita correlando le informazioni provenienti da ciascuno dei sotto-rivelatori di cui si compone CMS, secondo la tecnica del Particle Flow [7]. L’o-biettivo finale è quello di definire energia, impulso e direzione di elettroni, muonie adroni prodotti.Dal momento che una particella lascia vari segnali individuali nei rivelatori, alfine di distinguere le informazione relative ad una singola di esse si utilizzano deglialgoritmi di connessione. Questi, una volta individuate informazioni compatibili,le organizzano in blocchi dai quali successivamente, mediante ulteriori algoritmi,si identificano le particelle. Prima di tutto si individuano i muoni, andando a con-frontare le informazioni del tracciatore e delle camere a muoni, e successivamentegli elettroni. Per questi ultimi si sfruttano il tracciatore e i depositi energeticiin ECAL. Una volta avvenuta l’identificazione, le tracce vengono rimosse daglialtri blocchi e si prosegue con la ricerca degli adroni carichi e neutri e dei fotoniconfrontando i depositi in HCAL e ECAL.

3.2.2 Ricostruzione dei jet

La ricostruzione dei jet parte da quanto ricostruito con la tecnica del ParticleFlow ed è affidata all’algoritmo anti-kt [8]. Si introduce la distanza dij tra dueparticelle i e j :

dij = min(k−2ti , k−2tj )

∆2ij

R2

dove ∆2ij = (yi − yj)

2 + (φi − φj)2, R è un parametro radiale pari a 0.4 e kti,

yi e φi sono rispettivamente l’impulso trasverso, la rapidità e l’angolo azimutaledell’oggetto i. Si considera inoltre la distanza diF tra la particella i e il fascio:

diF = k−2ti

Si procede quindi al raggruppamento identificando la più piccola di queste: se èdij si ricombinano gli oggetti i e j mentre se è diF si identifica i come un jet esi rimuove dalla lista delle particelle. La procedura viene ripetuta ricalcolando ledistanze fino a quando non ci sono più oggetti.

Page 20: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 18

3.3 Il b-taggingIl b-tagging, come si è detto, è la tecnica usata in fisica delle particelle per l’i-dentificazione dei jet adronici prodotti dall’adronizzazione di un quark b, cioè deib-jet. La peculiarità fisica che questo metodo di analisi sfrutta maggiormente èla vita media τ dei b-adroni. Di fatto, una vita media τ ' 1.5×10−12s conferisceagli adroni la capacità di percorrere distanze dell’ordine di qualche millimetroprima di decadere in adroni più leggeri non contenenti quark b. Tale lunghezzadi decadimento determina un vertice secondario (SV ) all’interno del jet dovutoal decadimento del b-adrone rispetto al punto di interazione dove si è formatoil quark b, detto vertice primario (PV ). La presenza di un vertice secondario apochi millimetri dal primario è una caratteristica specifica dei b-jet, dal momentoche gli adroni dei jet leggeri o hanno vite medie molto piccole e decadendo dannoorigine a ulteriori tracce che rientrano nel vertice primario, oppure hanno vitemedie talmente lunghe da interagire con il rivelatore prima di decadere. Rico-struire la presenza del SV permette quindi di discriminare il flavour dei vari jet.Un’altra variabile su cui si basa lo studio del b-tagging è il parametro d’impatto(IP), definito come la minima distanza tra il PV e una data traccia. Solo le tracceche hanno avuto origine nel vertice secondario, presentano un valore significati-vo del parametro d’impatto. Pur essendo una distanza, a questa variabile vieneassegnato un segno confrontando la configurazione della traccia stessa rispetto alvertice primario: se il punto di massimo avvicinamento tra la traccia e il verticeprimario è a valle rispetto alla direzione del jet l’IP ha segno positivo, negativonel caso opposto. Il parametro d’impatto è un invariante relativistico legato allavita media τ di una particella tramite la relazione IP = c · τ . Per gli adronicontententi quark b IP' 0.5 mm. Quanto finora descritto è illustrato nella figura(3.1).Un’altra caratteristica sfruttabile è la grande massa dei b-adroni la quale fa si

che i prodotti di decadimento abbiano un grande impulso trasverso all’asse deljet rispetto a quelli misurabili nei jet leggeri.Infine gli adroni pesanti sono caratterizzati dall’avere un branching ratio alto perdecadimenti semi-leptonici (∼ 20%). La presenza di "soft-lepton", cioè elettro-ni e muoni tra i costituenti del jet, costituisce un’altra proprietà sfruttabile perl’identificazione dei jet pesanti.

3.3.1 Algoritmi di b-tagging

CMS ha sviluppato diversi algoritmi di b-tagging per identificare i jet provenientida quark b a partire dalle suddette proprietà caratterizzanti i b-jet, quali la lungavita media, la grande massa e il grande impulso trasverso dei b-adroni e la presen-za all’interno degli stessi jet di elettroni o muoni. In questa analisi si utilizzano 4algoritmi diversi [10], tutti ottenuti con tecniche multivariate che permettono dicombinare le variabili associate alle proprietà dei jet:

Page 21: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 19

Figura 3.1: Confronto tra b-jet e jet leggeri. Vertice primario, vertice secodarioe parametro d’impatto.

• CSVv2: Combined Secondary Vertex version 2 è la versione ottimizzatadell’algoritmo CSV, utilizzato durante il Run 1. Combina le informazionidelle tracce e dei vertici secondari associati al jet usando un neural network(NN) con un solo strato, o layer, nascosto. Si richiede che ci siano almenodue tracce del jet che superano certi criteri di qualità. Ai jet che non pre-sentano nè due tracce utili nè un SV viene assegnato di default un valoredel discriminatore pari a -1, per evidenziare l’assenza di informazioni utiliper l’identificazione da b. Esistono due versioni in base all’algoritmo utiliz-zato per la ricostruzione del vertice secondario. Quella usata qui è InclusiveVertex Finder (IVF), che ricostruisce i vertici secondari nell’evento primadi individuare i jet.

• DeepCSV: è un’ulteriore versione dell’algoritmo CSVv2, del quale utilizzale stesse variabili combinandole con un deep NN, cioè un NN con un numerodi strati nascosti maggiore di uno (in questo caso 5).

• cMVAv2: Combined Multivariate Analysis version 2 combina i valori di 6discriminatori di algoritmi distinti mediante un’analisi multivariata eseguitacon un Boosted Decision Tree. Oltre alle due versioni del già citato CSVv2,gli altri algoritmi sono: Soft Electron, Soft Muon e Jet Probability, anchequest’ultimo in due versioni leggermente diverse. I primi due sono basatisulla presenza di soft-lepton all’interno del jet e sulle caratteristiche cine-matiche tipiche che essi possiedono, mentre l’ultimo utilizza informazionirelative al paramentro d’impatto delle tracce.

Page 22: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 20

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1discriminatore

0

0.05

0.1

0.15

0.2

0.25Segnale (Gluon Fusion)

)tFondo (t

Figura 3.2: Distribuzione del valore del discriminatore di b-tag dell’algoritmoDeepCSV per i jet negli eventi di segnale e di fondo.

• DeepFlavour: è anche questo un discriminatore ottenuto con un Deep NNche usa direttamente le informazioni delle tracce, degli oggetti neutri e deivertici associati al jet.

Ciascuno degli algoritmi sopra citati fornisce il valore di un discriminatoreper ogni jet: più è alto il suo valore e più è probabile che si tratti di un jet dab. Gli eventi di segnale e di fondo presentano pertanto distribuzioni diverse diquesto discriminatore. Come si può osservare nella figura (3.2), i primi mostranoandamenti spostati verso bassi valori (solitamente 0 o -1, a seconda del rangedi definizione del discriminatore) poichè sono caratterizzati dalla presenza di jetleggeri mentre i secondi sono piccati intorno a 1 a seguito della presenza di b-jet.Per ogni algoritmo si possono stabilire dei punti di lavoro, definiti come soglie nelvalore del discriminatore. Infatti, variando queste ultime, si ottengono efficien-ze di discriminazione diverse. Tuttavia nessuno di questi algoritmi è in grado diidentificare univocamente i jet derivanti da quark b. Infatti talvolta possono indi-viduare erroneamente come b-jet dei jet da c o jet leggeri. Per tutti gli agoritmi sidefinisce un’efficienza di b-tag, pari al numero di b-jet correttamente riconosciutidall’algoritmo, diviso il numero totale di b-jet, e un’efficienza di mistag, uguale alnumero di jet non da b erroneamente individuati come b diviso il numero totaledi jet non da b.

Page 23: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 21

3.4 Fattori di correzioneL’efficienza nel riconoscere i b-jet degli algoritmi sopracitati viene testata inizial-mente su campioni di dati simulati con tecniche Monte Carlo (MC). Quello chespesso accade è che vi sia una discrepanza tra i valori delle efficienze trovati apartire delle simulazioni e quelli che si ottengono eseguendo invece lo stesso tipodi analisi nei campioni di dati realmente acquisiti. Al fine di eliminare questa dif-ferenza, si procede a correggere la simulazione MC ripesando, evento per evento,le efficienze ottenute, in modo tale che queste eguaglino quelle sui dati raccolti.Anzichè operare correzioni sui singoli punti di lavoro degli algoritmi, la ricali-brazione delle efficienze di b-tagging viene effettuata correggendo l’intera formadella distribuzione del discriminatore dei jet simulati. Tramite opportuni fattoridi correzione, si cerca dunque di equalizzare tale distribuzione a quella osservatanei dati. I fattori di correzione, detti anche scale factors, vengono derivati sepa-ratamente per i b-jet e per i jet leggeri. In entrambi i casi lo studio ha inizio daun campione di eventi in cui sono presenti due leptoni isolati di carica opposta(elettroni o muoni), per i quali si richiede un impulso trasverso maggiore di 25GeV per il più energetico e maggiore di 15 GeV per il restante. Devono inoltreessere presenti nell’evento esattamente due jet con impulso trasverso maggiore di20 GeV. Per la determinazione delle correzioni dei b-jet, si richiede che uno diquesti sia b-taggato, ovvero effettivamente riconosciuto come b-jet presentando ildiscriminatore maggiore di una soglia sufficientemente alta così che il campioneselezionato non contenga praticamente jet leggeri. Quindi si impongono ulterioricondizioni che assicurano di selezionare eventi da tt̄ in modo tale che vi sia un’altaprobabilità che anche il secondo jet sia da b. Al contrario, le correzioni per i jetleggeri vengono eseguite in un campione di dati in cui gli eventi hanno basse pro-babilità di avere jet da b nello stato finale (Z+jet). Anche in questo caso, vi sonovincoli per uno dei due jet considerati, il quale è richiesto essere con probabilitàvicina a uno un jet leggero, richiedendo che il discriminatore sia inferiore a unasoglia molto bassa. Nessuna condizione viene imposta al secondo jet ma, tenendoconto delle selezioni apportate al campione di dati, è molto probabile che non sitratti di un jet da b.Gli scale factors sono quindi misurati usando il secondo jet dell’evento, cioè quel-lo di cui conosciamo il flavour, senza aver posto vincoli sul discriminatore. Siestraggono quindi gli scale factor normalizzando la distribuzione del discrimina-tore di questi jet a quella osservata nei dati. Una volta ottenuti, questi fattoridi correzione devono essere validati in varie regioni di controllo. Un esempio è lavalidazione in eventi tt̄ con un solo leptone. In questo tipo di eventi entrambi itop decadono in due quark b e due bosoni W, tuttavia solo uno dei due bosonivettori decade in un leptone ed un neutrino; l’altro decade in una coppia di quarkleggeri. Lo stato finale di questi processi è quindi molto diverso da quello dalquale sono stati tratti gli scale factors; questo permette quindi un miglior con-trollo incrociato. Negli eventi in esame viene richiesta la presenza di un elettroneo un muone isolato con pt>30 GeV e |η|<2.1 e di esattamente quattro jet con

Page 24: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 3. B-TAGGING PER GLI EVENTI DI FONDO 22

(a) (b)

Figura 3.3: Distribuzione dei valori del discriminatore dell’algoritmo CSVv2 peril campione di eventi tt̄ con un solo leptone prima (a) e dopo (b) avere applicatoi fattori di correzione [10].

pt>30 GeV, due dei quali b-taggati dall’algoritmo del quale si vogliono testarei fattori di correzione. Nella figura (3.3) si osserva la distribuzione dei valoridel discriminatore CSVv2 per tutti i jet della regione di controllo. Si nota chel’accordo tra i dati e le simulazioni è migliore dopo aver applicato i fattori dicorrezione. La banda grigia rappresenta l’incertezza sui fattori di correzione. Sivede che la differenza residua tra dati e MC è contenuta in questa banda. Questaincertezza inoltre può essere propagata nell’analisi finale, permettendo di stimarecosì l’errore sistematico sulla misura dovuto all’algoritmo di b-tagging.

Page 25: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Capitolo 4

Analisi dati

Come si è visto nel capitolo precedente, ad ogni jet è associato un certo valoredel discrimatore dell’algoritmo di b-tagging utilizzato. Al fine di stabilire se sitratta di un jet da b o meno, è necessario applicare un taglio ai possibili valoridel discriminatore. Una volta stabilita questa soglia, si è in grado di separaregli eventi che contengono b-jet da quelli che non li contengono. Nello specificosi può riuscire a riconoscere gli eventi H → W+W− da quelli tt̄ → W+W−bb̄che presentano b-jet nello stato finale. Occorre dunque effettuare una sceltaottimale del valore di questa soglia per ciascuno dei quattro algoritmi utilizzati eindividuare tra questi quello con prestazioni migliori.

L’analisi che segue utilizza un campione di dati da simulazioni Monte Carlo,che riproducono sia gli eventi di segnale, sia quelli di fondo. La risposta delrivelatore CMS alle particelle prodotte negli eventi è stata simulata utilizzando ilprogramma GEANT4.L’analisi viene effettuata mediante un programma in C++ implementato dalprogramma di analisi dati ROOT [11].

4.1 Tagli di selezioneIl segnale che si studia è quello del decadimento del bosone di Higgs che prevedenello stato finale due leptoni di carica opposta e due neutrini. Si è operata peròuna distinzione in base al processo che ha portato alla produzione dell’Higgs. Sisono infatti presi in considerazione i meccanismi di Gluon Fusion e di VectorBoson Fusion riassunti rispettivamente nei modi seguenti:

gg → H → W+W− → l+l−νν̄ (4.1)

qq′ → qq′H → qq′W+W− → qq′l+l−νν̄ (4.2)

In entrambi i casi, prima di procedere all’analisi, sono stati applicati dei taglidi selezione sui corrispondenti campioni di dati. Essi consistono in una serie dicondizioni discendenti dalla cinematica dell’interazione in esame che un eventodeve soddisfare affinchè venga analizzato.

23

Page 26: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 24

Per tutti e due i tipi di segnale, si richiede la presenza di due leptoni isolati. Que-sto perchè, come si è già osservato, all’interno dei b-jet possono trovarsi leptonileggeri provenienti dal decadimento semi-leptonico dei b-adroni oppure muoniderivanti da pioni eventualmente originati nel processo di adronizzazione. Taliparticelle possono quindi costituire un fondo per i leptoni di segnale provenientidal decadimento dei due bosoni W. Richiedere dunque che non vi sia attività,ovvero presenza di ulteriori particelle, in prossimità dei leptoni esclude il fattoche essi siano parte di un jet (e quindi dovuti ad un processo di fondo) e avvalorail fatto che siano stati originati in un evento di segnale.Si richiede inoltre che nel singolo evento l’impulso trasverso del leptone più ener-getico, detto leading, sia maggiore o uguale a 20 GeV mentre quello del secondopiù energetico (subleading) superi o eguagli i 10 GeV. È inoltre necessaria unamassa invariante dei due leptoni carichi maggiore di 12 GeV e un impulso tra-sverso maggiore di 30 GeV. Un’ulteriore vincolo riguarda il flavour di questi.Selezionando infatti solo gli eventi in cui vi sono un elettrone e un muone, si rie-sce a sopprimere il fondo dovuto al processo Drell-Yann qq → l+l−, che presentanello stato finale due leptoni dello stesso tipo. Resta un piccolo fondo di eventidi Drell-Yann qq → τ+τ−, nei quali i due τ decadono poi uno in un elettrone el’altro in un muone, ma il branching ratio per questi decadimenti è soltato il 17,5% circa [12].Si richiede poi la presenza di MET con almeno 20 GeV a seguito della presenzadei neutrini. Questo requisito rimuoverebbe da solo quasi tutto il fondo DY, an-che con leptoni dello stesso tipo, non essendoci i neutrini. La misura della METè però poco precisa e dunque può risultare diversa da zero anche quando non cisono neutrini nell’evento.Nel caso della Gluon Fusion, l’analisi separa inoltre i vari eventi in tre categorieche si escludono a vicenda in base al numero di jet presenti. Si distingue tra:

• 0 jet: nell’evento non sono presenti jet con impulso trasverso maggiore di30 GeV

• 1 jet: nell’evento è presente un solo jet con impulso trasverso maggiore di30 GeV

• 2 jet nell’evento ci sono almeno due jet con impulso trasverso maggiore di30 GeV

Per quanto riguarda invece la Vector Boson Fusion (VBF), si richiede che nelsingolo evento ci siano almeno due jet con impulso trasverso maggiore o uguale a30 GeV, che questi abbiano una massa di almeno 400 GeV e che vi sia tra essi un∆η > 3, dato che i due quark iniziali tendono a proseguire in avanti e in direzioneopposta.Per tutte queste sottocategorie di analisi, per la reiezione del fondo da tt̄, siconsidera il valore di b-tagging di tutti i jet con un impulso trasverso maggioredi 20 GeV.

Page 27: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 25

4.2 Curve ROCLa prima parte di questo lavoro comprende la costruzione delle curve ReceiverOperating Characteristic (ROC) per i vari algoritmi di b-tagging e per ciascunadelle sottoclassi in cui si è divisa l’analisi. A tal fine, si definisce l’efficienza dib-veto ε per un dato taglio sul discriminatore come il numero di eventi in cui i jetselezionati presentano un valore del discriminatore inferiore al taglio scelto divisoper il numero totale di eventi. Si ricorda che il segnale considerato non ha jet dab e dunque l’efficienza di b-veto coincide con l’efficienza di selezione del segnale.Definiamo inoltre, per gli eventi di fondo, la reiezione come 1− ε, corrispondenteal numero di eventi non selezionati dal taglio diviso il numero totale di eventi.Nel range in cui variano i discriminatori degli algoritmi scelti, si sono definiti 100valori del taglio e si sono costruiti due istogrammi, ponendo nel primo il numerodi eventi che superano la selezione al variare del taglio mentre nel secondo il nu-mero totale di eventi. Ogni bin dell’istogramma corrisponde ad un preciso valoredel taglio. Eseguendo la divisione bin per bin di questi, si ottiene in ciascun binl’efficienza di veto relativa al taglio corrispondente. Si è operato in questo modosia per gli eventi di segnale sia per quelli di fondo. Per questi ultimi si è poicalcolata la reiezione. Per il calcolo degli errori si è ricorsi al metodo ClopperPearson [13], fornito dal programma di analisi ROOT. Sono state infine costruitele curve ROC, ponendo nell’asse delle ascisse l’efficienza di veto sugli eventi disegnale εs e nell’asse delle ordinate la reiezione sugli eventi di fondo 1-εf . Diseguito si riportano gli andamenti ottenuti per le categorie 0 jet, 1 jet, 2 jet eVBF.La curva ideale del classificatore perfetto è costituita da un segmento che dalpunto (0,1) continua orizzontalmente fino al punto (1,1) per poi scendere al pun-to (1,0). In questo caso infatti si avrebbe una reiezione del fondo pari ad 1 perqualsiasi valore dell’efficienza sul segnale. L’algoritmo che non fornisce alcun aiu-to invece è quello la cui curva ROC congiunge i punti (0,1) e (1,0) mediante unaretta con pendenza pari a -1. In questo caso efficienza sul segnale e sul fondoavrebbero sempre lo stesso valore, dunque non si otterrebbe nessun vantaggiodall’applicazione di un taglio sul discriminatore. Tanto più ci si allontana daquesta situazione e ci si avvicina a quella ottimale, tanto più l’algoritmo è buo-no. Il primo obiettivo è l’individuazione dell’algoritmo con migliori prestazioni.Osservando le figure dalla (4.1) alla (4.4), si nota come vi siano degli algorit-mi con prestazioni migliori su tutto il range del discriminatore. Ad eccezionedella categoria 0 jet, questi mostrano curve prossime al caso ideale. Si trattadegli algoritmi cMVAv2 (in rosso) e DeepCSV (in blu). Un modo per individuarel’algoritmo migliore tra quelli utilizzati consiste nel determinare quello che ga-rantisce l’efficienza di segnale maggiore a parità di reiezione sul fondo. Tuttavia,per un’analisi accurata, si è preferito massimizzare una specifica figura di meritocome verrà discusso nella prossima sezione.

Page 28: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 26

0.4 0.5 0.6 0.7 0.8 0.9 1s∈

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

f∈

cMVAv2CSVv2

DeepCSVDeepFlavour

Figura 4.1: Curve ROC dei quattro algoritmi per la categoria 0 jet.

0 0.2 0.4 0.6 0.8 1s∈

0.5

0.6

0.7

0.8

0.9

1

f∈

cMVAv2CSVv2

DeepCSVDeepFlavour

Figura 4.2: Curve ROC dei quattro algoritmi per la categoria 1 jet.

Page 29: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 27

0 0.2 0.4 0.6 0.8 1s∈

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

f∈

cMVAv2CSVv2

DeepCSVDeepFlavour

Figura 4.3: Curve ROC dei quattro algoritmi per la categoria 2 jet.

0 0.2 0.4 0.6 0.8 1s∈

0.6

0.7

0.8

0.9

1

f∈

cMVAv2CSVv2

DeepCSVDeepFlavour

Figura 4.4: Curve ROC dei quattro algoritmi per la categoria VBF.

Page 30: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 28

4.3 Determinazione dell’algoritmo miglioreLa massimizzazione di una figura di merito consiste nel cercare il valore del tagliosul discriminatore per il quale essa possiede il valore più grande. In questa analisila figura di merito scelta è la significanza s = S√

S+F, definita come il numero

di eventi di segnale (S) che passano la selezione diviso la radice quadrata dellasomma del numero di eventi di segnale e di fondo (F) selezionati. Anche inquesto caso, un evento passa la selezione se tutti i suoi jet presentano il valore deldescriminatore inferiore al taglio scelto. Procedendo in modo analogo a quantodescritto per le curve ROC, si sono contati gli eventi che superano la selezione alvariare del taglio, sia di segnale che di fondo. In questo caso però al fondo da tt̄, siè unito anche quello dovuto alle coppie WW. Quest’ultimo non era stato preso inconsiderazione per il calcolo dell’efficienza di b-tagging degli algoritmi in quantonon presenta b-jet nello stato finale e dunque si comporta come il segnale rispettoai tagli di b-tagging. Tuttavia per ottimizzare la significanza è importante tenerneconto.Si è quindi proceduto al calcolo della significanza per i singoli tagli. Nelle figure(4.5), (4.6), (4.7), (4.8) si riportano in grafico i valori della significanza al variaredel taglio sul discriminatore dei quattro algoritmi, rispettivamente per le categorie0 jet, 1 jet, 2 jet e VBF.Si è infine provveduto alla ricerca del massimo valore della significanza per ciascunalgoritmo e del taglio corrispondente a questo. Nelle pagine seguenti si riportanoi risultati ottenuti, in particolare nelle tabelle (4.1), (4.2), (4.3), (4.4).

Page 31: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 29

1− 0.5− 0 0.5 1Taglio

7

8

9

10

11

Sig

nific

anza

cMVAv2

CSVv2

DeepCSV

DeepFlavour

Figura 4.5: Significanza per la categoria 0 jet.

0 jetAlgoritmo tmax smaxcMVAv2 0.32 11.3947CSVv2 0.81 11.3406

DeepCSV 0.33 11.4356DeepFlavour 0.45 11.1761

Tabella 4.1: Massimo della significanza e valore del taglio corrispondente per isingoli algoritmi per la categoria 0 jet.

Page 32: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 30

1− 0.5− 0 0.5 1Taglio

0

1

2

3

4

5

6

Sig

nific

anza

cMVAv2

CSVv2

DeepCSV

DeepFlavour

Figura 4.6: Significanza per la categoria 1 jet.

1 jetAlgoritmo tmax smaxcMVAv2 -0.44 5.90637CSVv2 0.57 5.64807

DeepCSV 0.2 5.91366DeepFlavour 0.18 5.30856

Tabella 4.2: Massimo della significanza e valore del taglio corrispondente per isingoli algoritmi per la categoria 1 jet.

Page 33: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 31

1− 0.5− 0 0.5 1Taglio

0

0.5

1

1.5

2

2.5

3

Sig

nific

anza

cMVAv2

CSVv2

DeepCSV

DeepFlavour

Figura 4.7: Significanza per la categoria 2 jet.

2 jetAlgoritmo tmax smaxcMVAv2 -0.58 3.08509CSVv2 0.58 2.77814

DeepCSV 0.18 3.02259DeepFlavour 0.15 2.42955

Tabella 4.3: Massimo della significanza e valore del taglio corrispondente per isingoli algoritmi per la categoria 2 jet.

Page 34: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 32

1− 0.5− 0 0.5 1Taglio

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

2.2

Sig

nific

anza

cMVAv2

CSVv2

DeepCSV

DeepFlavour

Figura 4.8: Significanza per la categoria VBF.

VBFAlgoritmo tmax smaxcMVAv2 -0.62 2.00108CSVv2 0.56 1.8519

DeepCSV 0.21 1.89333DeepFlavour 0.16 1.70945

Tabella 4.4: Massimo della significanza e valore del taglio corrispondente per isingoli algoritmi per la categoria VBF.

Page 35: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 33

Quanto ottenuto conferma quello che era stato precedentemente dedotto dallostudio delle curve ROC: gli algoritmi migliori risultano essere il cMVAv2 e ilDeepCSV. I valori ottenuti per questi due algoritmi sono mostrati per tutte lecategorie nella tabella (4.5), in modo da facilitare il confronto.

0 jetcMVAv2 DeepCSV11.3947 11.4356

1 jetcMVAv2 DeepCSV5.90637 5.91366

2 jetcMVAv2 DeepCSV3.08509 3.02259

VBFcMVAv2 DeepCSV2.00108 1.89333

Tabella 4.5: Confronto tra il massimo della significanza ottenuta dagli algoritmicMVAv2 e DeepCSV per le categorie di analisi 0 jet, 1 jet, 2 jet e VBF.

Si vede che in particolare il DeepCSV mostra prestazioni migliori per lecategorie 0 jet e 1 jet mentre il cMVAv2 per quelle di 2 jet e VBF. I valori deitagli corrispondenti al massimo della significanza sono 0.33 per 0 jet, 0.2 per 1jet, -0.58 per 2 jet e -0.62 per VBF.Va tuttavia osservato che la differenza di significanza tra questi algoritmi è moltopiccola e la decisione finale deve essere presa tenendo conto dell’accordo tra i datie la simulazione per ciascun algoritmo.

4.4 Confronto tra simulazione e datiIl confronto tra simulazione e dati per tutti i punti ottimali individuati e la deci-sione finale su quale algoritmo utilizzare vanno oltre lo scopo di questo lavoro ditesi. Tuttavia per illustrare il metodo e avere un’idea della bontà della simulazio-ne si mostrano i risultati ottenuti per l’algoritmo DeepCSV in corrispondenza diun valore del taglio pari a 0.1522, che è vicino ai valori che sono stati individuaticome ottimali. Il confronto è stato eseguito in due diverse regioni di controllo, unacon quark top, e quindi b-jet, ed una con jet leggeri. Nel primo caso, dopo averapplicato le preselezioni descritte nel paragrafo precedente, si è richiesta la pre-senza nei singoli eventi di un leading jet con pt>30 GeV e con un discriminatoresuperiore al taglio imposto. Il valore del discriminatore del subleading jet è statoinvece usato per controllare l’accordo tra i dati e le simulazioni in questo campio-ne di eventi. La distribuzione di questi dopo aver applicato i fattori di correzionecorrispondenti è mostrata in figura (4.9) ed è suddivisa in due bin:[0,0.1522], incui vi sono jet non b-taggati, e [0.1522,1] in cui vi sono jet riconosciuti come da b.Si distingue inoltre in base all’impulso trasverso del jet: nella figura (a) rientranoi jet con pt>30 GeV mentre nella figura (b) quelli con 20<pt<30 GeV.Per il confronto nella regione di controllo con jet leggeri, si selezionano gli even-ti con due leptoni di carica opposta ma stesso flavour, che soddisfano le stesserichieste in termini di impulso trasverso descritte per la precedente regione di

Page 36: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 34

controllo e con una massa invariante tra gli 80 e i 120 GeV. Così facendo si se-lezionano gli eventi che provengono dal decadimento del bosone vettore Z, dovesono generalmente presenti jet leggeri. Nella figura (4.10) si riportano le distri-buzioni del discriminatore per i jet negli eventi selezionati, avendo apportato lestesse suddivisioni del caso precedente. Quello che si osserva è un buon accordotra i dati e le simulazioni entro le incertezze fornite dai fattori di correzione perle due diverse regioni di controllo, sia per i jet ad alto pt (figure a), sia per quellia basso pt (figure b). Un ulteriore aspetto importante da mettere in evidenza è lapiattezza del rapporto dati/MC dato che la normalizzazione assoluta degli eventidi fondo potrà essere ricavata dai dati stessi.

Page 37: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

CAPITOLO 4. ANALISI DATI 35

(a) (b)

Figura 4.9: Distribuzione dei valori del discriminatore dell’algoritmo DeepCSVper jet con pt maggiore di 30 GeV (a) e tra 20 e 30 GeV (b) nella regione dicontrollo con b-jet, dopo aver applicato i fattori di correzione.

(a) (b)

Figura 4.10: Distribuzione dei valori del discriminatore dell’algoritmo DeepCSVper jet con pt maggiore di 30 GeV (a) e tra 20 e 30 GeV (b) nella regione dicontrollo con jet leggeri, dopo aver applicato i fattori di correzione.

Page 38: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Conclusioni

In questo lavoro di tesi è stato effettuato uno studio dei 4 principali algoritmi dib-tagging utilizzati dalla collaborazione CMS per distinguere il fondo dovuto aiprocessi tt̄ dagli eventi di segnale H → W+W−, prodotti nelle collisioni protone-protone a LHC.Si sono utilizzati per questo scopo dei campioni di dati simulati con il metodoMonte Carlo.Per i processi di segnale si è operata una distinzione a livello di analisi a secondache il meccanismo di produzione del bosone di Higgs fosse quello di Gluon Fusiono di Vector Boson Fusion. Per il primo di questi si sono ulteriormente classificatigli eventi in base al numero di jet presenti nello stato finale. In particolare si sonoconsiderati distintamente eventi con 0 jet, 1 jet e 2 jet.Una volta applicate le opportune selezioni sugli eventi, per tutte quattro le ca-tegorie (0 jet, 1 jet, 2 jet e VBF ) si è valutata l’efficienza di veto sugli eventidi segnale e la reiezione su quelli di fondo per vari tagli sul valore del discrimi-natore fornito da ciascuno degli algoritmi considerati. Tale valutazione è statafatta richiedendo che tutti i jet all’interno di un evento presentassero un valoredel discrimatore inferiore al taglio imposto. Successivamente si sono costruite lecurve ROC.Si è quindi proceduto a scegliere l’algoritmo con prestazioni migliori per le sin-gole sottoclassi di analisi. La scelta è stata effettuata andando a massimizzarela significanza. Si è identificato l’algoritmo che tra i quattro forniva il valore piùgrande di questa figura di merito al variare della soglia imposta sul discriminato-re. Una volta individuato, si è quindi risaliti al taglio per il quale si raggiungevail massimo della significanza.Il presente studio ha permesso dunque di individuare per ogni categoria l’algo-ritmo migliore e il punto di lavoro ottimale per separare il segnale dal fondo.Questo risultato sarà utilizzato nell’analisi, ancora in corso, volta a misurarela sezione d’urto di produzione del bosone di Higgs, nel canale di decadimentoH → W+W− → l+νl−ν̄, con tutti i dati raccolti dall’esperimento CMS.

36

Page 39: AnnoAccademico 2017/2018 proprietà di questo nuovo bosone in diversi canali di produzione e decadimento ... l’accoppiamento con un campo scalare, denominato campo di Higgs. La teoria

Bibliografia

[1] D. Griffiths. Introduction to Elementary Particles. Second, Revised Edition,2008.

[2] Vernon D. Barger and Roger J.N. Phillips. Collider Physics. Addison-Wesley,1987.

[3] CERN website, https://wiki.cern.ch/twiki/bin/view/LHCPhysics/CrossSections.

[4] CERN website, https://home.cern/science/accelerators/large-hadron-collider.

[5] CERN website, https://twiki.cern.ch/twiki/bin/view/CMSPublic/LumiPublicResult.

[6] The CMS Collaboration. The CMS Experiment at the CERN LHC. JINST,2008.

[7] The CMS Collaboration. Particle-Flow reconstruction and global eventdescription with the CMS detector. CMS PRF 14 001, 2017.

[8] G. P. Salam M. Cacciari and G. Soyez. The anti-kt jet clustering algorithm.JHEP 0804:063, 2008.

[9] Luca Scodellaro. B tagging in Atlas and CMS. CMS CR-2017/225, 2017.

[10] The CMS Collaboration. Identification of heavy-flavour jets with the CMSdetector in pp collisions at 13 TeV. CMS-BTV-16-002, 2018.

[11] ROOT website. https://root.cern.ch.

[12] Particle Data Group. 2018.

[13] L. Lista. Statistical Methods for Data Analysis in Particle Physics. 2nd ed.,2016.

37