Upload
luisella-rossetti
View
232
Download
1
Embed Size (px)
Citation preview
Physics Analysis ToolsPhysics Analysis Tools
Luca Lista
INFN
Physics Analysis ToolsPhysics Analysis Tools
Luca Lista
INFN
RECO e AODRECO e AOD
Luca Lista, INFN 4
Formato Dati: RECO a AODFormato Dati: RECO a AOD
• RECO: output consistente della ricostruzione– Consente riprocessamento – Goal: 250 kB/ev– + G4 tracce/vertici + generatore MC
• AOD: output essenziale per l’analisi– Non è possibile il refit delle tracce– Goal: 50 kB/ev– + generatore MC
• Ancora le dimensioni non sono ancora ottimali…
Luca Lista, INFN 5
Dimensioni dell’EventoDimensioni dell’Evento
Luca Lista, INFN 6
Contributi agli AODContributi agli AOD
50 eventi bb
Tra
ckC
an
did
ate
s_C
kfE
lect
ron
Ca
nd
ida
tes_
_T
est
.
Luca Lista, INFN 7
Contributi ai RECOContributi ai RECO
50 eventi bb
reco
Gsf
Tra
ckE
xtra
s_G
sfE
lect
ron
s__
Te
st.
Tra
ckin
gP
art
icle
s_tr
ack
ing
tru
th_
Tra
ckT
ruth
_T
est
.
Tra
ckC
an
did
ate
s_C
kfE
lect
ron
Ca
nd
ida
tes_
_T
est
.
Luca Lista, INFN 8
Contenuto degli AODContenuto degli AOD
• Al momento, basato su decisione dei “DPG/POG” (ex PRS…)– Tracce (senza hit)– Ecal clusters + shape + tracce– mu/e/gamma, jets (varie collezioni), met– Vari tags
• Una review del contenuto deve essere fatta insueme con i gruppi di Fisica!
Luca Lista, INFN 9
Analisi interattiva e FWLiteAnalisi interattiva e FWLite
• I dati di RECO e AOD sono analizzabili direttamente con ROOT
• Caricamento automatico delle shared libraries del sistema DataFormats (FWLite)
• Sviluppi in corso per permettere l’installazione separata delle librerie dei RECO e AOD senza installazione completa di CMSSW
• E’ nei nostri desiderata il supporto di altre piattaforme per permettere l’analisi su laptop/desktop– MacOS, Windows (Cygwin probabilmente problematico…)
• Maggiori sforzi sono necessari per andare in questa direzione
Luca Lista, INFN 10
Integrazione interattivo e batchIntegrazione interattivo e batch
• Sono disponibili esempi su come sviluppare algoritmi in ambiente interattivo (TSelector) ed incorporarli incorporati in ambiente batch (EDAnalyzer)
• Integrazione con PROOF in corso di definizione– Richiede la distribuzione delle shared libraries ai
worker nodes di PROOF– Tool in comune con CRAB?– Quanto è sentita come priorità per l’analisi?
Luca Lista, INFN 11
User DataUser Data• Le possibilità interattive rendono l’EDM un formato adatto per l’analisi
“finale”• Qantità definite dall’utente si possono facilmente aggiungere all’evento
– Esempi forniti negli ultimi tutorials• Lo “skimming” può sostituire grossi “ntuple dump” (come in
ExRootAnalysis con ORCA)– L’output di un job di analisi può essere un file contenente eventi con una
miscela di collezioni RECO/AOD e User Data– L’analisi interattiva permette di fare plot di quantità User Data contro
quantità RECO/AOD– Produzione integrata con i sistemi ufficiali, e gestibile centralmente
• La “provenance” viene tracciata nel file di output– Le “event lists” permetteranno –un giorno- di tornare dai dati selezionati
nello skim agli eventi completi nelle collezioni RECO/AOD• Non è necessario scrivere “n-tuple” per i plot finali dell’analisi
– Si evita di definire un formato e delle macro utilizzabili sono in un contesto limitato
– Il codice realizzato per l’analisi interattiva di un canale può essere immediatamente rilasciato come strumento comune
• Vogliamo incoraggiare quest’approccio in modo da ottimizzare lo spazioni disco e fornire supporto centrale ai formati di analisi specifici
Strumenti comuniStrumenti comuni
Luca Lista, INFN 13
Moduli Generici ComuniModuli Generici Comuni
• Selettori e Filtri comuni sono definiti in maniera generica per un qualsiasi tipo di collezione
• Semplificano le selezioni più semplici in skim e sequenze di HLT
• L’output potrà diventare, invece di una collezione di cloni, una collezione di puntatori– edm::View, in fase di sviluppo
Luca Lista, INFN 14
Candidati ParticelleCandidati Particelle
• Definiscono un’interfaccia comune per molti oggetti fisici di alto livello:– Elettroni, Fotoni, Muoni, Jet, Energia mancante– Ma anche: particelle generate, decadimenti in
molti corpi (Zll, HZ4l, BsJ/, ..)• Contenuto semplice:
– 4-momento, vertice, carica– Link a componenti RECO/SIM (generici)– Costituenti “figli” e navigazione madre figli
• Pienamente integrati nell’EDM– Collezioni di candidati definite dall’utente possono
diventare persistenti– Si possono usare in maniera interattiva
Luca Lista, INFN 15
Tipi di CandidatiTipi di Candidati
• Oggetti di alto livellocon “link” agli oggetti RECO
• Oggetti compostidi vario tipo
• Eventi generati MC
Luca Lista, INFN 16
Candidati compositiCandidati compositi
• Moduli disponibili per l’analisi combinatoria
• Controllo degli “overlap”
• Fit di vertice comuneintegrato con oggetticompositi
Luca Lista, INFN 17
Analisi CombinatoriaAnalisi Combinatoria• L’analisi combinatoria è in genere banale ma noiosa:
– Controllare cicli annidati, evitare conteggi multipli, verificare sovrapposizione di particelle ...
– Il codice è praticamente identico in contesti diversi: • J/, Z, 0, KS, HZZ*, …
• Esistono moduli generici per questi compiti:– Si evita di fare debugging di repliche dello stesso codice– Le collezioni di output collections possono essere aggiunte
all’evento e salvate per farne analisi interattiva insieme a user-data– Un esercizio di associazione di quantità-utente (e.g.: isolamento dei
lepton) ai leptoni del decadimento di una Zll danno una dimostrazione della funzionalità del modello
• Fit di vertice integrato nell’analisi combinatoria ( … )• Strumenti di match con il Monte Carlo sono “naturali” per oggetti
compositi– Navigazione automatica alle particelle “madri”
Luca Lista, INFN 18
Verità Monte CarloVerità Monte Carlo• Convertire HepMC in candidati riduce la dimensione su disco della
verità MC di un fattore ~2– Sarà default in 1_3_0
• Modello “nativo” per ricostruire i Jet
• Match RECOMC– Match semplice basato su R– Navigazione ai “parenti” automatica per oggetti compositi– Vanno integrati i moduli di match basati su hit Geant
• Jet parton matching– Sviluppi in corso per rilasciare un pacchetto consistente con algoritmi già
utilizzati in ORCA
Luca Lista, INFN 19
Candidati JetCandidati Jet
• Identica struttura per Jet da torricalorimetriche eda generatore MC
• Identica navigabilitàcome per altri oggetti composti
Luca Lista, INFN 20
Vertex fitterVertex fitter
• Integrato Kalman Vertex Fitter di Thomas Speer con candidati compositi
ESHandle<MagneticField> B;es.get<IdealMagneticFieldRecord>().get( B );
CandCommonVertexFitter fitter; fitter.set( B.product() );
Candidate * fittedZ = Z->clone();fitter.set( * fittedZ );
• Interfaccia semplificata rispetto al fitter generico sulle tracce– Estrazione delle tracce etc. nascosta all’utente
Luca Lista, INFN 21
Uso di Strumenti comuni in analisiUso di Strumenti comuni in analisi
• E’ bene uniformare l’uso degli strumenti comuni per l’analisi– I gruppi di analisi hanno un ruolo fondamentale in
questo
• Molti gruppi tendono a replicare in proprio una serie di strumenti HAF, MrParticle, PAX, …
• Usare strumenti comuni garantisce:– Riproducibilità dei risultati– Supporto centrale– Integrazione con il modello di calcolo
• Skim, filtri, etc.
Luca Lista, INFN 22
ConlusioniConlusioni
Usate i tool comuni di analisi…
… e fornite feedback!
Noi forniremo supporto.