32
Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) [email protected]

Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) [email protected]

Embed Size (px)

Citation preview

Page 1: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

Mario Reale INFN CNAF Bologna

L'uso attuale di Grid negli esperimenti LHC e

realizzazione di HEPCAL

Mario Reale

(INFN CNAF - Bologna)[email protected]

Page 2: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

2Mario Reale INFN CNAF Bologna

• 1.Computing di oggi negli esp.LHC nelle produzioni MC– Catena s/w di produzione– Modelli attuale di produzione distribuita e loro limiti

• 2.Uso attuale,consolidato di GRID

• 3.Programmi in corso per l’integrazione di GRID

• 4.Elementi comuni nel lavoro di gridificazione

• 5.HEPcal ed idee realizzative

Indice

Page 3: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

3Mario Reale INFN CNAF Bologna

1.Computing (oggi) negli esperimenti LHC

• Massiccie produzioni MC di evt. simulati

• Diversificazione dei siti di produzione

• Gestione db di riferimento per la produzione, sia centralizzati che locali (farm)

• Persistenza :

-Root

-Objectivity

-Pool (futuro)

Page 4: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

4Mario Reale INFN CNAF Bologna

Modello di flusso dei dati in HEP

Physics Generator

Detector Simulation

Generator Data

Simulated Raw Data

Monte Carlo

Raw Data

DAQ system

L2/L3 Trigger

Calibration System

Calibration Data

Reconstruction

ESD Event Tags

Raw Data Calibration Data

Group Analysis

Event Summary Data(ESD)

Event Tags

Analysis Object Data(AOD) Group Analysis Tags

Physics Analysis

Ntuples

Analysis Workstation

Physics results

DetectorAnalysis Cycle

Trigger Tags

Event Tags

Page 5: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

5Mario Reale INFN CNAF Bologna

ATLAS : catena di produzione MC

RAW EVTS files(hits,digits)

gen data cards

detect geom

HepMC (O-O)

Gen files

Generatore: Pythia

(Ricostruzione,Conversione)

RZ Zebra

Objectivity db (Root)

gen files

ATLSIM (dice)Simulazione: GEANT3

Root

AODs

ASCII

(Athena)

ASCII

Page 6: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

6Mario Reale INFN CNAF Bologna

CMS : catena di produzione MCPythiagen data cards

detect geom Gen files

Generatore: Pythia

Ricost/digitizzazione-Copia sui db di Objectivity

ObjectivityDB

Ntuples (gen files)

CMSIM Simulazione: GEANT3

Hbook Zebra

ASCII

ASCII-db

SIM cards

ooDigi

ORCA-COBRA

ooHits

FZ-filesZebra

Page 7: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

7Mario Reale INFN CNAF Bologna

LHCb : catena di produzione MC

gen data cards detect geom

SICBMC/Gauss

RAWH files

Brunel

OODSTs

Generatore: PythiaSimulazione:GEANT3

Ricostruzione

RZ Zebra

Root

ASCIIASCII

Page 8: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

8Mario Reale INFN CNAF Bologna

Alice : catena di produzione MC

root files

Config.C

detect geom

Generatori via interfaccia astratta :

- Hijing- Herwig- Pythia

Ricostruzione

Root

Aliroot

Simulazione: GEANT3 GEANT4

FLUKA (tra poco)Root

root files

ASCII

Aliroot

codice in c++root db

Analisi : root

Page 9: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

9Mario Reale INFN CNAF Bologna

Limiti dei workflow di produzione attuali

• “Baby sitting” delle farm

• Coordinamento “manuale” degli amministratori locali delle farm nella pianificazione delle produzioni

• Frammentazione dei dominii : – Steering manuale delle produzioni replicato in ogni

sito– Mancanza di flessibilita’ nello sfruttamento delle

risorse – Difficolta’ di controllo centralizzato

Page 10: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

10Mario Reale INFN CNAF Bologna

2.Uso attuale di GRID

• Validazione congiunta dei 4 esp. dei testbed 0,1,2 di EDG Grid

• Data Challenge 1 su EDG release 1.2.2 (ATLAS) ( 1% di tot DC1)

• Stress test su EDG release 1.3.0 (CMS) :in griglia di partenza

• Inclusione inter-operativa delle risorse testbed EDG nel modello di comp.distribuito Alien (ALICE)

• PDC, CDC in corso per LHCb

Page 11: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

11Mario Reale INFN CNAF Bologna

• Scopo originario:- Realizzazione dell’ 1% di Data Challenge 1 sul testbed

distribuito di EDG GRID - Verifica della production quality fornita dal testbed EDG e della

portabilita’ del s/w ATLAS su GRID - Totale Produzione pianificata:

- 100 partizioni in input – 500 000 evts simulati

- Siti coinvolti : CERN, NIKHEF, RAL, CNAF, KARLSRUHE, LYON

• Esecuzione prevista originariamente: 2 fasi- Fase preparatoria – Trasferimento e registrazione dei dati in

input- Fase di esecuzione job e recupero dell’ output

Atlas Data Challenge 1 su EDGAtlas-EDG task force

Page 12: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

12Mario Reale INFN CNAF Bologna

Atlas Data Challenge 1 su EDGAtlas-EDG task force

Piano originario: 1 – fase preparatoria

•Trasferimento di files (gen) in input dal Mass Storage CASTOR @ CERN

al GRID storage element (SE) del CERN

•Trasferimento di files dal GRID storage element (SE) del CERN agli storage

element dei 5 siti distribuiti

• Registrazione dei files in ingresso nel Replica Catalog di ATLAS

2 – fase di esecuzione e gestione output

•Sottomissione di Job per la produzione su GRID

•Esecuzione e recupero dell’ output

•Registrazione dei files in output nel RC di ATLAS

Page 13: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

13Mario Reale INFN CNAF Bologna

In dettaglio – Risultato : testati con successo:

•Trasferimento dei dati in input da CASTOR al CERN SE ( 5 files di ROOT del dataset 2000, ognuno da circa 1.7 GB each ) con RFIO

•Registrazione nel Replica Catalog

•Sottomissione dei Job e recupero dell’ output sul sito del CERN

Atlas Data Challenge 1 su EDGAtlas-EDG task force

Page 14: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

14Mario Reale INFN CNAF Bologna

UI

CASTOR

CERB

RC CE

CE

jdl

(ldap)

JDL:

ReplicaCatalog=“ldap://grid011g.cnaf.infn.it:9011/ATLAS Testbed1 Replica Catalog…”;

InputData={LF:”dc1.002000.evgen.0001.hlt.pythia_jet_17.root”};

DataAccessProtocol= “file”;

...

NFS

NFS

NFS

lxshare0399.cern.ch

Input

file

Atlas Data Challenge 1 su EDGAtlas-EDG task force

Sottomisisone dei Job : testata con successo

G.Negri/S.Resconi/ATLAS

Page 15: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

15Mario Reale INFN CNAF Bologna

UI

CASTOR

CERB

RC CE

CEZEBRA

registration of

ZEBRA file in

the RC

GDMP

output sandbox

output sandbox

NFS

Atlas Data Challenge 1 su EDGAtlas-EDG task force

Recupero dell’ output : testato con successo

G.Negri/S.Resconi/ATLAS

Page 16: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

16Mario Reale INFN CNAF Bologna

• Successo Parziale :– Interfacciamento di base

tra s/w ATLAS di produzione ed EDG : OK

– Sottomissione dei Job, recupero dell’ output

utilizzando s/w ATLAS sul tb produzione EDG : OK

- Coinvolgimento di siti distribuiti : parziale, dovuto

a problemi di trasferimento di files estesi

legato alla release utilizzata EDG 1.2.2 e diponibilita’ complessiva dei servizi

Atlas Data Challage 1 su EDGAtlas-EDG task force : riepilogo

G.Negri/S.Resconi/ATLAS

Page 17: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

17Mario Reale INFN CNAF Bologna

•Scopo:

•Test CMS prod-ready per EDG

•Test flessibilita’ CMS per GRID

• 10 % della “summer” production in 4 settimane: 1 Milione di eventi da generare

•Siti Coinvolti

•Siti di EDG GRID testbed + farm CMS Legnaro + siti CMS UK, F

•Macchine “allocate” a CMS Tier 1 italia (CNAF)

•1 SE dedicato al CERN e 1 a Legnaro

Stress Test CMS - GRID

Page 18: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

18Mario Reale INFN CNAF Bologna

3.Programmi di integrazione di GRID

• ATLAS: integrazione di Athena/Gaudi con Grid

• CMS: integrazione di Impala/BOSS con Grid

• Alice : integrazione di Alien con EDG

• LHCb: integrazione di Gaudi con Grid

Page 19: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

19Mario Reale INFN CNAF Bologna

ATLAS : integrazione Grid

• Athena/Gaudi da integrare con GRID

• Integrazione in studio, in parallelo a ulteriori sviluppi di Athena/Gaudi, basata su Python come software bus

• Sviluppo comune a LHCb (GANGA)

Page 20: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

20Mario Reale INFN CNAF Bologna

CMS : integrazione Grid

• Installato s/w CMS (IMPALA, BOSS) sulla user interface (EDG UI)

• Unificazione del database di BOSS• Impala scrive un file di descrizione del job da

eseguire (JDL) - indipendente dalla locazione - e lo sottomette automaticamente al Broker di EDG

• I job possono essere eseguiti su qualsiasi risorsa di GRID disponibile. (non c’e’ bisgno di configurazione locale della farm)

Page 21: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

21Mario Reale INFN CNAF Bologna

Data Management components(Catalogues)

Planner (uses CMS

production SW)

Storage Element

Reference DB

Local analysis tools with plugin to access

remote data

Physics Data Production & Analysis Portal

Computing Element

EDG User Interface

job job

job

job

job

CMS Grid overview per DC04(2003-04)

Page 22: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

22Mario Reale INFN CNAF Bologna

LHCb : integrazione Grid

- Interfacciati nel framework (Java) per la gestione delle produzioni MC tutti I comandi di EDG / WMS ( grid-proxy-init, dg-job-submit, dg-job-status…)

-Dimostrata l’ inter-operativita’ LHCb-EDG/testbed 1 durante la review di EDG (marzo 2002)

- sottomissione dei Job, monitor, recupero output- basic data management con GDMP

-Sviluppata e proposta una architettura di integrazione tra GRID e Athena/Gaudi/GANGA

Page 23: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

23Mario Reale INFN CNAF Bologna

InternetInternet

GRIDGRID

Athena\GAUDI

Localuser

GaudiPython

Remote user

HTML page

JobConfiguration

DB

BookkeepingDB

ProductionDB

GU

IJava Module OS Module EDG API PythonROOT

PYTHON SW BUS

GAUDI client

WorkspacesDB

LHCb : integrazione Grid architettura

Page 24: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

24Mario Reale INFN CNAF Bologna

Alice : integrazione Grid

• Realizzato interfacciamento ad EDG : accessibile come un sito AliEn

• Punti rilevanti emersi nel lavoro attuale :

– Autenticazione all’ Alien Catalog per i job eseguiti sui WNs EDG

– Interfaccia Alien - EGD SE

( richiede API EDG SE )

Page 25: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

25Mario Reale INFN CNAF Bologna

Server

EDG CEAliEn CE

EDG SE

Data Catalogue

EDG RB

WNs

EDG UI

AliEn SE

Alice SE on EDG nodes Alice Data Catalogue access by EDG nodes

EDG UI Installation JDL translationCertificates

Alice: integrazione AliEn-EDG

(Cerello,Barbera,Buncic Saiz,et al.)

Page 26: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

26Mario Reale INFN CNAF Bologna

Valutazione dello stato del testbed: script per sottomettere periodicamente jobs AliRoot su tutto il testbed EDG utilizzando tutti I brokers (RB) EDG Sito Web di monitor e statistiche

Interoperabilita’ AliEn/EDG: Porting di EDG UI a RH7.2 e Solaris Porting di EDG/CE e EDG/SE a RH7.2 Test del comportamento EDG/RC (per un eventuale uso in parallelo con AliEn/RC)

Alice: integrazione AliEn-EDGsviluppi

(P.Cerello/ALICE)

Page 27: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

27Mario Reale INFN CNAF Bologna

4.Elementi comuni nel lavoro di gridificazione

• Tutti gli esperimenti hanno esigenze simili anche se non identiche: interfacciare il loro modello attuale di computing distribuito con il middleware EDG– Sheduling dei jobs (sia esso “pulled” o “pushed”)– Sistemi di Logging e Bookkeeping– Data Management su GRID (RM,GDMP, RFIO, MSS)

• Gli esperimenti hanno definito assieme un certo numero di use cases comuni nell’ uso di GRID

• Verranno usati come riferimento per ulteriori sviluppi del middleware di GRID

• Verranno interfacciati in maniera specifica al Computing System dei diversi esperimenti

• Interoperabilita’ USA-EU

Page 28: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

28Mario Reale INFN CNAF Bologna

5. HEPCAL ed idee realizzative

– costituzione di un gruppo di utenti grid rappresentanti degli esperimenti (proposta di HEPCAL, GAG == Grid Application Group)

– interazione con i progetti di middleware (gia’ iniziata con iVDGL e EDG)

– “test cases” (indipendenti dall’esperimento) per testare l’implementazione di HEPCAL

– proposta da parte dei progetti di middleware di “esempi” di implementazione di HEPCAL, frammenti di codice o comandi

– “regression test suite” basata su HEPCAL da girare su LCG-1

Page 29: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

29Mario Reale INFN CNAF Bologna

HEPCAL : proseguimento

• Continuazione possibile di HEPCAL – Prioritizzazione degli use case– Quantificazione (quanti files, di che dimensioni,

quanti utenti, quante richieste al secondo etc.)– Collezione delle esigenze per il calcolo interattivo

Page 30: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

30Mario Reale INFN CNAF Bologna

EventGeneration

Core Services

Dictionary

Whiteboard

Foundation and Utility Libraries

DetectorSimulation

Engine

Persistency

StoreMgr

Reconstruction

Algorithms

Geometry Event Model

GridServices

I nteractiveServices

Modeler

GUIAnalysis

EvtGen

Calibration

Scheduler

Fitter

PluginMgr

Monitor

NTuple

Scripting

FileCatalog

ROOT GEANT4 DataGrid Python Qt

Monitor

. . .MySQLFLUKA

EventGeneration

Core Services

Dictionary

Whiteboard

Foundation and Utility Libraries

DetectorSimulation

Engine

Persistency

StoreMgr

Reconstruction

Algorithms

Geometry Event Model

GridServices

I nteractiveServices

Modeler

GUIAnalysis

EvtGen

Calibration

Scheduler

Fitter

PluginMgr

Monitor

NTuple

Scripting

FileCatalog

ROOT GEANT4 DataGrid Python Qt

Monitor

. . .MySQLFLUKA

Dominii Architetturali del s/w per le applicazioni LHC

Page 31: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

31Mario Reale INFN CNAF Bologna

Conclusioni

• GRID (EDG in particolare) ha dimostrato in concreto l’interoperabilita’ con il software di produzione degli esperimenti LHC

• I processi di integrazione con GRID sono ancora in corso, tuttavia esistono gia’ progetti complessivamente abbastanza definiti di ulteriore inclusione di GRID sia nelle produzioni che nelle analisi dati

• In futuro una quantita’ crescente di produzioni verra’ portata su GRID

Page 32: Mario Reale INFN CNAF Bologna L'uso attuale di Grid negli esperimenti LHC e realizzazione di HEPCAL Mario Reale (INFN CNAF - Bologna) mario.reale@cnaf.infn.it

32Mario Reale INFN CNAF Bologna

Ringraziamenti

• P.Mato,E. Van Herwijnen,V.Vagnoni,F.Harris (LHCb)

• S.Resconi, G.Negri, L.Perini (ATLAS)

• F.Carminati,P.G.Cerello,P.Buncic,P.Saiz(Alice)

• A.Fanfani,C.Grandi,P.Capiluppi,A.Sciaba’ (CMS)