View
45
Download
3
Category
Preview:
DESCRIPTION
Dai problemi scientifici alle architetture di calcolo ovvero come cucire con aghi e gomene. Vittorio Rosato Servizio di Calcolo e Modellistica ENEA Casaccia rosato@casaccia.enea.it. Giovedì della Cultura Scientifica, Casaccia 29.4.2004. Key-points. - PowerPoint PPT Presentation
Citation preview
Vittorio RosatoServizio di Calcolo e Modellistica
ENEA Casaccia
rosato@casaccia.enea.it
Dai problemi scientifici alle architetture di calcoloDai problemi scientifici alle architetture di calcolo ovveroovvero
come cucire con come cucire con aghi e gomeneaghi e gomene
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Key-pointsKey-points
1. un legame stretto tra problemi e modelli di calcolo
2. I modelli di calcolo determinano le architetture sulle quali hanno maggiori possibilità di essere eseguiti efficientemente
le piattaforme di calcolo dovrebbero essere“”science-driven”
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Invece…Invece…3. Le architetture di calcolo sono funzionalizzate
per altre classi di applicazioni (grafica, multimedia, internet etc.)
dunque……dunque……4. La computational science ha dovuto elaborare
nuovi modelli operativi e/o a utilizzare enormi piattaforme di calcolo visto che non può guidare lo sviluppo delle architetture.
Questa presentazione illustrera’ alcuni degli ambiti nei quali la presenza di questi problemi ha spinto l’ elaborazione di (nuovi) modelli operativi.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
L’approccio computazionale è ormaiconsiderato come “la ”terza via” dell’approccio conoscitivo alla realtà
Problema
Modello
Architettura
Predizione
Gedanken experimentGedanken experiment
Architetture:- seriali - parallele
Data partitioningfarming
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Distributed memory Shared memory
Principali architetture parallelePrincipali architetture parallele
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problema Problema Modello Modello
locali linearizzazione data partitioningmodello sistolico
comp1 com1 comp2 com2
globali (spettrali, n-corpi) data partitioning difficile
modello sistolico complesso
comp1 com1 comp2 com2
Data partitioningfarming
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Data partitioning(ripartizione dei dati tra i nodi di calcolo)
Task partitioning(ripartizione del lavoro tra i nodi di calcolo)
Principali architetture parallelePrincipali architetture parallele
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Facciamo un esempio: modelli di reti complesseFacciamo un esempio: modelli di reti complesse
Reti complesse: grandi sistemi di nodi e archi che descrivono interazioni funzionali tra oggetti (o entità astratte).
•interattoma del lievito (N=103)•coautorship (N=104)•rete di routers di internet (N=104)•catena alimentare (N=103)•……….•……..•Ammasso globulare (N=106)
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà localiCalcolo di proprietà locali
Calcolo del coeff. di clustering di una rete
nodo della rete devo calcolare il numero di legami tra i suoi vicini e compararlo con il numero massimo di legami che essi potrebbero sviluppare
C = 5/10 = 0.5
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Come implemento il calcolo di questa proprietà ?Come implemento il calcolo di questa proprietà ?
(1)(1)Fornisco Fornisco a tutti gli a tutti gli elementi di elementi di calcolo la calcolo la struttura struttura della rete della rete (2) (2) attribuisco attribuisco il calcolo di c il calcolo di c di un subset di un subset di nodi a di nodi a ciascun ciascun elemento di elemento di calcolo.calcolo.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà globali : dinamica di un ammasso globulareCalcolo di proprietà globali : dinamica di un ammasso globulare
N=105
(1)Calcolo delle rij (n= 1010)
(2)Calcolo delle forze 1/ rij
(3)Integrazione eq. del moto per k= 104 volte
Problemi:- enorme numero di
ops- Struttura non
omogenea- Bilanciamento carico
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
(1)gruppi di dati sui processori
(2)Calcolo rij intra-gruppo(3)Trasmissione dati
inter-proc.(4)Calcolo rij intra-gruppo(5)……
Grande traffico sulla reteBuona scalabilità per
n<16
(1)Calcolo rij su ciascun proc.(2)Somma delle forze su i(3)……
Ridotto traffico sulla reteBuona scalabilità n<32
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problemi computazionali complessiProblemi computazionali complessi
astrofisica (mod. cosmologici, mod. stellari)protein foldingmodelli quantistici di nano-strutturesystems biologyanalisi e controllo di sistemi complessireal-time (analisi di immagine, compressione etc.)Termofluidodinamica, chimica delle reazioniPlasma physics
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
www.nersc.gov
..purtroppo…....purtroppo…..
www.top500.org
87%
68%
58%
64%
74%
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
..le cause principali…....le cause principali…..
Inoltre le prestazioni di (1) bandwidth e di latenza delle reti(2) bandwidth di accesso alle memorie (3) taglia delle memorie interne (cache)non hanno mostrato, nel tempo, lo stesso andamento della legge di Moore, dunque le piattaforme di calcolo sono -”equilibrate”
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Il risultato di tutto questo éIl risultato di tutto questo é
Source: The Divergence problem, H. Simon, Director NERSC, June 2003
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Soluzioni della tecnologia corrente:Soluzioni della tecnologia corrente:
Earth Simulator5192 processors~ 40 Tflops
(Tflops= 103 Miliardi op/sec)
http://www.es.jamstec.go.jp/esc/eng/
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Wide-area computing farms (GRID)Wide-area computing farms (GRID)
Una GRID è un insieme di piattaforme di calcolo distribuite su un’ampia regione che possono eseguire parti diverse dello stesso codice oppure ”repliche” dello stesso codice con dati diversi.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Applicazioni scientifiche su GRID ”globali”Applicazioni scientifiche su GRID ”globali”
www.seti@home.org
www.intel.com/cure/anthrax.htm
folding.stanford.edu
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicatoHW dedicatoUn’altra strategia consiste nella progettazione di architetture massimamente efficienti per lo svolgimento di specifiche tasks.
Esempi:(1) GRAvitational PipE (GRAPE) per
simulazioni astrofisiche
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicatoHW dedicato
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicatoHW dedicatoEsempio:
(2) APE per simulazioni di LQCD
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicatoHW dedicato
Si possono progettare device HW (microprocessori) specializzati per effettuare in mainera molto efficiente (e dunque rapida) specifiche analisi su grandi quantità di sequenze (DNA, proteine). Su questa idea è in corso di realizzazione uno spin-off :
YlichronYlichron
0 0 0
B Input Port
A I
nput Port
1 1 1
11 1
1 1 1
C Output Port
SE
L_1
SE
L_2
SE
L_3
11 1
111
111
1
1
1
1
1
1
1
1
1
Eq. 0 C(i,j,k)=0 with 1 i q, 1 j q, k=0Eq. 1 C(i,j,k)=C(i,j,k-1)+A(i,k)*B(k,j) with 1 i q, 1 j q, 1 k q
Output C(i,j,k) with 1 i q, 1 j q, k=q
FPGA-based board (standard PCI)
0 0 0
B Input Port
A I
nput Port
1 1 1
11 1
1 1 1
C Output Port
SE
L_1
SE
L_2
SE
L_3
11 1
111
111
1
1
1
1
1
1
1
1
1
Automatic synthesisAutomatic validation and checkVHDL expression
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
ConclusioniConclusioni(1) Il mercato ha selezionato le nuove architetture di
calcolo. Tranne alcune eccezioni di piattaforme ”science driven” (IBM BlueGene, vector machines) la comunità scientifica userà, nei prossimi anni, sistemi MPP basati su componenti COTS .
(2) La GRID ha una duplice valenza: da un lato costituisce una soluzione sostenibile, dall’altro consente la realizzazione di progetti ad alto lavoro computazionale. Attribuiamo a questa strategia rilevanti implicazioni commerciali.
(3) I sistemi HW/SW possono costituire una soluzione conveniente in alcuni campi applicativi: la bioinformatica, le applicazioni real-time, l’analisi delle immagini etc. Il miglioramento della tecnologia delle logiche programmabili consentirà, a breve, di utilizzare questa soluzione anche per problemi di calcolo scientifico (floating-point).
Recommended