Upload
maurizio-peretto
View
181
Download
0
Embed Size (px)
Citation preview
POLITECNICO DI TORINO I Facoltà di Ingegneria
Corso di laurea in Ingegneria Civile
TESI DI LAUREA
Distrettualizzazione di reti acquedottistiche mediante la teoria delle reti complesse
Relatori:
• Boano Fulvio • Revelli Roberto • Ridolfi Luca • Scibetta Marco
Candidato:
Peretto Maurizio
novembre 2012
Indice
1
INDICE
• Introduzione
• Capitolo 1: Reti complesse
o 1.1 La teoria dei grafi
o 1.2 Le comunità di una rete
o 1.3 Overlap
o 1.4 Mutual information
o 1.5 Esempio di analisi di una rete complessa mediante le
comunità
• Capitolo 2: Metodo per l’individuazione delle comunità
o 2.1 Tipi di metodi per l’individuazione delle comunità
o 2.2 Metodo Louvain
• Capitolo 3: Applicazione alle reti acquedottistiche
o 3.1 Anytown
3
5
6
9
11
13
0000
15
18
18
20
25
27
Indice
2
� 3.1.1 Descrizione generale
� 3.1.2 Analisi delle comunità, modularità e mutual
information
o 3.2 Realtown
� 3.2.1 Descrizione generale
� 3.2.2 Descrizione delle fasi di processo
� 3.2.3 Analisi delle comunità, modularità e mutual
information
• Conclusione
• Bibliografia e webgrafia
27
2822
28
44
44
46
5000
51
67
68
Introduzione
3
INTRODUZIONE
Le reti complesse, cioè reti molto estese e con numerose ramificazioni, rivestono
un ruolo fondamentale all'interno del mondo scientifico in quanto risultano molto
utili per studiare innumerevoli fenomeni in svariati ambiti: dalla sociologia, alla
biologia, ma anche nel settore delle costruzioni. Ne sono un esempio le reti stradali e
quelle di distribuzione dell’energia elettrica. Un'ulteriore applicazione in cui la
teoria delle reti complesse è particolarmente efficace è quella delle reti
acquedottistiche.
Per l’analisi delle reti idriche, un aspetto innovativo da analizzare è quello che
riguarda la loro distrettualizzazione, cioè il modo in cui le portate si trasmettono da
un nodo all’altro della rete formando delle zone all’interno delle quali gli scambi
idrici sono più intensi rispetto agli scambi con altre zone. L’individuazione delle
distrettualizzazioni di una rete acquedottistica al variare del tempo permetterebbe
quindi di capire a fondo il comportamento della rete stessa e darebbe quindi la
possibilità di attuare un maggior controllo in fase di esercizio da parte del gestore,
sia per quanto riguarda l’individuazione delle perdite, sia per poter eventualmente
isolare alcune porzioni della rete in caso di rotture o di presenza di sostanze
inquinanti o anche solo durante la manuntenzione ordinaria. L’obiettivo è quindi
quello di sperimentare un nuovo approccio per lo studio delle reti idriche e verificare
che esso sia valido e applicabile per l’analisi delle reti reali.
Generalmente, la distribuzione dei rami all'interno di una rete complessa non è
omogenea, infatti spesso è possibile individuare delle concentrazioni di rami
all'interno di determinati gruppi di nodi, che quindi condividono proprietà comuni
oppure hanno ruoli simili all'interno della rete. Questa caratteristica delle reti è detta
struttura a comunità e, nel caso specifico delle reti acquedottistiche, le comunità
rappresentano appunto i distretti.
Introduzione
4
Il metodo utilizzabile per quest’analisi consiste quindi nello schematizzare la rete
acquedottistica mediante dei grafi e poi applicare la teoria delle reti complesse, con
l’aiuto anche di un sito internet mediante il quale si applicano gli algoritmi di
calcolo alla rete, per comprendere come evolve la distrettualizzazione a seconda
delle ore del giorno, durante le quali le richieste idriche ai nodi della rete variano.
Nel capitolo 1 saranno pertanto descritte la teoria delle reti complesse e le
variabili che sono utilizzate per analizzarle, nel capitolo 2 si procederà a illustrare i
possibili algoritmi applicabili e in particolare quello che verrà impiegato, cioè il
metodo Louvain, e infine nel capitolo 3 saranno riportati i risultati delle analisi
condotte su due reti: dapprima quella della città fittizia di Anytown, che è una rete di
dimensioni limitate utilizzata già per lo studio di diversi problemi nell’ambito delle
reti idriche, e in seguito una rete molto simile ad una realmente esistente,
denominata Realtown.
Capitolo 1: Reti complesse
5
CAPITOLO 1: RETI COMPLESSE
A partire dalla seconda metà del secolo scorso, numerose ricerche scientifiche
hanno portato all’affermazione del fatto che le reti complesse sono l’elemento
pervasivo con il quale è strutturato il mondo che ci circonda. Si tratta di studi
scientifici che spaziano dalla matematica alla fisica, dalla biologia alla sociologia e
che hanno portato alla nascita di un nuovo campo di ricerca denominato scienza
delle reti complesse.
La presenza di reti che compongono e descrivono la realtà è evidente non appena
si pensa per esempio alla rete stradale di uno Stato, al sistema nervoso nel corpo
umano oppure ancora alla rete di comunicazioni tra cellulari. Ciò dimostra anche
come le reti caratterizzino ogni ambito della realtà e non riguardino solo uno o pochi
campi di applicazione.
Le reti reali sono complesse in quanto sono molto estese e quindi per studiarle è
necessario svolgere un numero di operazioni davvero ingente. Perciò la scienza delle
reti complesse è una disciplina che è nata anche grazie allo sviluppo tecnologico che
ha fornito i mezzi per elaborare grandi quantità di dati, ovvero i calcolatori. Lo
studio delle reti complesse si basa sulla teoria dei grafi, la quale permette di
descrivere le reti stesse in termini matematici e dunque arrivare a conclusioni valide
dal punto di vista scientifico.
L’analisi delle reti permette di evidenziare delle comunità al loro interno, cioè
delle parti delle reti stesse che presentano delle caratteristiche in comune tra loro,
quali l’appartenenza ad un certo gruppo etnico o ad una città oppure ancora uno
scambio di informazioni più fitto tra i membri della comunità stessa (ambito
sociale). Riuscire quindi a identificare le comunità risulta quindi fondamentale per
capire il comportamento della rete nella sua interezza.
Capitolo 1: Reti complesse
6
1.1 La teoria dei grafi:
I grafi sono oggetti discreti che permettono di schematizzare una grande varietà
di situazioni e di processi e spesso di consentirne l'analisi in termini quantitativi
e algoritmici.
In termini pratici, per grafo si intende una struttura costituita da vertici (o nodi) e da
collegamenti tra i vertici. I collegamenti possono essere orientati, cioè hanno un
verso definito, e in questo caso sono detti rami , oppure non orientati, e in questo
caso sono detti spigoli.
È inoltre possibile associare ulteriori dati ai nodi e/o ai collegamenti come per
esempio delle coordinate geografiche o delle distanze.
La tipica raffigurazione grafica di un grafo su un piano è costituita da punti o
cerchietti, che rappresentano i nodi, e da segmenti o curve che collegano due nodi e
indicano i rami/spigoli.
Il grado di un nodo in un grafo non orientato è il numero di rami che incidono su
quel nodo, cioè che lo hanno come estremo; per i grafi orientati, si distingue invece
fra grado entrante e grado uscente.
Due rami si dicono paralleli se incidono sulla stessa coppia di nodi. Un grafo
semplice è un grafo che non contiene rami paralleli.
Figura 1:
Esempio di
raffigurazione
grafica di un
grafo
orientato e di
uno non
orientato.
Capitolo 1: Reti complesse
7
Un cammino (catena per i grafi non orientati) è una successione di nodi fra i quali
esiste un ramo di collegamento e se la partenza e l'arrivo coincidono allora il
cammino si dice circuito .
Un grafo non orientato si dice connesso se esiste una catena congiungente ogni
coppia di nodi; in caso contrario si dice non connesso.
Un grafo orientato si dice connesso se il grafo non orientato che si ottiene
ignorando la direzione dei rami risulta connesso; si dice invece fortemente
connesso se ogni nodo è raggiungibile da qualsiasi altro attraverso un cammino.
Per rappresentare i grafi nella memoria di un elaboratore, si seguono diversi
metodi, a seconda del tipo di operazioni che si devono compiere e, in definitiva, del
problema da risolvere. Le principali sono:
• Matrice di adiacenza: è una delle rappresentazione più immediate,
applicabile ai grafi semplici: un grafo di n nodi V1,V2, ...,Vn viene
rappresentato da una matrice di dimensioni (nxn) di cifre binarie (0 o 1) in
cui l'elemento aij vale 1 se esiste il ramo (Vi,Vj) e 0 altrimenti. È inoltre
possibile inserire al posto del valore 1 un altro valore, chiamato peso, che
descrive una caratteristica del ramo. Per esempio nel caso in cui si stia
rappresentando una rete stradale, si potrebbe indicare la distanza fisica tra
due vertici.
• Lista di adiacenza: è una rappresentazione basata su una lista di nodi del
grafo, in cui per ogni nodo vengono elencati i nodi ad esso adiacenti. Questa
è in genere la più efficiente tra le modalità dal punto di vista computazionale,
specialmente per un grafo con pochi rami.
• Matrice di incidenza: questa modalità di rappresentazione è basata su di una
matrice (nxm). La matrice ha quindi un numero di righe pari al numero di
nodi (n) e un numero di colonne pari al numero di rami (m). Nel caso di grafi
non orientati, il generico elemento (i,j) della matrice sarà pari a 1 se il j-
esimo ramo del grafo incide sul nodo i, sarà pari a 0 se il ramo j-esimo non
incide sul nodo i. Nel caso di grafi orientati, il generico elemento (i,j) della
matrice sarà pari a -1 se il ramo j-esimo esce dal nodo i, sarà pari a 1 se il
ramo j-esimo entra nel nodo i, oppure pari a 0 se il ramo j-esimo non incide
Capitolo 1: Reti complesse
8
sul nodo i. Nella matrice di incidenza ogni colonna ha esattamente due
elementi diversi da zero; essi sono in corrispondenza delle righe della
matrice relative ai due nodi estremi del ramo.
• Lista dei rami: su ogni riga si indica un numero identificativo per ognuno
dei due vertici legati e il numero 1 che indica la presenza del ramo, oppure al
posto del valore 1 il peso del ramo nel caso di grafi pesati.
Figura 2:
Esempio di
rappresentazione di un
grafo descritto
mediante di adiacenza,
lista di adiacenza,
matrice di incidenza e
lista dei rami.
v1 v2 v3 v4 v5
v1 0 1 1 0 0
v2 1 0 1 1 0
v3 1 1 0 1 1
v4 0 1 1 0 1
v5 0 0 1 1 0
v1: v2,v3
v2: v1,v3,v4
v3: v1,v2,v4,v5
v4: v2,v3,v5
v5: v3,v4
r1 r2 r3 r4 r5 r6 r7
v1 1 1 0 0 0 0 0
v2 1 0 1 1 0 0 0
v3 0 1 1 0 1 1 0
v4 0 0 0 1 1 0 1
v5 0 0 0 0 0 1 1
v1 v2 1
v1 v3 1
v2 v3 1
v2 v4 1
v3 v4 1
v3 v5 1
v4 v5 1
Matrice di adiacenza
Lista di adiacenza
Matrice di incidenza
Lista dei rami
Capitolo 1: Reti complesse
9
La teoria dei grafi è nata con la pubblicazione di Eulero sui "Sette ponti di
Königsberg", nella quale l’autore attraverso un grafo ha risolto la questione, più
volte proposta nel corso dei secoli, riguardante la possibilità di seguire un percorso
in passeggiata che attraversi ogni ponte della città (l’attuale Kaliningrad) una e una
volta soltanto e tornare al punto di partenza. Eulero ha infatti dimostrato che ciò era
impossibile schematizzando la situazione reale mediante un grafo che era diverso
dalla realtà fisica della città ma ne conservava le caratteristiche utili al fine della sua
analisi.
Nella seconda metà del XX secolo gli studi e i risultati si sono sviluppati
ampiamente, in sintonia con i forti sviluppi del calcolo automatico. L'introduzione
del computer ha consentito da un lato lo sviluppo di indagini sperimentali sui grafi e
dall'altro ha richiesto alla teoria dei grafi di indagare su algoritmi e modelli di forte
impatto applicativo. Nel giro di cinquant'anni la teoria dei grafi è diventata un
capitolo della matematica molto sviluppato, ricco di risultati profondi e con forti
influenze applicative.
1.2 Le comunità di una rete:
I grafi che rappresentano sistemi reali non sono regolare come dei reticoli. Al
contrario, essi sono delle schematizzazioni dove l’ordine coesiste con il disordine in
quanto mentre descrivono grandi disomogeneità, mostrando le situazioni reali,
rivelano allo stesso tempo un elevato livello di organizzazione, tanto è vero che il
Figura 3:
Passaggi della creazione del grafo da parte di Eulero per studiare il problema dei
"Sette ponti di Königsberg"
Capitolo 1: Reti complesse
10
tipo di struttura rimane lo stesso in tutta la rete. Infatti di solito ci sono tanti nodi che
hanno un basso grado e pochi nodi che hanno un grado decisamente più elevato.
Pertanto la distribuzione dei rami non è disomogenea solo globalmente, ma anche
localmente, con elevate concentrazioni all'interno di determinati gruppi di vertici, e
basse concentrazioni tra questi gruppi. Questa caratteristica delle reti reali è
chiamata struttura a comunità. Le comunità, chiamate anche moduli o distretti ,
sono gruppi di vertici che probabilmente condividono proprietà comuni e/o hanno
ruoli simili all'interno del grafico.
La società offre una vasta gamma di gruppi possibili: legami familiari, di lavoro e
di amicizia, villaggi, città, nazioni. La diffusione di internet ha portato anche alla
creazione di gruppi virtuali, che vivono sul Web, come comunità online. Esistono
comunità anche in molte altre reti in molti ambiti: biologia, informatica, ingegneria,
economia, politica e altri ancora. In reti di interazione tra proteine, le comunità sono
composte da gruppi di proteine aventi la stessa funzione specifica all'interno della
cellula, nel grafico del World Wide Web esse possono corrispondere a gruppi di
pagine che trattano gli stessi argomenti o correlate, in reti metaboliche possono
essere relative a moduli funzionali come i cicli e le vie, e così via.
Le comunità possono avere applicazioni concrete: l’identificazione dei gruppi di
clienti con interessi simili nella rete dei rapporti di acquisto tra clienti e rivenditori
online permette di istituire efficaci sistemi di pubblicità, che guidano i clienti
attraverso i vari prodotti del rivenditore e migliorano le opportunità di business.
Figura 4:
Esempio di
un grafo
con le
comunità in
evidenza.
Capitolo 1: Reti complesse
11
L’individuazione delle comunità e dei relativi limiti è importante anche per altri
motivi. Esse consentono infatti di classificare i nodi in base alla loro posizione
strutturale nei moduli: i vertici con una posizione centrale nella loro comunità, cioè
che condividono un gran numero di rami con gli altri nodi del gruppo, possono avere
una funzione importante all'interno del gruppo stesso; vertici che si trovano ai
confini tra diverse comunità hanno invece un ruolo importante di comunicazione.
Tale classificazione sembra essere significativa nell’ambito sociale e nelle reti
metaboliche. Infine, si può studiare un ulteriore grafico in cui i vertici sono costituiti
dalle comunità precedentemente individuate e i rami sono la somma dei
collegamenti tra i nodi che appartengono a comunità diverse. In questo modo si
ottiene una descrizione del grafico originale che svela i rapporti tra i vari moduli.
Un altro aspetto importante legato alla struttura della comunità è l'organizzazione
gerarchica che è ben evidente nella maggior parte dei sistemi a rete nel mondo reale.
Le reti reali infatti solitamente sono composte da comunità all’interno delle quali è
possibile individuare comunità più piccole, a loro volta suddivisibili in moduli
ancora più piccoli, ecc.. Il corpo umano offre un ottimo esempio di organizzazione
gerarchica: è composto da organi, gli organi sono composti da tessuti, i tessuti da
cellule, ecc.. Un altro esempio è rappresentato dalle aziende commerciali, che sono
caratterizzate da una organizzazione piramidale, che vanno dai lavoratori al
presidente, con numerosi livelli intermedi.
1.3 Overlap:
I metodi esistenti per la ricerca di comunità in reti di grandi dimensioni sono utili
se la struttura della comunità è tale da poter essere interpretata in termini di
comunità separate le une dalle altre. Tuttavia molte reti reali sono caratterizzate
comunità che in parte si sovrappongono, nelle quali cioè alcuni nodi appartengono a
più di una comunità.
Tale affermazione diventa evidente pensando al fatto che ognuno di noi appartiene
dal punto di vista sociale a diverse comunità, relative alla nostra la vita personale
(scuola, hobby, famiglia). A loro volta i membri delle nostre comunità hanno le loro
comunità, con una conseguente rete estremamente complessa. Questo aspetto è stato
Capitolo 1: Reti complesse
12
a lungo apprezzato dai sociologi, ma non è mai stato studiato in modo sistematico
per le grandi reti.
In generale, ogni nodo i di una rete può essere caratterizzato da un numero di
appartenenza mi, che corrisponde al numero di comunità a cui il nodo appatiene.
Allo stesso tempo due comunità qualsiasi α e β possono avere in comune sα,βov nodi,
detti overlap size (dimensione di sovrapposizione) tra le comunità α e β. A loro
volta le comunità costituiscono anche una rete i cui legami sono le sovrapposizioni,
il cui numero è detto grado di comunità dαcom. Infine la dimensione sα
com della
comunità α corrisponde al numero dei nodi che comprende.
Per caratterizzare la struttura delle comunità di una rete complessa si introducono
le distribuzioni di queste quattro grandezze di base: in particolare si considerano le
loro funzioni di probabilità cumulata, indicate con P(scom), P(dcom), P(sov) e P(m).
Figura 5:
Esempio di rete sociale in cui gli stessi nodi appartengono a varie comunità.
Capitolo 1: Reti complesse
13
1.4 Mutual information:
Quando si studiano delle reti i cui pesi variano nel tempo, come ad esempio le reti
di acquedotti, dove le portate nei singoli tratti variano in funzione della richiesta
durante il giorno, è utile cercare di comprendere quanto le configurazioni di
comunità in determinati istanti (ad esempio una configurazione ogni ora)
differiscono tra loro.
Nella pletora di metodi, uno dei più utilizzati si riconduce al calcolo di entropie. Il
concetto di base è quello di immaginare di avere una stessa rete con n nodi e di aver
fatto due ripartizioni X e Y, aventi rispettivamente nX e nY comunità. Quindi:
� = ���, ��, … , ��� = ���, ��, … , �� Corrispondentemente si può pensare a due vettori con n componenti ciascuno che
attribuiscano ciascuno degli n nodi alle comunitµa Xi o Yi. Quindi vettori del tipo
(considerando un esempio di rete con n = 5 nodi e tre ripartizioni nX = nY = 3):
���� = ���, ��, ��, ��, ������� = ���, ��, ��, ��, ��� I vettori ovviamente sono ordinati nello stesso modo. Ossia, per esempio, il nodo 2 è
attribuito alla comunità X2 nella prima ripartizione e alla comunità Y1 nella seconda
ripartizione.
Si indica con niX e nj
Y rispettivamente il numero di nodi che cadono nelle comunità
Xi e Yj e con nij il numero di nodi condivisi dalle comunità (Xi; Yj). Per esempio,
(2)
(1)
Figura 6:
Esempio di un
grafo suddiviso
in quattro
comunità,
alcune delle
quali hanno
nodi in comune
(evidenziati in
rosso).
Capitolo 1: Reti complesse
14
riferendosi ai vettori (2), si ha che n1X= 2 oppure n2
Y= 1, mentre n12 = 1 (ovvero solo
il nodo 3 cade sia nella comunità X1 (dal punto di vista della ripartizione X) sia nella
comunità Y2 (dal punto di vista della ripartizione Y).
Allora è possibile definire la mutual information :
���, �� = ���� − ���|�� dove:
���� = −����� ∙ ln �����
è la Shannon entropy e P(x) è la probabilità di avere nodi nella comunità x (che
corre su tutte le comunità trovate nella ripartizione X), ossia:
���� = ��� = �� = �!
Per esempio nel caso della ripartizione (2) si ha che x corrisponde a tutte le comunità
individuate (ossia X1, X2 e X3) e pertanto: P(X1) = 2/5, P(X2) = 2/5 e P(X3) = 1/5.
Nella (3) la H(X|Y ) è l'entropia condizionata di X dato Y ed è definita come:
���|�� = −����, �� ∙ ln ���|���,"
= −����, �� ∙ ln ���, �������,"
dove:
���, �� = ��� = �, � = �� = �"
è la joint distribution ed x, y della sommatoria corrono su tutte le possibili coppie
(Xi; Yj).
In realtà per permettere la confrontabilità tra partizioni, si preferisce usare la mutual
information normalizzata:
��#$%��, �� =2���, ��
���� + ����
Essa è compresa tra zero, se le partizioni sono totalmente indipendenti, e 2, se tutte
le comunità della partizione X si uniscono in un’unica comunità nella partizione Y.
Vi è inoltre un altro valore di interesse che può assumere la mutual information
normalizzata, cioè 1, quando le partizioni X e Y sono identiche.
Quindi è possibile diagrammare il suo valore nel tempo per avere un'indicazione
di come le comunità sono dinamiche (ossia mutano) oppure rimangono sempre le
stesse.
(3)
(5)
(6)
(4)
(7)
(8)
Capitolo 1: Reti complesse
15
1.5 Esempio di analisi di una rete complessa mediante le comunità:
Per rendere ancora più evidente la fondamentale importanza che le comunità
assumono nell’analisi delle reti complesse si può considerare l’esempio dei dati di
una società telefonica belga. La rete è composta da 2,6 milioni di clienti, tra i quali i
collegamenti pesati rappresentano il numero totale di chiamate durante un periodo di
6 mesi.
I dati permettono di associare ad ogni cliente diverse voci, come ad esempio l'età,
il sesso, la lingua e il codice di avviamento postale del luogo in cui vivono. Questa
vasta rete sociale è eccezionale a causa della particolare situazione del Belgio, dove
coesistono due principali comunità linguistiche (francese e olandese) e dove è
possibile analizzare l’omogeneità linguistica delle comunità. Da un punto di vista
sociologico, la possibilità di evidenziare l'omogeneità linguistica, religiosa o etnica
delle comunità apre prospettive per descrivere la coesione sociale e la fragilità
potenziale di un paese.
Su questa rete particolare si può rilevare una struttura gerarchica delle comunità a
sei livelli. Al livello più basso ogni cliente è una comunità a sé stante e al livello più
alto ci sono 261 comunità che hanno più di 100 clienti. Queste comunità
rappresentano circa il 75% di tutti i clienti. L'omogeneità di una comunità si
caratterizza per la percentuale di coloro che parlano la lingua dominante in quella
comunità, questa quantità va a 1 quando la comunità tende ad essere monolingue.
L’analisi rivela che la rete è fortemente segregata, con la maggior parte delle
comunità quasi monolingui. Ci sono 36 comunità con più di 10 000 clienti e, ad
eccezione di una sola comunità a livello di interfaccia tra i due gruppi linguistici, in
tutte le altre oltre l'85% dei loro membri parlano la stessa lingua. Inoltre è
interessante analizzare più da vicino l’unica comunità che ha una distribuzione più
equilibrato di lingue: attraverso un’analisi gerarchica è possibile considerare le
sotto-comunità evidenziate ad un livello inferiore. Queste sotto-comunità sono
strettamente collegate tra loro e sono composte da gruppi eterogenei di persone.
Questi gruppi di persone, in cui il linguaggio cessa di essere un fattore
discriminante, potrebbero eventualmente giocare un ruolo cruciale per l'integrazione
del paese e per l'emergere di una qualsiasi idea tra le comunità. Ci si può infatti
Capitolo 1: Reti complesse
16
chiedere cosa accadrebbe se la comunità a livello di interfaccia tra i due gruppi
linguistici fosse rimossa.
Figura 7:
Rappresentazione grafica della rete di telefonia mobile belga. La dimensione di ogni
nodo è proporzionale al numero di individui inclusi nella comunità corrispondente e
il suo colore rappresenta la principale lingua parlata nella comunità (rosso per il
francese e verde per l'olandese). Solo le comunità composte da più di 100 clienti
sono stati rappresentate. Si noti la comunità intermedia tra i due gruppi linguistici
principali. Lo zoom a più alta risoluzione rivela che è fatta da diverse sottocomunità
con una separazione lingua meno evidente.
Capitolo 1: Reti complesse
17
Un'altra interessante osservazione è legata alla presenza di altre lingue: in realtà
nel caso specifico gli utenti possono scegliere quale lingua dichiarare di utilizzare
all’operatore tra quattro lingue possibili: francese, olandese, inglese o tedesco. È
interessante notare che, mentre i clienti di lingua inglese si disperdono abbastanza
uniformemente in tutte le comunità, oltre il 60% dei clienti di lingua tedesca sono
concentrati in una sola comunità.
Questo è probabilmente dovuto al fatto che le persone di lingua tedesca sono
principalmente concentrate in una piccola regione vicino alla Germania, mentre le
persone di lingua inglese sono distribuite su tutto il paese.
Dall’analisi della rete è infine possibile notare che le comunità di lingua francese
sono connesse molto più densamente rispetto a quelle di lingua olandese: in media,
la forza dei legami tra le comunità di lingua francese è del 54% più forte rispetto a
quelli tra le comunità di lingua olandese. Questa differenza di struttura tra le due
sotto-reti sembra indicare che le due comunità linguistiche sono caratterizzate da
diversi comportamenti sociali e suggerisce quindi di cercare altre caratteristiche
topologiche per le comunità.
Capitolo 2: Metodo per l’individuazione delle comunità
18
CAPITOLO 2: METODO PER L’INDIVIDUAZIONE DELLE COMUNITÀ
Come è stato evidenziato, l’identificazione delle comunità e della loro
organizzazione gerarchica nei grafi, utilizzando le informazioni codificate nella
topologia dei grafi stessi, è fondamentale per poterli comprendere e studiare.
Il problema, apparentemente intuitivo, in realtà non è strutturato in maniera
univoca: il concetto di comunità non è rigorosamente definito e prevede un certo
grado di arbitrarietà e/o di buon senso. In effetti, esistono alcune ambiguità e ci sono
spesso molti modi altrettanto legittimi di risolverle. Pertanto, non è sorprendente che
ci siano un sacco di metodi nella letteratura. È importante sottolineare che
l'identificazione delle comunità è possibile solo se nei grafi il numero di bordi m è
dell'ordine del numero di nodi n. Se m >> n, la distribuzione dei rami tra i nodi è
troppo omogenea affinché le comunità abbiano senso. In questo caso il problema si
trasforma in qualcosa di diverso, che richiede concetti e metodi di natura diversa,
valutando ad esempio la vicinanza tra i vertici e non la loro effettiva interazione.
In questo capitolo si cercherà quindi di fornire una panoramica generale sui vari
tipi di metodi possibili, concentrandosi poi sul metodo che pare più efficace per una
successiva applicazione nello studio delle reti acquedottistiche.
2.1 Tipi di metodi per l’individuazione delle comunità:
Il problema dell’individuazione delle comunità ha una lunga tradizione ed è
apparso in varie forme e in diverse discipline, ma avendo sempre in comune lo
stesso obiettivo: identificare le comunità nelle reti complesse più velocemente
possibile e potendo visualizzare la struttura della rete.
Un buon approccio consiste nello scomporre le reti in sub-unità o comunità in
base al fatto che siano altamente connessi tra loro, con i nodi appartenenti a diverse
comunità che siano invece scarsamente collegati. Le formulazioni precise di questo
Capitolo 2: Metodo per l’individuazione delle comunità
19
problema di ottimizzazione sono però computazionalmente intrattabili, quindi sono
stati proposti diversi algoritmi per trovare partizioni ragionevolmente buone in un
modo ragionevolmente veloce. Questa ricerca di algoritmi veloci ha suscitato molto
interesse negli ultimi anni grazie alla crescente disponibilità di set di dati di grandi
dimensioni e al notevole impatto delle reti sulla vita di tutti i giorni.
Si possono distinguere diversi tipi di algoritmi di rilevamento di comunità:
• algoritmi di divisione: individuano e rimuovono dalla rete i collegamenti tra
le varie comunità;
• algoritmi di aggregazione: uniscono nodi simili in modo ricorsivo;
• metodi di ottimizzazione: si basano sulla massimizzazione di una funzione
obiettivo. La qualità delle partizioni risultanti da questi metodi è spesso
misurata dalla cosiddetta modularità della partizione. La modularità di una
partizione è un valore scalare tra -1 e 1 che misura la densità dei legami
all'interno delle comunità rispetto ai collegamenti tra le comunità. Nel caso
di reti pesate, cioè di reti che hanno pesi sui loro collegamenti, essa è definita
come:
� = 12 ∙ ���� − ∙ �2 ∙ � � ∙ ���, ���,�
dove:
o � è il peso del ramo tra i e j
o = ∑ �� è la somma dei pesi dei rami che incidono sul vertice i
o � è la comunità a cui è assegnato il vertice i
o � = ��∑ ��
o � = 1 se � = �� , � = 0 altrimenti
La modularità è quindi utilizzata per confrontare la qualità delle partizioni
ottenute con metodi diversi, ma anche come una funzione obiettivo da
(9)
Capitolo 2: Metodo per l’individuazione delle comunità
20
ottimizzare. Purtroppo, l'ottimizzazione esatta della modularità è un
problema computazionalmente difficile e sono quindi necessari algoritmi di
approssimazione quando si tratta di grandi reti. L'algoritmo di
approssimazione più veloce per ottimizzare la modularità su reti di grandi
dimensioni è stato proposto da Clauset et al. Tale metodo consiste nell’unire
le varie comunità per aumentare la modularità. Purtroppo, questo algoritmo
può produrre valori di modularità che sono significativamente inferiori a
quelli che possono essere determinati usando, per esempio, un qualsiasi
metodo di aggregazione. Inoltre, il metodo proposto da Clauset et al. ha una
tendenza a produrre comunità molto estese che contengono gran parte dei
nodi, anche su reti che non hanno una struttura a comunità significativamente
evidente. Ciò ha anche lo svantaggio di rallentare notevolmente l'algoritmo e
di renderlo inapplicabile a reti di oltre un milione di nodi. Questo effetto
indesiderato è stato aggirato con l'introduzione di accorgimenti al fine di
equilibrare la dimensione delle comunità durante l’aggregazione,
accelerando così il tempo di esecuzione e consentendo di affrontare reti fino
a qualche milione di nodi.
2.2 Metodo Louvain:
L'idea originale di questo metodo è dovuta a Étienne Lefebvre che per primo lo ha
sviluppato durante la sua tesi di laurea presso l'Université Catholique de Louvain
(Louvain-la-Neuve) nel marzo 2007. Il metodo è stato migliorato e testato con
Vincent Blondel, Jean-Loup Guillaume e Renaud Lambiotte ed ora è conosciuto
come il "metodo Louvain", perché, anche se i co-autori ora occupano incarichi a
Parigi, Londra e Louvain-la-Neuve, il metodo è stato messo a punto quando tutti
erano all'Université Catholique de Louvain.
Questo metodo, che sarà successivamente applicato per l’analisi di reti
acquedottistiche, trova partizioni con modularità elevata nelle reti di grandi
dimensioni in un tempo breve e sviluppa una struttura gerarchica completa di
comunità, dando così l'accesso a diverse risoluzioni sulle comunità della rete.
Capitolo 2: Metodo per l’individuazione delle comunità
Contrariamente a tutti gli altr
estensione della rete che si incontrano con questo algoritmo sono dovuti
capacità di memoria, invece
comunità di una rete di 118 milioni nodi
L'algoritmo è diviso in due fasi che vengono ripetute
di partire con una rete di
differente ad ogni nodo della rete, così
comunità quanti sono i nodi.
ad i e si valuta l’incremento
comunità e ponendolo nella comunità di
per cui questo incremento
incremento positivo, i rimane nella sua comunità di origine. Questo processo viene
applicato ripetutamente e sequenzialmente a
StatiU.E.
Unione Europea
Italia
Francia
Germania
...
Figura 8:
Esempio di organizzazione gerarchica di una rete che descrive le suddivisioni
politiche dell’Unione Europea.
Capitolo 2: Metodo per l’individuazione delle comunità
Contrariamente a tutti gli altri algoritmi di rilevamento delle comunità, i limiti di
che si incontrano con questo algoritmo sono dovuti
, invece che al tempo di calcolo: è stato possibile identificare le
una rete di 118 milioni nodi solamente in 152 minuti.
in due fasi che vengono ripetute iterativamente. Si supponga
di partire con una rete di n nodi ponderata. Innanzitutto, si assegna una
erente ad ogni nodo della rete, così in questa suddivisione iniziale ci sono
quanti sono i nodi. In seguito, per ogni nodo i si considera il
mento di modularità, che si avrebbe rimuovendo
comunità e ponendolo nella comunità di j. Il nodo i è quindi posto nella comunità
mento è massimo (e positivo). Se invece non è possibile
rimane nella sua comunità di origine. Questo processo viene
etutamente e sequenzialmente a tutti i nodi finché nessun ulteriore
CircoscrizioniComuniProvinceRegioni
Valle d'Aosta
Lombardia
Lazio
Piemonte
Torino
Torino
Chivasso
Susa
...
Cuneo
Alessandria
...
...
Esempio di organizzazione gerarchica di una rete che descrive le suddivisioni
politiche dell’Unione Europea.
21
comunità, i limiti di
che si incontrano con questo algoritmo sono dovuti alla
tato possibile identificare le
iterativamente. Si supponga
si assegna una comunità
iniziale ci sono tante
si considera il nodo j vicino
rimuovendo i dalla sua
è quindi posto nella comunità
non è possibile avere un
rimane nella sua comunità di origine. Questo processo viene
finché nessun ulteriore
Circoscrizioni
Circoscrizione 1
Circoscrizione 2
Circoscrizione 3
...
Esempio di organizzazione gerarchica di una rete che descrive le suddivisioni
Capitolo 2: Metodo per l’individuazione delle comunità
22
incremento può essere ottenuto e, a questo punto, la prima fase è completata. È da
sottolineare il fatto che un nodo può essere, e spesso è, considerato più volte durante
questa prima fase, che termina quando vengono raggiunti i massimi locali di
modularità, cioè quando nessun singolo movimento può aumentare la modularità. È
inoltre fondamentale notare che l'output dell'algoritmo dipende dall'ordine in cui
vengono considerati i nodi. I risultati preliminari su casi di test diversi sembrano
indicare che l'ordine dei nodi non ha un'influenza significativa sulla modularità che
si ottiene, mentre può influire sul tempo di calcolo, ma le ragioni di questa
dipendenza non sono chiare.
Una parte dell’efficienza dei risultati dell'algoritmo è data dal fatto che
l’ incremento di modularità ottenuto spostando un nodo isolato i in una comunità C
può essere facilmente calcolato con la seguente relazione:
∆� = �∑ +� 2 ∙ ,�2 ∙ � − �∑ +��� 2 ∙ � �� − �∑ �2 ∙ � − �∑ ���2 ∙ ��� − " 2 ∙ �#� dove:
o ∑ � è la sommatoria dei pesi dei rami all'interno della comunità C, in cui è
spostato un singolo nodo i
o ∑ � è la sommatoria dei pesi dei rami che incidono sui nodi appartenenti alla
comunità C
o è la sommatoria dei pesi dei rami che incidono sul nodo i
o ,� è la sommatoria dei pesi dei collegamenti dal nodo i ai nodi in C
o � è la sommatoria dei pesi di tutti i rami della rete.
Questa espressione è usata per valutare la variazione di modularità quando il nodo i
viene rimosso dalla sua comunità per essere spostato in una comunità vicina.
La seconda fase dell'algoritmo consiste nella costruzione di una nuova rete i cui nodi
sono ora le comunità trovate durante la prima fase. Per fare ciò, i pesi dei
collegamenti tra i nodi nuovi sono dati dalla somma dei pesi dei collegamenti tra i
nodi corrispondenti alle due comunità. Dopo che questa seconda fase è completata, è
quindi possibile riapplicare la prima fase dell'algoritmo alla risultante rete ponderata
e iterare. Si indica con il termine passaggio una singola combinazione di queste due
fasi. Per costruzione, il numero di comunità diminuisce ad ogni passaggio e di
(10)
Capitolo 2: Metodo per l’individuazione delle comunità
23
conseguenza la maggior parte del tempo di calcolo viene utilizzato nei primi
passaggi. I passaggi vengono ripetuti fino a quando non avvengono più modifiche e
ciò significa anche che è stato raggiunto il massimo di modularità.
L'algoritmo memorizza naturalmente una nozione di gerarchia delle comunità
costruite durante il processo. L'altezza della gerarchia è determinata dal numero di
passaggi ed è generalmente un numero piccolo.
Questo semplice algoritmo ha diversi vantaggi. In primo luogo, i suoi passi sono
intuitivi e facili da implementare e il risultato non è controllato a priori e poi è
estremamente veloce, grazie al fatto che i possibili aumenti di modularità sono facili
da calcolare e che il numero di comunità diminuisce drasticamente dopo pochi
passaggi. Inoltre il problema del limite di risoluzione della modularità sembra essere
superato grazie all’intrinseca natura multi-livello di questo algoritmo. Infatti, un
Figura 9:
Visualizzazione dei passi dell’algoritmo. Ogni passo è costituito da due fasi: una in
cui è ottimizzata modularità consentendo solo cambiamenti locali delle comunità e
un’altra in cui vengono aggregate le comunità che si trovano al fine di costruire una
nuova rete di comunità. I passaggi vengono ripetuti iterativamente finché non è più
possibile ottenere incrementi della modularità.
Capitolo 2: Metodo per l’individuazione delle comunità
24
approccio di pura ottimizzazione della modularità non riesce ad identificare le
comunità più piccole di una certa scala, introducendo quindi un limite di risoluzione
sulle comunità rilevate. Questa osservazione è solo in parte pertinente in questo
caso, in quanto la prima fase dell’algoritmo comporta lo spostamento di singoli nodi
da una comunità all'altra, di conseguenza la probabilità che due distinte comunità
possano essere “fuse” spostando i singoli nodi uno per uno è molto bassa. Queste
comunità possono essere unite nei passi successivi, dopo che i blocchi di nodi sono
stati aggregati. Infine, le soluzioni intermedie trovate dall’algoritmo potrebbero
anche avere un significato ben preciso e la struttura gerarchica individuata può
consentire all'utente finale di osservare la struttura della rete con la risoluzione
desiderata. Il fatto che le soluzioni intermedie abbiano un significato non è ancora
stato dimostrato, però sembra che abbiano senso, a causa del fatto che corrispondono
a un massimo locale di modularità, nel senso che non è possibile aumentare la
modularità muovendo una singola entità da una comunità ad un’altra. Nel primo
passaggio queste entità sono nodi, ma in quelli successivi corrispondono a gruppi di
nodi via via più grandi, quindi le partizioni intermedie possono essere viste come
massimi locali della modularità a scale differenti.
Capitolo 3: Applicazione alle reti acquedottistiche
25
CAPITOLO 3: APPLICAZIONE ALLE RETI ACQUEDOTTISTICHE
Nell'ambito delle reti di distribuzione di acqua si definisce
distrettualizzazione la tecnica di suddividere un’intera rete in distretti omogenei,
territorialmente raccolti e con caratteristiche idrauliche simili al fine di migliorare la
gestione e la manutenzione della rete.
La distrettualizzazione si ottiene sia in sede di progetto di una rete ex novo, sia
ove sia necessario procedere alla distrettualizzazione di una rete esistente,
individuando il confine della stessa e i punti di ingresso (ed eventualmente d'uscita)
della risorsa idrica.
La distrettualizzazione può essere utile per:
• individuare e delimitare zone con livello piezometrico differente;
• definire punti di misura per ottimizzare la ricerca di perdite;
• facilitare la determinazione del bilancio idrico di una rete;
• incrementare l'acqua contabilizzata agli utenti;
• isolare porzioni di rete nel caso di rotture o inquinamento per cause
esterne.
La distrettualizzazione è una tecnica innovativa che rivoluziona l'approccio
tradizionale che prevedeva sistemi di distribuzione idrica estesi a tutto il territorio
urbano. L'approccio tradizionale, che offre innegabili vantaggi in termini di elasticità
di funzionamento e facilità nella progettazione dell'estendimento delle reti, comporta
un meno efficiente controllo del sistema idrico e insormontabili difficoltà nel
monitoraggio puntuale delle perdite idriche.
Lo studio della distrettualizzazione delle reti acquedottistiche utilizzando la teoria
delle reti complesse pare possible, anche se quest’approccio non è ancora mai stato
utilizzato. Per dimostrarlo, si è scelto di analizzare una rete molto utilizzata nello
Capitolo 3: Applicazione alle reti acquedottistiche
26
studio del comportamento e dell’ottimizzazione delle reti idriche, alla cui città è
stato dato il nome di Anytown. Una volta verificato che i risultati ottenuti fossero
significativi, si è deciso di analizzare una rete acquedottistica simile ad una tipica
rete relamente in esercizio, chiamata nel seguito rete di Realtown.
Per condurre questo studio, sono stati ricavati i file di testo in cui sono contenute
le portate che descrivono queste due reti al variare delle ore del giorno (un file per
ogni ora), utilizzando degli script che si basano sui comnponenti di cui sono
composte le reti (tubazioni, pompe, serbatoio,...).
In seguito i file delle portate sono stati analizzati attraverso il sito
http://www.netcom-analyzer.org/ , realizzato dall’ ISI Foundation, mediante il quale
è possibile analizzare una qualsiasi rete complessa scegliendo tra vari metodi. Per
questo studio è stato scelto di utilizzare il metodo Louvain, a causa di suoi numerosi
vantaggi, già indicati nel capitolo 2.
Il sito fornisce come risultati dei documenti di testo nei quali ognuna delle righe
rappresenta una comunità e su di essa sono indicati i numeri identificativi dei nodi
che ne fanno parte. Il sito restituisce un file per ogni passaggio del metodo Louvain,
fornendo quindi la possibilità di studiare la rete a diversi livelli.
Infine questi file hanno permesso di calcolare mediante il programma ‘Matlab’ la
modularità e la mutual information riguardanti le varie configurazioni e di
visualizzare l’evoluzione delle comunità evidenziandole con colori differenti
direttamente utilizzando le coordinate dei nodi sulla mappa topologica.
Capitolo 3: Applicazione alle reti acquedottistiche
27
3.1 Anytown:
3.1.1 Descrizione generale:
L'obiettivo degli studi che sono stati fin qui eseguiti sulla rete della città di
Anytown (USA) è stato quello di individuare la combinazione di tubazioni, pompe e
serbatoi economicamente più efficace per rafforzare un’ipotetica rete esistente per
soddisfare le richieste previste, tenendo conto sia dei costi di costruzione che dei
costi di gestione.
La città si è sviluppata attorno ad un centro storico situato a sud del nodo 7, dove
gli scavi sono più difficili da effettuare e di conseguenza sono più costosi. C'è una
zona residenziale circostante, con alcune industrie vicino sl nodo 15 e un nuovo
parco industriale da sviluppare a nord. L'acqua viene pompata nel sistema da un
impianto di trattamento delle acque per mezzo di tre pompe identiche collegate in
parallelo a monte del nodo 1. Nello studio di Anytown sono utilizzate le unità di
misura americane.
Figura 10:
Rete idrica di Anytown.
Capitolo 3: Applicazione alle reti acquedottistiche
28
I due serbatoi esistenti funzionano con livelli d'acqua compresi tra 225 e 250 ft,
per una capacità effettiva di 156250 gal per ogni serbatoio. Il volume d’acqua
compreso tra 215 e 225 ft, corrispondente ad un volume di 62.500 gal per ogni
serbatoio, viene riservato per esigenze di emergenza. Una pressione minima di
almeno 40 psi deve essere fornita in tutti i nodi in corrispondenza di una portata pari
a quella media giornaliera e in condizioni di picco istantaneo, in cui la portata è pari
a 1,8 volte quella media giornaliera.
Condizioni di carico:
nodo quota
portata media giornaliera
(ft) (gpm) 1 20 500 2 50 200 3 50 200 4 50 600 5 50 500 6 50 500 7 50 500 8 50 1000 9 50 500 10 50 500 11 120 400 12 120 400 13 80 400 14 120 400 15 120 1000 16 120 400
3.1.2 Analisi delle comunità, modularità e mutual information:
I risultati ottenuti con l’analisi dei file delle portate di Anytown sono
interessanti e soprattutto consentono di ipotizzare una buona riuscita
delle stesse analisi su una rete acquedottistica reale e quindi molto più
vasta. Dalle immagini riportate nel seguito si può infatti osservare come
Capitolo 3: Applicazione alle reti acquedottistiche
29
le comunità rilevate sia ben riconoscibili le une dalle altre e si può anche
dire che fisicamente abbiano senso, cioè che rappresentino realmente i
nodi tra i quali vi è una maggiore comunicazione.
Le comunità variano in funzione dell’ora del giorno, in quanto variano le portate
che si trasmettono tra i vari nodi della rete.
Il numero di comunità rilevate è diverso a seconda dell’ora del giorno
considerata, come si può osservare dal seguente grafico:
Essendo la rete di Anytown piccola (18 nodi), l’algoritmo di analisi delle
comunità completa il suo processo in un unico passaggio e i risultati sono mostrati
nelle seguenti immagini:
0
1
2
3
4
5
6
7
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
numero di comunità
Figura 11:
Grafico che riporta il numero i comunità rilevate al variare delle ore del giorno.
Capitolo 3: Applicazione alle reti acquedottistiche
30
• Ora 1:
• Ora 2:
Capitolo 3: Applicazione alle reti acquedottistiche
31
• Ora 3:
• Ora 4:
Capitolo 3: Applicazione alle reti acquedottistiche
32
• Ora 5:
• Ora 6:
Capitolo 3: Applicazione alle reti acquedottistiche
33
• Ora 7:
• Ora 8:
Capitolo 3: Applicazione alle reti acquedottistiche
34
• Ora 9:
• Ora 10:
Capitolo 3: Applicazione alle reti acquedottistiche
35
• Ora 11:
• Ora 12:
Capitolo 3: Applicazione alle reti acquedottistiche
36
• Ora 13:
• Ora 14:
Capitolo 3: Applicazione alle reti acquedottistiche
37
• Ora 15:
• Ora 16:
Capitolo 3: Applicazione alle reti acquedottistiche
38
• Ora 17:
• Ora 18:
Capitolo 3: Applicazione alle reti acquedottistiche
39
• Ora 19:
• Ora 20:
Capitolo 3: Applicazione alle reti acquedottistiche
40
• Ora 21:
• Ora 22:
Capitolo 3: Applicazione alle reti acquedottistiche
41
• Ora 23:
• Ora 24:
Capitolo 3: Applicazione alle reti acquedottistiche
42
Quanto più il valore della modularità che le varie distrettualizzazioni assumono è
elevato, più significa che l’analisi delle comunità è efficace e che le stesse comunità
trovate sono delle suddivisioni teoriche che ben rappresentano il comportamento
reale della rete. Di seguito si riporta il valore della modularità delle
distrettualizzazioni alle varie ore del giorno:
ora modularità
ora Modularità 1 0,4647
13 0,5175 2 0,4645
14 0,5144 3 0,4893
15 0,5357 4 0,4878
16 0,5321 5 0,4888
17 0,5270 6 0,5151
18 0,4955 7 0,5132
19 0,4935 8 0,5120
20 0,4924 9 0,5175
21 0,4671 10 0,5151
22 0,4661 11 0,5141
23 0,4718 12 0,5112
24 0,4691
0,4200
0,4400
0,4600
0,4800
0,5000
0,5200
0,5400
0,5600
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
modularità
Figura 12:
Grafico che riporta i valori di modularità al variare delle ore del giorno.
Capitolo 3: Applicazione alle reti acquedottistiche
43
Per quanto riguarda invece la mutual information, calcolata tra le configurazioni
di due ore successive, a seconda delle ore del giorno assume i seguenti valori:
ora mutual
information
ora mutual
information I I norm
I I norm 1-2 0,6512 1,0000
13-14 0,6571 1,0000 2-3 0,6180 0,9937
14-15 0,6571 1,0000 3-4 0,5927 1,0000
15-16 0,6571 1,0000 4-5 0,5927 1,0000
16-17 0,6571 1,0000 5-6 0,5927 1,0000
17-18 0,5848 0,8941 6-7 0,5927 1,0000
18-19 0,6512 1,0000 7-8 0,5927 1,0000
19-20 0,6512 1,0000 8-9 0,5927 1,0000
20-21 0,6512 1,0000 9-10 0,5927 1,0000
21-22 0,6512 1,0000 10-11 0,5927 1,0000
22-23 0,6512 1,0681 11-12 0,3898 0,6267
23-24 0,5681 1,0000 12-13 0,6121 0,9358
24-1 0,4851 0,7957
Si nota che ci sono alcuni periodi durante il giorno in cui le comunità continuano
a essere identiche a quelle dell’ora precedente (Inorm=1), alcune ore in particolare in
cui avviene un cambiamento delle comunità e anche un’ora (ora 23) in cui due
comunità dell’ora precedente si uniscono a formarne una unica (Inorm>1).
0,0000
0,2000
0,4000
0,6000
0,8000
1,0000
1,2000
1-2
2-3
3-4
4-5
5-6
6-7
7-8
8-9
9-1
0
10
-11
11
-12
12
-13
13
-14
14
-15
15
-16
16
-17
17
-18
18
-19
19
-20
20
-21
21
-22
22
-23
23
-24
24
-1
mutual information
I Inorm
Figura 13:
Grafico che riporta i valori mutual information e mutual information normalizzata al
variare delle ore del giorno.
Capitolo 3: Applicazione alle reti acquedottistiche
44
3.2 Realtown:
3.2.1 Descrizione generale:
Il fabbisogno idrico complessivo di Realtown è assicurato da una produzione
locale, alla quale concorrono alcuni pozzi situati sul territorio comunale, e da un a
fornitura integrativa tramite un colegamento con l’impianto di un comune limitrofo.
La rete di distribuzione può essere vista come suddivisa in tre zone:
• La rete bassa che si estende intorno alla zona industriale, avente quote di p.c.
fra 290 e 330 m s.l.m..
• La rete media che si estende attorno al centro storico, avente quote di p.c. fra
330 e 400 m s.l.m..
• La rete alta, avente quote di p.c. fra 400 e 485 m s.l.m..
Figura 14:
Rete di Realtown
Capitolo 3: Applicazione alle reti acquedottistiche
45
L’impianto principale, denominato Impianto 1, ha quota p.c. di 310 m s.l.m. ed è
situato a Sud-Est del territorio comunale. Esso è formato da cinque pozzi di cui tre,
denominati G11, G12 e G13, immettono la loro produzione di circa 85 l/s nella rete
di distribuzione; i restanti due, denominati G14 e G15, immettono la loro produzione
di circa 70 l/s in un serbatoio di accumulo.
Nel medesimo serbatoio viene anche accumulata la fornitura integrativa proveniente
dall’impianto di un comune vicino, per compensare la produzione locale
insufficiente.
Una stazione di risollevamento, composta da tre elettropompe, alimenta la rete di
distribuzione bassa ed il serbatoio seminterrato di compenso, denominato Serbatoio
2 (quota p.c. di 371,8 m s.l.m.), situato a Sud-Ovest del territorio comunale; a
quest’ultimo è collegata una elettropompa di risollevamento che fornisce, in caso di
necessità, un contributo alla rete media.
Ad alimentare la rete di distribuzione bassa contribuisce anche, con una
produzione complessiva di circa 30 l/s, l’Impianto 3 (quota p.c. di 330 m s.l.m.);
esso, situato nella zona Nord del territorio comunale, comprende due pozzi,
denominati G61 e G62, ed un serbatoio pensile di compenso (quota p.c. di 340 m
s.l.m.), attualmente fuori servizio.
La rete di distribuzione bassa alimenta la Stazione di sollevamento 3 (quota p.c.
di 364 m s.l.m.), situata nel centro storico di Realtown e comprendente due
elettropompe di risollevamento, denominate M31 e M32. Questa stazione immette
una portata di circa 50 l/s sulla rete di distribuzione media e tramite essa alimenta il
serbatoio dell’Impianto 4.
L’Impianto 3 (quota p.c. di 378 m s.l.m.), situato a Ovest del territorio comunale,
è formato da tre pozzi, denominati G51, G52 e G53, e la sua produzione
complessiva di 60 l/s alimenta il Serbatoio 4.
L’Impianto 4 (quota p.c. di 416,9 m s.l.m.), situato a Ovest del territorio
comunale, comprende un serbatoio di accumulo, suddiviso in tre vasche, e una
stazione di risollevamento (Stazione di sollevamento 4). Alimentato dall’Impianto 2
e dalla Stazione di sollevamento 3 immette sia nella rete di distribuzione media, che
Capitolo 3: Applicazione alle reti acquedottistiche
46
nella rete di distribuzione alta fino al Serbatoio 5 (quota p.c. di 488,5 m s.l.m.);
l’alimentazione della rete alta, ad una portato di circa 20 l/s, avviene tramite una
stazione di risollevamento composta da due elettropompe denominate M41 e M42.
I processi tipici di ogni singolo sottoimpianto sono controllati da automazioni
locali collegate in rete al Centro di gestione dove le informazioni principali sono
acquisite, visualizzate tramite una stazione PC di supervisione impianti a
disposizione del personale addetto alla conduzione e manutenzione, e inviate al
Servizio TLC per l’acquisizione dei paramentri di esercizio e degli allarmi.
3.2.2 Descrizione delle fasi di processo:
Il processo di produzione dell’impianto di Realtown è costituito da una serie di
fasi successive, descritte dettagliatamente nel seguito. Ad esse fanno riferimento i
Manuali Operativi ed i dicumenti per la gestione e registrazione delle attività
dell’impianto.
• Fase di processo di tipo A – Approvvigionamento:
Alla fase d’approvvigionamento concorrono alcuni pozzi distribuiti sul territorio
comunale. I pozzi sono di seguito elencati e suddivisi secondo le aree di
appartenenza.
o Impianto 1:
pozzo profondità
colonna diametro colonna portata
(m) (mm) (l/s)
G11 (120) 25
G12 160 da 0 a 99,80 m: 600
40 da 99,80 a 160 m: 450
G13 203 da 0 a 102 m: 600
28 da 102 a 203 m: 400
G14 (150) 24
G15 150 400 38
Capitolo 3: Applicazione alle reti acquedottistiche
47
o Impianto 2:
pozzo profondità
colonna diametro colonna Portata
(m) (mm) (l/s)
G51 135,80 400 18
G52 (150) -600 20
G53 200 da 0 a 114,30 m: 600
14 da 114,30 a 200 m: 400
o Impianto 3:
pozzo profondità
colonna diametro colonna Portata
(m) (mm) (l/s)
G61 200 600 25
G62 213 da 0 a 91,70 m: 600
40 da91,70 a 213 m: 400
• Fase di processo di tipo B – Adduzione:
Per adduzione s’intende tutto il sistema di trasporto dell’acqua, all’interno delle
aree di produzione, dai punti di approvvigionamento fino alla consegna alla rete di
distribuzione.
Sono comprese nel processo condotte e tubazioni con relative apparecchiature di
controllo quali valvole e saracinesche necessarie alla regolazione e intercettazione
dei flussi.
• Fase di processo di tipo G – Filtrazione:
L’impianto è costituito da due unità filtranti installate presso l’Impianto 1,
contenenti carbone attivo granulare.
Idraulicamente sono allacciate in modo da intercettazre il flusso proveniente dal
pozzo G11 prima dell’immissione nella rete.
Capitolo 3: Applicazione alle reti acquedottistiche
48
La capacità complessiva di trattamento è di circa 50 l/s ed è impiegato per la
rimozione dei composti organoalogenati.
Ogni unità è formata da un filtro cilindrico in acciaio di diametro 4160 mm ed
altezza 2040 mm che contiene uno strato di carbone attivo granulare che costituisce
lo strato attivo del sistema.
La ripartzione del flusso tra le due unità avviene tramite le saracinesche di
regolazione. I filtri lavorano alla pressione di rete ed eventuale aria formatasi
durante il processo è fatta evacuare dagli sfiati superiori.
Quando la capacità di adsorbimento del carbone attivo è esaurita viene sostituito:
per estrarlo si utlizza acqua in pressione prelevata dalla rete, mentre l’immissione
avviene a secco attraverso il passo d’uomo predisposto alla sommità del filtro. La
manovra delle saracinesche avviene manualmente.
• Fase di processo di tipo H – Disinfezione finale:
Negli impianti 1, 3 e 4 si usa, per la disinfezione finale delle acque potabili,
ipoclorito di sodio.
Per l’Impianto 1 la fase avviene: per la produzione dei pozzi G12 e G13 tramite
impianto di dosaggio, uno per pozzo, con punto di immissione direttamente sulla
condotta in uscita; per quanto riguarda la produzione dei pozzi G14 e G15 tramite un
impianto di dosaggio a portata variabile, con punto d’immissione direttamente nel
serbatoio di accumulo.
Nell’Impianto 3 la fase di disinfezione finale avviene tramite impianto di
dosaggio, uno per pozzo, con punto di immissione direttamente sulla condaotta in
uscita.
Per l’Impianto 4 la fase di disinfezione finale avviene tramite impianto di
dosaggio a portata variabile, con punto di immissione sulla condotta in ingresso al
serbatoio.
Capitolo 3: Applicazione alle reti acquedottistiche
49
• Fase di processo di tipo I – Accumulo acque in serbatoio:
I serbatoi sono vasche di accumulo per l’acqua trattata o in arrivo da impianti di
risollevamento la cui funzione principale è di compensare la differenza di portata tra
l’acqua prodotta o distribuita e l’acqua richiesta dall’utenza.
I serbatoi hanno dimensioni costruttive in funzione delle portate degli impianti e
dell’uso a cui sono destinati.
La tabella che segue riporta i serbatoi utilizzati per l’acquedotto di Realtown:
serbatoi capacità altezza utile quota sfioro
(m3) (m) (m s.l.m.)
Serbatoio 1 2000 4,00 314,00
Serbatoio 2 800 5,00 375,80
Serbatoio 3 180 7,00 377,00
Serbatoio 4 10000 7,20 424,10
Serbatoio 5 100 4,00 492,50
• Fase di processo di tipo L – Secondo sollevamento:
La rete di distribuzione acqua potabile è rifornita da quattro stazioni di
risollevamento:
o Stazione di sollevamento 1:
La stazione di risollevamento risulta composta da quattro elettropompe collegate
idraulicamente al serbatoio seminterrato.
denominazione Tipo Prevalenza Portata
(m3) (l/s)
M16 elettropompa asse
orizzontale 88 50
M17 elettropompa asse
orizzontale 88 50
M18 elettropompa asse
orizzontale 88 50
Capitolo 3: Applicazione alle reti acquedottistiche
50
denominazione Tipo Prevalenza Portata
(m3) (l/s)
M19 elettropompa asse
orizzontale 90 60
o Stazione di sollevamento 2:
La stazione di risollevamento comprende un’elettropompa collegata
idraulicamente al serbatoio seminterrato.
denominazione Tipo Prevalenza Portata
(m3) (l/s)
M21 elettropompa asse
orizzontale 50 25
o Stazione di sollevamento 3:
La stazione di risollevamento comprende due elettropompe alloggiate in due
vasche di forma cilindrica in acciaio, collegate idraulicamente alle reti bassa e
media.
denominazione Tipo Prevalenza Portata
(m3) (l/s)
M31 elettropompa sommersa 50 67
M32 elettropompa sommersa 42 71
o Stazione di sollevamento 4:
La stazione di risollevamento comprende due elettropompe alloggiate in una
vasca di forma cilindrica in acciaio, collegata idraulicamente al serbatoio.
denominazione Tipo Prevalenza Portata
(m3) (l/s)
M41 elettropompa sommersa 76 20
M42 elettropompa sommersa 75 22
Capitolo 3: Applicazione alle reti acquedottistiche
51
3.2.3 Analisi delle comunità, modularità e mutual information:
I risultati che si ottengono dall’analisi dei file delle portate nella rete
risultano essere molto interessanti. Dalle immagini riportate nel seguito
si può infatti osservare come le comunità rilevate sia molto spesso ben
riconoscibili le une dalle altre e ciò permette di affermare che la rete è
suddivisibile in distretti che a loro volta si comportano quasi come delle
reti indipendenti gli uni dagli altri. Come già accaduto durante l’analisi
di Anytown, le comunità variano in funzione dell’ora del giorno, in
quanto variano le portate che si trasmettono tra i vari nodi della rete. Il
numero di comunità rilevate è notevole e varia nel corso della giornata,
come indicato dal seguente grafico:
Essendo molto grande il numero di nodi della rete di Realtown (3775),
l’algoritmo di analisi delle comunità completa il suo processo in tre passaggi (un
numero comunque molto limitato) e quello più interessante è l’ultimo, con il quale si
20
22
24
26
28
30
32
34
36
38
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
numero di comunità
Figura 15:
Grafico che riporta il numero i comunità rilevate al variare delle ore del giorno.
Capitolo 3: Applicazione alle reti acquedottistiche
52
identificano in modo preciso le distrettualizzazioni della rete acquedottistica. Inoltre
vista la grande quantità di dati, non è possibile rapprensentare sulla mappa fisica
tutte le comunità con colori diversi, quindi si è scelto di rappresentare soltanto quelle
che, alle varie ore del giorno, sono le quattordici comunità più grandi, cioè quelle
che comprendono il maggior numero di nodi. Si è infatti notato che
rappresentandone quattordici (con ogni colore sono rappresentate due comunità)
quasi tutti i nodi della rete risultano rappresentati (i punti piccoli neri indicano i nodi
della rete che non rientrano in queste comunità).
• Ora 1:
Capitolo 3: Applicazione alle reti acquedottistiche
53
• Ora 2:
• Ora 3:
Capitolo 3: Applicazione alle reti acquedottistiche
54
• Ora 4:
• Ora 5:
Capitolo 3: Applicazione alle reti acquedottistiche
55
• Ora 6:
• Ora 7:
Capitolo 3: Applicazione alle reti acquedottistiche
56
• Ora 8:
• Ora 9:
Capitolo 3: Applicazione alle reti acquedottistiche
57
• Ora 10:
• Ora 11:
Capitolo 3: Applicazione alle reti acquedottistiche
58
• Ora 12:
• Ora 13:
Capitolo 3: Applicazione alle reti acquedottistiche
59
• Ora 14:
• Ora 15:
Capitolo 3: Applicazione alle reti acquedottistiche
60
• Ora 16:
• Ora 17:
Capitolo 3: Applicazione alle reti acquedottistiche
61
• Ora 18:
• Ora 19:
Capitolo 3: Applicazione alle reti acquedottistiche
62
• Ora 20:
• Ora 21:
Capitolo 3: Applicazione alle reti acquedottistiche
63
• Ora 22:
• Ora 23:
Capitolo 3: Applicazione alle reti acquedottistiche
64
• Ora 24:
La modularità che le varie distrettualizzazioni assumono risulta avere un valore
molto elevato e ciò significa che l’analisi delle comunità è efficace e che le stesse
comunità trovate sono delle suddivisioni teoriche che ben rappresentano il
comportamento reale della rete. Di seguito si riporta il valore della modularità delle
distrettualizzazioni alle varie ore del giorno:
ora modularità
ora Modularità 1 0,9573
13 0,9592 2 0,9579
14 0,9612 3 0,9583
15 0,9593 4 0,9567
16 0,9598 5 0,9680
17 0,9673 6 0,9567
18 0,9553 7 0,9554
19 0,9618 8 0,9610
20 0,9643 9 0,9611
21 0,9641 10 0,9565
22 0,9535 11 0,9572
23 0,9591 12 0,9570
24 0,9704
Capitolo 3: Applicazione alle reti acquedottistiche
65
Per quanto riguarda invece la mutual information, calcolata tra le
distrettualizzazioni di due ore successive, si nota che al variare del tempo assume i
seguenti valori:
ora mutual
information
ora mutual
information I I norm
I I norm 1-2 0,9050 0,6461
13-14 1,1413 0,8161 2-3 1,3809 0,9071
14-15 1,1498 0,8040 3-4 1,2961 0,8512
15-16 1,3756 1,0125 4-5 1,2634 0,8368
16-17 0,9829 0,7464 5-6 1,2007 0,8001
17-18 1,0904 0,7709 6-7 1,3595 0,9358
18-19 1,2925 0,9230 7-8 1,0858 0,7651
19-20 1,2318 0,9332 8-9 1,2964 0,9385
20-21 1,1762 0,9016 9-10 1,1223 0,8482
21-22 1,0190 0,7540 10-11 1,0899 0,7840
22-23 1,1131 0,7941 11-12 1,3387 0,9563
23-24 1,2178 0,9102 12-13 1,1015 0,8017
24-1 1,0164 0,8046
0,9450
0,9500
0,9550
0,9600
0,9650
0,9700
0,9750
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
modularità
Figura 16:
Grafico che riporta i valori di modularità al variare delle ore del giorno.
Capitolo 3: Applicazione alle reti acquedottistiche
66
Si nota come le comunità non sono mai esattamente identiche al variare delle ore
del giorno, ma ciò è dovuto al fatto che la rete è molto vasta. Però la mutual
information normalizzata assume valori sufficientemente elevati, quindi si può
affermare che la distrettualizzazione varia a seconda delle ore del giorno, ma
presenta anche delle caratteristiche che si ripetono e permettono quindi di ricavare
informazioni importanti sul comportamento della rete stessa.
0,0000
0,2000
0,4000
0,6000
0,8000
1,0000
1,2000
1,4000
1,60001
-2
2-3
3-4
4-5
5-6
6-7
7-8
8-9
9-1
0
10
-11
11
-12
12
-13
13
-14
14
-15
15
-16
16
-17
17
-18
18
-19
19
-20
20
-21
21
-22
22
-23
23
-24
24
-1
mutual information
I Inorm
Figura 17:
Grafico che riporta i valori mutual information e mutual information normalizzata al
variare delle ore del giorno.
Conclusione
67
CONCLUSIONE
I risultati ottenuti con l’analisi della rete di Anytown e soprattutto di quella di
Realtown sono molto interessanti, in quanto permettono di affermare che è possibile
applicare la teoria delle reti complesse per capire come le reti acquedottistiche sono
distrettualizzate, in base alle portate che scorrono al loro interno, e basandosi sui
valori di poche variabili in grado di descrivere bene il comportamento della rete
quali la modularità e la mutual information.
La distrettualizzazione delle reti idriche ha una notevole importanza dal punto di
vista della gestione delle reti stesse, in quanto facilita notevolmente l’individuazione
delle perdite e rende così possibile un intervento più efficace mediante la
regolazione delle pressioni oppure con la sostituzione delle tubazioni più degradate.
La distrettualizzazione permette inoltre un più completo monitoraggio del bilancio
idrico e delle prestazioni della rete e consente inoltre di intervenire con interruzioni
locali in caso di presenza di sostanze inquinanti che potrebbero altrimenti estendersi
a tutta la rete.
Infine l’individuazione dei distretti in cui è suddivisa una rete acquedottistica può
essere utile anche in fase di progetto di una nuova rete o di ampliamento di una già
esistente. È infatti possibile svolgere delle simulazioni utilizzando gli stessi metodi
già descritti per prevedere il futuro comportamento dei distretti e quindi
eventualmente anche apportare delle modifiche alla rete ipotizzata.
Bibliografia e webgrafia
68
BIBLIOGRAFIA
• Fortunato S., “Community detection in graphs”, Physics Reports 486 (2010)
pagine 75-174
• Blondel V. D., Guillaume J., Lambiotte R., Lefebvre E., “Fast unfolding of
communities in large networks”, Journal of Statistical Mechanics: Theory
and Experiment
• Walski T., Brill E., Gessler J., Goulter I., Jeppson R., Lansey K., Lee
H., Liebman J., Mays L., Morgan D., Ormsbee L. (1987). ”Battle of the
Network Models: Epilogue.” J. Water Resour. Plann. Manage., 113(2),
pagine 191–203.
WEBGRAFIA
• http://it.wikipedia.org/wiki/Teoria_dei_grafi
• http://gbgb.altervista.org/Web_progepi/appunti/le_strutture_dati.htm
• http://it.wikipedia.org/wiki/Problema_dei_ponti_di_Königsberg
• http://www.cfinder.org
• http://it.wikipedia.org/wiki/Distrettualizzazione
• http://www.netcom-analyzer.org