Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle reti complesse

POLITECNICO DI TORINO I Facoltà di Ingegneria

Corso di laurea in Ingegneria Civile

TESI DI LAUREA

Distrettualizzazione di reti acquedottistiche mediante la teoria delle reti complesse

Relatori:

• Boano Fulvio • Revelli Roberto • Ridolfi Luca • Scibetta Marco

Candidato:

Peretto Maurizio

novembre 2012

Indice

1

INDICE

• Introduzione

• Capitolo 1: Reti complesse

o 1.1 La teoria dei grafi

o 1.2 Le comunità di una rete

o 1.3 Overlap

o 1.4 Mutual information

o 1.5 Esempio di analisi di una rete complessa mediante le

comunità

• Capitolo 2: Metodo per l’individuazione delle comunità

o 2.1 Tipi di metodi per l’individuazione delle comunità

o 2.2 Metodo Louvain

• Capitolo 3: Applicazione alle reti acquedottistiche

o 3.1 Anytown

3

5

6

9

11

13

0000

15

18

18

20

25

27

Indice

2

� 3.1.1 Descrizione generale

� 3.1.2 Analisi delle comunità, modularità e mutual

information

o 3.2 Realtown

� 3.2.1 Descrizione generale

� 3.2.2 Descrizione delle fasi di processo

� 3.2.3 Analisi delle comunità, modularità e mutual

information

• Conclusione

• Bibliografia e webgrafia

27

2822

28

44

44

46

5000

51

67

68

Introduzione

3

INTRODUZIONE

Le reti complesse, cioè reti molto estese e con numerose ramificazioni, rivestono

un ruolo fondamentale all'interno del mondo scientifico in quanto risultano molto

utili per studiare innumerevoli fenomeni in svariati ambiti: dalla sociologia, alla

biologia, ma anche nel settore delle costruzioni. Ne sono un esempio le reti stradali e

quelle di distribuzione dell’energia elettrica. Un'ulteriore applicazione in cui la

teoria delle reti complesse è particolarmente efficace è quella delle reti

acquedottistiche.

Per l’analisi delle reti idriche, un aspetto innovativo da analizzare è quello che

riguarda la loro distrettualizzazione, cioè il modo in cui le portate si trasmettono da

un nodo all’altro della rete formando delle zone all’interno delle quali gli scambi

idrici sono più intensi rispetto agli scambi con altre zone. L’individuazione delle

distrettualizzazioni di una rete acquedottistica al variare del tempo permetterebbe

quindi di capire a fondo il comportamento della rete stessa e darebbe quindi la

possibilità di attuare un maggior controllo in fase di esercizio da parte del gestore,

sia per quanto riguarda l’individuazione delle perdite, sia per poter eventualmente

isolare alcune porzioni della rete in caso di rotture o di presenza di sostanze

inquinanti o anche solo durante la manuntenzione ordinaria. L’obiettivo è quindi

quello di sperimentare un nuovo approccio per lo studio delle reti idriche e verificare

che esso sia valido e applicabile per l’analisi delle reti reali.

Generalmente, la distribuzione dei rami all'interno di una rete complessa non è

omogenea, infatti spesso è possibile individuare delle concentrazioni di rami

all'interno di determinati gruppi di nodi, che quindi condividono proprietà comuni

oppure hanno ruoli simili all'interno della rete. Questa caratteristica delle reti è detta

struttura a comunità e, nel caso specifico delle reti acquedottistiche, le comunità

rappresentano appunto i distretti.

Introduzione

4

Il metodo utilizzabile per quest’analisi consiste quindi nello schematizzare la rete

acquedottistica mediante dei grafi e poi applicare la teoria delle reti complesse, con

l’aiuto anche di un sito internet mediante il quale si applicano gli algoritmi di

calcolo alla rete, per comprendere come evolve la distrettualizzazione a seconda

delle ore del giorno, durante le quali le richieste idriche ai nodi della rete variano.

Nel capitolo 1 saranno pertanto descritte la teoria delle reti complesse e le

variabili che sono utilizzate per analizzarle, nel capitolo 2 si procederà a illustrare i

possibili algoritmi applicabili e in particolare quello che verrà impiegato, cioè il

metodo Louvain, e infine nel capitolo 3 saranno riportati i risultati delle analisi

condotte su due reti: dapprima quella della città fittizia di Anytown, che è una rete di

dimensioni limitate utilizzata già per lo studio di diversi problemi nell’ambito delle

reti idriche, e in seguito una rete molto simile ad una realmente esistente,

denominata Realtown.

Capitolo 1: Reti complesse

5

CAPITOLO 1: RETI COMPLESSE

A partire dalla seconda metà del secolo scorso, numerose ricerche scientifiche

hanno portato all’affermazione del fatto che le reti complesse sono l’elemento

pervasivo con il quale è strutturato il mondo che ci circonda. Si tratta di studi

scientifici che spaziano dalla matematica alla fisica, dalla biologia alla sociologia e

che hanno portato alla nascita di un nuovo campo di ricerca denominato scienza

delle reti complesse.

La presenza di reti che compongono e descrivono la realtà è evidente non appena

si pensa per esempio alla rete stradale di uno Stato, al sistema nervoso nel corpo

umano oppure ancora alla rete di comunicazioni tra cellulari. Ciò dimostra anche

come le reti caratterizzino ogni ambito della realtà e non riguardino solo uno o pochi

campi di applicazione.

Le reti reali sono complesse in quanto sono molto estese e quindi per studiarle è

necessario svolgere un numero di operazioni davvero ingente. Perciò la scienza delle

reti complesse è una disciplina che è nata anche grazie allo sviluppo tecnologico che

ha fornito i mezzi per elaborare grandi quantità di dati, ovvero i calcolatori. Lo

studio delle reti complesse si basa sulla teoria dei grafi, la quale permette di

descrivere le reti stesse in termini matematici e dunque arrivare a conclusioni valide

dal punto di vista scientifico.

L’analisi delle reti permette di evidenziare delle comunità al loro interno, cioè

delle parti delle reti stesse che presentano delle caratteristiche in comune tra loro,

quali l’appartenenza ad un certo gruppo etnico o ad una città oppure ancora uno

scambio di informazioni più fitto tra i membri della comunità stessa (ambito

sociale). Riuscire quindi a identificare le comunità risulta quindi fondamentale per

capire il comportamento della rete nella sua interezza.


6

1.1 La teoria dei grafi:

I grafi sono oggetti discreti che permettono di schematizzare una grande varietà

di situazioni e di processi e spesso di consentirne l'analisi in termini quantitativi

e algoritmici.

In termini pratici, per grafo si intende una struttura costituita da vertici (o nodi) e da

collegamenti tra i vertici. I collegamenti possono essere orientati, cioè hanno un

verso definito, e in questo caso sono detti rami , oppure non orientati, e in questo

caso sono detti spigoli.

È inoltre possibile associare ulteriori dati ai nodi e/o ai collegamenti come per

esempio delle coordinate geografiche o delle distanze.

La tipica raffigurazione grafica di un grafo su un piano è costituita da punti o

cerchietti, che rappresentano i nodi, e da segmenti o curve che collegano due nodi e

indicano i rami/spigoli.

Il grado di un nodo in un grafo non orientato è il numero di rami che incidono su

quel nodo, cioè che lo hanno come estremo; per i grafi orientati, si distingue invece

fra grado entrante e grado uscente.

Due rami si dicono paralleli se incidono sulla stessa coppia di nodi. Un grafo

semplice è un grafo che non contiene rami paralleli.

Figura 1:

Esempio di

raffigurazione

grafica di un

grafo

orientato e di

uno non

orientato.


7

Un cammino (catena per i grafi non orientati) è una successione di nodi fra i quali

esiste un ramo di collegamento e se la partenza e l'arrivo coincidono allora il

cammino si dice circuito .

Un grafo non orientato si dice connesso se esiste una catena congiungente ogni

coppia di nodi; in caso contrario si dice non connesso.

Un grafo orientato si dice connesso se il grafo non orientato che si ottiene

ignorando la direzione dei rami risulta connesso; si dice invece fortemente

connesso se ogni nodo è raggiungibile da qualsiasi altro attraverso un cammino.

Per rappresentare i grafi nella memoria di un elaboratore, si seguono diversi

metodi, a seconda del tipo di operazioni che si devono compiere e, in definitiva, del

problema da risolvere. Le principali sono:

• Matrice di adiacenza: è una delle rappresentazione più immediate,

applicabile ai grafi semplici: un grafo di n nodi V1,V2, ...,Vn viene

rappresentato da una matrice di dimensioni (nxn) di cifre binarie (0 o 1) in

cui l'elemento aij vale 1 se esiste il ramo (Vi,Vj) e 0 altrimenti. È inoltre

possibile inserire al posto del valore 1 un altro valore, chiamato peso, che

descrive una caratteristica del ramo. Per esempio nel caso in cui si stia

rappresentando una rete stradale, si potrebbe indicare la distanza fisica tra

due vertici.

• Lista di adiacenza: è una rappresentazione basata su una lista di nodi del

grafo, in cui per ogni nodo vengono elencati i nodi ad esso adiacenti. Questa

è in genere la più efficiente tra le modalità dal punto di vista computazionale,

specialmente per un grafo con pochi rami.

• Matrice di incidenza: questa modalità di rappresentazione è basata su di una

matrice (nxm). La matrice ha quindi un numero di righe pari al numero di

nodi (n) e un numero di colonne pari al numero di rami (m). Nel caso di grafi

non orientati, il generico elemento (i,j) della matrice sarà pari a 1 se il j-

esimo ramo del grafo incide sul nodo i, sarà pari a 0 se il ramo j-esimo non

incide sul nodo i. Nel caso di grafi orientati, il generico elemento (i,j) della

matrice sarà pari a -1 se il ramo j-esimo esce dal nodo i, sarà pari a 1 se il

ramo j-esimo entra nel nodo i, oppure pari a 0 se il ramo j-esimo non incide


8

sul nodo i. Nella matrice di incidenza ogni colonna ha esattamente due

elementi diversi da zero; essi sono in corrispondenza delle righe della

matrice relative ai due nodi estremi del ramo.

• Lista dei rami: su ogni riga si indica un numero identificativo per ognuno

dei due vertici legati e il numero 1 che indica la presenza del ramo, oppure al

posto del valore 1 il peso del ramo nel caso di grafi pesati.

Figura 2:

Esempio di

rappresentazione di un

grafo descritto

mediante di adiacenza,

lista di adiacenza,

matrice di incidenza e

lista dei rami.

v1 v2 v3 v4 v5

v1 0 1 1 0 0

v2 1 0 1 1 0

v3 1 1 0 1 1

v4 0 1 1 0 1

v5 0 0 1 1 0

v1: v2,v3

v2: v1,v3,v4

v3: v1,v2,v4,v5

v4: v2,v3,v5

v5: v3,v4

r1 r2 r3 r4 r5 r6 r7

v1 1 1 0 0 0 0 0

v2 1 0 1 1 0 0 0

v3 0 1 1 0 1 1 0

v4 0 0 0 1 1 0 1

v5 0 0 0 0 0 1 1

v1 v2 1

v1 v3 1

v2 v3 1

v2 v4 1

v3 v4 1

v3 v5 1

v4 v5 1

Matrice di adiacenza

Lista di adiacenza

Matrice di incidenza

Lista dei rami


9

La teoria dei grafi è nata con la pubblicazione di Eulero sui "Sette ponti di

Königsberg", nella quale l’autore attraverso un grafo ha risolto la questione, più

volte proposta nel corso dei secoli, riguardante la possibilità di seguire un percorso

in passeggiata che attraversi ogni ponte della città (l’attuale Kaliningrad) una e una

volta soltanto e tornare al punto di partenza. Eulero ha infatti dimostrato che ciò era

impossibile schematizzando la situazione reale mediante un grafo che era diverso

dalla realtà fisica della città ma ne conservava le caratteristiche utili al fine della sua

analisi.

Nella seconda metà del XX secolo gli studi e i risultati si sono sviluppati

ampiamente, in sintonia con i forti sviluppi del calcolo automatico. L'introduzione

del computer ha consentito da un lato lo sviluppo di indagini sperimentali sui grafi e

dall'altro ha richiesto alla teoria dei grafi di indagare su algoritmi e modelli di forte

impatto applicativo. Nel giro di cinquant'anni la teoria dei grafi è diventata un

capitolo della matematica molto sviluppato, ricco di risultati profondi e con forti

influenze applicative.

1.2 Le comunità di una rete:

I grafi che rappresentano sistemi reali non sono regolare come dei reticoli. Al

contrario, essi sono delle schematizzazioni dove l’ordine coesiste con il disordine in

quanto mentre descrivono grandi disomogeneità, mostrando le situazioni reali,

rivelano allo stesso tempo un elevato livello di organizzazione, tanto è vero che il

Figura 3:

Passaggi della creazione del grafo da parte di Eulero per studiare il problema dei

"Sette ponti di Königsberg"


10

tipo di struttura rimane lo stesso in tutta la rete. Infatti di solito ci sono tanti nodi che

hanno un basso grado e pochi nodi che hanno un grado decisamente più elevato.

Pertanto la distribuzione dei rami non è disomogenea solo globalmente, ma anche

localmente, con elevate concentrazioni all'interno di determinati gruppi di vertici, e

basse concentrazioni tra questi gruppi. Questa caratteristica delle reti reali è

chiamata struttura a comunità. Le comunità, chiamate anche moduli o distretti ,

sono gruppi di vertici che probabilmente condividono proprietà comuni e/o hanno

ruoli simili all'interno del grafico.

La società offre una vasta gamma di gruppi possibili: legami familiari, di lavoro e

di amicizia, villaggi, città, nazioni. La diffusione di internet ha portato anche alla

creazione di gruppi virtuali, che vivono sul Web, come comunità online. Esistono

comunità anche in molte altre reti in molti ambiti: biologia, informatica, ingegneria,

economia, politica e altri ancora. In reti di interazione tra proteine, le comunità sono

composte da gruppi di proteine aventi la stessa funzione specifica all'interno della

cellula, nel grafico del World Wide Web esse possono corrispondere a gruppi di

pagine che trattano gli stessi argomenti o correlate, in reti metaboliche possono

essere relative a moduli funzionali come i cicli e le vie, e così via.

Le comunità possono avere applicazioni concrete: l’identificazione dei gruppi di

clienti con interessi simili nella rete dei rapporti di acquisto tra clienti e rivenditori

online permette di istituire efficaci sistemi di pubblicità, che guidano i clienti

attraverso i vari prodotti del rivenditore e migliorano le opportunità di business.

Figura 4:

Esempio di

un grafo

con le

comunità in

evidenza.


11

L’individuazione delle comunità e dei relativi limiti è importante anche per altri

motivi. Esse consentono infatti di classificare i nodi in base alla loro posizione

strutturale nei moduli: i vertici con una posizione centrale nella loro comunità, cioè

che condividono un gran numero di rami con gli altri nodi del gruppo, possono avere

una funzione importante all'interno del gruppo stesso; vertici che si trovano ai

confini tra diverse comunità hanno invece un ruolo importante di comunicazione.

Tale classificazione sembra essere significativa nell’ambito sociale e nelle reti

metaboliche. Infine, si può studiare un ulteriore grafico in cui i vertici sono costituiti

dalle comunità precedentemente individuate e i rami sono la somma dei

collegamenti tra i nodi che appartengono a comunità diverse. In questo modo si

ottiene una descrizione del grafico originale che svela i rapporti tra i vari moduli.

Un altro aspetto importante legato alla struttura della comunità è l'organizzazione

gerarchica che è ben evidente nella maggior parte dei sistemi a rete nel mondo reale.

Le reti reali infatti solitamente sono composte da comunità all’interno delle quali è

possibile individuare comunità più piccole, a loro volta suddivisibili in moduli

ancora più piccoli, ecc.. Il corpo umano offre un ottimo esempio di organizzazione

gerarchica: è composto da organi, gli organi sono composti da tessuti, i tessuti da

cellule, ecc.. Un altro esempio è rappresentato dalle aziende commerciali, che sono

caratterizzate da una organizzazione piramidale, che vanno dai lavoratori al

presidente, con numerosi livelli intermedi.

1.3 Overlap:

I metodi esistenti per la ricerca di comunità in reti di grandi dimensioni sono utili

se la struttura della comunità è tale da poter essere interpretata in termini di

comunità separate le une dalle altre. Tuttavia molte reti reali sono caratterizzate

comunità che in parte si sovrappongono, nelle quali cioè alcuni nodi appartengono a

più di una comunità.

Tale affermazione diventa evidente pensando al fatto che ognuno di noi appartiene

dal punto di vista sociale a diverse comunità, relative alla nostra la vita personale

(scuola, hobby, famiglia). A loro volta i membri delle nostre comunità hanno le loro

comunità, con una conseguente rete estremamente complessa. Questo aspetto è stato


12

a lungo apprezzato dai sociologi, ma non è mai stato studiato in modo sistematico

per le grandi reti.

In generale, ogni nodo i di una rete può essere caratterizzato da un numero di

appartenenza mi, che corrisponde al numero di comunità a cui il nodo appatiene.

Allo stesso tempo due comunità qualsiasi α e β possono avere in comune sα,βov nodi,

detti overlap size (dimensione di sovrapposizione) tra le comunità α e β. A loro

volta le comunità costituiscono anche una rete i cui legami sono le sovrapposizioni,

il cui numero è detto grado di comunità dαcom. Infine la dimensione sα

com della

comunità α corrisponde al numero dei nodi che comprende.

Per caratterizzare la struttura delle comunità di una rete complessa si introducono

le distribuzioni di queste quattro grandezze di base: in particolare si considerano le

loro funzioni di probabilità cumulata, indicate con P(scom), P(dcom), P(sov) e P(m).

Figura 5:

Esempio di rete sociale in cui gli stessi nodi appartengono a varie comunità.


13

1.4 Mutual information:

Quando si studiano delle reti i cui pesi variano nel tempo, come ad esempio le reti

di acquedotti, dove le portate nei singoli tratti variano in funzione della richiesta

durante il giorno, è utile cercare di comprendere quanto le configurazioni di

comunità in determinati istanti (ad esempio una configurazione ogni ora)

differiscono tra loro.

Nella pletora di metodi, uno dei più utilizzati si riconduce al calcolo di entropie. Il

concetto di base è quello di immaginare di avere una stessa rete con n nodi e di aver

fatto due ripartizioni X e Y, aventi rispettivamente nX e nY comunità. Quindi:

� = ��, ��, … , �� = ��, ��, … , �� Corrispondentemente si può pensare a due vettori con n componenti ciascuno che

attribuiscano ciascuno degli n nodi alle comunitµa Xi o Yi. Quindi vettori del tipo

(considerando un esempio di rete con n = 5 nodi e tre ripartizioni nX = nY = 3):

�� = ��, ��, ��, ��, �� = ��, ��, ��, ��, �� I vettori ovviamente sono ordinati nello stesso modo. Ossia, per esempio, il nodo 2 è

attribuito alla comunità X2 nella prima ripartizione e alla comunità Y1 nella seconda

ripartizione.

Si indica con niX e nj

Y rispettivamente il numero di nodi che cadono nelle comunità

Xi e Yj e con nij il numero di nodi condivisi dalle comunità (Xi; Yj). Per esempio,

(2)

(1)

Figura 6:

Esempio di un

grafo suddiviso

in quattro

comunità,

alcune delle

quali hanno

nodi in comune

(evidenziati in

rosso).


14

riferendosi ai vettori (2), si ha che n1X= 2 oppure n2

Y= 1, mentre n12 = 1 (ovvero solo

il nodo 3 cade sia nella comunità X1 (dal punto di vista della ripartizione X) sia nella

comunità Y2 (dal punto di vista della ripartizione Y).

Allora è possibile definire la mutual information :

��, �� = �� − ��|�� dove:

�� = −�� ∙ ln ��

è la Shannon entropy e P(x) è la probabilità di avere nodi nella comunità x (che

corre su tutte le comunità trovate nella ripartizione X), ossia:

�� = �� = �� = �!

Per esempio nel caso della ripartizione (2) si ha che x corrisponde a tutte le comunità

individuate (ossia X1, X2 e X3) e pertanto: P(X1) = 2/5, P(X2) = 2/5 e P(X3) = 1/5.

Nella (3) la H(X|Y ) è l'entropia condizionata di X dato Y ed è definita come:

��|�� = −��, �� ∙ ln ��|��,"

= −��, �� ∙ ln ��, ��,"

dove:

��, �� = �� = �, � = �� = �"

è la joint distribution ed x, y della sommatoria corrono su tutte le possibili coppie

(Xi; Yj).

In realtà per permettere la confrontabilità tra partizioni, si preferisce usare la mutual

information normalizzata:

��#$%��, �� =2��, ��

�� + ��

Essa è compresa tra zero, se le partizioni sono totalmente indipendenti, e 2, se tutte

le comunità della partizione X si uniscono in un’unica comunità nella partizione Y.

Vi è inoltre un altro valore di interesse che può assumere la mutual information

normalizzata, cioè 1, quando le partizioni X e Y sono identiche.

Quindi è possibile diagrammare il suo valore nel tempo per avere un'indicazione

di come le comunità sono dinamiche (ossia mutano) oppure rimangono sempre le

stesse.

(3)

(5)

(6)

(4)

(7)

(8)


15

1.5 Esempio di analisi di una rete complessa mediante le comunità:

Per rendere ancora più evidente la fondamentale importanza che le comunità

assumono nell’analisi delle reti complesse si può considerare l’esempio dei dati di

una società telefonica belga. La rete è composta da 2,6 milioni di clienti, tra i quali i

collegamenti pesati rappresentano il numero totale di chiamate durante un periodo di

6 mesi.

I dati permettono di associare ad ogni cliente diverse voci, come ad esempio l'età,

il sesso, la lingua e il codice di avviamento postale del luogo in cui vivono. Questa

vasta rete sociale è eccezionale a causa della particolare situazione del Belgio, dove

coesistono due principali comunità linguistiche (francese e olandese) e dove è

possibile analizzare l’omogeneità linguistica delle comunità. Da un punto di vista

sociologico, la possibilità di evidenziare l'omogeneità linguistica, religiosa o etnica

delle comunità apre prospettive per descrivere la coesione sociale e la fragilità

potenziale di un paese.

Su questa rete particolare si può rilevare una struttura gerarchica delle comunità a

sei livelli. Al livello più basso ogni cliente è una comunità a sé stante e al livello più

alto ci sono 261 comunità che hanno più di 100 clienti. Queste comunità

rappresentano circa il 75% di tutti i clienti. L'omogeneità di una comunità si

caratterizza per la percentuale di coloro che parlano la lingua dominante in quella

comunità, questa quantità va a 1 quando la comunità tende ad essere monolingue.

L’analisi rivela che la rete è fortemente segregata, con la maggior parte delle

comunità quasi monolingui. Ci sono 36 comunità con più di 10 000 clienti e, ad

eccezione di una sola comunità a livello di interfaccia tra i due gruppi linguistici, in

tutte le altre oltre l'85% dei loro membri parlano la stessa lingua. Inoltre è

interessante analizzare più da vicino l’unica comunità che ha una distribuzione più

equilibrato di lingue: attraverso un’analisi gerarchica è possibile considerare le

sotto-comunità evidenziate ad un livello inferiore. Queste sotto-comunità sono

strettamente collegate tra loro e sono composte da gruppi eterogenei di persone.

Questi gruppi di persone, in cui il linguaggio cessa di essere un fattore

discriminante, potrebbero eventualmente giocare un ruolo cruciale per l'integrazione

del paese e per l'emergere di una qualsiasi idea tra le comunità. Ci si può infatti


16

chiedere cosa accadrebbe se la comunità a livello di interfaccia tra i due gruppi

linguistici fosse rimossa.

Figura 7:

Rappresentazione grafica della rete di telefonia mobile belga. La dimensione di ogni

nodo è proporzionale al numero di individui inclusi nella comunità corrispondente e

il suo colore rappresenta la principale lingua parlata nella comunità (rosso per il

francese e verde per l'olandese). Solo le comunità composte da più di 100 clienti

sono stati rappresentate. Si noti la comunità intermedia tra i due gruppi linguistici

principali. Lo zoom a più alta risoluzione rivela che è fatta da diverse sottocomunità

con una separazione lingua meno evidente.


17

Un'altra interessante osservazione è legata alla presenza di altre lingue: in realtà

nel caso specifico gli utenti possono scegliere quale lingua dichiarare di utilizzare

all’operatore tra quattro lingue possibili: francese, olandese, inglese o tedesco. È

interessante notare che, mentre i clienti di lingua inglese si disperdono abbastanza

uniformemente in tutte le comunità, oltre il 60% dei clienti di lingua tedesca sono

concentrati in una sola comunità.

Questo è probabilmente dovuto al fatto che le persone di lingua tedesca sono

principalmente concentrate in una piccola regione vicino alla Germania, mentre le

persone di lingua inglese sono distribuite su tutto il paese.

Dall’analisi della rete è infine possibile notare che le comunità di lingua francese

sono connesse molto più densamente rispetto a quelle di lingua olandese: in media,

la forza dei legami tra le comunità di lingua francese è del 54% più forte rispetto a

quelli tra le comunità di lingua olandese. Questa differenza di struttura tra le due

sotto-reti sembra indicare che le due comunità linguistiche sono caratterizzate da

diversi comportamenti sociali e suggerisce quindi di cercare altre caratteristiche

topologiche per le comunità.

Capitolo 2: Metodo per l’individuazione delle comunità

18

CAPITOLO 2: METODO PER L’INDIVIDUAZIONE DELLE COMUNITÀ

Come è stato evidenziato, l’identificazione delle comunità e della loro

organizzazione gerarchica nei grafi, utilizzando le informazioni codificate nella

topologia dei grafi stessi, è fondamentale per poterli comprendere e studiare.

Il problema, apparentemente intuitivo, in realtà non è strutturato in maniera

univoca: il concetto di comunità non è rigorosamente definito e prevede un certo

grado di arbitrarietà e/o di buon senso. In effetti, esistono alcune ambiguità e ci sono

spesso molti modi altrettanto legittimi di risolverle. Pertanto, non è sorprendente che

ci siano un sacco di metodi nella letteratura. È importante sottolineare che

l'identificazione delle comunità è possibile solo se nei grafi il numero di bordi m è

dell'ordine del numero di nodi n. Se m >> n, la distribuzione dei rami tra i nodi è

troppo omogenea affinché le comunità abbiano senso. In questo caso il problema si

trasforma in qualcosa di diverso, che richiede concetti e metodi di natura diversa,

valutando ad esempio la vicinanza tra i vertici e non la loro effettiva interazione.

In questo capitolo si cercherà quindi di fornire una panoramica generale sui vari

tipi di metodi possibili, concentrandosi poi sul metodo che pare più efficace per una

successiva applicazione nello studio delle reti acquedottistiche.

2.1 Tipi di metodi per l’individuazione delle comunità:

Il problema dell’individuazione delle comunità ha una lunga tradizione ed è

apparso in varie forme e in diverse discipline, ma avendo sempre in comune lo

stesso obiettivo: identificare le comunità nelle reti complesse più velocemente

possibile e potendo visualizzare la struttura della rete.

Un buon approccio consiste nello scomporre le reti in sub-unità o comunità in

base al fatto che siano altamente connessi tra loro, con i nodi appartenenti a diverse

comunità che siano invece scarsamente collegati. Le formulazioni precise di questo


19

problema di ottimizzazione sono però computazionalmente intrattabili, quindi sono

stati proposti diversi algoritmi per trovare partizioni ragionevolmente buone in un

modo ragionevolmente veloce. Questa ricerca di algoritmi veloci ha suscitato molto

interesse negli ultimi anni grazie alla crescente disponibilità di set di dati di grandi

dimensioni e al notevole impatto delle reti sulla vita di tutti i giorni.

Si possono distinguere diversi tipi di algoritmi di rilevamento di comunità:

• algoritmi di divisione: individuano e rimuovono dalla rete i collegamenti tra

le varie comunità;

• algoritmi di aggregazione: uniscono nodi simili in modo ricorsivo;

• metodi di ottimizzazione: si basano sulla massimizzazione di una funzione

obiettivo. La qualità delle partizioni risultanti da questi metodi è spesso

misurata dalla cosiddetta modularità della partizione. La modularità di una

partizione è un valore scalare tra -1 e 1 che misura la densità dei legami

all'interno delle comunità rispetto ai collegamenti tra le comunità. Nel caso

di reti pesate, cioè di reti che hanno pesi sui loro collegamenti, essa è definita

come:

� = 12 ∙ �� − ∙ �2 ∙ � � ∙ ��, ��,�

dove:

o � è il peso del ramo tra i e j

o = ∑ �� è la somma dei pesi dei rami che incidono sul vertice i

o � è la comunità a cui è assegnato il vertice i

o � = ��∑ ��

o � = 1 se � = �� , � = 0 altrimenti

La modularità è quindi utilizzata per confrontare la qualità delle partizioni

ottenute con metodi diversi, ma anche come una funzione obiettivo da

(9)


20

ottimizzare. Purtroppo, l'ottimizzazione esatta della modularità è un

problema computazionalmente difficile e sono quindi necessari algoritmi di

approssimazione quando si tratta di grandi reti. L'algoritmo di

approssimazione più veloce per ottimizzare la modularità su reti di grandi

dimensioni è stato proposto da Clauset et al. Tale metodo consiste nell’unire

le varie comunità per aumentare la modularità. Purtroppo, questo algoritmo

può produrre valori di modularità che sono significativamente inferiori a

quelli che possono essere determinati usando, per esempio, un qualsiasi

metodo di aggregazione. Inoltre, il metodo proposto da Clauset et al. ha una

tendenza a produrre comunità molto estese che contengono gran parte dei

nodi, anche su reti che non hanno una struttura a comunità significativamente

evidente. Ciò ha anche lo svantaggio di rallentare notevolmente l'algoritmo e

di renderlo inapplicabile a reti di oltre un milione di nodi. Questo effetto

indesiderato è stato aggirato con l'introduzione di accorgimenti al fine di

equilibrare la dimensione delle comunità durante l’aggregazione,

accelerando così il tempo di esecuzione e consentendo di affrontare reti fino

a qualche milione di nodi.

2.2 Metodo Louvain:

L'idea originale di questo metodo è dovuta a Étienne Lefebvre che per primo lo ha

sviluppato durante la sua tesi di laurea presso l'Université Catholique de Louvain

(Louvain-la-Neuve) nel marzo 2007. Il metodo è stato migliorato e testato con

Vincent Blondel, Jean-Loup Guillaume e Renaud Lambiotte ed ora è conosciuto

come il "metodo Louvain", perché, anche se i co-autori ora occupano incarichi a

Parigi, Londra e Louvain-la-Neuve, il metodo è stato messo a punto quando tutti

erano all'Université Catholique de Louvain.

Questo metodo, che sarà successivamente applicato per l’analisi di reti

acquedottistiche, trova partizioni con modularità elevata nelle reti di grandi

dimensioni in un tempo breve e sviluppa una struttura gerarchica completa di

comunità, dando così l'accesso a diverse risoluzioni sulle comunità della rete.


Contrariamente a tutti gli altr

estensione della rete che si incontrano con questo algoritmo sono dovuti

capacità di memoria, invece

comunità di una rete di 118 milioni nodi

L'algoritmo è diviso in due fasi che vengono ripetute

di partire con una rete di

differente ad ogni nodo della rete, così

comunità quanti sono i nodi.

ad i e si valuta l’incremento

comunità e ponendolo nella comunità di

per cui questo incremento

incremento positivo, i rimane nella sua comunità di origine. Questo processo viene

applicato ripetutamente e sequenzialmente a

StatiU.E.

Unione Europea

Italia

Francia

Germania

...

Figura 8:

Esempio di organizzazione gerarchica di una rete che descrive le suddivisioni

politiche dell’Unione Europea.


Contrariamente a tutti gli altri algoritmi di rilevamento delle comunità, i limiti di

che si incontrano con questo algoritmo sono dovuti

, invece che al tempo di calcolo: è stato possibile identificare le

una rete di 118 milioni nodi solamente in 152 minuti.

in due fasi che vengono ripetute iterativamente. Si supponga

di partire con una rete di n nodi ponderata. Innanzitutto, si assegna una

erente ad ogni nodo della rete, così in questa suddivisione iniziale ci sono

quanti sono i nodi. In seguito, per ogni nodo i si considera il

mento di modularità, che si avrebbe rimuovendo

comunità e ponendolo nella comunità di j. Il nodo i è quindi posto nella comunità

mento è massimo (e positivo). Se invece non è possibile

rimane nella sua comunità di origine. Questo processo viene

etutamente e sequenzialmente a tutti i nodi finché nessun ulteriore

CircoscrizioniComuniProvinceRegioni

Valle d'Aosta

Lombardia

Lazio

Piemonte

Torino

Torino

Chivasso

Susa

...

Cuneo

Alessandria

...

...


politiche dell’Unione Europea.

21

comunità, i limiti di

che si incontrano con questo algoritmo sono dovuti alla

tato possibile identificare le

iterativamente. Si supponga

si assegna una comunità

iniziale ci sono tante

si considera il nodo j vicino

rimuovendo i dalla sua

è quindi posto nella comunità

non è possibile avere un

rimane nella sua comunità di origine. Questo processo viene

finché nessun ulteriore

Circoscrizioni

Circoscrizione 1

Circoscrizione 2

Circoscrizione 3

...



22

incremento può essere ottenuto e, a questo punto, la prima fase è completata. È da

sottolineare il fatto che un nodo può essere, e spesso è, considerato più volte durante

questa prima fase, che termina quando vengono raggiunti i massimi locali di

modularità, cioè quando nessun singolo movimento può aumentare la modularità. È

inoltre fondamentale notare che l'output dell'algoritmo dipende dall'ordine in cui

vengono considerati i nodi. I risultati preliminari su casi di test diversi sembrano

indicare che l'ordine dei nodi non ha un'influenza significativa sulla modularità che

si ottiene, mentre può influire sul tempo di calcolo, ma le ragioni di questa

dipendenza non sono chiare.

Una parte dell’efficienza dei risultati dell'algoritmo è data dal fatto che

l’ incremento di modularità ottenuto spostando un nodo isolato i in una comunità C

può essere facilmente calcolato con la seguente relazione:

∆� = �∑ +� 2 ∙ ,�2 ∙ � − �∑ +�� 2 ∙ � �� − �∑ �2 ∙ � − �∑ ��2 ∙ �� − " 2 ∙ �#� dove:

o ∑ � è la sommatoria dei pesi dei rami all'interno della comunità C, in cui è

spostato un singolo nodo i

o ∑ � è la sommatoria dei pesi dei rami che incidono sui nodi appartenenti alla

comunità C

o è la sommatoria dei pesi dei rami che incidono sul nodo i

o ,� è la sommatoria dei pesi dei collegamenti dal nodo i ai nodi in C

o � è la sommatoria dei pesi di tutti i rami della rete.

Questa espressione è usata per valutare la variazione di modularità quando il nodo i

viene rimosso dalla sua comunità per essere spostato in una comunità vicina.

La seconda fase dell'algoritmo consiste nella costruzione di una nuova rete i cui nodi

sono ora le comunità trovate durante la prima fase. Per fare ciò, i pesi dei

collegamenti tra i nodi nuovi sono dati dalla somma dei pesi dei collegamenti tra i

nodi corrispondenti alle due comunità. Dopo che questa seconda fase è completata, è

quindi possibile riapplicare la prima fase dell'algoritmo alla risultante rete ponderata

e iterare. Si indica con il termine passaggio una singola combinazione di queste due

fasi. Per costruzione, il numero di comunità diminuisce ad ogni passaggio e di

(10)


23

conseguenza la maggior parte del tempo di calcolo viene utilizzato nei primi

passaggi. I passaggi vengono ripetuti fino a quando non avvengono più modifiche e

ciò significa anche che è stato raggiunto il massimo di modularità.

L'algoritmo memorizza naturalmente una nozione di gerarchia delle comunità

costruite durante il processo. L'altezza della gerarchia è determinata dal numero di

passaggi ed è generalmente un numero piccolo.

Questo semplice algoritmo ha diversi vantaggi. In primo luogo, i suoi passi sono

intuitivi e facili da implementare e il risultato non è controllato a priori e poi è

estremamente veloce, grazie al fatto che i possibili aumenti di modularità sono facili

da calcolare e che il numero di comunità diminuisce drasticamente dopo pochi

passaggi. Inoltre il problema del limite di risoluzione della modularità sembra essere

superato grazie all’intrinseca natura multi-livello di questo algoritmo. Infatti, un

Figura 9:

Visualizzazione dei passi dell’algoritmo. Ogni passo è costituito da due fasi: una in

cui è ottimizzata modularità consentendo solo cambiamenti locali delle comunità e

un’altra in cui vengono aggregate le comunità che si trovano al fine di costruire una

nuova rete di comunità. I passaggi vengono ripetuti iterativamente finché non è più

possibile ottenere incrementi della modularità.


24

approccio di pura ottimizzazione della modularità non riesce ad identificare le

comunità più piccole di una certa scala, introducendo quindi un limite di risoluzione

sulle comunità rilevate. Questa osservazione è solo in parte pertinente in questo

caso, in quanto la prima fase dell’algoritmo comporta lo spostamento di singoli nodi

da una comunità all'altra, di conseguenza la probabilità che due distinte comunità

possano essere “fuse” spostando i singoli nodi uno per uno è molto bassa. Queste

comunità possono essere unite nei passi successivi, dopo che i blocchi di nodi sono

stati aggregati. Infine, le soluzioni intermedie trovate dall’algoritmo potrebbero

anche avere un significato ben preciso e la struttura gerarchica individuata può

consentire all'utente finale di osservare la struttura della rete con la risoluzione

desiderata. Il fatto che le soluzioni intermedie abbiano un significato non è ancora

stato dimostrato, però sembra che abbiano senso, a causa del fatto che corrispondono

a un massimo locale di modularità, nel senso che non è possibile aumentare la

modularità muovendo una singola entità da una comunità ad un’altra. Nel primo

passaggio queste entità sono nodi, ma in quelli successivi corrispondono a gruppi di

nodi via via più grandi, quindi le partizioni intermedie possono essere viste come

massimi locali della modularità a scale differenti.

Capitolo 3: Applicazione alle reti acquedottistiche

25

CAPITOLO 3: APPLICAZIONE ALLE RETI ACQUEDOTTISTICHE

Nell'ambito delle reti di distribuzione di acqua si definisce

distrettualizzazione la tecnica di suddividere un’intera rete in distretti omogenei,

territorialmente raccolti e con caratteristiche idrauliche simili al fine di migliorare la

gestione e la manutenzione della rete.

La distrettualizzazione si ottiene sia in sede di progetto di una rete ex novo, sia

ove sia necessario procedere alla distrettualizzazione di una rete esistente,

individuando il confine della stessa e i punti di ingresso (ed eventualmente d'uscita)

della risorsa idrica.

La distrettualizzazione può essere utile per:

• individuare e delimitare zone con livello piezometrico differente;

• definire punti di misura per ottimizzare la ricerca di perdite;

• facilitare la determinazione del bilancio idrico di una rete;

• incrementare l'acqua contabilizzata agli utenti;

• isolare porzioni di rete nel caso di rotture o inquinamento per cause

esterne.

La distrettualizzazione è una tecnica innovativa che rivoluziona l'approccio

tradizionale che prevedeva sistemi di distribuzione idrica estesi a tutto il territorio

urbano. L'approccio tradizionale, che offre innegabili vantaggi in termini di elasticità

di funzionamento e facilità nella progettazione dell'estendimento delle reti, comporta

un meno efficiente controllo del sistema idrico e insormontabili difficoltà nel

monitoraggio puntuale delle perdite idriche.

Lo studio della distrettualizzazione delle reti acquedottistiche utilizzando la teoria

delle reti complesse pare possible, anche se quest’approccio non è ancora mai stato

utilizzato. Per dimostrarlo, si è scelto di analizzare una rete molto utilizzata nello


26

studio del comportamento e dell’ottimizzazione delle reti idriche, alla cui città è

stato dato il nome di Anytown. Una volta verificato che i risultati ottenuti fossero

significativi, si è deciso di analizzare una rete acquedottistica simile ad una tipica

rete relamente in esercizio, chiamata nel seguito rete di Realtown.

Per condurre questo studio, sono stati ricavati i file di testo in cui sono contenute

le portate che descrivono queste due reti al variare delle ore del giorno (un file per

ogni ora), utilizzando degli script che si basano sui comnponenti di cui sono

composte le reti (tubazioni, pompe, serbatoio,...).

In seguito i file delle portate sono stati analizzati attraverso il sito

http://www.netcom-analyzer.org/ , realizzato dall’ ISI Foundation, mediante il quale

è possibile analizzare una qualsiasi rete complessa scegliendo tra vari metodi. Per

questo studio è stato scelto di utilizzare il metodo Louvain, a causa di suoi numerosi

vantaggi, già indicati nel capitolo 2.

Il sito fornisce come risultati dei documenti di testo nei quali ognuna delle righe

rappresenta una comunità e su di essa sono indicati i numeri identificativi dei nodi

che ne fanno parte. Il sito restituisce un file per ogni passaggio del metodo Louvain,

fornendo quindi la possibilità di studiare la rete a diversi livelli.

Infine questi file hanno permesso di calcolare mediante il programma ‘Matlab’ la

modularità e la mutual information riguardanti le varie configurazioni e di

visualizzare l’evoluzione delle comunità evidenziandole con colori differenti

direttamente utilizzando le coordinate dei nodi sulla mappa topologica.


27

3.1 Anytown:

3.1.1 Descrizione generale:

L'obiettivo degli studi che sono stati fin qui eseguiti sulla rete della città di

Anytown (USA) è stato quello di individuare la combinazione di tubazioni, pompe e

serbatoi economicamente più efficace per rafforzare un’ipotetica rete esistente per

soddisfare le richieste previste, tenendo conto sia dei costi di costruzione che dei

costi di gestione.

La città si è sviluppata attorno ad un centro storico situato a sud del nodo 7, dove

gli scavi sono più difficili da effettuare e di conseguenza sono più costosi. C'è una

zona residenziale circostante, con alcune industrie vicino sl nodo 15 e un nuovo

parco industriale da sviluppare a nord. L'acqua viene pompata nel sistema da un

impianto di trattamento delle acque per mezzo di tre pompe identiche collegate in

parallelo a monte del nodo 1. Nello studio di Anytown sono utilizzate le unità di

misura americane.

Figura 10:

Rete idrica di Anytown.


28

I due serbatoi esistenti funzionano con livelli d'acqua compresi tra 225 e 250 ft,

per una capacità effettiva di 156250 gal per ogni serbatoio. Il volume d’acqua

compreso tra 215 e 225 ft, corrispondente ad un volume di 62.500 gal per ogni

serbatoio, viene riservato per esigenze di emergenza. Una pressione minima di

almeno 40 psi deve essere fornita in tutti i nodi in corrispondenza di una portata pari

a quella media giornaliera e in condizioni di picco istantaneo, in cui la portata è pari

a 1,8 volte quella media giornaliera.

Condizioni di carico:

nodo quota

portata media giornaliera

(ft) (gpm) 1 20 500 2 50 200 3 50 200 4 50 600 5 50 500 6 50 500 7 50 500 8 50 1000 9 50 500 10 50 500 11 120 400 12 120 400 13 80 400 14 120 400 15 120 1000 16 120 400

3.1.2 Analisi delle comunità, modularità e mutual information:

I risultati ottenuti con l’analisi dei file delle portate di Anytown sono

interessanti e soprattutto consentono di ipotizzare una buona riuscita

delle stesse analisi su una rete acquedottistica reale e quindi molto più

vasta. Dalle immagini riportate nel seguito si può infatti osservare come


29

le comunità rilevate sia ben riconoscibili le une dalle altre e si può anche

dire che fisicamente abbiano senso, cioè che rappresentino realmente i

nodi tra i quali vi è una maggiore comunicazione.

Le comunità variano in funzione dell’ora del giorno, in quanto variano le portate

che si trasmettono tra i vari nodi della rete.

Il numero di comunità rilevate è diverso a seconda dell’ora del giorno

considerata, come si può osservare dal seguente grafico:

Essendo la rete di Anytown piccola (18 nodi), l’algoritmo di analisi delle

comunità completa il suo processo in un unico passaggio e i risultati sono mostrati

nelle seguenti immagini:

0

1

2

3

4

5

6

7

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

numero di comunità

Figura 11:

Grafico che riporta il numero i comunità rilevate al variare delle ore del giorno.


30

• Ora 1:

• Ora 2:


31

• Ora 3:

• Ora 4:


32

• Ora 5:

• Ora 6:


33

• Ora 7:

• Ora 8:


34

• Ora 9:

• Ora 10:


35

• Ora 11:

• Ora 12:


36

• Ora 13:

• Ora 14:


37

• Ora 15:

• Ora 16:


38

• Ora 17:

• Ora 18:


39

• Ora 19:

• Ora 20:


40

• Ora 21:

• Ora 22:


41

• Ora 23:

• Ora 24:


42

Quanto più il valore della modularità che le varie distrettualizzazioni assumono è

elevato, più significa che l’analisi delle comunità è efficace e che le stesse comunità

trovate sono delle suddivisioni teoriche che ben rappresentano il comportamento

reale della rete. Di seguito si riporta il valore della modularità delle

distrettualizzazioni alle varie ore del giorno:

ora modularità

ora Modularità 1 0,4647

13 0,5175 2 0,4645

14 0,5144 3 0,4893

15 0,5357 4 0,4878

16 0,5321 5 0,4888

17 0,5270 6 0,5151

18 0,4955 7 0,5132

19 0,4935 8 0,5120

20 0,4924 9 0,5175

21 0,4671 10 0,5151

22 0,4661 11 0,5141

23 0,4718 12 0,5112

24 0,4691

0,4200

0,4400

0,4600

0,4800

0,5000

0,5200

0,5400

0,5600

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

modularità

Figura 12:

Grafico che riporta i valori di modularità al variare delle ore del giorno.


43

Per quanto riguarda invece la mutual information, calcolata tra le configurazioni

di due ore successive, a seconda delle ore del giorno assume i seguenti valori:

ora mutual

information

ora mutual

information I I norm

I I norm 1-2 0,6512 1,0000

13-14 0,6571 1,0000 2-3 0,6180 0,9937

14-15 0,6571 1,0000 3-4 0,5927 1,0000

15-16 0,6571 1,0000 4-5 0,5927 1,0000

16-17 0,6571 1,0000 5-6 0,5927 1,0000

17-18 0,5848 0,8941 6-7 0,5927 1,0000

18-19 0,6512 1,0000 7-8 0,5927 1,0000

19-20 0,6512 1,0000 8-9 0,5927 1,0000

20-21 0,6512 1,0000 9-10 0,5927 1,0000

21-22 0,6512 1,0000 10-11 0,5927 1,0000

22-23 0,6512 1,0681 11-12 0,3898 0,6267

23-24 0,5681 1,0000 12-13 0,6121 0,9358

24-1 0,4851 0,7957

Si nota che ci sono alcuni periodi durante il giorno in cui le comunità continuano

a essere identiche a quelle dell’ora precedente (Inorm=1), alcune ore in particolare in

cui avviene un cambiamento delle comunità e anche un’ora (ora 23) in cui due

comunità dell’ora precedente si uniscono a formarne una unica (Inorm>1).

0,0000

0,2000

0,4000

0,6000

0,8000

1,0000

1,2000

1-2

2-3

3-4

4-5

5-6

6-7

7-8

8-9

9-1

0

10

-11

11

-12

12

-13

13

-14

14

-15

15

-16

16

-17

17

-18

18

-19

19

-20

20

-21

21

-22

22

-23

23

-24

24

-1

mutual information

I Inorm

Figura 13:

Grafico che riporta i valori mutual information e mutual information normalizzata al

variare delle ore del giorno.


44

3.2 Realtown:

3.2.1 Descrizione generale:

Il fabbisogno idrico complessivo di Realtown è assicurato da una produzione

locale, alla quale concorrono alcuni pozzi situati sul territorio comunale, e da un a

fornitura integrativa tramite un colegamento con l’impianto di un comune limitrofo.

La rete di distribuzione può essere vista come suddivisa in tre zone:

• La rete bassa che si estende intorno alla zona industriale, avente quote di p.c.

fra 290 e 330 m s.l.m..

• La rete media che si estende attorno al centro storico, avente quote di p.c. fra

330 e 400 m s.l.m..

• La rete alta, avente quote di p.c. fra 400 e 485 m s.l.m..

Figura 14:

Rete di Realtown


45

L’impianto principale, denominato Impianto 1, ha quota p.c. di 310 m s.l.m. ed è

situato a Sud-Est del territorio comunale. Esso è formato da cinque pozzi di cui tre,

denominati G11, G12 e G13, immettono la loro produzione di circa 85 l/s nella rete

di distribuzione; i restanti due, denominati G14 e G15, immettono la loro produzione

di circa 70 l/s in un serbatoio di accumulo.

Nel medesimo serbatoio viene anche accumulata la fornitura integrativa proveniente

dall’impianto di un comune vicino, per compensare la produzione locale

insufficiente.

Una stazione di risollevamento, composta da tre elettropompe, alimenta la rete di

distribuzione bassa ed il serbatoio seminterrato di compenso, denominato Serbatoio

2 (quota p.c. di 371,8 m s.l.m.), situato a Sud-Ovest del territorio comunale; a

quest’ultimo è collegata una elettropompa di risollevamento che fornisce, in caso di

necessità, un contributo alla rete media.

Ad alimentare la rete di distribuzione bassa contribuisce anche, con una

produzione complessiva di circa 30 l/s, l’Impianto 3 (quota p.c. di 330 m s.l.m.);

esso, situato nella zona Nord del territorio comunale, comprende due pozzi,

denominati G61 e G62, ed un serbatoio pensile di compenso (quota p.c. di 340 m

s.l.m.), attualmente fuori servizio.

La rete di distribuzione bassa alimenta la Stazione di sollevamento 3 (quota p.c.

di 364 m s.l.m.), situata nel centro storico di Realtown e comprendente due

elettropompe di risollevamento, denominate M31 e M32. Questa stazione immette

una portata di circa 50 l/s sulla rete di distribuzione media e tramite essa alimenta il

serbatoio dell’Impianto 4.

L’Impianto 3 (quota p.c. di 378 m s.l.m.), situato a Ovest del territorio comunale,

è formato da tre pozzi, denominati G51, G52 e G53, e la sua produzione

complessiva di 60 l/s alimenta il Serbatoio 4.

L’Impianto 4 (quota p.c. di 416,9 m s.l.m.), situato a Ovest del territorio

comunale, comprende un serbatoio di accumulo, suddiviso in tre vasche, e una

stazione di risollevamento (Stazione di sollevamento 4). Alimentato dall’Impianto 2

e dalla Stazione di sollevamento 3 immette sia nella rete di distribuzione media, che


46

nella rete di distribuzione alta fino al Serbatoio 5 (quota p.c. di 488,5 m s.l.m.);

l’alimentazione della rete alta, ad una portato di circa 20 l/s, avviene tramite una

stazione di risollevamento composta da due elettropompe denominate M41 e M42.

I processi tipici di ogni singolo sottoimpianto sono controllati da automazioni

locali collegate in rete al Centro di gestione dove le informazioni principali sono

acquisite, visualizzate tramite una stazione PC di supervisione impianti a

disposizione del personale addetto alla conduzione e manutenzione, e inviate al

Servizio TLC per l’acquisizione dei paramentri di esercizio e degli allarmi.

3.2.2 Descrizione delle fasi di processo:

Il processo di produzione dell’impianto di Realtown è costituito da una serie di

fasi successive, descritte dettagliatamente nel seguito. Ad esse fanno riferimento i

Manuali Operativi ed i dicumenti per la gestione e registrazione delle attività

dell’impianto.

• Fase di processo di tipo A – Approvvigionamento:

Alla fase d’approvvigionamento concorrono alcuni pozzi distribuiti sul territorio

comunale. I pozzi sono di seguito elencati e suddivisi secondo le aree di

appartenenza.

o Impianto 1:

pozzo profondità

colonna diametro colonna portata

(m) (mm) (l/s)

G11 (120) 25

G12 160 da 0 a 99,80 m: 600

40 da 99,80 a 160 m: 450

G13 203 da 0 a 102 m: 600

28 da 102 a 203 m: 400

G14 (150) 24

G15 150 400 38


47

o Impianto 2:

pozzo profondità

colonna diametro colonna Portata

(m) (mm) (l/s)

G51 135,80 400 18

G52 (150) -600 20

G53 200 da 0 a 114,30 m: 600

14 da 114,30 a 200 m: 400

o Impianto 3:

pozzo profondità

colonna diametro colonna Portata

(m) (mm) (l/s)

G61 200 600 25

G62 213 da 0 a 91,70 m: 600

40 da91,70 a 213 m: 400

• Fase di processo di tipo B – Adduzione:

Per adduzione s’intende tutto il sistema di trasporto dell’acqua, all’interno delle

aree di produzione, dai punti di approvvigionamento fino alla consegna alla rete di

distribuzione.

Sono comprese nel processo condotte e tubazioni con relative apparecchiature di

controllo quali valvole e saracinesche necessarie alla regolazione e intercettazione

dei flussi.

• Fase di processo di tipo G – Filtrazione:

L’impianto è costituito da due unità filtranti installate presso l’Impianto 1,

contenenti carbone attivo granulare.

Idraulicamente sono allacciate in modo da intercettazre il flusso proveniente dal

pozzo G11 prima dell’immissione nella rete.


48

La capacità complessiva di trattamento è di circa 50 l/s ed è impiegato per la

rimozione dei composti organoalogenati.

Ogni unità è formata da un filtro cilindrico in acciaio di diametro 4160 mm ed

altezza 2040 mm che contiene uno strato di carbone attivo granulare che costituisce

lo strato attivo del sistema.

La ripartzione del flusso tra le due unità avviene tramite le saracinesche di

regolazione. I filtri lavorano alla pressione di rete ed eventuale aria formatasi

durante il processo è fatta evacuare dagli sfiati superiori.

Quando la capacità di adsorbimento del carbone attivo è esaurita viene sostituito:

per estrarlo si utlizza acqua in pressione prelevata dalla rete, mentre l’immissione

avviene a secco attraverso il passo d’uomo predisposto alla sommità del filtro. La

manovra delle saracinesche avviene manualmente.

• Fase di processo di tipo H – Disinfezione finale:

Negli impianti 1, 3 e 4 si usa, per la disinfezione finale delle acque potabili,

ipoclorito di sodio.

Per l’Impianto 1 la fase avviene: per la produzione dei pozzi G12 e G13 tramite

impianto di dosaggio, uno per pozzo, con punto di immissione direttamente sulla

condotta in uscita; per quanto riguarda la produzione dei pozzi G14 e G15 tramite un

impianto di dosaggio a portata variabile, con punto d’immissione direttamente nel

serbatoio di accumulo.

Nell’Impianto 3 la fase di disinfezione finale avviene tramite impianto di

dosaggio, uno per pozzo, con punto di immissione direttamente sulla condaotta in

uscita.

Per l’Impianto 4 la fase di disinfezione finale avviene tramite impianto di

dosaggio a portata variabile, con punto di immissione sulla condotta in ingresso al

serbatoio.


49

• Fase di processo di tipo I – Accumulo acque in serbatoio:

I serbatoi sono vasche di accumulo per l’acqua trattata o in arrivo da impianti di

risollevamento la cui funzione principale è di compensare la differenza di portata tra

l’acqua prodotta o distribuita e l’acqua richiesta dall’utenza.

I serbatoi hanno dimensioni costruttive in funzione delle portate degli impianti e

dell’uso a cui sono destinati.

La tabella che segue riporta i serbatoi utilizzati per l’acquedotto di Realtown:

serbatoi capacità altezza utile quota sfioro

(m3) (m) (m s.l.m.)

Serbatoio 1 2000 4,00 314,00

Serbatoio 2 800 5,00 375,80

Serbatoio 3 180 7,00 377,00

Serbatoio 4 10000 7,20 424,10

Serbatoio 5 100 4,00 492,50

• Fase di processo di tipo L – Secondo sollevamento:

La rete di distribuzione acqua potabile è rifornita da quattro stazioni di

risollevamento:

o Stazione di sollevamento 1:

La stazione di risollevamento risulta composta da quattro elettropompe collegate

idraulicamente al serbatoio seminterrato.

denominazione Tipo Prevalenza Portata

(m3) (l/s)

M16 elettropompa asse

orizzontale 88 50


orizzontale 88 50


orizzontale 88 50


50


(m3) (l/s)


orizzontale 90 60


La stazione di risollevamento comprende un’elettropompa collegata

idraulicamente al serbatoio seminterrato.


(m3) (l/s)


orizzontale 50 25


La stazione di risollevamento comprende due elettropompe alloggiate in due

vasche di forma cilindrica in acciaio, collegate idraulicamente alle reti bassa e

media.


(m3) (l/s)

M31 elettropompa sommersa 50 67



La stazione di risollevamento comprende due elettropompe alloggiate in una

vasca di forma cilindrica in acciaio, collegata idraulicamente al serbatoio.


(m3) (l/s)




51

3.2.3 Analisi delle comunità, modularità e mutual information:

I risultati che si ottengono dall’analisi dei file delle portate nella rete

risultano essere molto interessanti. Dalle immagini riportate nel seguito

si può infatti osservare come le comunità rilevate sia molto spesso ben

riconoscibili le une dalle altre e ciò permette di affermare che la rete è

suddivisibile in distretti che a loro volta si comportano quasi come delle

reti indipendenti gli uni dagli altri. Come già accaduto durante l’analisi

di Anytown, le comunità variano in funzione dell’ora del giorno, in

quanto variano le portate che si trasmettono tra i vari nodi della rete. Il

numero di comunità rilevate è notevole e varia nel corso della giornata,

come indicato dal seguente grafico:

Essendo molto grande il numero di nodi della rete di Realtown (3775),

l’algoritmo di analisi delle comunità completa il suo processo in tre passaggi (un

numero comunque molto limitato) e quello più interessante è l’ultimo, con il quale si

20

22

24

26

28

30

32

34

36

38

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

numero di comunità

Figura 15:

Grafico che riporta il numero i comunità rilevate al variare delle ore del giorno.


52

identificano in modo preciso le distrettualizzazioni della rete acquedottistica. Inoltre

vista la grande quantità di dati, non è possibile rapprensentare sulla mappa fisica

tutte le comunità con colori diversi, quindi si è scelto di rappresentare soltanto quelle

che, alle varie ore del giorno, sono le quattordici comunità più grandi, cioè quelle

che comprendono il maggior numero di nodi. Si è infatti notato che

rappresentandone quattordici (con ogni colore sono rappresentate due comunità)

quasi tutti i nodi della rete risultano rappresentati (i punti piccoli neri indicano i nodi

della rete che non rientrano in queste comunità).

• Ora 1:


53

• Ora 2:

• Ora 3:


54

• Ora 4:

• Ora 5:


55

• Ora 6:

• Ora 7:


56

• Ora 8:

• Ora 9:


57

• Ora 10:

• Ora 11:


58

• Ora 12:

• Ora 13:


59

• Ora 14:

• Ora 15:


60

• Ora 16:

• Ora 17:


61

• Ora 18:

• Ora 19:


62

• Ora 20:

• Ora 21:


63

• Ora 22:

• Ora 23:


64

• Ora 24:

La modularità che le varie distrettualizzazioni assumono risulta avere un valore

molto elevato e ciò significa che l’analisi delle comunità è efficace e che le stesse

comunità trovate sono delle suddivisioni teoriche che ben rappresentano il

comportamento reale della rete. Di seguito si riporta il valore della modularità delle

distrettualizzazioni alle varie ore del giorno:

ora modularità

ora Modularità 1 0,9573

13 0,9592 2 0,9579

14 0,9612 3 0,9583

15 0,9593 4 0,9567

16 0,9598 5 0,9680

17 0,9673 6 0,9567

18 0,9553 7 0,9554

19 0,9618 8 0,9610

20 0,9643 9 0,9611

21 0,9641 10 0,9565

22 0,9535 11 0,9572

23 0,9591 12 0,9570

24 0,9704


65

Per quanto riguarda invece la mutual information, calcolata tra le

distrettualizzazioni di due ore successive, si nota che al variare del tempo assume i

seguenti valori:

ora mutual

information

ora mutual

information I I norm

I I norm 1-2 0,9050 0,6461

13-14 1,1413 0,8161 2-3 1,3809 0,9071

14-15 1,1498 0,8040 3-4 1,2961 0,8512

15-16 1,3756 1,0125 4-5 1,2634 0,8368

16-17 0,9829 0,7464 5-6 1,2007 0,8001

17-18 1,0904 0,7709 6-7 1,3595 0,9358

18-19 1,2925 0,9230 7-8 1,0858 0,7651

19-20 1,2318 0,9332 8-9 1,2964 0,9385

20-21 1,1762 0,9016 9-10 1,1223 0,8482

21-22 1,0190 0,7540 10-11 1,0899 0,7840

22-23 1,1131 0,7941 11-12 1,3387 0,9563

23-24 1,2178 0,9102 12-13 1,1015 0,8017

24-1 1,0164 0,8046

0,9450

0,9500

0,9550

0,9600

0,9650

0,9700

0,9750

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

modularità

Figura 16:

Grafico che riporta i valori di modularità al variare delle ore del giorno.


66

Si nota come le comunità non sono mai esattamente identiche al variare delle ore

del giorno, ma ciò è dovuto al fatto che la rete è molto vasta. Però la mutual

information normalizzata assume valori sufficientemente elevati, quindi si può

affermare che la distrettualizzazione varia a seconda delle ore del giorno, ma

presenta anche delle caratteristiche che si ripetono e permettono quindi di ricavare

informazioni importanti sul comportamento della rete stessa.

0,0000

0,2000

0,4000

0,6000

0,8000

1,0000

1,2000

1,4000

1,60001

-2

2-3

3-4

4-5

5-6

6-7

7-8

8-9

9-1

0

10

-11

11

-12

12

-13

13

-14

14

-15

15

-16

16

-17

17

-18

18

-19

19

-20

20

-21

21

-22

22

-23

23

-24

24

-1

mutual information

I Inorm

Figura 17:

Grafico che riporta i valori mutual information e mutual information normalizzata al

variare delle ore del giorno.

Conclusione

67

CONCLUSIONE

I risultati ottenuti con l’analisi della rete di Anytown e soprattutto di quella di

Realtown sono molto interessanti, in quanto permettono di affermare che è possibile

applicare la teoria delle reti complesse per capire come le reti acquedottistiche sono

distrettualizzate, in base alle portate che scorrono al loro interno, e basandosi sui

valori di poche variabili in grado di descrivere bene il comportamento della rete

quali la modularità e la mutual information.

La distrettualizzazione delle reti idriche ha una notevole importanza dal punto di

vista della gestione delle reti stesse, in quanto facilita notevolmente l’individuazione

delle perdite e rende così possibile un intervento più efficace mediante la

regolazione delle pressioni oppure con la sostituzione delle tubazioni più degradate.

La distrettualizzazione permette inoltre un più completo monitoraggio del bilancio

idrico e delle prestazioni della rete e consente inoltre di intervenire con interruzioni

locali in caso di presenza di sostanze inquinanti che potrebbero altrimenti estendersi

a tutta la rete.

Infine l’individuazione dei distretti in cui è suddivisa una rete acquedottistica può

essere utile anche in fase di progetto di una nuova rete o di ampliamento di una già

esistente. È infatti possibile svolgere delle simulazioni utilizzando gli stessi metodi

già descritti per prevedere il futuro comportamento dei distretti e quindi

eventualmente anche apportare delle modifiche alla rete ipotizzata.

Bibliografia e webgrafia

68

BIBLIOGRAFIA

• Fortunato S., “Community detection in graphs”, Physics Reports 486 (2010)

pagine 75-174

• Blondel V. D., Guillaume J., Lambiotte R., Lefebvre E., “Fast unfolding of

communities in large networks”, Journal of Statistical Mechanics: Theory

and Experiment

• Walski T., Brill E., Gessler J., Goulter I., Jeppson R., Lansey K., Lee

H., Liebman J., Mays L., Morgan D., Ormsbee L. (1987). ”Battle of the

Network Models: Epilogue.” J. Water Resour. Plann. Manage., 113(2),

pagine 191–203.

WEBGRAFIA

• http://it.wikipedia.org/wiki/Teoria_dei_grafi

• http://gbgb.altervista.org/Web_progepi/appunti/le_strutture_dati.htm

• http://it.wikipedia.org/wiki/Problema_dei_ponti_di_Königsberg

• http://www.cfinder.org

• http://it.wikipedia.org/wiki/Distrettualizzazione

• http://www.netcom-analyzer.org

Documents

Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle reti complesse