161
SEMEION CENTRO RICERCHE DI SCIENZE DELLA COMUNICAZIONE Rapporto di Ricerca Anno 2008

Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

Embed Size (px)

Citation preview

Page 1: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

SEMEION

CENTRO RICERCHE DI SCIENZE DELLA COMUNICAZIONE

Rapporto di Ricerca

Anno 2008

Page 2: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

4

Il Rapporto annuale di Ricerca è a cura di: Guido Maurelli

Hanno collaborato i ricercatori del Semeion: Massimo Buscema, Giulia Massini, Stefano Terzi,

Marco Intraligi, Massimiliano Capriotti, Riccardo Petritoli.

Copyright © 2009 Semeion Centro Ricerche di Scienze della Comunicazione

Via Sersale, 117 ~ 00128 Roma, Italy e-mail: [email protected]

web: www.semeion.it

Page 3: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

5

Indice

1. Presentazione del Semeion 7

1.1 Componenti del Semeion 13 1.2 I campi d’interesse della ricerca 19

2. Ricerca di base e sperimentale: scoperte, brevetti e

software 21 2.1 Reti AutoAssociate non lineari 24 2.2 Clustering Dinamico sulle Traiettorie di Datasets 30 2.3 Semantica dello spazio: Topological Weight

Centroid (TWC) 37 2.4 AutoClustering (AutoCL) 47 2.5 Active Connection Matrix: una nuova rete H-Net 52 2.6 Implicit Function As Squashing Time (IFAST):

evoluzioni 57 2.7 Probabilistic Function As Squashing Time (PFAST) 62 2.8 General Unsupervised Adaptive Algorithm for

Modular Organization of Learning Evolution (GUACAMOLE) 66

2.9 Meta-Classificatori: evoluzioni 74 2.10 AutoSelf Organizing Map (AutoSOM) 78 2.11 Nuove versioni e nuovi software del 2008 84

3. Ricerca applicata: progetti e software applicativi 93

3.1 Biomedicale settore Imaging 97 3.1.1 Applicazione della rete J-NET su Lung

Image Database Consortium (LIDC) 97 3.1.2 Procedura automatica per la generazione di

finestre su immagini con microcalcificazioni: DB CALMA 101

3.1.3 Identificazione automatica di aree d’interesse per l’identificazione di masse tumorali 104

3.1.4 Stima delle caratteristiche morfologiche dei noduli sul Lung Image Database Consortium (LIDC) 108

Page 4: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

6

3.2 Biomedicale settore clinico 112 3.2.1 Corsi di formazione sull’Intelligenza

Artificiale per medici specialisti 112 3.2.2 Classificazione di pazienti Alzheimer

tramite l’analisi delle proteine nel sangue 116 3.2.3 Applicazione delle Reti Neurali per

l’identificazione precoce della mortalità in pazienti affetti da sanguinamento gastrointestinale 120

3.2.4 Applicazione delle Reti Neurali per l’uso appropriato della endoscopia 123

3.3 Social Security 127 3.3.1 Analisi e previsione della concentrazione di

gas sulla base di sistemi di nanosensori 127 3.4 Industria, marketing e mondo del lavoro 131

3.4.1 Reti Neurali per la classificazione di fumatori sulla base di analisi cliniche e variabili socio-anagrafiche 131

3.4.2 Analisi e simulazione dinamica dei comportamenti di consumo 134

4. Pubblicazioni scientifiche 138 5. Attività di formazione 154 6. Collaborazioni e brevetti 156

6.1 Collaborazioni e cooperazioni istituzionali 156 6.2 Elenco dei brevetti 159

7. Partecipazione a conferenze e convegni 162

Page 5: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

7

1. Presentazione del Semeion Il Centro Ricerche Semeion è un Ente Scientifico senza scopo di

lucro, fondato nel 1985, con personalità giuridica riconosciuta nel 1991 dal Ministero dell’Università e della Ricerca (MIUR). Dal 2005 è diventato Istituto Scientifico Speciale del MIUR.

L’attività istituzionale del Semeion è suddivisa in tre ambiti: - ricerca di base e sperimentale nel campo dell’intelligenza

artificiale, volta a scoprire e sperimentare nuovi modelli matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi;

- ricerca applicata effettuata attraverso la realizzazione di progetti in biomedicina, sicurezza sociale, imaging, economia e finanza;

- formazione di giovani ricercatori, attraverso corsi, seminari e stage, nel campo dell’intelligenza artificiale con particolare attenzione ai nuovi modelli di Reti Neurali Artificiali e Algoritmi Evolutivi e alle procedure di applicazione per risolvere problemi complessi.

L’attività di ricerca sviluppata in ognuno di questi tre ambiti si concretizza in tre diversi modi.

La ricerca di base e sperimentale produce scoperte che vengono diffuse nella comunità scientifica tramite la pubblicazione di articoli scientifici e libri, e che spesso pongono le basi per la registrazione di brevetti.

La ricerca applicata porta alla realizzazione di progetti in diversi campi applicativi, nei quali i Sistemi Artificiali Adattivi contribuiscono all’acquisizione di nuove conoscenze e di know-how. I progetti più innovativi e competitivi diventano brevetti sfruttabili dal mondo dell’industria.

La formazione si realizza attraverso corsi, seminari e stage, che consentono a neolaureati in diverse discipline (informatica, ingegneria, fisica, matematica, medicina, statistica, ecc.) di acquisire nuove competenze nell’ambito del vasto campo dell’Intelligenza Artificiale.

Lo schema seguente illustra le diverse ramificazioni dell’attività di ricerca scientifica del Semeion.

Page 6: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

8

Nell’organizzazione generale delle attività di ricerca il tempo

dedicato alla ricerca di base e sperimentale corrisponde a circa il 60% delle risorse umane in organico al Semeion. Le scoperte e il software di ricerca, che viene parallelamente sviluppato a scopo sperimentale, i

At

tività

di R

icer

ca

del S

emei

on

Ric

erca

di B

ase

e S

perim

enta

le

Ric

erca

App

licat

a Fo

rmaz

ione

Scop

erte

e

Brev

etti

Softw

are

di

Ric

erca

Pu

bblic

azio

ni

Arti

coli

scie

ntifi

ci

Libr

i Parte

cipa

zion

e a

conv

egni

Prog

etti

e

Softw

are

appl

icat

ivo

Sem

inar

i C

orsi

St

age

Page 7: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

9

brevetti e le pubblicazioni scientifiche, sia libri che articoli scientifici, sono gli oggetti con i quali la ricerca di base comunica i risultati del proprio lavoro alla comunità scientifica. La partecipazione a conferenze e convegni, inoltre, misura il livello di interesse che la comunità scientifica attribuisce al lavoro svolto dai ricercatori del Semeion.

La ricerca applicata, che può essere definita come un insieme di procedure organizzate al fine di verificare il dominio di validità e l’utilità di una teoria, dipende dalla ricerca di base. Ha il compito di verificare la possibilità di sviluppare tecnologie che abbiano la consistenza dei prototipi. Misura il grado di applicazione di una teoria sul piano della sua utilità economica e sociale. Durante l’attività di ricerca applicata si realizzano progetti che portano alla costruzione prototipi. All’interno del Semeion l’attività di ricerca applicata impegna circa il 30% delle risorse umane.

La formazione, infine, che comprende anche gli stage formativi, nella pianificazione delle attività istituzionali del Semeion, si può definire un’attività di divulgazione scientifica, con intento didattico. Ha lo scopo di formare i nuovi ricercatori nel campo dell’Intelligenza Artificiale e occupa circa il 10% delle risorse umane del Semeion.

L’equipe del Semeion è composta globalmente da 22 persone. Il nucleo centrale è composto di 8 ricercatori di provenienza multidisciplinare: informatici, ingegneri, fisici, economisti e medici. Ognuno è impegnato, con diversi livelli di coinvolgimento, nella ricerca di base e applicata. A questi si aggiungono 6 ricercatori associati e 6 research fellows, che collaborano a distanza all’attività del Centro. Altre due persone gestiscono l’amministrazione e la segreteria, lo studio M&D si occupa delle relazioni esterne.

Nel corso di questi ultimi anni il lavoro dei ricercatori del Semeion ha prodotto numerose scoperte nel campo dell’Intelligenza Artificiale, alcune delle quali sono state brevettate in collaborazione con aziende interessate al loro sfruttamento economico. Nei laboratori del Semeion sono stati ideati, progettati e sperimentati nuovi modelli di Sistemi Artificiali Adattivi (Reti Neurali, Algoritmi Evolutivi, Sistemi di analisi e pre-processamento dei dati), e sono stati sviluppati programmi informatici finalizzati alla sperimentazione di questi modelli. Fino al 2008 l’attività di ricerca si è concretizzata in oltre 200 pubblicazioni di articoli scientifici su riviste internazionali, 20 libri monografici e 14 brevetti internazionali.

Page 8: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

10

Dal 2007 si è costituito un Comitato Tecnologico Scientifico, composto da diverse personalità del mondo della ricerca, sia di ambito pubblico che privato. Il Comitato si riunisce due volte l’anno e ha una funzione consultiva nell’ottica di contribuire ad orientare l’attività di ricerca di base e applicata che il Semeion svolge. L’organigramma dei componenti del Semeion è così strutturato.

Page 9: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

11

Dir

ett

ore

Prof.

Mas

sim

o B

usc

ema

Com

itato

Tecn

olo

gic

o S

cien

tifi

co

Dr.

C. S

ande

ls N

avar

roPr

of. P

L. S

acco

Pro

f. R

. Pas

sarie

lloD

r. F.

Naz

zari

Dr.

E. G

ross

iD

r. L.

Cris

cuol

i

Prof

. A. C

ollin

aD

r. M

. Chi

eli

Dr.

A. B

ettin

iPr

of. F

. Bel

tram

e

Rela

zion

i p

ub

blich

e

e ist

itu

zio

nali

Ric

erc

a d

i b

ase

e s

peri

men

tale

Ric

erc

aap

plica

ta

Ric

erc

ao

rgan

izza

zio

ne

e c

om

un

icazi

on

e

Ric

erc

ato

riass

oci

ati

Rese

arc

hfe

llo

ws

Prof.

M.

Busc

ema

Dr.

ssa

G.

Mas

sini

Ing.

S.

Ter

ziIn

g.

M.

Bre

da

M.

Intr

alig

iD

r. M

. Cap

riott

iIn

g.

R.

Pet

rito

li

Dr.

G.

Mau

relli

G.

Mag

istr

etti

Dr.

ssa

E.

Tes

ta

Ing.

G.

Catz

ola

Dr.

E.

Gro

ssi

Ing.

G.

Pier

iD

r. G

. Sal

ina

Dr.

V.

Carl

eiD

r. M

. Pi

zzio

l

Prof.

S.

Ein

stei

nPr

of.

PL.

Sac

coPr

of.

W.J

. Tast

leD

r. M

. Ram

azz

otti

St.

G.

Mon

aghan

Am

m.

R.

Fusc

o

Stu

dio

M&

DL.

M.

Her

cola

ni G

addi

Dir

ett

ore

Prof.

Mas

sim

o B

usc

ema

Com

itato

Tecn

olo

gic

o S

cien

tifi

co

Dr.

C. S

ande

ls N

avar

roPr

of. P

L. S

acco

Pro

f. R

. Pas

sarie

lloD

r. F.

Naz

zari

Dr.

E. G

ross

iD

r. L.

Cris

cuol

i

Prof

. A. C

ollin

aD

r. M

. Chi

eli

Dr.

A. B

ettin

iPr

of. F

. Bel

tram

e

Rela

zion

i p

ub

blich

e

e ist

itu

zio

nali

Ric

erc

a d

i b

ase

e s

peri

men

tale

Ric

erc

aap

plica

ta

Ric

erc

ao

rgan

izza

zio

ne

e c

om

un

icazi

on

e

Ric

erc

ato

riass

oci

ati

Rese

arc

hfe

llo

ws

Prof.

M.

Busc

ema

Dr.

ssa

G.

Mas

sini

Ing.

S.

Ter

ziIn

g.

M.

Bre

da

M.

Intr

alig

iD

r. M

. Cap

riott

iIn

g.

R.

Pet

rito

li

Dr.

G.

Mau

relli

G.

Mag

istr

etti

Dr.

ssa

E.

Tes

ta

Ing.

G.

Catz

ola

Dr.

E.

Gro

ssi

Ing.

G.

Pier

iD

r. G

. Sal

ina

Dr.

V.

Carl

eiD

r. M

. Pi

zzio

l

Prof.

S.

Ein

stei

nPr

of.

PL.

Sac

coPr

of.

W.J

. Tast

leD

r. M

. Ram

azz

otti

St.

G.

Mon

aghan

Am

m.

R.

Fusc

o

Stu

dio

M&

DL.

M.

Her

cola

ni G

addi

Page 10: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

12

L’equipe dei ricercatori del Semeion

Page 11: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

13

1.1 Componenti del Semeion Prof. Massimo Buscema (1955): Direttore della Ricerca. Computer

scientist, fa ricerca da anni sulle Reti Neurali Artificiali e sui Sistemi Artificiali Adattivi. È stato professore presso la University of Charleston (West Virginia-USA) e direttore del “Department of Science of Communications” della stessa università, è stato, inoltre, professore di “Informatica e Linguistica” presso l’Università di Perugia. Membro dell’Editorial Board di diverse riviste scientifiche internazionali. Ha ideato, costruito e sviluppato nuovi modelli e algoritmi d’intelligenza artificiale. È autore di numerose pubblicazioni scientifiche sugli aspetti teorici della Natural Computation con oltre 150 titoli: articoli scientifici, saggi e libri sullo stesso tema. Inventore di 14 brevetti internazionali.

Ricerca di Base e Sperimentale Dr.ssa Giulia Massini (1957): Ricercatore Senior, informatica, svolge

attività di ricerca sui Sistemi Artificiali Adattivi. Si occupa dell’applicazione della Neural Computation in prevalenza in ambito sociale e medico. Ha ideato e sviluppato nuovi algoritmi adattivi e software di ricerca, è autrice di numerose pubblicazioni scientifiche.

Ing. Stefano Terzi (1970): Ricercatore Senior, ingegnere elettronico, ha sviluppato software di ricerca implementando modelli di Reti Neurali Artificiali e di algoritmi evolutivi, per l’applicazione al campo medico e della sicurezza. Autore di diverse pubblicazioni scientifiche.

Ing. Marco Breda (1962): Ricercatore Senior, ingegnere elettronico, ha lavorato in importanti aziende nel settore delle telecomunicazioni (Telecom, Ericsson). Opera come ricercatore presso il Semeion dove si occupa di ricerca di base, contribuendo a diverse pubblicazioni e alla produzione di alcuni pacchetti applicativi.

Ricerca Applicata Marco Intraligi (1959): Ricercatore Senior, informatico, esperto in

tecniche di preprocessing ed elaborazioni di dati con i Sistemi Artificiali Adattivi. Autore di articoli scientifici sulle applicazioni di modelli artificiali nell’ambito della diagnostica clinica e dei sistemi di trattamento dell’imaging biomedicale.

Dr. Massimiliano Capriotti (1964): Ricercatore, informatico, esperto nell’applicazione dei modelli d’intelligenza artificiali al campo della sicurezza e della medicina. Autore di pubblicazioni scientifiche.

Page 12: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

14

Ing. Riccardo Petritoli (1970): Ricercatore, ingegnere elettronico, ha sviluppato software applicativi in ambito medico implementando modelli di Reti Neurali Artificiali. È esperto in tecniche di analisi di imaging biomedicale. Autore di pubblicazioni scientifiche.

Organizzazione e Comunicazione della Ricerca Dr. Guido Maurelli (1957): Ricercatore, laureato in lettere e filosofia,

Responsabile della comunicazione. È esperto nell’appli-cazione dei Sistemi Artificiali Adattivi al campo sociale. Ha pub-blicato articoli e saggi su libri e riviste scientifiche internazionali. Si occupa della divulgazione scientifica delle attività di ricerca del Semeion e della gestione dei progetti di ricerca applicata.

Dr.ssa Ester Testa (1972): segreteria organizzativa, laureata in Scienze Politiche, si occupa dell’organizzazione interna delle attività del Semeion.

Giancarlo Magistretti (1969): ragioniere, responsabile dell’am-ministrazione del Semeion.

Ricercatori Associati Ing. Gino Catzola (1953): Ricercatore Associato, ingegnere

elettronico, specializzato in Program Management, Computer Science, e Sistemi Dinamici Complessi. Ha lavorato per importanti aziende multinazionali per i mercati Difesa, Spazio, Telecomu-nicazioni (TIM, Digital Equipment, Alenia Spazio). Attualmente è in Telecom Italia. Collabora all’attività di ricerca del Semeion sui Sistemi Dinamici Complessi, Reti Neurali Artificiali e Intelligenza Artificiale.

Dr. Enzo Grossi (1951): Ricercatore Associato, medico, attualmente Direttore Medico della Bracco SpA, Dipartimento Farma Italia. Ha lavorato come manager nell’ambito della Ricerca e Sviluppo di diverse aziende multinazionali del settore medico farmaceutico (Menarini, Ciba Geigy, Beecham-Smith Kline & Beecham). Autore di circa 300 pubblicazioni scientifiche su riviste mediche. Membro di diverse società scientifiche e di board scientifici di riviste internazionali. Collabora all’attività di ricerca del Semeion, contribuendo attraverso numerose pubblicazioni.

Ing. Giovanni Pieri (1938): Ricercatore Associato, ingegnere chimico, attualmente è consulente per il trasferimento tecnologico presso imprese e enti pubblici. È stato direttore del Centro Ricerche G.

Page 13: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

15

Donegani (Montedison/ENI). Ha pubblicato articoli scientifici sulla fisica delle apparecchiature chimiche.

Dr. Vittorio Carlei (1972): Ricercatore Associato, Phd in economia, Ricercatore presso il DMQTE dell’Università di Chieti-Pescara, è Direttore della 2C-srl, una spin-off del Semeion, che opera nell’ambito della business innovation, applicando sistemi intelligenti in campo economico e finanziario per grandi gruppi bancari (Santander, Unicredit).

Prof. Gaetano Salina (1960): Ricercatore Associato, Primo Ricercatore dell’Istituto Nazionale di Fisica Nucleare, lavora nella sezione di Roma “Tor Vergata”. I suoi principali campi di interesse sono: computers massivamente paralleli, reti neuronali, elettronica digitale ed analogica (VLSI), meccanica statistica e teoria dei campi.

Dr. Marco Pizziol (1980): Ricercatore, laureato in fisica presso l’Università degli Studi di Roma “Tor Vergata”, lavora nell’ambito della ricerca e sviluppo di sistemi adattivi applicati in campo biomedico.

Research Fellows Prof. Stanley Einstein (1934): Psicologo clinico e sociale, da molti anni

specializzato nel campo delle tossicodipendenze, con particolare riferimento ai problemi di uso ed abuso di droghe. Autore di 14 libri, fondatore ed Editor in Chief della rivista internazionale sulle droghe “Substance Use & Misuse” pubblicata da oltre 40 anni, e di altre riviste su problemi sociali come “Violence, Aggression & Terrorism”. Direttore del Middle Eastern Summer Institute on Drug Use, Jerusalem.

Prof. Pierluigi Sacco (1964): Professore Ordinario di Politica Economica presso l’Università IUAV di Venezia. Prorettore alla Comunicazione e alle attività editoriali della IUAV. Scrive per il Sole24Ore. Ha pubblicato numerosi articoli e saggi scientifici nel campo della teoria economica, della teoria dei giochi e dell’economia della cultura.

Prof. William J. Tastle: Associate Professor presso la Ithaca College School of Business di New York, attualmente Managing Editor, dell’International Journal of General Systems, recentemente tiene corsi di: Database Applications in Business, Management Information Systems, Business Systems & Technology. La sua attività di ricerca è focalizzata su la modellizzazione dei sistemi complessi utilizzando interfacce visuali, e l’analisi dei sistemi aziendali complessi.

Page 14: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

16

Dr. Marco Ramazzotti (1969): Archeologo, Ricercatore presso la Cattedra di “Archeologia e Storia dell’Arte del Vicino Oriente Antico”, dell’Università di Roma La Sapienza. È stato fra i primi archeologi ad applicare modelli matematici (Reti Neurali, Algoritmi Evolutivi) allo studio di database archeologici, pubblicando diversi articoli su importanti riviste del settore.

St. Geoff Monaghan (1954): Ricercatore Associato, detective, ha lavorato 25 anni presso nella Metropolitan Police Service di Londra, Scotland Yard, con un’esperienza internazionale nelle strategie di contrasto al traffico di droga. Attualmente è consulente dell’United Nations Office on Drugs and Crime (UNODC) sede di Mosca.

Ammiraglio Roberto Fusco (1946): Ricercatore Associato, attualmente è ufficiale ammiraglio della Marina Militare in congedo. Ha percorso l’intera carriera di ufficiale di Stato Maggiore fino al massimo grado di Ammiraglio di Squadra. Laureato in “Scienze marittime e navali”, specializzato in “guerra elettronica” e “telecomunicazioni”. Ha assolto numerosi incarichi di comando navale. Dal 2007 collabora come esperto militare con il Semeion.

Comitato Tecnologico Scientifico Prof. Francesco Beltrame (1953): Professore Ordinario di Bioingegneria,

Dipartimento di Informatica, Sistemistica e Telematica della Facoltà di Ingegneria dell’Università degli Studi di Genova. Direttore del Dipartimento di Tecnologie dell’Informazione e delle Comunicazioni del CNR. Presidente del Comitato Tecnico Scientifico del MUR per la ricerca industriale (legge 297/99).

Dr. Andrea Bettini (1953): Manager e consulente di direzione, ha ricoperto ruoli dirigenziali in numerose aziende operanti in diversi settori: informatica, servizi, formazione professionale (Apple Computer Italia, Sodexho Pass, MrTed Italy, Irescogi, Fondazione Consulenti per il Lavoro). Attualmente è responsabile commerciale della RES Consulting Group.

Dr. Massimo Chieli (1950): Presidente di Alitalia Express e Consulente Aziendale. È autore di articoli e pubblicazioni su temi di organizzazione e di service management e svolge docenze in corsi di formazione e master aziendali e universitari.

Prof. Amilcare Collina (1939): Ingegnere chimico, è stato Professore al Politecnico di Milano, per 25 anni ha lavorato nel settore Ricerca & Sviluppo della Montedison con diversi livelli di responsabilità fino ad

Page 15: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

17

arrivare a ricoprire il ruolo di Capo dell’Ufficio Tecnologico dell’intero Gruppo. Dal 1994 lavora nel Gruppo Mapei, attualmente è Advisor del CEO per la ricerca e l’innovazione. È membro del Board Ricerca ed Innovazione del Cefic (European Chemical Industry Council).

Dr. Luciano Criscuoli (1950): Direttore Generale per il Coordinamento e lo Sviluppo della Ricerca del Ministero dell’Università e della Ricerca dal 1999. È membro permanente di numerose commissioni di studio per l’attuazione delle politiche di intervento nel settore della ricerca. Ricopre incarichi istituzionali di rappresentanza del Ministero nelle sedi nazionali e internazionali. Ha curato la definizione di nuove specifiche normative di settore, di documenti di programmazione del Ministero per l’attuazione di interventi finalizzati al potenziamento e al sostegno della ricerca (PNR, Linee Guida per la Politica Scientifica e Tecnologica del Governo, PON per il Mezzogiorno, ecc).

Dr. Enzo Grossi (1951): già descritto nei ricercatori associati. Dr. Federico Nazzari (1942): Manager nel settore dell’industria

Farmaceutica ha svolto le sue mansioni in aziende multinazionali ricoprendo importanti ruoli dirigenziali (Vice Direttore Generale Upjohn SpA, AD della Maggioni Winthrop, Presidente e AD dell’Istituto Luso Farmaco d’Italia SpA). Dal 2000 al 2007 ha operato in Bracco come Group Vice President General Affairs. È stato Presidente di Farmindustria per tre mandati, di cui due consecutivi il terzo nel 2003. Dal febbraio 2007 è entrato nel Consiglio di Recordati SpA con delega per i rapporti istituzionali.

Prof. Roberto Passariello (1941): Professore Ordinario di Radiologia e Direttore dell’Istituto di Radiologia dell’Università degli Studi di Roma “La Sapienza”. Autore o co-autore di 10 libri e di oltre 500 pubblicazioni scientifiche, molte delle quali su riviste internazionali. Autore di più di 600 Conferenze, comunicazioni, relazioni su invito e moderazioni a Tavole Rotonde in Italia e all’Estero. Membro Onorario di numerose società scientifiche fra cui: Radiological Society of North America, European Association of Radiology, Cardiovascular and Interventional Society of Europe, Royal College of Radiology.

Prof. Pierluigi Sacco (1964): già descritto nei ricercatori associati. Dr. Cristiano Sandels Navarro (1960): Project & Business Manager, si

occupa di progetti di sviluppo, organizzazione e gestione aziendale. Ha lavorato nell’ambito della comunicazione, marketing e consulenza aziendale. Collabora con l’Università di Milano con docenze sulla

Page 16: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

18

sostenibilità energetica e ambientale. Ha contribuito alla stesura dei contenuti del programma per la candidatura di Milano per l’EXPO 2015.

Relazioni pubbliche e istituzionali Luciana Marcellini Hercolani Gaddi (1948): Public & Institutional

Relations, fondatrice dello Studio M&D, che svolge tutte le attività necessarie a favorire il contatto e la messa in relazione fra aziende pubbliche, private ed istituzioni. I settori dove lo Studio prevalentemente opera sono quelli della Ricerca, dell’Aeronautica, della Manutenzione. Collabora con il Semeion dal 2005.

Page 17: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

19

1.2 I campi d’interesse della ricerca L’attività di ricerca del Semeion nelle sue componenti, ricerca di

base, ricerca sperimentale e ricerca applicata, ha investito, nel tempo, diversi campi d’interesse. Nel corso degli anni, come è ovvio per un centro ricerche, l’interesse ha subito modifiche determinate essenzialmente da mutate condizioni storico-scientifiche. Queste trasformazioni d’interesse sono state orientate principalmente da due spinte parallele:

a. un lavoro di ricerca scientifica sempre più orientato a studiare e comprendere le logiche di funzionamento dei fenomeni complessi;

b. un’attenzione al contesto storico relativamente allo sviluppo delle dinamiche socio-culturali e alle diverse manifestazioni del mondo naturale.

In questa prospettiva l’esplicitazione dei campi di interesse nei quali la ricerca del Semeion si è sviluppata dalla sua fondazione ad oggi, consentirà di comprendere l’evoluzione scientifica e storica del centro. I campi sono:

1. prevenzione sociale e sanitaria (dal 1985); 2. settore aziendale e industriale (dal 1987); 3. settore scolastico ed educativo (dal 1990); 4. ambiente e territorio (dal 1995); 5. economia e finanza (dal 1996); 6. mondo del lavoro e orientamento professionale (dal 1998); 7. settore medico, biologico e farmaceutico (dal 2000); 8. settore della sicurezza sociale e dei fenomeni criminali (dal

2000).

Page 18: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

20

Page 19: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

21

Ricerca di base e sperimentale: scoperte, brevetti e software

Page 20: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

22

Page 21: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

23

2. La Ricerca di Base e sperimentale: scoperte, brevetti e software

Prima di entrare nella descrizione delle diverse attività svolte dai

ricercatori, è opportuno fornire una breve definizione di come il Semeion concepisce la ricerca di base e sperimentale.

La ricerca di base consiste nella formulazione di teorie adeguatamente formalizzate (linguaggio matematico e/o equivalente implementabile su computer) e nella loro sperimentazione.

Ricerca di base e sperimentale sono due facce della stessa medaglia: la prima senza la seconda è non falsificabile e, quindi, incontrollabile, la seconda senza la prima è un’attività disordinata. La formulazione di teorie e la loro sperimentazione costituiscono i fondamenti della ricerca di base, così come da anni mostra la fisica.

La ricerca di base e quella sperimentale permettono le scoperte fondamentali. Le scoperte fondamentali sono quelle che ridisegnano i criteri con i quali si produce la conoscenza scientifica. Si tratta, quindi, di scoperte che non si limitano ad accrescere la conoscenza scientifica, ma che permettono nel tempo un progresso scientifico forte ed improvviso e un conseguente ritorno esponenziale degli investimenti. Le scoperte incrementali, invece, sono quelle che perfezionano e/o specificano, in un ambito sperimentale o applicativo particolare, le scoperte fondamentali. La ricerca di base si valuta in relazione alla produttività delle scoperte fondamentali e incrementali, e in base al numero di applicazioni tecnologiche che essa permette nel tempo.

La ricerca di base e sperimentale, così concepite, costituiscono l’attività principale del Semeion. Tale attività può essere vista come il motore del lavoro di ricerca, che si manifesta successivamente sotto diversi aspetti.

La ricerca di base è il luogo di riferimento teorico in relazione al quale la ricerca applicata pianifica la realizzazione dei progetti. È il laboratorio dove si sperimentano nuove teorie e si costruiscono nuovi modelli e algoritmi, realizzando programmi informatici di ricerca che hanno come scopo la pura funzione sperimentale.

Page 22: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

24

2.1 Reti AutoAssociate non lineari Il lavoro di ricerca sulle reti AutoAssociate, proseguito per tutto il

2008 ha portato alla scoperta, da parte di M. Buscema, di un nuovo modello di fusione di reti AutoAssociate non lineari.

Per consentire di inquadrare il problema è opportuno ricordare che questo tipo di reti rappresentano una categoria di potenti tecniche di data mining, che coprono un’area complessa con differenti topologie, regole di apprendimento, equazioni di trasferimento del segnale e funzioni di costo. Le reti AutoAssociate sono in grado di scoprire le connessioni nascoste analizzando uno stesso database da diversi punti di vista.

A partire da tali caratteristiche, nell’ultimo anno, è stato scoperto che ogni sistema di autoassociazione (modelli di rete AutoAssociata) fra variabili è confrontabile con ogni altro sulla base di un indice, denominato indice d’intersezione. L’indice d’intersezione evidenzia il livello di accordo tra i valori dei Minimum Spanning Tree (MST) delle matrici quadrate delle connessioni addestrate tra le variabili del database, prodotti da più sistemi di associazione sia di tipo lineare, che di tipo non lineare.

Possiamo definire come “autoassociatori” quei sistemi che hanno il compito di calcolare la forza di associazione all’interno delle variabili indipendenti che costituiscono un database.

Per consentire la comparabilità di più autoassociatori e, quindi, il loro livello di fusione, è necessario che almeno un autoassociatore sia lineare ed almeno uno sia bayesiano.

Oltre all’indice d’intersezione sono stati ideati altri tre indici, di cui uno composto, attraverso i quali è possibile calcolare il livello di similarità tra gli autoassociatori. Descriviamo brevemente le equazioni e le funzioni di ogni singolo indice.

L’indice d’intersezione è dato dalla seguente equazione:

Page 23: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

25

,

2

( );

( )

:,

Number of different MST coming from different algorithms;(NumVariables) .

Mi j

i jk i j

link true link trueIindex

link true link true

wherei j Nk MNM

= ==

= =

∈∈=

=

∑∩∪

L’indice di Evidenza misura quanto ciascuna associazione di MST di

un algoritmo è supportata da tutti gli altri algoritmi. L’equazione che ne permette il calcolo è la seguente:

, , , ,1 1 1;

1 ( );2( 1)( 1)

:,

Number of different MST coming from different algorithms;Number of Variables.

M M N

i i z k j z kz k j j i

Eindex link true link trueN M

wherei j Nk MNM

= = = ≠

= = =− −

∈∈==

∑∑ ∑ ∩

L’indice di Singolarità misura quanto l’MST di un algoritmo si

supporta autonomamente, e l’equazione è la seguente.

( ), , , ,1 1 1;

1 0;2( 1)( 1)

:,

Number of different MST coming from different algorithms;Number of Variables.

M M N

i i z k j z kz k j j i

Sindex link true link falseN M

wherei j Nk MNM

= = = ≠

= = = = − −

∈∈==

∑∑ ∑∩

Il quarto ed ultimo indice è denominato indice di evidenza o di

singolarità, e consente un bilanciamento fra i legami supportati e i legami singolari dell’MST di ogni algoritmo. L’equazione è la seguente:

Page 24: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

26

ln ; .ii i

i

SindexRatio RatioEindex

= − − ∞ ≤ ≤ +∞

dove in 0iRatio ≅ viene bilanciato il numero delle evidenze e delle

singolarità; in 0iRatio ≥ possiede più evidenze che singolarità; in 0iRatio ≤ possiede più singolarità che evidenze. Forniamo una descrizione del processo con cui si confrontano le

capacità di analisi degli autoassociatori prendendo ad esempio l’indice d’intersezione. Tale indice mostra l’accordo e il disaccordo di ogni coppia di algoritmi, in relazione alla loro fondamentale associazione fra le variabili di uno specifico database. Da un punto di vista generale mostriamo il comportamento di 5 algoritmi nelle tabelle seguenti:

Tabelle che mostrano il grado di accordo dei 5 algoritmi Analizzando le tabelle si può notare che oltre metà delle connessioni

della rete AutoCM sono supportate dalla Linear Correlation (LC), e oltre un terzo delle connessioni di una rete SOM sono supportate dalla Distanza Euclidea (ED). La LC sembra comportarsi come un ponte tra rete AutoCM e la rete SOM, mentre l’algoritmo Prior Probability (PP) mostra una logica completamente differente. Se si trasformano i valori d’intersezione degli algoritmi in una matrice delle distanze e se si proietta questa matrice in uno spazio tridimensionale si ottiene la seguente mappa.

Page 25: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

27

Mappa dei 5 algoritmi in relazione alla similarità dei risultati di un database

Nella mappa si può notare che l’algoritmo PP è collocato in una posizione isolata, gli algoritmi LC ed ED sembrano lavorare come punti di mediazione fra gli altri, mentre AutoCM e SOM appaiono specializzati in aree opposte della mappa. Da queste elaborazioni si può concludere che la rete AutoCM è supportata da LC, come la rete SOM è supportata da LC e ED, mentre l’algoritmo PP appare come un outlier.

Dall’esempio mostrato si può ricavare che quando si usano diversi tipi di autoassociatori non è facile stabilire quale algoritmo è migliore degli altri. Il solo “gold standard” disponibile consiste nell’esplorare ogni ipotesi dell’algoritmo sul campo. Poiché gli algoritmi seguono differenti tipi di matematiche, il modo migliore di operare è la fusione.

La ricerca ha proposto delle regole di costruzione del modello di fusione riassumibili nei seguenti punti:

a. ogni algoritmo propone un albero specifico delle dipendenze tra variabili che appartengono allo stesso database;

b. è necessario estrarre da tutti gli alberi disponibili soltanto un grafo i cui link fra le variabili sono più forti e più credibili;

c. sovrapponendo tutti gli alberi si conservano solo le connessioni messe in evidenza da almeno due algoritmi differenti.

In altri termini si può affermare che se due diversi algoritmi, usando matematiche diverse, individuano lo stesso legame tra variabili è più probabile che il legame fra quelle variabili sia effettivo.

Page 26: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

28

Questa logica di fusione degli algoritmi può generare grafi che presentano due sostanziali caratteristiche:

a. il grafo risultante dalla fusione può presentare dei cicli; b. il grafo risultante dalla fusione potrà essere sconnesso. Nella figura sottostante riportiamo un esempio di grafo che

riassume queste caratteristiche.

Grafo finale delle associazioni fra variabili

Il grafo è il risultato delle elaborazioni di diverse matrici estratte da

un database, utilizzando la tecnica di fusione descritta. Dal grafo si può notare che applicando questo modello di fusione

fra autoassociatori è possibile produrre sia grafi sparsi, con gruppi di nodi disconnessi, sia grafi che presentano numerosi e complessi cicli. Analizzando tali rappresentazioni è possibile sapere quali variabili sono senza significato, quali sono in grado di comunicare qualche informazione e, infine, quali variabili costituiscono la struttura portante del database.

Software (MST-MRG SW ver. 5.2 Semeion©) Progetto e sviluppo: M. Buscema Il software che elabora e visualizza i vari modelli di autoassociatori è

stato implementato nella versione 5.2 del software MST-MTG-MRG, del 2008. Nella figura seguente mostriamo la pagina principale del software.

Page 27: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

29

Pagina principale del SW MST-MRG 5.2

Page 28: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

30

2.2 Clustering Dinamico sulle traiettorie di database Nel Piano Triennale del Semeion 2008-2010 veniva descritta questa

nuova area di ricerca, finalizzata a trattare le informazioni che descrivono un database, non come fotografie statiche di una rappresentazione della realtà, ma come “forze congelate” che fissano una dinamica in un certo intervallo temporale. Un database è, dunque, un oggetto complesso all’interno del quale le variabili non sono altro che delle forze che delineano dei possibili futuri interpretativi. Si può parlare di dimensione dinamica delle variabili.

Sulla base di questi presupposti M. Buscema, nel 2008, ha sperimentato un metodo per calcolare gli attrattori delle variabili dinamiche.

Partendo da un database addestrato è possibile calcolare l’insieme di attrattori, che descrivono le sue direzioni potenziali, in tutte le combinazioni possibili. Analizzando uno alla volta quali caratteristiche possiede l’attrattore di ogni variabile è possibile vedere come si muovono tutte le altre. Dopo aver attivato un processo del genere si ottengono delle “linee d’universo” simile a quelle descritte nello spazio di H. Minkowski. La posizione di un punto è, infatti, definita da tutte le variabili che lo descrivono, il punto può essere spostato nel tempo fino a quando tutte le variabili non trovano una posizione di equilibrio. Il database viene “rianimato” a partire dall’attivazione di una variabile, ed è possibile osservare come ogni variabile tende a far muovere ogni altra variabile verso sé stessa. Si stabiliscono così delle linee d’universo, cioè delle traiettorie potenziali che descrivono il futuro di ogni variabile rispetto a tutte le altre.

Per visualizzare questo processo è possibile effettuare un’elaborazione con un sistema che implementa reti neurali AutoAssociate. Utilizzeremo come esempio l’ormai classico database Jet e Shark, i cui dati verranno elaborati utilizzando il software AutoAssociative Neural Networks (ver. 10.0 Semeion© 1999-2008 autore M. Buscema), con cui è possibile visualizzare il percorso sfumato che descrivono le variabili quando vengono interrogate.

Il database Jet e Shark è illustrato nella tabella seguente.

Page 29: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

31

La matrice della correlazione lineare fra le variabili del database è

illustrata nella tabella seguente.

Jets Sharks 20 30 40 JH COL HS Single Married Divorced Pusher Bookie BurglarJets 1.00 -1.00 0.53 -0.48 -0.05 0.53 -0.24 -0.32 0.27 -0.24 -0.05 0.00 0.00 0.00

Sharks -1.00 1.00 -0.53 0.48 0.05 -0.53 0.24 0.32 -0.27 0.24 0.05 0.00 0.00 0.0020 0.53 -0.53 1.00 -0.74 -0.32 0.05 -0.04 -0.01 0.03 -0.11 0.11 -0.05 -0.22 0.2730 -0.48 0.48 -0.74 1.00 -0.40 -0.13 0.20 -0.04 -0.04 0.03 0.02 0.10 0.10 -0.2140 -0.05 0.05 -0.32 -0.40 1.00 0.11 -0.22 0.08 0.02 0.11 -0.17 -0.07 0.15 -0.07JH 0.53 -0.53 0.05 -0.13 0.11 1.00 -0.41 -0.64 0.03 -0.11 0.11 -0.22 -0.05 0.27

COL -0.24 0.24 -0.04 0.20 -0.22 -0.41 1.00 -0.44 -0.16 0.33 -0.22 0.19 0.00 -0.19HS -0.32 0.32 -0.01 -0.04 0.08 -0.64 -0.44 1.00 0.11 -0.17 0.08 0.05 0.05 -0.11

Single 0.27 -0.27 0.03 -0.04 0.02 0.03 -0.16 0.11 1.00 -0.74 -0.40 0.10 0.42 -0.52Married -0.24 0.24 -0.11 0.03 0.11 -0.11 0.33 -0.17 -0.74 1.00 -0.32 -0.05 -0.22 0.27Divorced -0.05 0.05 0.11 0.02 -0.17 0.11 -0.22 0.08 -0.40 -0.32 1.00 -0.07 -0.29 0.37Pusher 0.00 0.00 -0.05 0.10 -0.07 -0.22 0.19 0.05 0.10 -0.05 -0.07 1.00 -0.50 -0.50Bookie 0.00 0.00 -0.22 0.10 0.15 -0.05 0.00 0.05 0.42 -0.22 -0.29 -0.50 1.00 -0.50Burglar 0.00 0.00 0.27 -0.21 -0.07 0.27 -0.19 -0.11 -0.52 0.27 0.37 -0.50 -0.50 1.00

Page 30: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

32

Mostriamo inoltre due esempi d’interrogazione con diversa visualizzazione (in 2 dimensioni e in 3 dimensioni). In entrambe si può notare il percorso che compiono le variabili selezionate, che appaiono con il colore rosso, nello spazio delle fasi a seguito della attivazione dinamica nel contesto delle altre variabili.

Nella prima interrogazione si può notare come le due variabili “Jet e ventenne” tendono ad avvicinarsi nel percorso dinamico, poiché la variabile ventenne caratterizza più il gruppo dei Jet che quello degli Shark.

Elaborazione con il SW AutoAssociative Neural Networks (ver. 10.0) variabili

“Jet e 20s” visualizzazione in 2D

Page 31: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

33

Elaborazione con il SW AutoAssociative Neural Networks (ver. 10.0) variabili

“Jet e 20s” visualizzazione in 3D

Diversamente nella seconda interrogazione attivando la variabile “Shark e ventenne”, appare evidente che le due variabili descrivono traiettorie distanti nello spazio delle dimensioni. La variabile ventenne, infatti, non è prototipica del gruppo degli Shark.

Page 32: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

34

Elaborazione con il SW AutoAssociative Neural Networks (ver. 10.0) variabili

“Shark e 20s” visualizzazione in 2D

Page 33: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

35

Elaborazione con il SW AutoAssociative Neural Networks (ver. 10.0) variabili

“Shark e 20s” visualizzazione in 3D Applicando questo modello di elaborazione, con il relativo software,

è possibile esplorare tutto lo spazio della fasi delle variabili di un database, effettuando innumerevoli interrogazioni, che descrivono le traiettorie delle variabili nella loro dinamica di relazione parallela.

Inoltre quest’ultima versione del software implementa: a. il calcolo della matrice delle distanze sulla base dei pesi

addestrati; b. il calcolo, a partire dalle connessioni addestrate, del database

delle traiettorie di ogni variabile e, tramite, campionamento sulla binomiale delle combinazioni delle variabili, calcola la dinamica delle traiettorie potenziali dell’intero database originale.

Software (AutoAssociative Neural Network SW ver. 10.0 Semeion©) Progetto e sviluppo: M. Buscema

Page 34: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

36

Il software che consente la visualizzazione delle traiettorie dinamiche dei database è stato implementato nella versione 10.0, denominata AutoAssociative Neural Network SW. Nella figura seguente mostriamo la pagina principale del software.

AutoAssociative Neural Network 10.0

Page 35: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

37

2.3 La semantica dello spazio: Topological Weight Centroid (TWC)

La possibilità di attribuire un significato ad una distribuzione di

punti in uno spazio, a due o a tre dimensioni, è un problema che affascina i matematici da tempo. Molti lavori sono stati fatti in questo ambito, la proposta dei ricercatori del Semeion si inscrive in questo contesto con un modello denominato Topological Weight Centroid (TWC), ideato da M. Buscema nel 2008.

L’utilizzo di tale modello prevede una precedente applicazione di un algoritmo di multidimensional scaling finalizzato ad ottenere una proiezione di molte dimensioni dello spazio di origine in due o tre dimensioni dello spazio obiettivo, tentando di minimizzare la differenza tra le distanze originarie degli iper-punti e lo spazio-obiettivo. Più la distorsione dell’errore sarà ridotta, più lo spazio-obiettivo sarà in grado di mostrare un’efficace visione della posizione dei punti.

Poiché un database composto da R-records per V-variabili può sempre essere visto come un insieme di R punti in uno spazio V-dimensionale, le quantità che vengono introdotte possono essere usate per descrivere gli aspetti semantici del database connessi alla posizione di R-records nel loro spazio V-dimensionale. Ma le stesse quantità sono in grado di mostrare gli aspetti semantici connessi con la posizione di V variabili nel loro spazio R-dimensionale, quando lo sforzo computazionale è affrontabile. Esistono diversi modelli per calcolare queste quantità, il TWC costituisce una sorta di metodologia di calcolo dalla quale ne derivano numerose altre. Negli esempi applicativi che vedremo tutte le quantità vengono definite considerando un insieme di N punti, chiamati entità, collocato in uno spazio bidimensionale, le quantità che si producono tramite questa metodica possono essere punti, curve o campi scalari. Elenchiamo i modelli su cui si è lavorato nel corso del 2008, e sui quali si sta attualmente lavorando:

- Topological Weighted Centroid (TWC); - Self Topological Weighted Centroid (STWC); - Proximity Scalar Field; - Gradient of the Scalar Field; - Relative Topological Weighted Centroid (TWCi); - Paths form Arithmetic Centroid to entities; - Paths between entities; - Scalar Field of the trajectories.

Page 36: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

38

Nel contesto di questo rapporto di ricerca forniamo una breve descrizione del TWC, che è stato applicato ad alcuni case study.

Si può definire come TWC di N entità in uno spazio bidimensionale il centro di massa di queste entità, pesato dalla prossimità che ogni entità ha con le altre. Le equazioni che descrivono il TWC insieme con l’esatto significato del concetto di prossimità sono state disegnate da M. Buscema. Si tratta di 15 equazioni che descrivono il modello, e che verranno pubblicate nel prossimo anno.

Una breve segnalazione merita anche l’applicazione dell’algoritmo Auto Contractive Map (Semeion©) per calcolare le nuove relazioni fra le N entità collocate in uno specifico spazio, in accordo con una serie di caratteristiche di tipo qualitativo, nell’ipotesi ulteriore di proporre un nuovo metodo per fondere queste nuove relazioni con le informazioni di tipo geografico.

In sintesi si può affermare che la metodologia TWC implica l’esistenza di un dataset così strutturato:

{ } 1: , N

n n nDATASET x y

=

dove xn e yn sono le coordinate geografiche di ogni entità in due

dimensioni spaziali. Contemporaneamente è possibile incrementare la complessità di

questo dataset, definendo ogni entità con un vettore di nuove caratteristiche:

{ }{ }, 1 1_ : , ,

NM

n n n p p nNEW DATASET x y c

= =

dove cn,p sono le caratteristiche astratte di ogni entità in un nuovo M spazio dimensionale.

Se si vogliono fondere tutte queste informazioni insieme è necessario calcolare il modo attraverso il quale le nuove caratteristiche modificano la classica matrice dello spazio euclideo. Per raggiungere tale obiettivo sarà necessario processare tutte le cn,p caratteristiche di ogni entità con una rete neurale Auto Contractive Map1. Questa rete neurale sarà in grado di stimare l’associazione non lineare fra le entità, in relazione alle nuove caratteristiche qualitative introdotte.

1 M. Buscema PST Cluster ver. 6.2 , Semeion Software n. 34, 2008, Roma.

Page 37: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

39

La metodologia del TWC è stata applicata nel corso del 2008 ad una serie di casi ottenendo dei risultati molto interessanti. Mostriamo due esempi esplicativi delle potenzialità del modello.

Il primo esempio rappresenta uno spazio con una semantica molto semplice, dove la sommatoria delle distanze di ogni entità da tutte le altre è esattamente la stessa, di conseguenza il centro aritmetico di massa (AC) è collocato approssimativamente nella stessa posizione del TWC. A tal proposito si osservi la figura sottostante:

Source Map TWC and AC

Utilizzando alcune delle equazioni del metodo TWC si può generare

la prossimità del campo scalare delle entità, rappresentata nella figura seguente:

La mappa mostra come il grado di prossimità dei punti è quasi

equamente distribuito all’interno del cerchio. È possibile notare, inoltre,

Page 38: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

40

la formazione di aree scure nella zona rossa, proprio dove la presenza dei punti originari è più densa.

Il secondo esempio è completamente differente, si tratta di un’elaborazione su dati reali che riguarda i luoghi dove la polizia di Londra ha effettuato arresti per traffico di cocaina, in un determinato periodo.

Mappa della distribuzione dei luoghi relativi al traffico di cocaina

Come si può osservare dalla mappa è evidente che la distribuzione

dei luoghi non è completamente random. Elaborando le coordinate di questi punti utilizzando alcune equazioni del TWC si opera uno spostamento. La mappa successiva mostra la linea di spostamento, si nota che il TWC sposta l’attenzione dal centro di massa verso un gruppo di luoghi collocato nel quartiere di Bromley.

Page 39: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

41

T.W.C.T.W.C.

Mappa dello spostamento realizzato con il TWC

Da una verifica effettuata con altro tipo di informazioni, il quartiere

di Bromley risulta essere uno dei più importanti luoghi di spaccio di cocaina, insieme con Westminster.

Generando il campo scalare di questa distribuzione, appiccando altre equazioni, si ottiene un’efficace rappresentazione delle dinamiche di intensità del traffico di cocaina a Londra. I due quartieri di Bromley e Westminster appaiono chiaramente come i due fuochi dello spaccio di cocaina.

Page 40: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

42

Mappa dove si evidenziano i due fuochi dei quartieri dove c’è spaccio di cocaina

Proiettando la stessa mappa in accordo al gradiente ed applicando

altre equazioni del TWC, è possibile distinguere nella nuova mappa sottostante la differente distribuzione dei cluster del traffico di cocaina a Londra.

Page 41: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

43

Mappa dove si evidenziano i cluster dello spaccio di cocaina

Inoltre è anche possibile ipotizzare le traiettorie più probabili che

connettono i diversi quartieri della città. Ciò si può fare costruendo un MST curvilineo, basato sui percorsi che connettono i diversi luoghi, applicando altre equazioni. Questo tipo di MST permette di evidenziare delle specie di “geodetiche” che descrivono dei percorsi curvilinei nel connettere le entità che formano i vertici del grafo. Sembra che applicando questo MST sia possibile descrivere le diversità morfologiche di una specie di “territorio” su cui poggia il grafo.

Nella figura successiva si può vedere la dinamica di connessione curvilinea che l’MST è in grado di tracciare fra i luoghi che indicano i quartieri di Londra, descrivendo specifiche traiettorie di tipo curvilineo.

Page 42: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

44

Mappa delle traiettorie che connettono i quartieri di Londra

Infine, la visualizzazione logica di questa mappa è rappresentabile

applicando l’algoritmo Maximaly Regular Graph2 (MRG), attraverso il quale è possibile analizzare i flussi di connessione del traffico di droga. L’ultima figura ne fornisce la rappresentazione grafica.

2 La spiegazione del funzionamento dell’algoritmo MRG si può trovare in “Semeion, Piano Triennale Anni 2008-2010 - Ricerca di Base e Applicata, Aracne Editrice, 2008, Roma, pp. 83-90”, l’implementazione è in “M. Buscema MST-MRG, ver. 5.2, Semeion Software n. 38, Roma.

Page 43: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

45

Rappresentazione logica dei flussi del traffico di droga tramite MRG

Osservando il grafo è possibile ipotizzare che la cocaina a Londra

parte dal quartiere di Bromley, viene distribuita nel quartiere di Merton e, successivamente, passando attraverso il quartiere di Lambeth arriva al mercato di Westminster, dal quale viene distribuita in tutti gli altri quartieri.

Software (PST Cluster SW ver. 6.2 Semeion©) Progetto e sviluppo: M. Buscema Il software che implementa gli algoritmi TWC e STWC è il PST

Cluster versione 6.2. Nella figura seguente mostriamo la pagina principale del software dove sono evidenziati i due algoritmi implementati.

Page 44: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

46

Pagina principale del SW PST Cluster 6.2 con evidenziati gli algoritmi TWC e STWC

Page 45: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

47

2.4 AutoClustering (AutoCl) La tematica che riguarda i metodi per affrontare i cosiddetti

problemi di natural clustering può essere così sintetizzata “trovare il numero ottimo di cluster per un determinato numero di punti”. Nel 2008 M. Buscema ha ideato un algoritmo per realizzare un clustering automatico che ottimizza questa funzione, il metodo è stato denominato AutoClustering.

Il criterio di base per affrontare questo problema consiste nell’individuare le similarità più significative sia dei record rispetto alle variabili, che delle variabili rispetto ai record in un database, al fine di costruire classi omogenee di oggetti. Per classe omogenea s’intende una classe i cui elementi hanno una distanza minima fra di loro rispetto ad una specifica metrica.

Nella pratica attuale al ricercatore si pongono due tipi di problemi: - la definizione del numero di classi, che viene determinato a

priori; - la scelta della metrica da utilizzare per misurare la distanza

interna degli elementi che compongono ognuna delle classi. Ogni piccola variazione di questi due elementi produce un

clustering completamente diverso. Ad oggi non esiste un metodo per stabilire il numero ottimo di cluster in relazione ad una metrica selezionata.

Il sistema AutoClustering consiste nell’attivare una procedura di cluster iterativa che va da 2 a N cluster. La procedura si basa sull’algoritmo evolutivo GenD3, che ha il compito di minimizzare le differenze rispetto alle classi. Dopo aver applicato l’algoritmo per effettuare il clustering è poi possibile utilizzare tecniche come la K-Means, oppure la Fuzzy K-Means.

Il primo passo consiste nello stimare il valore dei centroidi collocati in uno spazio. Dopo di ciò è necessario stabilire per ogni record il grado di appartenenza al suo centroide (valore di membership).

La formula che calcola la distanza di un punto dal suo centroide di appartenenza e da quello vicino è la seguente:

3 Buscema M. (2004), Genetic Doping Algorithm (GenD): theory and applications, in Expert Systems, Vol. 2 no. 2, May 2004, pp. 63-79, Blackwell Publishing.

Page 46: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

48

2 22 2

2 21 1

( ) ( )

( ) ( )

x x y y

x x y y

Din P C P C

Dout P C P C

= − + −

= − + −

dove: Din = distanza del punto dal suo centroide; Dout = distanza del punto dal centroide più vicino, escluso quello di appartenenza. La membership (µ) è data dalla seguente formula:

1 DinDin Dout

µ = −+

Per posizionare un punto rispetto a 2 cluster il sistema sceglie la

membership minima, e memorizza il valore di membership. Lo stesso tipo di elaborazione viene fatto rispetto a 3 cluster,

scegliendo sempre la membership minima fra i tre. La stessa cosa avviene per 4 cluster, per 5, ecc.

L’elaborazione si ferma quando, a seguito dell’aumento dei cluster, accade che in almeno un cluster viene classificato un solo punto.

Questo meccanismo impedisce al sistema di creare dei cluster che rimarranno vuoti, tutti i cluster, infatti, sono occupati da almeno un punto. Al termine di questo processo si ottengono una serie di valori, ogni valore corrisponde a quello ottimo per ogni cluster. La formula finale è la seguente:

{ }{ }mink kC Max Arg µ∗ =

dove: C* = cluster ottimi; Maxk = valore massimo dei cluster; Arg = numero dei cluster; min {µk} = membership minima di ogni clusterizzazione. Dopo aver completato tutte le elaborazioni il sistema è in grado di

stabilire quanti sono i cluster ottimi per quel numero di punti.

Page 47: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

49

Il metodo AutoClustering è stato applicato all’analisi delle attività culturali nella Regione Veneto, lo scopo era quello di scoprire i cluster naturali presenti sul territorio regionale a partire da una serie di variabili che ne descrivono le caratteristiche degli eventi culturali.

Il progetto Distretto Culturale Evoluto (DiCE) della Regione Veneto realizzato nel 2008 è un ampio progetto con diversi obiettivi, all’interno del quale è stato sperimentato il metodo AutoClustering, che ha fornito dei risultati molto interessanti. Nella ricerca sono stati individuati 491 comuni del Veneto, caratterizzati da una serie di indicatori culturali, come ad esempio: presenza di teatri e musei, attività pubblicitarie, arti visive, industrie che operano nella moda e nel design, beni architettonici, produzione radio e televisive, attività artigianali, ecc.

Elaborando il database dei 491 comuni il metodo AutoClustering ha individuato 8 cluster naturali, rappresentati nella figura seguente. Ogni cluster è rappresentato con un colore diverso.

Visualizzazione degli 8 cluster della Regione Veneto

Page 48: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

50

L’elemento più interessante di questa elaborazione è dato dal fatto

che i comuni con il maggior valore di membership non sono le città capoluogo di provincia, diversamente da quanto ci si aspettava, ma sono piccoli comuni spesso collocati in zone ritenute piuttosto periferiche rispetto allo sviluppo di attività culturali. Solo la città di Verona nel cluster numero 2 ha avuto la membership più alta collocandosi in cima alla classifica dei comuni appartenenti a quel cluster. Mostriamo una tabella per dare un’idea sintetica dei risultati prodotti da questa elaborazione. Nella tabella vengono riportati per ogni cluster:

- il comune con il più alto valore di membership; - il comune capoluogo di provincia; - il comune con il più basso valore di membership. In questo modo è possibile notare sia la differenza del valore di

membership che separa il primo comune rispetto alla posizione occupata dai capoluoghi di provincia, sia la distanza fra il primo e l’ultimo comune.

Risultati elaborazione 8 cluster Veneto

Cluster Comune Membership Cluster 1

Forno di Zoldo Belluno Lentiai

0.95 0.64 0.44

Cluster 2 Verona Melara

0.97 0.42

Cluster 3 Pontelongo Padova

Costa di Rovigo

0.91 0.60 0.48

Cluster 4 Isola Vicentina Vicenza Orgiano

0.97 0.68 0.46

Cluster 5 Chiarano Venezia

Cavallino Treporti

0.89 0.49 0.35

Cluster 6 Sant’Urbano Rovigo

Torreglia

0.91 0.58 0.44

Cluster 7 Giavera del Montello Treviso Spinea

0.93 0.60 0.47

Page 49: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

51

Cluster 8 Rossano Veneto Alano di Piave

0.93 0.46

Tabella delle elaborazioni sugli 8 cluster del Veneto Nel cluster numero 8 non è presente alcun capoluogo di provincia. Da un punto di vista generale questo esempio di sperimentazione

evidenzia che un database è una collezione di iper-punti collocata in una specifica dimensione spaziale, che rappresenta un’implicita funzione continua. Tale funzione è una iper-superficie, altamente non lineare, che include tutte le informazioni nascoste ed esplicite compresse nel database. L’azione di data-mining consiste nella ricostruzione della funzione implicita continua, di cui il database specifico è un campione discreto. Le informazioni nascoste rappresentano le possibili dinamiche dell’universo di cui il database è un campione. In questa prospettiva, quindi, l’esplorazione di un database è un’attività in grado di far emergere quelle informazioni altrimenti invisibili con altri metodi.

Page 50: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

52

2.5 Active Connection Matrix: la nuova rete H-Net Il settore di ricerca dedicato all’imaging, dove il Semeion opera dal

2003 con l’ideazione della famiglia di sistemi Active Connection Matrix (ACM) per l’elaborazione delle immagini, si è arricchito di una nuova rete neurale denominata H-Net.

Nella seconda metà del 2008 la rete H-Net è stata ideata ed implementata da M. Buscema nel sistema ACM.

Attualmente la rete H-Net implementa tre tipi di algoritmi: H0, H1, H2.

Lo scopo principale di H-Net è quello di essere un efficace strumento per l’analisi delle immagini, in particolare mette in atto processi di:

- segmentation; - texture analysis; - edges findings. Il modo migliore per presentare le capacità di H-Net consiste nel

mostrare i risultati di alcune elaborazioni. Nella figura sottostante mostriamo l’immagine originale di una mammografia senza alcuna elaborazione.

Immagine originale di una mammografia

Page 51: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

53

Su questa immagine sono state realizzate le seguenti elaborazioni. La prima utilizzando l’algoritmo H0.

Elaborazione dell’immagine originale utilizzando l’algoritmo H0

Confrontando le due immagini appare piuttosto evidente che

l’elaborazione con l’algoritmo H0 ha messo in evidenza la texture del tessuto mammario.

Vediamo l’elaborazione con il secondo algoritmo.

Page 52: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

54

Elaborazione dell’immagine originale utilizzando l’algoritmo H1

L’elaborazione l’algoritmo H1 produce un aumento di contrasto e

mostra delle parti, all’interno del tessuto mammario, del tutto invisibili nell’immagine originale.

Vediamo infine il risultato della terza elaborazione.

Page 53: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

55

Elaborazione dell’immagine originale utilizzando l’algoritmo H2

Utilizzando l’algoritmo H2 vengono distinte all’interno del tessuto

mammario le parti con diversi gradi di densità. Si può notare come l’immagine elaborata distingue chiaramente il tessuto muscolare, che presenta una maggiore densità, dal tessuto della mammella dotato di densità molto più bassa.

L’insieme di questi processi di elaborazione aiuta il radiologo ad osservare con più profondità ed attenzione la struttura interna del tessuto, con la possibilità di individuare più facilmente eventuali anomalie.

Software (ACM SW ver. 12.0 Semeion©) Progetto e sviluppo: M. Buscema La rete H-Net con i suoi tre algoritmi è stata implementata nella

versione 12.0 del software ACM.

Page 54: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

56

The H-Net system

The three H-Net versions implemented

The H-Net parameters

The H-Net system

The three H-Net versions implemented

The H-Net parameters

Pagina principale del SW ACM 12.0

Nella figura precedente si può notare l’inserimento del sistema H-

Net e dei suoi tre algoritmi nella preesistente famiglia dei sistemi ACM.

Page 55: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

57

2.6 Implicit Function As Squashing Time: evoluzioni Il metodo Implicit Function As Squashing Time (IFAST) ideato da

M. Buscema nel 2005, che si occupa dell’analisi dei segnali non stazionari ha subito delle evoluzioni nel corso del 2008. Riepiloghiamo le idee fondamentali di IFAST per poi spiegare l’innovazione inserita nel processo di elaborazione.

Il metodo IFAST ha lo scopo di individuare la funzione implicita (sottostante) in una serie multivariata di segnali, attraverso la riduzione della sequenza temporale ad una serie di invarianti spaziali. Finora il metodo è stato applicato ai segnali elettroencefalografici (EEG) al fine di discriminare soggetti con diversi gradi di demenza. In pratica dato un campione di soggetti il cui EEG è stato elaborato dal metodo IFAST, ogni soggetto di tale campione è stato diagnosticato, sulla base di standards internazionali, come anziano sano (Normal Old = NOld), come anziano con un deficit in una sola area cognitiva misurabile con i tests specifici (Mild Cognitive Impairment = MCI) o come paziente con una qualche forma di demenza, in particolare Alzheimer (AD). I presupposti teorici dell’applicazione sono i seguenti:

1. ogni sequenza multivariata di segnali provenienti dal cervello è raffigurabile come un complesso sistema dinamico asincrono, altamente non lineare, in cui il comportamento di ogni canale è intelligibile solo in relazione alla dinamica degli altri canali all’interno della struttura globale del cervello;

2. la funzione implicita che rende conto di questo processo asincrono consiste nella conversione del processo in un’ipersuperficie che descrive l’interazione temporale di tutte le dinamiche dei singoli canali di registrazione del segnale EEG.

3. questa funzione non lineare è, in definitiva, la rappresentazione spaziale delle interazioni temporali delle attività del cervello registrate nei singoli canali di registrazione del segnale EEG.

Date queste premesse il metodo IFAST effettua una compressione del tracciato EEG utilizzando i parametri delle connessioni di una Rete Neurale Auto-Associata non lineare, addestrata sui dati di quello stesso tracciato. La tipologia e l’algoritmo di apprendimento di una Rete Neurale di questo tipo possono essere i più diversi. È fondamentale che la Rete Neurale sia di tipo AutoAssociato (cioè che il vettore di Input operi da Target per il vettore di Output), e che le funzioni di trasferimento che la definiscono siano non lineari e differenziabili in

Page 56: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

58

ogni punto. È inoltre necessario che tutte le elaborazioni siano effettuate con lo stesso tipo di Rete Neurale e che le matrici di pesi iniziali, generati randomicamente, siano uguali per ognuna delle elaborazioni. Per ogni EEG, in pratica, ogni Rete Neurale deve partire sempre dallo stesso punto, anche se quel punto è casuale.

Dal punto di vista medico analizzare il livello di declino cognitivo di un soggetto significa voler decifrare la qualità di funzionamento del suo cervello. Decodificare tale qualità a partire dal tracciato EEG di un soggetto significa andare a cercare in quel tracciato, che varia su tutti i siti di registrazione del segnale nel tempo, quei modelli invarianti che caratterizzano la salute funzionale di quel cervello in una specifica fase della sua vita.

Da un punto di vista operativo il metodo IFAST ritiene che la qualità di funzionamento di un cervello è decodificabile, a partire da un buon campionamento della sua attività elettrica, tramite sistemi in grado di isolare quei tratti di EEG che sono invarianti rispetto al tempo del tracciato. Questa è la ragione per cui si usano per l’analisi delle EEG Reti Neurali AutoAssociate non lineari di tipo combinatorio e non di tipo sequenziale.

L’obiettivo del metodo IFAST consiste nel tentare di catturare il cosiddetto “rumore di fondo” dell’attività cognitiva di un cervello, che indica in modo sfumato lo stato di salute della sua struttura, nei diversi stati di attività mentale. Tale rumore di fondo dovrebbe essere una sorta di qualità cognitiva invariante allo scorrere delle EEG e di cui l’attività elettrica registrata dovrebbe mantenere delle tracce.

Nel metodo IFAST ogni Rete Neurale AutoAssociata deve apprendere sulle sue connessioni i modelli spaziali invarianti che caratterizzano ogni soggetto in quel periodo della sua vita. Tali modelli invarianti sono presenti e nascosti nel tracciato EEG.

Il metodo IFAST è stato oggetto, fino ad oggi, di tre pubblicazioni su riviste scientifiche internazionali:

M. Buscema, P. Rossini, C. Babiloni, E. Grossi, The IFAST model, a novel parallel nonlinear EEG analysis technique, distinguishes mild cognitive impairment and Alzheimer’s disease patients with high degree of accuracy, Artificial Intelligence in Medicine (2007) 40, 127-141.

M. Buscema, M. Capriotti, F. Bergami, C. Babiloni, P. Rossini, E. Grossi, The Implicit Function as Squashing Time Model: A Novel Parallel Nonlinear EEG Analysis Technique Distinguishing Mild Cognitive Impairment

Page 57: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

59

and Alzheimer’s Disease Subjects with High Degree of Accuracy, Computational Intelligence and Neuroscience, Volume 2007, Article ID 35021, 15 pp.

P. Rossini, M. Buscema, M. Capriotti, E. Grossi, G. Rodriguez, C. Del Percio, C. Babiloni, Is it possible to automatically distinguish resting EEG data of normal elderly vs. mild cognitive impairment subjects with high degree of accuracy? Clinical Neurophysiology 119 (2008) 1534–1545.

Nel primo e nel secondo articolo il metodo IFAST, solo sulla base dell’input dei 19 canali di EEG, è stato in grado di distinguere fra pazienti malati di Alzheimer (AD) e pazienti Mild Cognitive Impairment (MCI), con una capacità previsionale superiore al 90%.

Nel terzo articolo il database era composto da soggetti normali (NOld) e pazienti (MCI), IFAST è riuscito a classificarli sempre con un’accuratezza superiore al 90%. Una quarta pubblicazione è in corso di submission sulla rivista Current Alzheimer Research.

Lo studio realizzato nel 2008, che ha portato alla stesura dell’articolo per la quarta pubblicazione, ha inserito nel protocollo di elaborazione la Rete Neurale AutoContractive Map (AutoCM), la cui ispirazione teorica risale al 19944, e che negli ultimi anni è stata oggetto di numerose pubblicazioni su riviste scientifiche internazionali, per le applicazioni in campo medico (vedi il capitolo pubblicazioni scientifiche in questo volume).

L’obiettivo dello studio consisteva nel poter prevedere quei soggetti diagnosticati come MCI ad un tempo T0, che a distanza di un anno (tempo T1) si sarebbero convertiti in malati AD, anche leggeri. Per effettuare questa previsione si è dotato IFAST di una Rete Neurale molto potente nella fase di compressione come l’AutoCM, che nelle sperimentazioni ha dimostrato di raggiungere il migliore risultato. Da un punto di vista medico poter individuare con una diagnosi precoce i soggetti MCI che si trasformeranno in malati AD, a distanza di un certo tempo è un problema molto complesso. Nello studio il campione era composto da 143 pazienti diagnosticati come MCI, di questi 51 si sono trasformati in malati AD e 92 sono rimasti MCI. Lo studio attraverso l’applicazione di IFAST, utilizzando la rete AutoCM, e applicando diversi protocolli di elaborazione in doppio cieco, è riuscito ad individuare con un’accuratezza media superiore al 90% quei soggetti che si sarebbero trasformati in malati AD. Sullo stesso problema in letteratura gli studi attualmente ottengono un’accuratezza non superiore

4 Vedi Semeion - Rapporto di Ricerca n. 5, anno 2006, pag. 32, Aracne Editrice, 2007.

Page 58: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

60

all’80%, utilizzando sistemi di elaborazione come le Wavelet e la Blind Source Separation. Mostriamo la tabella di una delle elaborazioni effettuate nello studio. I risultati ottenuti riguardano i segnali con un range di frequenza 0-12 Hz, dove è stato applicato il sistema TWIST (Semeion©) per la riduzione del rumore e si riferiscono ad un subset di 6 reti Back Propagation.

n SE SP A.M.Acc. W.M.Acc. VP VN FP FN AUC

1 92.86 89.29 91.07 90.48 13 25 3 1 0.921 2 92.86 92.86 92.86 92.86 13 26 2 1 0.957 3 100 85.71 92.86 90.48 14 24 4 0 0.932 4 100 82.14 91.07 88.1 14 23 5 0 0.926 5 92.86 89.29 91.07 90.48 13 25 3 1 0.935 6 92.86 85.71 89.29 88.1 13 24 4 1 0.888

Mean 95.24 87.5 91.37 90.08 13.3 24.5 3.5 0.7 0.92

Risultati ottenuti con 6 reti Back Propagation su un subset del campione globale I risultati complessivi dello studio, oltre a confermare ulteriormente

le ipotesi teoriche di IFAST, individuano nella rete AutoCM il sistema migliore per proiettare in uno spazio la correlazione fra le variabili, mediante la costruzione di un adeguato luogo in cui la nozione di “vicinanza” riflette con precisione tutte le loro associazioni.

Riportiamo la figura di una rete AutoCM, per ricordarne la struttura.

Esempio di rete Auto-CM con 4 unità per strato e 20 connessioni complessive

] Input layer

] Hidden layer

] Output layer

Page 59: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

61

Software (IFAST SW ver. 7.0 Semeion©) Progetto e sviluppo: M. Buscema Il software IFAST è stato aggiornato con alcune nuove funzioni

nella versione 7.0, con la quale sono state effettuate le elaborazioni i cui risultati sono stati pubblicate negli ultimi articoli.

Pagina principale del SW IFAST 7.0

Page 60: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

62

2.7 Probabilistic Function As Squashing Time (P-FAST) Il metodo denominato P-FAST, ideato da M. Buscema, affronta un

problema simile a quello descritto dal più complesso sistema IFAST, da cui ne deriva anche l’analogia dell’acronimo che sta per Probabilistic Function As Squashing Time. Il problema consiste nel trovare un sistema di pre-processing che sia in grado di tradurre efficacemente nella dimensione spaziale segnali che si sviluppano nel tempo.

L’occasione pratica che ha consentito una riflessione su questo argomento è venuta dalla necessità di elaborare dati provenienti da nanosensori. In questo tipo di segnali la relazione temporale è propria, nel senso che i nanosensori registrano nel tempo la concentrazione di sostanze in un dato ambiente, quindi nella rappresentazione spaziale del modello, questa logica dev’essere mantenuta.

Il primo passo consiste nel selezionare una metrica tra quelle disponibili sia in letteratura (distanza euclidea, correlazione lineare, ecc.) che tra quelle ideate dal Semeion (AutoContractiveMap, Prior Probability, ecc.).

Nello schema sottostante si descrive il percorso necessario per passare da una matrice quadrata che contiene i valori di un database originario, ad una nuova matrice quadrata che rispetta la logica temporale contenuta nel database iniziale.

Page 61: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

63

Applicazione della metrica(Euclidea, Lineare, AutoCM,

PPA…)

Matrice quadratadei pesi

Calcolo del

Minimum Spanning Tree

Matrice quadrata composta da 1/0

Implementazione dei nuovi valoriIf (x=1) then W

Nuova matrice quadrata (N-MQ)N-MQ(n+1)= N-MQ (n)+ N-MQ(n-1)

Finestra mobile con shift di 1 record

Applicazione della metrica(Euclidea, Lineare, AutoCM,

PPA…)

Matrice quadratadei pesi

Calcolo del

Minimum Spanning Tree

Matrice quadrata composta da 1/0

Implementazione dei nuovi valoriIf (x=1) then W

Nuova matrice quadrata (N-MQ)N-MQ(n+1)= N-MQ (n)+ N-MQ(n-1)

Finestra mobile con shift di 1 record

Schema del processo di elaborazione di P-FAST I passi sostanziali del percorso descritto sono due: l’applicazione del

Minimum Spanning Tree (MST), che mette in evidenza la struttura minima fra le variabili che compongono il database e la finestra mobile che permette di ricostruire nello spazio la successione degli eventi nel tempo.

Per comprendere meglio il processo prendiamo ad esempio una semplice situazione in cui è necessario comprendere le relazioni che legano tre soggetti durante una conversazione, cercando di capire come si sono modificate nel tempo.

Immaginiamo che queste tre persone interagiscono fra loro parlando, dopo un po’ di tempo è possibile calcolare il MST, che descrive la struttura minima delle loro relazioni.

Dopo aver stabilito il primo MST si calcolano il numero di parole che ognuno dei soggetti si è scambiato.

Stabilendo un intervallo temporale che registra la conversazione e conta il numero di parole scambiate si modifica la struttura della matrice e si calcolano diversi MST. Sommando le matrici che si sono formate si ottiene sempre una nuova matrice, analizzando la quale è possibile vedere come si sono modificate le relazioni nel tempo.

Page 62: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

64

Questa stessa logica è stata applicata ad un progetto sperimentale sui nanosensori, i cui risultati vengono descritti in dettaglio nella sezione Ricerca Applicata di questo volume. Il processo di elaborazione è molto simile. Il nanosensore, che ha il compito di rilevare il grado di concentrazione di alcune sostanze presenti nell’ambiente, produce in uscita 5 valori, questi valori interagiscono fra loro nel tempo. Selezionando le matrici di valori in step temporali definiti, si riesce ad ottenere una rappresentazione integrata delle relazioni fondamentali nella loro dimensione temporale per tutta la durata del fenomeno.

Questa procedura consente di estrarre una matrice di valori che diventa un vettore di input per una Rete Neurale Supervisionata. Il vettore di input per la rete supervisionata è dato dalla seguente formula:

( )12

n n× −

Nel caso dei nanosensori il vettore di input è composto da 10 valori (n=5), a cui è possibile aggiungere 2 indici:

- un primo indice denominato ДMean, che somma le variazioni della media su ogni canale;

- un secondo indice denominato ДVar, che somma le variazioni delle variazioni della media su ogni canale.

Questa composizione definisce due metriche, derivate dai diversi vettori di input.

Due altre metriche, derivate da una differente composizione dei vettori di input, sono state ideate da G. Massini e denominate Ranking dinamico. Le metriche sono due perché il ranking può essere effettuato sia sui valori reali che sui valori scalati. Durante il processo di elaborazione viene fissata, ad intervalli regolari, una classifica della posizione dei record del database.

Un’altra metrica, ideata da S. Terzi, consiste nel parametrizzare il cambiamento di ognuna delle curve prodotte, stabilendo delle soglie di controllo. In questo caso il vettore di input è composto dai soli valori prodotti dai nanosensori senza altre aggiunte.

Software (P-FAST SW ver. 4.0 Semeion©) Progetto e sviluppo: M. Buscema Il metodo P-FAST è stato implementato in un software di ricerca,

molto essenziale, per consentire le elaborazioni su un progetto di ricerca descritto nella sezione Ricerca Applicata di questo volume.

Page 63: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

65

Pagina principale del SW P-FAST 4.0

Nella pagina del software sono elencate le diverse metriche con cui

possono essere elaborati i dati.

Page 64: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

66

2.8 General Unsupervised Adaptive Algorithm for Modular Organization of Learning Evolution (GUACAMOLE)

Nell’ambito del lavoro di ricerca finalizzato ad approfondire lo

studio delle Reti Neurali Auto-Associate non lineari5, nel 2008 M. Buscema ha ideato un modello di elaborazione denominato General Unsupervised and Adaptive Classification Algorithm for Modular Organization of Learning Evolution (GUACAMOLE), di cui si prevede di realizzare un brevetto nel 2009.

La domanda iniziale che il ricercatore si è posto e che poi ha consentito lo sviluppo di tale modello è la seguente: “Come è possibile costruire un sistema artificiale capace di effettuare un processo di pattern recognition, senza utilizzare Reti Neurali Supervisionate?”.

In letteratura il problema non era mai stato affrontato in questi termini. Le Reti Neurali Supervisionate sono risultate sempre efficaci per la classificazione e il riconoscimento di modelli e, soprattutto quando i problemi di classificazione diventano particolarmente complessi, queste reti sono in grado di competere, raggiungendo spesso risultati migliori, con altri modelli statistici come: Support Vector Machines, reti Bayesiane, diversi tipi di alberi decisionali, KNN, tecniche gaussiane, modelli di metaclassificazione.

L’approccio delle reti supervisionate e dei modelli analoghi condividono una metodologia comune: hanno bisogno di utilizzare un protocollo nel quale il database deve essere suddiviso in due parti, una prima parte serve per il training dei modelli utilizzando la coppia ‘input-target’, per identificare i parametri attraverso l’addestramento dei pesi, una seconda parte serve per verificare il grado di accuratezza della classificazione.

Inoltre questi approcci condividono la classica distinzione statistica fra variabili dipendenti e indipendenti. Questa coppia di concetti sembra avere un fondamento da un punto di vista empirico, ma appare completamente non plausibile da un punto di vista biologico, fino ad oggi, infatti, non esistono evidenze dell’esistenza di “neuroni insegnanti”. Al contrario, per quello che si sa rispetto al loro funzionamento, tutti i neuroni sembrano creare, adattare e cancellare le loro connessioni in un modo non supervisionato. La domanda iniziale,

5 Vedi Semeion Piano Triennale 2008-2010 - Ricerca di Base e Applicata, Aracne Editrice, Roma, 2008, pp. 56-69.

Page 65: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

67

quindi, appare assolutamente in linea con l’idea di avvicinarsi in modo sempre più efficace a simulare il funzionamento di fenomeni che appartengono al mondo naturale.

Il primo indispensabile pre-requisito di un sistema che effettua pattern recognition in modo non supervisionato consiste nel potersi confrontare con successo con i classici algoritmi supervisionati, altrimenti la sua implementazione non avrebbe senso. Elenchiamo più in dettaglio i requisiti che un sistema come GUACAMOLE deve avere, per poter essere confrontato con gli altri modelli che rispondono allo stesso compito:

- innanzitutto deve classificare i nuovi vettori di input che si presentano al sistema uguagliando o migliorando la capacità di classificazione dei modelli supervisionati;

- quando il sistema viene stimolato da un nuovo vettore di input deve funzionare come una memoria dinamica, diversamente dagli algoritmi supervisionati che congelano il lavoro in un’unica risposta;

- il sistema dev’essere in grado di generare autonomamente nuovi vettori di input per ognuna delle classi;

- il sistema dev’essere in grado di simulare le conseguenze dinamiche dei suoi risultati di classificazione.

Lo schema di elaborazione di GUACAMOLE è illustrato nelle due figure seguenti. La prima figura mostra la fase di training indipendente per ognuna delle classi con cui è stato suddiviso il database originario. La seconda figura mostra la fase di testing.

Page 66: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

68

Class 1 Class 2 Class 3 …

Class NClass 1 Class 2 Class 3 …

Class N

Schema di elaborazione della fase di training di GUACAMOLE

Nella fase di training il database originario viene articolato in

sottocampioni e distribuito casualmente in singole classi. I dati di ogni classe vengono elaborati da diversi tipi di Reti Neurali AutoAssociate. Lo scopo dell’apprendimento consiste nell’individuare la funzione che replica correttamente l’input con l’output in tutti i record presenti in ognuna delle classi. In ogni classe si effettua un training indipendente senza mostrare il target alla rete.

Al termine della fase di training tutti i record saranno collocati in una delle classi, l’appartenenza alla classe (1, 2, 3, ecc.) sarà determinata dal grado di similitudine dei record.

Page 67: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

69

Class 1 Class 2 Class 3 …

Class PClass 1 Class 2 Class 3 …

Class P

TrainError(1) TrainError(2) TrainError(3) TrainError(P)

New Testing Record=Min{En(p)}

TrainError(1) TrainError(2) TrainError(3) TrainError(P)

New Testing Record=Min{En(p)}

Schema di elaborazione della fase di testing di GUACAMOLE

Nella successiva fase di testing i nuovi record, sconosciuti alla rete neurale, vengono attribuiti alle singole classi in relazione alla minimizzazione della funzione di costo, con cui si calcola l’efficacia di quella rete.

In altri termini è come se i nuovi record di testing si scegliessero la classe nella quale risultano meglio collocati, ottimizzando le funzioni di costo in relazione al modello di rete neurale utilizzato per l’elaborazione. Al termine di questo processo il sistema misura l’accuratezza della classificazione confrontandolo con il target di ogni singola classe.

L’architettura del sistema GUACAMOLE utilizza attualmente due differenti tipi di reti neurali Auto-Associate:

- la New Recirculation Neural Network (NRC) ideata inizialmente da Hinton nel 1988, e rinnovata con nuove equazioni da Buscema nel 19986;

6 G.E. Hinton and J.L. McClelland Learning Representation by Recirculation in Proceedings of IEEE Conference on Neural Information Processing Systems, November 1988.

Page 68: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

70

- la Auto Contractive Map (AutoCM) ideata da Buscema nel 1997, con aggiornamenti e perfezionamenti apportati fino al 20077.

Nelle prove sperimentali, che sono state finora effettuate, il sistema GUACAMOLE ha ottenuto dei risultati molto positivi e, in alcuni casi, sorprendenti.

Mostriamo i risultati di due sperimentazioni confrontati con quelli ottenuti tramite altri modelli.

Il primo esempio consiste nel riconoscimento di caratteri numerici scritti a mano. Il database è composto di 1.594 caratteri scritti manualmente da persone diverse, collocate in differenti contesti e codificate in 256 bit, corrispondenti ad una griglia 16x16. L’obiettivo è quello di classificare correttamente ogni carattere numerico, si tratta quindi di una classificazione 1 di 10.

ANN Test Output1 Output2 Output3 Output4 Output5 Output6 Output7 Output8 Output9 Output10 A.Mean Acc W.Mean Acc ErrorsGUACAMOLE 97.50% 95.24% 87.18% 92.31% 95.12% 84.62% 100.00% 94.87% 92.50% 92.11% 93.14% 93.22% 27MetaGen_TEST 97.50% 95.24% 92.31% 92.31% 90.24% 92.31% 97.56% 92.31% 87.50% 92.11% 92.94% 92.96% 28MetaBayes 97.50% 97.62% 89.74% 74.36% 85.37% 89.74% 100.00% 92.31% 85.00% 100.00% 91.16% 91.21% 35MetaCm 95.00% 88.10% 87.18% 92.31% 87.80% 87.18% 97.56% 92.31% 85.00% 92.11% 90.45% 90.45% 38FF_Bm24 95.00% 90.48% 84.62% 92.31% 87.80% 87.18% 100.00% 89.74% 75.00% 92.11% 89.42% 89.45% 42FF_Bp24 92.50% 85.71% 87.18% 87.18% 90.24% 79.49% 95.12% 89.74% 90.00% 89.47% 88.66% 88.69% 45FF_Sn24 92.50% 85.71% 87.18% 89.74% 87.80% 84.62% 97.56% 92.31% 75.00% 94.74% 88.72% 88.69% 45FF_Lvq24 90.00% 85.71% 92.31% 94.87% 90.24% 84.62% 90.24% 84.62% 90.00% 81.58% 88.42% 88.44% 46

ANN Pred Output1 Output2 Output3 Output4 Output5 Output6 Output7 Output8 Output9 Output10 A.Mean Acc W.Mean Acc ErrorsGUACAMOLE 100.00% 100.00% 97.50% 95.00% 97.50% 100.00% 97.50% 95.00% 100.00% 90.00% 97.25% 97.24% 11MetaCmP 97.50% 100.00% 97.50% 87.50% 92.50% 95.00% 95.00% 82.50% 94.74% 90.00% 93.22% 93.22% 27MetaGenP 97.50% 97.50% 95.00% 97.50% 90.00% 95.00% 92.50% 82.50% 92.11% 80.00% 91.96% 91.96% 32MetaBayesP 95.00% 100.00% 85.00% 82.50% 92.50% 97.50% 90.00% 80.00% 92.11% 97.50% 91.21% 91.21% 35FF_Bp24P 95.00% 97.50% 90.00% 95.00% 90.00% 92.50% 92.50% 87.50% 84.21% 82.50% 90.67% 90.70% 37FF_Bm24P 100.00% 97.50% 95.00% 85.00% 87.50% 95.00% 92.50% 75.00% 89.47% 87.50% 90.45% 90.45% 38FF_Lvq24P 95.00% 95.00% 92.50% 97.50% 90.00% 90.00% 90.00% 80.00% 92.11% 65.00% 88.71% 88.69% 45FF_Sn24P 97.50% 95.00% 82.50% 90.00% 92.50% 87.50% 87.50% 77.50% 86.84% 87.50% 88.43% 88.44% 46

Tabella dei risultati sul database dei caratteri numerici scritti a mano

In questo esperimento GUACAMOLE raggiunge il miglior

risultato, sia nel testing che nel prediction, messa a confronto non solo con Reti Neurali Supervisionate, ma anche con i più potenti metaclassificatori, presenti in letteratura. La tabella mostra, evidenziata in giallo, l’accuratezza media raggiunta da GUACAMOLE. In tutti gli esperimenti su questi dati il risultato del sistema è sempre stato migliore degli altri classificatori e metaclassificatori utilizzati.

M. Buscema Recirculation Neural Networks in SUM 33(2), pp. 383-388, 1998. 7 M. Buscema, R. Petritoli, G. Pieri, P. Sacco Auto Contractive Maps Semeion Technical Paper 32, 2008, Aracne Editrice, Roma.

Page 69: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

71

Il secondo esperimento è stato effettuato su un database medico di pazienti affetti da sclerosi laterale amiotrofica (SLA)8. Sono stati utilizzati gli stessi dati di una pubblicazione già uscita per verificare la capacità di miglioramento potenziale utilizzando GUACAMOLE. Il database era costituito da 54 pazienti affetti da SLA e da un campione di controllo di 208 casi. I risultati sono riportati nelle tre tabelle seguenti.

LDA Casi Controlli A.Mean Acc W.Mean Acc ErrorsLDA1AB 89.66% 73.08% 81.37% 76.69% 31LDA1BA 86.21% 74.76% 80.48% 77.27% 30LDA2AB 82.76% 74.04% 78.40% 75.94% 32LDA2BA 79.31% 75.73% 77.52% 76.52% 31LDA3AB 89.66% 76.92% 83.29% 79.70% 27LDA3BA 79.31% 72.82% 76.06% 74.24% 34LDA4AB 68.97% 75.96% 72.46% 74.44% 34LDA4BA 79.31% 71.84% 75.58% 73.48% 35LDA5AB 72.41% 66.35% 69.38% 67.67% 43LDA5BA 65.52% 75.73% 70.62% 73.48% 35Media 79.31% 73.72% 76.52% 74.94% 33.20

Risultati sul database della SLA con la Linear Discriminant Analysis

Supervised ANN Casi Controlli A.Mean Acc W.Mean Acc ErrorsFF_Bp(1AB) 86.21% 87.50% 86.85% 87.22% 17FF_Bp(1BA) 86.21% 83.50% 84.85% 84.09% 21FF_Bp(2AB) 82.76% 75.96% 79.36% 77.44% 30FF_Bp(2BA) 79.31% 88.35% 83.83% 86.36% 18FF_Bp(3AB) 79.31% 82.69% 81.00% 81.95% 24FF_Bp(3BA) 82.76% 77.67% 80.21% 78.79% 28FF_Bp(4AB) 72.41% 85.58% 79.00% 82.71% 23FF_Bp(4BA) 82.76% 75.73% 79.24% 77.27% 30FF_Bp(5AB) 82.76% 61.54% 72.15% 66.17% 45FF_Bp(5BA) 68.97% 83.50% 76.23% 80.30% 26Media 80.35% 80.20% 80.27% 80.23% 26.20

Risultati sul database della SLA con la rete supervisionata Back Propagation

8 S. Penco, M. Buscema, M. C. Patrosso, A.Marocchi, E. Grossi, New application of intelligent agents in sporadic amyotrophic lateral sclerosis identifies unexpected specific genetic background, BMC Bioinformatics 2008, 9:254.

Page 70: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

72

GUACAMOLE Casi Controlli A.Mean Acc W.Mean Acc ErrorsGuacamole(1ab) 93.10% 100.00% 96.55% 98.50% 2Guacamole(1ba) 100.00% 100.00% 100.00% 100.00% 0Guacamole(2ab) 93.10% 100.00% 96.55% 98.50% 2Guacamole(2ba) 96.55% 100.00% 98.28% 99.24% 1Guacamole(3ab) 93.10% 100.00% 96.55% 98.50% 2Guacamole(3ba) 93.10% 99.03% 96.07% 97.73% 3Guacamole(4ab) 93.10% 98.08% 95.59% 96.99% 4Guacamole(4ba) 93.10% 99.03% 96.07% 97.73% 3Guacamole(5ab) 96.55% 100.00% 98.28% 99.25% 1Guacamole(5ba) 86.21% 100.00% 93.10% 96.97% 4Media 93.79% 99.61% 96.70% 98.34% 2.20

Risultati sul database della SLA con GUACAMOLE

Mettendo a confronto le tre tabelle si può notare come i risultati del

sistema GUACAMOLE siano sempre superiori a quelli ottenuti sia dalla Linear Discriminant Analysis, che dai modelli di Reti Neurali Supervisionate.

Software (Meta AutoAssociative ANNs SW ver. 3.0 Semeion©) Progetto e sviluppo: M. Buscema Le Reti AutoAssociate che compongono il sistema GUACAMOLE

sono state implementate nel software Meta AutoAssociative ANNs, che è finalizzato alla sperimentazione con questo tipo di reti in una logica di confronto continuo con le reti supervisionate.

Page 71: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

73

Pagina principale del SW Meta AutoAssociative ANNs ver. 3.0

Page 72: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

74

2.9 Meta-Classificatori: evoluzioni Da alcuni anni si è aperta una nuova linea di ricerca all’interno del

Semeion per fornire un contributo alla costruzione di modelli di meta-classificazione sia di tipo supervisionato che non-supervisionato, tema attualmente molto presente in letteratura. Nel Piano Triennale (2008-2010) del Semeion questo argomento è stato ampiamente trattato.

L’obiettivo di tali sistemi consiste nel tentare di migliorare il risultato di una classificazione in termini di accuratezza. I Meta-Classificatori, ideati e sviluppati all’interno del Semeion, sono stati definiti globalmente Meta-Nets, perché implementano diversi tipi di reti neurali e costituiscono una famiglia di modelli con una serie di tratti in comune. Descriviamo brevemente questi tratti:

- tutti i modelli Meta-Nets hanno una tipica architettura di rete neurale, dove i nodi di input costituiscono l’output complessivo di tutti i classificatori che compongono il modello, e dove i nodi di output sono i target di classificazione del problema;

- le connessioni fra l’input e l’output dei modelli Meta-Nets sono sempre a gradiente massimo, e sono definiti da specifici algoritmi che caratterizzano la peculiarità del singolo modello;

- il vettore di output dei modelli Meta-Nets è calcolato da un’equazione probabilistica denominata Soft Max;

- tutti i modelli Meta-Nets sono non supervisionati, ogni modello valuta il proprio output non conoscendo la composizione degli errori dei classificatori, ma soltanto la statistica delle loro risposte. Ciò implica che i Meta-Nets sono particolarmente sensibili alla qualità dei classificatori da ottimizzare.

Per poter essere utilizzati i modelli Meta-Nets condividono una serie di caratteristiche che ne determinano il protocollo di funzionamento. Sintetizziamo i punti principali di tali caratteristiche:

- per applicare un modello Meta-Net il database dev’essere diviso in tre sottocampioni casuali: Training set, Testing set e Prediction set; Training e Testing costituiscono il campione di Tuning, necessario all’addestramento del modello, il Prediction o Validation set costituisce il sottocampione con il quale vengono valutate le prestazioni dei Meta-Nets;

- il numero dei nodi di input (M) è uguale al numero degli output (N) originali dei classificatori che lavorano come componenti di una Meta-Net (P), M=PxN;

Page 73: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

75

- il numero dei nodi di output è lo stesso delle classi originali (N); - le connessioni (C) tra l’input e l’output sono a matrice completa,

C=MxN; - ogni valore di connessione rappresenta la plausibilità attraverso

la quale ogni classificatore componente supporta il nodo della Meta-Net;

- il valore numerico di ogni connessione di una Meta-Net può appartenere all’intervallo tra (-∞, implausibilità) e (+∞, plausibilità);

- la plausibilità e l’implausibilità di ogni connessione è in funzione della probabilità di ogni componente di Meta-Net durante la fase di testing;

- la classificazione finale di una Meta-Net è la composizione probabilistica dei suoi input pesati su ogni nodo di output (algoritmo Soft Max).

Da un punto di vista matematico la caratteristica generale che accomuna tutti gli algoritmi di una Meta-Net è la specifica procedura attraverso la quale la plausibilità di ogni output di ognuno dei classificatori è connesso con ognuno degli output del Meta-Classificatore globale.

Nella figura sottostante mostriamo la rappresentazione generale di una Meta-Net, con una visualizzazione degli elementi descritti.

Architettura generale di una Meta-Net

Page 74: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

76

Per concludere questo panorama riassuntivo sui meta-classificatori è importante sottolineare che esistono diversi algoritmi per calcolare il valore dei pesi di una Meta-Net, e che altri possono essere aggiunti per svolgere lo stesso compito. Il livello di complessità degli algoritmi è molto differenziato, comunque è possibile raggrupparli in 4 tipi:

1. Deterministic Local Meta-Net (DL-MN): ogni algoritmo è una semplice equazione per calcolare i pesi, che rappresenta ogni classificatore nella Meta-Net; a. Meta Bayes (Buscema 1994); b. Meta Sum (Buscema 2007); c. Meta Fuzzy (Buscema 2008); d. Meta Exp (Buscema 2008); e. Meta Einstein (Buscema 2008).

2. Learning Local Meta-Net (LL-MN): ogni algoritmo è una rete neurale in cui i pesi addestrati rappresenteranno ogni classificatore nella Meta-Net; a. Meta AutoAssociative (Buscema 1994); b. Meta Local AutoContractive Map (Buscema 2007); c. Meta Local Harmonic (Buscema 2007).

3. Deterministic Global MetaNet (DG-MN): ogni algoritmo è un’equazione per calcolare la matrice dei pesi di una Meta-Net, considerando tutti i classificatori simultaneamente; a. Prior Probability Algorithm (Buscema 2007);

4. Learning Global Meta-Net(LG-MN): ogni algoritmo è una rete neurale addestrata per calcolare la matrice dei pesi di una Meta-Net, considerando tutti i classificatori simultanea-mente; a. Meta Global Auto Contractive Map (Buscema 2007).

Come si può notare dall’elenco alcuni di questi algoritmi sono stati ideati nel 2008 ed implementati nel relativo software di ricerca.

Software (Meta-Nets SW ver. 5.0 Semeion©) Progetto e sviluppo: M. Buscema Per utilizzare i diversi modelli di Meta-Net è stato sviluppato un

software che ne implementa tutti gli algoritmi disponibili. Nella videata che segue si può osservare l’elenco degli algoritmi, da cui si evincono quelli introdotti nel 2008.

Page 75: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

77

Pagina principale del SW Meta-Nets ver. 5.0

Page 76: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

78

2.10 AutoSelf Organizing Map (AutoSOM)

Nel corso del 2008 G. Massini ha ideato un nuovo algoritmo che prevede un diverso modo di elaborare i dati utilizzando una rete neurale Self Organizing Map (SOM). La caratteristica fondamentale di questa procedura consiste nel poter dimensionare la matrice della SOM durante l’elaborazione, sulla base del database che la rete sta classificando. Normalmente applicando una SOM su un database è il ricercatore che deve decidere il dimensionamento della matrice in uscita osservando la struttura dei dati, la AutoSOM prende da sola questa decisione, osservando direttamente il database. Quindi la sua particolarità, rispetto ad una rete SOM classica, è proprio quella di non dovere definire a priori la conformazione e il numero di celle di cui il sistema ha bisogno.

Per far comprendere visivamente il processo mostriamo un esempio di conformazione “a fiore” che ha assunto la matrice dopo un apprendimento avvenuto su un database composto da 756 cifre scritte a mano e successivamente tradotte in immagini di dimensioni 16×16 pixel.

All’inizio del processo di elaborazione è stata data la possibilità alla rete AutoSOM di accedere ad una matrice di grandi dimensioni (100×100 celle), al termine del lavoro la rete ha spontaneamente ridotto la matrice a 46×47 celle.

Nella figura che segue viene mostrata un parte della matrice al termine della fase di apprendimento. Si può notare come la rete neurale ha identificato una zona della matrice nella quale ha collocato i risultati dell’elaborazione.

Page 77: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

79

Parte della matrice 100×100 a fine apprendimento (100 epoche)

Page 78: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

80

Nella figura successiva viene rappresentata la stessa matrice con la distribuzione delle frequenze dei codebook.

Visualizzazione delle frequenze sulla matrice

Una terza visualizzazione, infine, rappresenta la stessa matrice dove

vengono evidenziati, oltre ai codebook vincenti (le zone in scala dei grigi), i codebook di frontiera, più ambigui, in scala dei verdi.

Page 79: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

81

Winner codebooks (scala dei grigi), altri codebooks (scala dei verdi)

Nell’ultima figura, infine, mostriamo un’elaborazione, nella quale

sono stati inseriti i target, dove appaiono i diversi record che si sono distribuiti nelle aree definite della matrice, mentre le zone che non classificano nessun record definiscono i bordi di tali aree.

Page 80: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

82

Distribuzione dei cluster sulla base dei 10 target

Page 81: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

83

Software (AutoSOM SW ver. 1.0 Semeion©) Progetto e sviluppo: G. Massini Come di consueto l’algoritmo AutoSOM è stato implementato nel

2008 in un software omonimo, ancora con impianto sperimentale e suscettibile di ulteriori funzioni da sviluppare.

Pagina principale del SW AutoSOM ver. 1.0

Page 82: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

84

2.11 Nuove versioni e nuovi software del 2008 Per facilitare la visione globale del lavoro di implementazione dei

modelli e degli algoritmi scoperti nel 2008, forniamo un elenco riepilogativo delle versioni dei software di ricerca 2008 con i relativi aggiornamenti.

M. Buscema MST-MRG SW ver. 5.2 Semeion Software n. 38, Roma, 2008.

In questa versione del software è stata aggiunta la pagina “Validation” che consente il confronto tra vari MST dello stesso algoritmo attraverso l’attivazione del comando “Test”, e parallelamente analogo confronto fra più MST di algoritmi diversi effettuati sullo stesso database (comando “Compare”).

Page 83: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

85

M. Buscema AutoAssociative Neural Network SW ver. 10.0 Semeion Software n. 13, Roma, 2008.

Nella versione 2008 il software AutoAssociative Neural Network implementa due nuove funzioni, precisamente:

- il calcolo della matrice delle distanze (*.wtx) sulla base dei pesi addestrati;

- il calcolo, a partire dalle connessioni addestrate, il database delle traiettorie di ogni variabile e, tramite campionamento sulla binomiale delle combinazioni delle variabili, calcola il database delle traiettorie potenziali dell’intero database originale.

Page 84: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

86

M. Buscema PST Cluster SW ver. 6.2 Semeion Software n. 34, Roma, 2008.

In questa nuova versione del software è stato fatto un notevole lavoro di implementazione di nuovi algoritmi ed equazioni, ecco il dettaglio:

- la collocazione del TWC (Alfa Parameter); - la collocazione del STWC (Beta Parameter); - la trasformazione del piano in un campo scalare; - il calcolo del gradiente del piano; - la trasformazione del campo scalare in vettoriale; - il calcolo dell’ MST curvilineo; - il calcolo delle traiettorie da un punto all’altro del piano; - il calcolo del campo delle traiettorie; - il calcolo del campo vettoriale delle traiettorie; - la coniugazione delle trasformazioni precedenti tramite le

distanze tra i punti calcolate attraverso l’elaborazione di una rete neurale AutoCM di un nuovo database, nel quale i punti sono codificati tramite coordinate non fisiche, diverse e astratte.

Page 85: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

87

M. Buscema ACM SW ver. 12.0 Semeion Software, n. 30, Roma, 2008.

Anche il software ACM nel versione del 2008 ha implementato

importanti algoritmi: - Il filtro BB-Gradient (Sobel) coniugato con ACM PmH; - Le nuove versioni di J-Net:

i. J-Net Order: Sum OR Product; ii. J-Net Actors: Weights OR States.

- La nuova H-Net nelle versioni H0, H1, H2 e con l’opzione Alfa, ampiamente descritta in questo volume.

Page 86: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

88

M. Buscema P-FAST SW ver. 4.0 Semeion Software, n. 52, Roma, 2008.

L’implementazione di nuovi algoritmi nel software P-Fast ha

consentito un ampliamento dei modelli per l’analisi delle serie temporali multivariate. Ecco l’elenco degli algoritmi implementati nel 2008:

- Euclidean Distance Scaled (Buscema 2008); - Prior Probability (Buscema 2008); - AutoContractive Map (Buscema 2008); - Delta Mean (Buscema 2008); - Delta Variance (Buscema 2008); - Ranking (Massini 2008); - Scaled Ranking (Massini 2008).

Page 87: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

89

M. Buscema Meta AutoAssociative ANNs SW ver. 3.0 Semeion Software n. 50, Roma, 2008.

Le Reti AutoAssociate, che compongono il sistema GUACAMOLE, implementate nel software Meta AutoAssociative ANNs sono 4:

- AutoContractive Map; - New Recirculation; - Auto AM; - Auto Back Propagation.

Page 88: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

90

M. Buscema Meta-Nets SW ver. 5.0 Semeion Software, n. 44, Roma, 2008.

Nel software Meta-Nets sono stati implementati tutti i nuovi meta-

classificatori ideati all’interno del Semeion, ne riproponiamo l’elenco completo:

a. Meta Bayes ( Buscema 1994); b. Meta Sum (Buscema 2007); c. Meta Fuzzy (Buscema 2008); d. Meta Einstein Sum (Buscema 2008); e. Meta Exponential (Buscema 2008); f. Meta Auto Associative (Buscema 1994); g. Prior Probability Algorithm (Buscema 2007); h. Meta AutoContractive Map, Local and Global, (Buscema

2007); i. Meta Harmonic (Buscema 2007).

Page 89: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

91

G. Massini AutoSOM SW ver. 1.0 Semeion Software, Roma, 2008.

La versione 1.0 del software attualmente contiene solo l’algoritmo Auto Self Organizing Map, si prevede di sviluppare nuove funzioni nei prossimi anni.

Page 90: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

92

Page 91: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

93

Ricerca applicata: Progetti e software applicativi

Page 92: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

94

Page 93: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

95

3. La Ricerca Applicata: progetti e software applicativi La ricerca applicata rappresenta il ponte tra la ricerca di base e quella

industriale. Ha lo scopo di verificare la trasferibilità e la produttività delle scoperte che provengono dalla ricerca di base nel campo sociale e industriale.

La comunicazione efficiente tra ricerca di base e ricerca applicata è il punto critico per l’efficace implementazione di quest’ultima. In un progetto di ricerca applicata, i riferimenti a teorie sperimentate e validate devono essere chiari e dettagliati.

Un modo per rendere efficiente la comunicazione tra ricerca di base e ricerca applicata è quello di formare esperti di ricerca applicata che siano in grado di comprendere a fondo le teorie sperimentate in quel campo, avendo la capacità di estrarre da esse idee applicative vantaggiose sotto il profilo sociale ed economico.

In questa prospettiva il Semeion ha formato, e continua a formare, ricercatori con un profilo che identifica gli esperti di ricerca applicata come persone competenti tecnicamente nei diversi ambiti di interesse, principalmente orientati alla applicazione industriale e/o sociale della ricerca di base.

Questa organizzazione dell’attività di ricerca favorisce la realizzazione di tecnologie innovative e competitive orientate al mercato, interpretando i diversi bisogni sia delle imprese sia del settore pubblico.

L’attività di ricerca istituzionale del Semeion si ferma quindi alla soglia della ricerca industriale, che deve essere intesa come la traduzione delle tecnologie possibili in prodotti e/o processi innovativi, utilizzabili in un mercato di consumatori e/o utenti. L’ideazione di brevetti è il risultato della logica produttiva della ricerca applicata, che ha anche il compito di proteggere le architetture dei processi di produzione e dello stesso prodotto finale.

All’interno del Semeion la ricerca applicata si concretizza nell’effettuazione di elaborazioni e sperimentazioni su ogni tipo di problema che sia articolato in uno specifico Database. Tali sperimentazioni vengono fatte utilizzando i modelli e gli algoritmi ideati e scoperti nell’attività di ricerca di base; i risultati sono il prodotto dei singoli progetti di ricerca.

Per effettuare questa attività i ricercatori del Semeion hanno messo a punto metodi di elaborazione dotati di specifici protocolli di

Page 94: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

96

validazione, utilizzando procedure che fanno riferimento agli standard internazionali.

Coerentemente con il Piano Triennale 2008-2010, pubblicato lo scorso anno, l’attività di ricerca applicata nel 2008 si è focalizzata su 3 campi applicativi:

- biomedicale: imaging diagnostico e clinico-farmaceutico; - sicurezza sociale e fenomeni criminali; - industriale, marketing e mondo del lavoro. È importante sottolineare che in questo volume non è possibile

descrivere molto del lavoro di ricerca applicata svolto nel corso del 2008 nel settore sicurezza sociale. Si tratta, infatti, di progetti svolti in collaborazione con importanti istituzioni a carattere riservato, dei quali non è possibile fornire né informazioni, né risultati.

Nella descrizione di progetti abbiamo mantenuto la struttura a schede, inaugurata nel Piano Triennale, per ogni singolo progetto si riporta:

- obiettivo; - risultati conseguiti; - equipe di ricerca e partner esterno; - sviluppi.

Page 95: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

97

3.1 Biomedicale settore Imaging Il campo biomedicale è attivo dalla fine del 2000 ed è stato oggetto

di innumerevoli progetti di ricerca applicata nel corso degli ultimi otto anni, i risultati di questi progetti hanno dato luogo a pubblicazioni su riviste scientifiche internazionali. Il partner di riferimento interessato ai risultati emersi da questi progetti di ricerca è il Gruppo Bracco, articolato nelle due aziende principali Bracco SpA e Bracco Imaging SpA. Quest’ultima è anche il principale finanziatore dei singoli progetti nel settore dell’imaging.

3.1.1 Applicazione della rete J-Net su Lung Image Database

Consortium (LIDC) Obiettivo del progetto L’obiettivo del progetto è di effettuare una prima esplorazione sulla

capacità dell’algoritmo J-Net9 di stimare la malignità dei noduli al polmone. Il sistema J-Net è un algoritmo proprietario del Semeion (Semeion©) ideato da M. Buscema, la cui pubblicazione scientifica è avvenuta nel 2008.

La sorgente dei dati, su cui sono state effettuate tutte le elaborazioni, è costituita da immagini TAC del database Lung Image Database Consortium (LIDC) del National Cancer Institute. Il database riporta i dati di 85 pazienti: la cartella di ogni paziente contiene le immagini TAC, in formato DICOM, del torace e i giudizi di 4 radiologi relativi alla presenza di eventuali noduli.

In particolare sono riportate le informazioni relative a noduli grandi (≥ 3mm ): le caratteristiche morfologiche, le coordinate spaziali dei voxel relativi al nodulo e la stima della malignità. Quest’ultima misura era articolata in 5 differenti livelli di gravità: 1 = decisamente benigno; 2 = probabilmente benigno; 3 = incerto; 4 = probabilmente maligno; 5 = decisamente maligno.

9 M. Buscema, L. Catzola, E. Grossi, Images as Active Connection Matrixes: the J-Net System, ID MED, Vol. 2, No. 1, Page 27 of 53, 2008.

Page 96: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

98

Il gold standard di riferimento non era dato dalla biopsia, ma dal giudizio indipendente dei 4 esperti radiologi. Si noti che ogni lettura effettuata dai radiologi è stata considerata come un singolo nodulo, non considerando che differenti letture si possono riferire allo stesso nodulo. Il motivo di questa drastica semplificazione deriva dallo scopo di questo studio preliminare, consistente nel rintracciare indicazioni sull’effettiva possibilità di prevedere la malignità dei noduli dai parametri estratti tramite il sistema J-Net.

Risultati conseguiti Lo schema che segue illustra le attività e le fasi del progetto:

DB Immagini [DICOM]

DB Annotazioni [XML]

Conversione DICOM/ACM

(MATLAB) DB Immagini

[ACM]

J-Net (ACM BATCH)

Importazione Annotazioni

Confronto Annotazioni/Elaborazioni J-Net

Immagini Processate da

J-Net

Importazione e Codifica immagini processate da J-

Net

Schema delle attività progettuali

La prima attività effettuata è stata l’importazione in Matlab di tutte

le immagini in formato DICOM e la loro conversione in unità Hounsfield: ciò ha permesso di processare insieme immagini provenienti da sistemi di acquisizione diversi.

Page 97: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

99

Quindi le porzioni di immagini contenenti i noduli sono state estratte e processate con J-Net (parametro Union–State, 3 cicli) ripetutamente modulando il valore di alfa (da -1 ad 1 con passo 0.1).

Tramite J-Net da una singola immagine di partenza sono state ottenute 11 immagini differenti (una per ogni valore di alfa). Il post-processamento è consistito nella segmentazione delle immagini ottenute e la misura dell’indice perimetro/area (IPA) delle superfici rappresentanti i noduli. Il database risultante consiste di vettori di IPA per ogni nodulo.

Una prima analisi dei risultati è stata effettata applicando la Principal Component Analysis (PCA): la proiezione del database sulle due componenti principali estratte non ha evidenziato una netta separazione fra i noduli benigni (classi 1 e 2) dai noduli maligni (classi 3 e 4).

Risultati della PCA

Si è quindi effettuata una seconda analisi addestrando una batteria di

10 reti neurali artificiali (Feed Forward Back Propagation) utilizzando un protocollo Training-Test-Validation: è stata ottenuta una sensitività media pari a 83,18%, una specificità media pari a 58,82% per una accuratezza media pari a 72,56%.

Page 98: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

100

Una migliore prestazione è stata ottenuta utilizzando la rete GUACAMOLE (Semeion©): sensitività pari a 81,82%, specificità pari a 82,35% per un’accuratezza media pari a 82,09%.

Noduli benigni VS Noduli maligni

Sensitivity Specificity Arith. Mean Accuracy

FF-Bp GUACAMOLE

83.18% 81.82%

58.82% 82.35%

72.56% 82.09%

Tabella dei risultati finali del progetto con il confronto fra due diversi tipi di RNA Si può osservare che la rete GUACAMOLE evidenzia una buona

separabilità dei noduli benigni dai maligni, nonostante il gold standard sia arbitrario in quanto la classificazione della malignancy è basata sul giudizio dei radiologi e non sull’esame bioptico.

Equipe di ricerca e partner esterni L’equipe dei ricercatori che ha lavorato a questo progetto era

composta da R. Petritoli e S. Terzi. Il partner esterno, finanziatore del progetto è la Bracco Imaging

SpA. Sviluppi Attualmente il lavoro di ricerca è orientato ad aumentare le

applicazioni sia del modello J-Net che della rete neurale AutoAssociata GUACAMOLE, che si sta dimostrando particolarmente efficace su diversi problemi.

Page 99: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

101

3.1.2 Procedura automatica per la generazione di finestre su immagini con microcalcificazioni: DB CALMA

Obiettivo del progetto L’obiettivo del progetto consiste nell’individuare una procedura per

la generazione automatica delle finestre 60x60 (sliding window) delle immagini che presentano microcalcificazioni, e di valutare i risultati ottenuti, lavorando su una estrazione di immagini mammografiche presenti nel database CALMA (Computer Assisted Library for Mammography ).

Risultati conseguiti Lo schema che segue illustra l’insieme di attività che sono state

svolte sul progetto.

Immagini

Importazione (MATLAB)

Finestratura (MATLAB)

Immagini Formato ACM

Wavelet (MATLAB)

Immagini Formato ACM

Istogrammi (MATLAB) PmH e IAC

(ACM Batch)

DB per la classificazione

Classificazione 1/2 (Supervised)

Schema delle attività progettuali

L’insieme delle attività progettuali sono suddivise in 7 fasi.

Page 100: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

102

Fase 1: importazione immagini e finestratura In questa prima fase le immagini mammografiche sono state

importate in ambiente Matlab per consentire una strutturazione del database su cui effettuare le elaborazioni successive. Le immagini sono state organizzate in finestre mobili 60x60 pixel, e poi collocate all’interno di un nuovo tipo di database.

Fase 2: Implementazione filtraggio wavelet e combinazione di algoritmi In questa fase è stato implementato uno script di Matlab per

applicare alle finestre un filtraggio basato sulle wavelet, in riferimento alle specifiche disponibili. Sono stati scelti due approcci per affrontare il problema:

- applicazione di tecniche di filtraggio sofisticate, con l’aggiunta di una regola deterministica per il riconoscimento delle microcalcificazioni all’interno delle finestre;

- combinazione di metodi composti dall’algoritmo PmH (famiglia ACM, Semeion©), insieme ai valori dell’istogramma che descrive la distribuzione dei grigi, con una rete neurale addestrata sul passo precedente.

RimozioneBackground

AND

Contrast enhancement

ObjectIdent Erosion

Symlet 8

GaussianFiltering

NormalFit

RimozioneBackground

AND

Contrast enhancement

ObjectIdent Erosion

Symlet 8

GaussianFiltering

NormalFit

Schema delle tecniche di filtraggio con regola deterministica

Page 101: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

103

DB MICROFiltraggioWavelet

Gaussian noiseidentifier DB TRAINING

PmHHistogramANN

RISULTATI

DB MICROFiltraggioWavelet

Gaussian noiseidentifier DB TRAINING

PmHHistogramANN

RISULTATI

Schema della combinazione di metodi

Fase 3: Classificazione (micro/non micro) delle immagini Al termine di questi due processi di filtraggio delle immagini, sono

stati creati due diversi database, successivamente elaborati con Reti Neurali Supervisionate (Back-Propagation), per verificare la capacità di distinguere il tessuto con presenza/assenza di microcalcificazioni.

I risultati delle elaborazioni non sono stati particolarmente soddisfacenti. Il filtraggio con regola deterministica sottoposto alle reti neurali produce risultati che vanno da 79% al 92%, mantenendo però molto alti il numero dei falsi positivi (13.5 in media). La combinazione di algoritmi ottiene tra il 76% e il 90%, riducendo però sensibilmente il numero dei falsi positivi (3.4 in media), circa in terzo del metodo precedente.

Equipe di ricerca e partner esterni L’equipe dei ricercatori ha lavorato al progetto era composta da: S.

Terzi, M. Intraligi e M. Capriotti. Il partner esterno, finanziatore del progetto è la Bracco Imaging

SpA. Sviluppi

Page 102: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

104

Per migliorare i risultati emersi gli ulteriori sviluppi del progetto dovranno focalizzarsi sul preprocessing per migliorare l’estrazione del profilo del seno, sull’algoritmo d’identificazione per migliorare i parametri e sulla definizione di migliori feature da dare in input alle reti neurali.

3.1.3 Identificazione automatica di aree d’interesse per l’identificazione di masse tumorali

Obiettivo del progetto L’obiettivo del progetto è finalizzato alla costruzione di un modello

(ROI Hunter) per l’identificazione automatica di aree d’interesse su immagini mammografiche. Il ROI Hunter è il primo livello di un articolata procedura che utilizza i modelli di elaborazione PVT e IFAST (Semeion©) come meccanismo di pre-processing per la successiva classificazione del tessuto tumorale con presenza o con assenza di masse.

Risultati conseguiti La sorgente dei dati è costituita da mammografie estratte dal

database del progetto CALMA (Computer Assisted Library for Mammography ) relative a 385 pazienti. La cartella di ogni paziente contiene le proiezioni relative alle radiografie effettuate (4-6 proiezioni su entrambi i seni) e le informazioni sulla presenza di eventuali forme tumorali. In particolare sono riportate le informazioni relative a masse tumorali: le caratteristiche morfologiche, le coordinate spaziali dei voxel riferite al nodulo e la stima della malignità.

Le attività svolte nel progetto sono illustrate nello schema che segue.

Page 103: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

105

Schema delle attività progettuali

La prima attività effettuata è stata l’importazione in Matlab di tutte

le immagini in formato DICOM ed una successiva scalatura di 1:5 (per velocizzare le operazioni di calcolo seguenti). Quindi le immagini sono state sottoposte a tre differenti fasi di processamento.

Fase 1: Breast Profile Segmentation Si è identificata l’area relativa al seno, distinguendola dal background

e dal muscolo pettorale. Per tale operazione si è utilizzata il modello CM Anti-Squash, della famiglia Active Connection Matrix (ACM Semeion©), che effettua sulle immagini un contrast enhancement. Un modulo successivo ha eseguito un thresholding individuando l’area principale relativa al seno. Operatori a basso livello hanno completato il processamento riempiendo eventuali buchi o concavità della sagoma della mammella.

Fase 2: Mass Segmentation In questa fase sono state individuate eventuali masse tumorali nel

seno, osservando l’area precedentemente isolata. La soluzione adottata prevedeva un elaborazione con CM Anti-Squash per il contrast enhancement e un thresholding modulato sull’intensità media del seno. L’output prodotto consisteva in una lista di oggetti “masse”, ovvero un

Immagini (Calma)

Importazione In MATLAB

Breast Profile Segmentation

Mass Segmentation

Metadati (Calma)

Masse Identificate

Valutazione Prestazioni

Selezione degli Oggetti

Page 104: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

106

insieme di aree dell’immagine indiziate come contenenti masse tumorali.

Fase 3: Selezione degli oggetti Gli oggetti precedentemente individuati sono stati selezionati

eliminando tutti quelli che si trovavano ai bordi dell’area che delimita il seno allo scopo di ridurre il numero dei falsi positivi. Il processamento consta di due passi distinti: prima si stima la luminosità dello sfondo Image Background (IB), nell’immagine ACM (Background Gray Estimation), quindi in ogni oggetto dell’immagine si controlla quanti pixel, all’interno delle area individuata, hanno intensità luminosa pari a IB: se la percentuale di tali pixel supera una soglia predeterminata, l’oggetto è scartato (si sospetta sia un artefatto sul bordo del seno). Le sperimentazioni sono state effettuate in due sessioni:

Prima sessione di sperimentazioni o 272 immagini elaborate o 74 pazienti o 152 lesioni complessive o Filtraggio degli oggetti al bordo del seno non effettuato o Identificati 1975 oggetti:

- Veri Positivi (lesioni identificate): 127 - Falsi Positivi (oggetti sani): 1793 (7.47 FP/Imm) - Falsi Negativi (lesioni non identificate): 25 - Sensitivity = 83.55%

Seconda sessione di sperimentazioni o 301 immagini o 81 pazienti o 171 lesioni complessive o Effettuato filtraggio degli oggetti al bordo del seno o Migliorato il Breast Profile Segmentation o Identificati 4328 oggetti:

- Veri Positivi (lesioni identificate): 156 - Falsi Positivi prima del filtraggio: 5658 (18.80 FP/Imm) - Falsi Positivi (oggetti sani): 4172 (13.86 FP/Imm) - Falsi Negativi (lesioni non identificate): 15 - Sensitivity = 91.23%

Finita la fase di identificazione delle masse tumorali è stata effettuata una sperimentazione sulla possibilità di discriminare fra masse maligne e benigne utilizzando le aree degli oggetti individuati.

Il protocollo di sperimentazione applicato è il seguente:

Page 105: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

107

ROI

IFAST

(AutoCM)

Output: 217 vettori di 300 nodi

PVT

(gradiente 2)

Supervised ANNs

(Train/Test Random )

ROI

IFAST

(AutoCM)

Output: 217 vettori di 300 nodi

PVT

(gradiente 2)

Supervised ANNs

(Train/Test Random )

Protocollo di sperimentazione per l’individuazione della presenza/assenza di masse I risultati delle elaborazioni sono riassunti nella seguente tabella. ANN SE SP A.M.Acc. W.M.Acc.FF_Bp(ab)6hAUTO(13) 90.57 69.09 79.83 79.63FF_Bp(ab)12hAUTO(19) 73.58 87.27 80.43 80.56FF_Bp(ab)24h12hAUTO(5) 83.02 78.18 80.6 80.56FF_Bp(ab)24hAUTO(1) 79.25 80 79.62 79.63FF_Bp(ab)48h24hAUTO(7) 81.13 78.18 79.66 79.63FF_Bp(ab)bip12hAUTO(17) 86.79 74.55 80.67 80.56FF_Bp(ab)bip48hAUTO(2) 67.92 94.55 81.23 81.48Mean 77.83 82.05 79.94 79.98

Equipe di ricerca e partner esterni L’equipe dei ricercatori che ha lavorato al progetto è composta da:

S. Terzi e R. Petritoli, M. Capriotti. Il partner esterno, finanziatore del progetto è la Bracco Imaging

SpA.

Page 106: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

108

Sviluppi Questa prima sperimentazione incoraggia a procedere con nuove

applicazioni per continuare a testare le capacità del ROI Hunter, in funzione della classificazione del tessuto con masse tumorali.

3.1.4 Stima delle caratteristiche morfologiche dei noduli sul

DB Lung Image Database Consortium (LIDC) Obiettivo del progetto L’obiettivo del progetto è quello di stimare le caratteristiche

morfologiche (locazione, estensione malignità, etc.) dei noduli “grandi” (≥ 3 mm) del database Lung Image Database Consortium (LIDC). Il progetto costituisce la naturale continuazione di quello descritto nel paragrafo 3.1.1. di questo rapporto. Il database di riferimento è lo stesso e le valutazioni sulla malignità dei noduli è basata sulla scala precedentemente descritta. La differenza consiste nella integrazioni dei giudizi indipendenti dei 4 radiologi, che hanno generato una diversa struttura del database.

In base a tali nuovi dati si è verificata la capacità dell’algoritmo J-Net di stimare la malignità di un nodulo al seno a partire da immagini TAC.

Risultati conseguiti Nello schema che segue vengono illustrate le attività del progetto:

Page 107: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

109

DB Immagini [Matlab]

Individuazione dei noduli

Confronto Annotazioni/Elaborazioni J-NET

Stima delle caratteristiche

morfologiche dei noduli

Importazione e Codifica immagini processate da J-NET

DB Annotazioni [Matlab]

Immagini processate da

J-NET

Integrazione delle informazioni

sui noduli

Schema delle attività progettuali

Tutte le attività sono state sviluppate in 3 fasi successive: Fase 1: Individuazione dei noduli Per ogni paziente del database, in riferimento alle immagini TAC e

le annotazioni, è stato individuato un unico insieme dei noduli. Ciò è stato effettuato andando a verificare il grado di sovrapposizione dei noduli presente nelle aree di letture diverse. In presenza di una sovrapposizione le letture sono state considerate come indicanti lo stesso nodulo.

Fase 2: Integrazione delle informazioni sui noduli Quando un nodulo è indicato da diverse letture, le caratteristiche

morfologiche sono integrate valutando anche il consenso sui giudizi clinici: quest’ultima quantità è stimata utilizzando l’Indice di misura del consenso utilizzando l’Agreement Theory10.

Fase 3: Codifica del processamento di J-Net Le immagini risultanti dal processamento di J-Net, sono state

importate di nuovo in ambiente Matlab, convertite con un processo semiautomatico in immagini binarie prima e poi in oggetti, questa

10 W.J. Tastle & M.J. Wierman, E-Business Decision Making by Agreement, International Journal of EBusiness Research, 4(4), pp. 16-25, 2008.

Page 108: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

110

operazione è stata fatta per ciascun valore di alfa, infine sugli oggetti prodotti sono stati calcolati una serie di parametri morfologici.

Al termine di queste tre fasi è stata costruita la nuova struttura del database, sul quale è stata effettuata l’elaborazione finalizzata ad analizzare la correlazione tra l’evoluzione della reta J-Net e la classe stimata dai radiologi. Sulla base alle nuove informazioni integrate sulle caratteristiche morfologiche dei noduli sono state effettuate due analisi dei dati.

Nella prima analisi come target è stata utilizzata la moda fra i valori di malignancy indicata dai radiologi. In particolare sono stati selezionati solo i noduli che avevano più di una lettura e con l’Indice di misura del consenso maggiore all’80%.

Applicando una serie di Reti Neurali Supervisionate con protocollo ‘Leave-one-out’ sono state ottenuti i seguenti risultati:

- Dataset: 54 Record x 10 Variabili - Mal: 8 Record - Ben: 46 Record - Sensitività: 100% - Specificità: 80,43% - Accuratezza media: 90,22% Nella seconda analisi come target è stata utilizzato il peggiore fra i

valori di malignancy indicata dai radiologi. In particolare sono stati selezionati solo i noduli che avevano più di una lettura.

Anche in questo caso è stato applicato un insieme di Reti Neurali Supervisionate con protocollo ‘Leave-one-out’, ottenendo i seguenti risultati:

- Dataset: 57 Record x 10 Variabili - Mal: 53 Record - Ben: 4 Record - Sensitività: 96,23% - Specificità: 75% - Accuratezza media: 85,61%

Equipe di ricerca e partner esterni L’equipe dei ricercatori che ha lavorato al progetto è composta da:

S. Terzi e R. Petritoli.

Page 109: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

111

Il partner esterno, finanziatore del progetto è la Bracco Imaging SpA.

Sviluppi Il lavoro di ricerca è orientato ad aumentare le applicazioni del

modello J-Net selezionando altri database sui quali fare le elaborazioni, nella prospettiva di validare ulteriormente modello e protocolli di elaborazione.

Page 110: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

112

3.2 Biomedicale settore clinico L’altro settore medico particolarmente interessato alle potenzialità

applicative dei Sistemi Artificiali Adattivi del Semeion è quello clinico. In questo ambito si è fatto un considerevole lavoro negli ultimi 8 anni. In particolare sono stati sottoposti all’analisi dei modelli Semeion circa 80 diversi dataset, e sono stati pubblicati oltre 30 articoli su riviste scientifiche internazionali di ambito biomedicale. L’insieme delle patologie cliniche sulle quali si è concentrata l’attività di elaborazione e sperimentazione sono state:

- patologie dell’apparato gastroenterologico; - malattia di Alzheimer; - patologie cardiovascolari. Questo lavoro di analisi ha prodotto una serie di progetti applicativi

sostanzialmente orientati alla diffusione dei modelli di elaborazione, basati sui Sistemi Artificiali Adattivi, nel mondo medico. In questa prospettiva nel corso del 2008 sono stati realizzati sia corsi di formazione, finalizzati alla conoscenza delle potenzialità che questi modelli offrono, sia nuovi progetti applicativi di elaborazione dei dati su diverse patologie.

3.2.1 Corsi di formazione sull’Intelligenza Artificiale per

medici specialisti Obiettivo del progetto Negli ultimi anni nel campo medico è emersa la consapevolezza, nei

settori dove si fa ricerca, che per analizzare e comprendere i fenomeni complessi serve una matematica complessa. I Sistemi Artificiali Adattivi costituiscono ad oggi il risultato e contemporaneamente una delle più importanti linee di sviluppo dei nuovi approcci della matematica ai campi dove la complessità è la norma.

In questa prospettiva il Semeion ha iniziato a promuovere, in collaborazione con la Bracco, un’attività di formazione con lo scopo di consentire ai medici di avvicinarsi ai temi della complessità acquisendo un bagaglio di competenze di base sui Sistemi Artificiali Adattivi. L’obiettivo è non solo quello di favorire l’uso di nuovi strumenti di analisi delle malattie, ma anche di fornire gli strumenti pratici per lavorare in modo diverso sui dati clinici che vengono quotidianamente raccolti dai medici specialisti.

Page 111: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

113

Risultati conseguiti Nel 2008 sono stati realizzati tre corsi di formazione a cui hanno

partecipato oltre 40 medici specialistici fra gastroenterologi, neurologi ed endocrinologi.

I risultati formativi ottenuti sono stati molto incoraggianti e hanno registrato un grande interesse da parte dei medici provenienti da diverse specializzazioni. Infatti, nei questionari di valutazione di fine corso, la quasi totalità dei partecipanti hanno espresso un esplicito interesse a partecipare ad altri corsi di approfondimento sui diversi temi dell’Intelligenza Artificiale in medicina.

Per mostrare il tipo di argomenti trattati alleghiamo di seguito il programma completo di uno dei corsi di formazione realizzati nel 2008.

Page 112: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

114

INTELLIGENZA ARTIFICIALE IN

MEDICINA:

Back to the future

Corso di formazione I 2o anno

Semeion Centro Ricerche

Roma 7 – 10 Maggio 2008

Programma del corso

Programma 8 Maggio

9.00 – 9.15 Arrivo e registrazione dei partecipanti

9.15 – 10.30 Intelligenza Artificiale e complessità in medicina: obiettivi funzionali e operativi del corso di formazione (E. Grossi) 10.30 – 13.30 Scelta delle variabili e Data Management (G. Maurelli e M. Intraligi): 1. I principi guida per la scelta delle

variabili e la raccolta dei dati 2. Organizzazione dei dati in tabelle

Excel 3. Manipolazione delle variabili 4. Esercitazioni ed esempi pratici su

dataset medici

Pausa Pranzo 14.30 – 18.30 Le Reti Neurali Artificiali (M. Buscema)

1. Architettura delle Reti Neurali Artificiali

2. Reti Neurali Artificiali: strategie d’apprendimento

3. Reti Neurali Supervisionate 4. Reti Neurali Auto-Associate 5. Reti Self Organizing Maps

21.00 Cena sociale

Page 113: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

115

Programma 9 Maggio

9.30 – 10.30 Le Reti Neurali Supervisionate i protocolli di elaborazione (S. Terzi): 1. Protocollo 5x2 cross validation 2. Confronto fra Analisi Discriminante

Lineare e Reti Neurali Artificiali

10.30 – 11.30 Approfondimento sulle Reti Neurali Supervisionate con laboratorio di sperimentazione su dataset medici (S. Terzi e M. Intraligi) 11.30 – 12.30 Le Reti SOM i protocolli di elaborazione e l’uso del software (G. Massini)

12.30 – 13.30 Approfondimento sulle Reti SOM con laboratorio di sperimentazione su dataset medici (G. Massini e M. Intraligi)

Pausa Pranzo 14.30 -15.30 La rete Auto-Contractive Map e il Semantic Connections Map: nuove forme di elaborazione e visualizzazione dei dati (M. Buscema)

Programma 9 Maggio

15.30 – 17.30 Suddivisione dei corsisti in due gruppi per esercitazioni sui dataset medici con il software Semantic Connections Map (E. Grossi, M. Buscema, G. Massini, S. Terzi, M. Intraligi)

17.30 – 18.00 Rassegna sulle applicazioni mediche dei Sistemi Artificiali Adattivi (E. Grossi)

18.00 – 19.00 Discussione sulle esercitazioni effettuate dai corsisti, riflessioni e prospettive

21.00 Cena sociale

Materiali didattici distribuiti durante il corso: 1. CD contenente una bibliografia

selezionata di articoli scientifici sull’Intelligenza Artificiale in Medicina

2. CD contenente i PPT didattici utilizzati dai docenti durante l’attività di formazione

Equipe di ricerca e partner esterni L’equipe di docenti è composta dai ricercatori del Semeion, a cui si

aggiungono anche docenti esterni con specifica competenza in campo medico. Il partner esterno che partecipa alla realizzazione del progetto formativo è la Bracco SpA.

Sviluppi Dato l’interesse finora suscitato dai corsi di formazione, dei quali si

è ormai standardizzato un programma che consente ai medici di venire a conoscenza sia degli aspetti teorici dei Sistemi Artificiali Adattivi, sia di verificare sui propri dati le potenzialità applicative di questi sistemi, come indicato nel Piano Triennale, l’attività di formazione continuerà nel 2009.

Page 114: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

116

3.2.2 Classificazione e di pazienti Alzheimer tramite l’analisi delle proteine nel sangue

Obiettivo del progetto Il progetto ha l’obiettivo di verificare la capacità previsionale dei

modelli del Semeion (Reti Neurali e Algoritmi Evolutivi) nel classificare correttamente, pazienti malati di Alzheimer, distinguendoli da anziani pazienti con altre patologie raggruppati nella classe Mild Cognitive Impairment (MCI).

Il database di riferimento su cui sono state effettuate tutte le elaborazioni proviene da un articolo scientifico pubblicato su Nature Medicine nel 200711, che ha consentito di effettuare un confronto sui risultati ottenuti con diversi metodi.

Risultati conseguiti Gli autori dell’articolo hanno condotto l’esperimento su un database

composto di 222 soggetti caratterizzati da 120 proteine. Nell’esperimento, il campione è stato suddiviso in tre parti: - Training set (43 AD, 40 NDC), SET-A; - Testing set “AD” (42 AD, 39 NDC, 11 OD), SET-B; - Testing set “MCI” (47 MCI), SET-C. Nell’articolo il training set è stato utilizzato per identificare,

attraverso la combinazione di due modelli statistici Significance Analysis of Microarrays (SAM) e (PAM) (Predictive Analysis of Microarray), 18 proteine maggiormente predittive tra le 120 iniziali.

Successivamente il modello PAM, impostato con le 18 proteine, è stato verificato sui due testing sets.

Per poter comparare l’accuratezza predittiva del modello PAM con le Reti Neurali Artificiali, sono state effettuate 6 diverse sperimentazioni utilizzando lo stesso database di riferimento. In ogni sperimentazione è stato applicato un diverso protocollo di elaborazione allo scopo di rendere stabili i risultati ottenuti.

I modelli a confronto nelle diverse elaborazioni sono stati: - PAM, degli autori dell’articolo su Nature Medicine; - LDA (Linear Discriminant Analisys), modello statistico

multivariato lineare; 11 R. Sandip et al., Classification and prediction of clinical Alzheimer’s diagnosis based on plasma signaling proteins, in Nature Medicine Letters, Advanced Online Publication, published online 14 October 2007, doi: 10.1038/nm1653.

Page 115: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

117

- Rete Neurale Back-Propagation (ANN-BP), inventata da Rumelhart, nel 1986, modificata da Buscema nel 1998].

Le 6 sperimentazioni hanno seguito i seguenti protocolli:

1. Distribuzione originaria come da articolo Nature (input 18 variabili);

2. Distribuzione random (5x2cv) sul Tuning Set con Prediction sul Set-C originario (input 18 variabili);

3. Distribuzione random (5x2cv) sul Tuning Set con Prediction sul Set-C originario (input 120 variabili);

4. Distribuzione random (5x2cv), Train-Test-Predict sul DB Globale (input 120 variabili) con applicazione dell’algoritmo PAM a confronto con ANN-BP;

5. Applicazione del sistema TWIST (5x2cv) sul Tuning Set con Prediction sul Set-C originario (input 120 variabili);

6. Distribuzione random (5x2cv), Train-Test-Predict sul DB selezionato dal sistema TWIST (input 55 variabili) con applicazione dell’algoritmo PAM a confronto con ANN-BP.

La prima sperimentazione aveva l’obiettivo di replicare fedelmente

la distribuzione dei casi presente nell’articolo. Le altre 5 utilizzano il più formale protocollo random 5x2cv12, ampiamente utilizzato in letteratura e sempre applicato nelle sperimentazioni dai ricercatori del Semeion, che garantisce una maggiore stabilità nell’accuratezza dei risultati.

La struttura del protocollo applicata al nostro caso è illustrata nella figura seguente.

12 Dietterich T. G. (1998), Approximate statistical tests for comparing supervised classification learning algorithms, Neural Computation 10:1885–1924.

Page 116: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

118

Tuning Set175 subjects

Random Selection

Sub 1aSub 2a……..

Sub 5a

Sub 1bSub 2b………Sub 5b

Training Testing

TrainingTesting

Set ATrain

AD = 43NDC = 40

Set BTest set AD

AD = 42NDC = 39OD = 11

LDA 1abLDA 2ab

……..LDA 5ab

PAM 1abPAM 2ab

……..PAM 5ab

BP 1abBP 2ab……..

BP 5ab

LDA 1baLDA 2ba

……..LDA 5ba

PAM 1baPAM 2ba

……..PAM 5ba

BP 1baBP 2ba……..

BP 5ba

Set CTest set MCI

AD = 22OD = 8

MCI = 17

Tuning Set175 subjects

Random Selection

Sub 1aSub 2a……..

Sub 5a

Sub 1bSub 2b………Sub 5b

Sub 1aSub 2a……..

Sub 5a

Sub 1bSub 2b………Sub 5b

Training Testing

TrainingTesting

Set ATrain

AD = 43NDC = 40

Set BTest set AD

AD = 42NDC = 39OD = 11

Set ATrain

AD = 43NDC = 40

Set BTest set AD

AD = 42NDC = 39OD = 11

LDA 1abLDA 2ab

……..LDA 5ab

PAM 1abPAM 2ab

……..PAM 5ab

BP 1abBP 2ab……..

BP 5ab

LDA 1abLDA 2ab

……..LDA 5ab

PAM 1abPAM 2ab

……..PAM 5ab

BP 1abBP 2ab……..

BP 5ab

LDA 1baLDA 2ba

……..LDA 5ba

PAM 1baPAM 2ba

……..PAM 5ba

BP 1baBP 2ba……..

BP 5ba

LDA 1baLDA 2ba

……..LDA 5ba

PAM 1baPAM 2ba

……..PAM 5ba

BP 1baBP 2ba……..

BP 5ba

Set CTest set MCI

AD = 22OD = 8

MCI = 17

Protocollo 5x2cv applicato al Tuning set

Dallo schema si può notare che il SET-C è stato mantenuto esterno, ed è stato utilizzato come set di validazione.

Nelle ultime due sperimentazioni del progetto è stato utilizzato il sistema TWIST (Semeion©) (Training With Input Selection and Testing), ideato da M. Buscema nel 2006. Si tratta di un algoritmo per il pre-processing dei dati, finalizzato a migliorare le tecniche del cosiddetto “resampling” per l’addestramento di sistemi artificiali.

Nella figura seguente, viene riportato lo schema di questo protocollo applicato a tutto il campione di 222 soggetti con lo scopo di individuare il numero minimo di variabili di input (proteine) con le quali ottenere il massimo risultato.

Page 117: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

119

Set ATrain

AD = 43NDC = 40

Set BTest set AD

AD = 42NDC = 39OD = 11

Set CTest set MCI

AD = 22OD = 8

MCI = 17

Tot 222 (120 var)

Twist55 proteins selected

LDA BPPAM

RandomTrain-Test-Validation

Tot 222 (55 var)

Set ATrain

AD = 43NDC = 40

Set BTest set AD

AD = 42NDC = 39OD = 11

Set CTest set MCI

AD = 22OD = 8

MCI = 17

Tot 222 (120 var)

Twist55 proteins selected

LDA BPPAM

RandomTrain-Test-Validation

Tot 222 (55 var)

Protocollo di sperimentazione applicato al campione globale con l’utilizzo del modello TWIST

I risultati complessivi di tutte le sperimentazioni effettuate sono

riassunti nella seguente tabella.

Protocollo Casi Tune Casi Pred Predict LDA PAM ANN1 18 Origin Nature 175 47 originale - 80.85% 82.98%2 18x2cv Random 175 47 originale 68.30% 69.36% 74.04%3 120x2cv Random 175 47 originale 54.26% 64.47% 68.51%4 120x2cv Random 222 66 random 71.51% 81.82% 85.61%5 Twist 5x2 Twist 175 47 originale - - 74.04%6 Twist 55var Random 222 66 random 84.85% 82.12% 87.42%

EXPE

I risultati ottenuti dimostrano che la rete neurale (ANN) raggiunge

sempre il miglior risultato, dimostrando di essere il classificatore più efficace, mentre il modello PAM è sempre superiore alla LDA, tranne che nell’ultima elaborazione.

Equipe di ricerca e partner esterni

Page 118: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

120

L’equipe dei ricercatori che hanno lavorato al progetto era composta da: M. Intraligi e M. Capriotti.

Il partner esterno, finanziatore del progetto, è la Bracco Imaging SpA.

Sviluppi I risultati di questo tipo di progetti tendono, ovviamente, a

confrontare le performance dei modelli del Semeion con i sistemi presenti in letteratura al fine di migliorarne le caratteristiche, sia nei termini dei protocolli applicati, sia nei termini delle modifiche algli algoritmi che possono aumentare le capacità predittive dei modelli stessi.

3.2.3 Reti Neurali per l’identificazione precoce della mortalità

in pazienti affetti da sanguinamento gastrointestinale Obiettivo del progetto

Il progetto denominato PNED (Progetto Nazionale Emorragia Digestiva), inserito nel Piano Triennale (2008-2010) ha lo scopo di identificare le variabili cliniche che consentono di predire il rischio di decesso in pazienti che presentano emorragia digestiva, applicando le Reti Neurali Artificiali (Semeion©). Dal punto di vista medico l’obiettivo primario dello studio mirava alla elaborazione di uno score predittivo del rischio degli outcomes negativi (morte, intervento chirurgico, risanguinamento).

Si è trattato di uno studio prospettico osservazionale, realizzato sul territorio nazionale, che ha coinvolto strutture ospedaliere, Policlinici Universitari ed Istituti di Ricerca a Carattere Scientifico. I centri che hanno partecipato allo studio sono stati 25.

Risultati conseguiti L’analisi è stata condotta su un database complessivo di 2.432

pazienti (1.601 maschi, 831 femmine) che presentavano sanguinamento gastrointestinale, con esito certificato. Del totale dei pazienti 2.318 (95.3%) mantenevano la condizione iniziale, mentre in 114 di loro (4.7%) si verificava l’exitus.

Sono state analizzate 68 variabili indipendenti, la maggior parte delle quali di tipo clinico anamnestico, precedenti all’esame endoscopico.

Page 119: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

121

Poiché era presente un notevole sbilanciamento del target (proporzione decessi/non decessi) si è deciso di applicare un protocollo di ottimizzazione. A tal fine è stata fatta un’elaborazione su un sottogruppo ristretto e bilanciato di pazienti, che comprendeva tutti i decessi (n. 114) e un sottocampione dei non decessi (n. 185) rappresentativo dell’intero campione, selezionato mediante una rete Self Organizing Maps (SOM). Lo scopo di questa procedura era quello di estrarre un sottocampione dei non decessi rappresentativo dell’intero campione.

Dopo il lavoro di bilanciamento del campione sono state applicate una serie di reti neurali di tipo supervisionato (Semeion©), messe a confronto con l’analisi discriminante lineare (LDA), adottando due protocolli di elaborazione:

- il protocollo random 5x2 cross-validation, normalmente applicato nelle elaborazioni del Semeion;

- un secondo protocollo finalizzato a selezionare in maniera adattiva le variabili “giuste” ed escludere quelle che per le reti costituivano una sorta di “rumore”, ridistribuendo anche in maniera ottimale i soggetti nei subsets di training e testing, utilizzando il sistema TWIST (Semeion©).

Mostriamo di seguito le figure dei due protocolli utilizzati. decesso

114sopravvivenza

2318

SOM

185 2133File di apprendimento299

Random

150 149

ANNs

Train

Test

Test

Train

Risultati preliminari

Prediction

Risultatiglobali

decesso114

sopravvivenza2318

SOM

185 2133File di apprendimento299

Random

150 149

ANNs

Train

Test

Test

Train

Risultati preliminari

Prediction

Risultatiglobali

Schema del protocollo random 5x2 CV

Page 120: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

122

decesso114

sopravvivenza2318

SOM

185 2133File di apprendimento299

Twist

? ?

ANNsPrediction

Train

Test

Test

Train

Risultati preliminari

Risultatiglobali

decesso114

sopravvivenza2318

SOM

185 2133File di apprendimento299

Twist

? ?

ANNsPrediction

Train

Test

Test

Train

Risultati preliminari

Risultatiglobali

Schema del protocollo TWIST

Nelle due tabelle che seguono vengono mostrati i risultati medi

ottenuti con i due diversi protocolli.

Risultati medi protocollo 5x2 CV Sensitivity Specificity Arith. Mean

Accuracy LDA FF-Bp

59.12% 75.44%

74.54% 72.78%

66.83% 74.11%

Risultati del protocollo 5x2 CV sul dataset di Prediction

ANN High Risk Low Risk A.Mean Acc W.Mean Acc Errors PPV NPVTwist-1(26var) 81.96% 81.42% 81.69% 81.43% 137 10.11% 99.43%Twist-5(24x2) 94.35% 81.19% 87.77% 81.50% 136 11.26% 99.81%Twist-6(28x2) 86.11% 83.29% 84.70% 83.36% 123 13.06% 99.50%Twist-7(30x2) 85.13% 82.93% 84.03% 82.99% 126 13.05% 99.47%Twist-9(28x2) 89.25% 82.00% 85.62% 82.19% 132 12.32% 99.62%

RIEPILOGO - RISULTATI MEDI SUL TESTING+PREDICTION SET

Risultati delle 5 combinazioni del protocollo TWIST

Le elaborazioni effettuate con il protocollo TWIST, hanno

utilizzato diversi modelli di reti neurali proprietarie del Semeion. I

Page 121: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

123

risultati raggiunti in questo protocollo, sempre superiori all’80%, in accuratezza media, evidenziano la possibilità di sviluppare un modello predittivo di diagnosi precoce per il sanguinamento gastrointestinale.

Equipe di ricerca e partner esterni L’equipe dei ricercatori che hanno lavorato e lavoreranno al

progetto è composta da: M. Intraligi, M. Capriotti. Il partner esterno, finanziatore del progetto, è la Bracco SpA. Sviluppi Lo studio consente di porre le basi per impostare una

sperimentazione più allargata finalizzata alla costruzione di un sistema prototipale per testare sul campo il modello predittivo descritto.

3.2.4 Applicazione delle Reti Neurali per l’uso appropriato

dell’EGDS Obiettivo del progetto Nell’ambito degli esami endoscopici la cosiddetta EGDS

(esofagogastroduodenoscopia) è un esame che permette di individuare eventuali infiammazioni, ulcere e altri tipi di lesioni nel tubo digerente superiore. Lo studio osservazionale, promosso dalla Società Italiana di Endoscopia Digestiva (SIED), aveva l’obiettivo di verificare l’uso appropriato di tale esame su un database molto esteso di pazienti. L’elaborazione dei dati è stata effettuata con una serie di modelli, Reti Neurali e Algoritmi Evolutivi, proprietari del Semeion.

Risultati conseguiti Il campione raccolto dalla SIED, con il contributo di 56 Centri di

Endoscopia distribuiti in maniera rappresentativa su tutto il territorio nazionale, era composto di 8.252 pazienti. Le variabili complessive erano 103.

L’analisi esplorativa preliminare, effettuata dai ricercatori del Semeion, ha individuato 61 variabili elaborabili che, dopo ulteriore codifica di “massimizzazione” sono diventate 169. Il processo di massimizzazione ha lo scopo di valorizzare il potere informativo di una variabile qualitativa, che sarà rappresentata da un numero di nuove variabili pari al numero di opzioni (categorie) presenti in quella variabile.

Page 122: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

124

Tra le nuove 169 variabili, con cui è stato articolato il database, sono state individuate due possibili variabili “target” ricavate dalla diagnosi successiva all’effettuazione di EGDS.

Il campione di 8.252 casi, depurato dai soggetti con dati incompleti, è risultato pari a 7.532 soggetti.

Tutte le elaborazioni sono state effettuate sul campione di 7.532 pazienti. Inoltre nelle elaborazioni è stato applicato il protocollo 5x2 cross-validation e il sistema TWIST, precedentemente descritto, che ha selezionato 24 variabili ottimizzate per le elaborazioni. Per un primo gruppo d sperimentazioni le variabili target erano denominate Patologie Rilevanti (3.541) vs Patologie Non rilevanti (3.991). I risultati delle sperimentazioni sono mostrati nella seguente tabella.

RELEVANT PATHOLOGY %Sens %Spec A.M.Acc. W.M.Acc. VP VN FP FNCod Color 26.52 83.06 54.79 56.48 939 3315 676 2602Indicated 88.73 25.46 57.09 55.20 3142 1016 2975 399Symptoms 31.04 75.65 53.34 54.67 1099 3019 972 2442Symptoms or Age>45 yrs 83.00 25.33 54.17 52.44 2939 1011 2980 602Linear Discriminant * 58.66 66.97 62.82 63.07 2077 2673 1318 1464Back Propagation Anns * 84.03 35.86 59.95 58.51 2975 1431 2560 566Twist - Back propagation 84.44 34.10 59.27 57.77 2990 1361 2630 551* mean of 10 models

Risultati delle elaborazioni su Patologie Rilevanti vs Patologie Non Rilevanti Nella tabella sono messi a confronto i metodi tradizionali con cui si

definiscono le patologie rilevanti, con la LDA e le reti neurali. Dai risultati si può notare che le reti neurali (BP, TWIST-BP) non riescono a fare meglio dell’indicazione del medico (Indicated).

Un secondo gruppo di sperimentazioni erano finalizzate ad individuare i soggetti che presentavano una neoplasia al momento della prima visita. Il campione dei 7.532 era così composto:

- 200 pazienti con neoplasie; - 7.332 senza neoplasie. Nella tabella che segue sono riportati i risultati ottenuti.

NEOPLASIA %Sens %Spec A.M.Acc. W.M.Acc. VP VN FP FNCod Color 54.50 79.46 66.98 78.80 109 5826 1506 91Indicated 97.00 19.22 58.11 21.28 194 1409 5923 6Symptoms 67.50 73.60 70.55 73.43 135 5396 1936 65Symptoms or Age>45 yrs 97.00 21.92 59.46 23.91 194 1607 5725 6Linear Discriminant * 76.80 77.89 77.35 77.86 155 5718 1614 45Back Propagation Anns * 80.80 75.40 78.10 75.55 162 5530 1802 38* mean of 10 models

Risultati delle elaborazioni su Neoplasie vs Altre Patologie

Page 123: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

125

I risultati della LDA e della BackPropagation sono stati ottenuti applicando il protocollo 5x2cv con distribuzione random su un campione ridotto di 445 soggetti (200 positivi e 245 negativi). I restanti 7087 soggetti negativi sono stati classificati come terzo campione.

In questa elaborazione si può notare che le reti neurali seppure inferiori in termini di sensitività, riducono drasticamente il numero dei falsi positivi (da 5.923 a 1.802).

Su questa linea è utile segnalare un’ultima sperimentazione finalizzata ad individuare quei pazienti che al momento della prima visita non presentavano neoplasie, ma che invece risultavano affetti da una neoplasia al termine dello studio. In questo caso i 7.532 pazienti erano distribuiti in 130 Nuove Neoplasie vs 7.402 Altre Patologie, che comprendevano anche le neoplasie già conosciute.

Nella tabella che segue sono riportati i risultati di quest’ultima sperimentazione.

NEW NEOPLASIA %Sens %Spec A.M.Acc. W.M.Acc. VP VN FP FNCod Color 60.00 79.24 69.62 78.90 78 5865 1537 52Indicated 98.46 19.09 58.78 20.46 128 1413 5989 2Symptoms 75.38 73.35 74.36 73.38 98 5429 1973 32Symptoms or Age>45 yrs 96.15 21.72 58.94 23.01 125 1608 5794 5Linear Discriminant * 69.54 85.36 77.45 85.09 90 6319 1084 40Back Propagation Anns * 82.31 76.65 79.48 76.74 107 5673 1729 23Twist - Back Propagation * 82.62 81.63 82.13 81.65 107 6042 1360 23* mean of 10 models

Risultati delle elaborazioni su Nuove Neoplasie vs Altre Patologie I risultati della LDA e della BackPropagation sono stati ottenuti

applicando il protocollo 5x2cv con distribuzione random su un campione ridotto di 448 soggetti (130 positivi e 318 negativi). I restanti 7084 soggetti negativi sono stati classificati come terzo campione.

In questa sperimentazione si può notare che l’accuratezza media delle reti neurali è molto superiore (82.13%) rispetto a quella del medico (58.78%), e che anche in questo caso nonostante la sensitività del medico è molto alta, nel caso delle reti neurali il numero dei falsi positivi è ancora più ridotto della sperimentazione precedente.

Nella figura mostriamo la curva ROC che sintetizza i risultati di questo esperimento mostrando la posizione di tutti i modelli.

Page 124: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

126

Symptoms or Age>45years

LDA

Color

Indicated

Symptoms

Symptoms or Age>45years

LDA

Color

Indicated

Symptoms

Curva ROC dei nuovi casi di neoplasia

Equipe di ricerca e partner esterni L’equipe dei ricercatori che hanno lavorato e lavoreranno al

progetto è composta da: M. Intraligi, M. Capriotti. Il partner esterno, finanziatore del progetto, è la Bracco SpA. Sviluppi Dati i risultati ottenuti il lavoro successivo dello studio è indirizzato

a migliorare le prestazioni delle reti neurali in termini di sensitività, riuscendo a mantenere un grado di specificità elevato, ciò consentirebbe di effettuare uno screening più efficace sui pazienti realmente a rischio.

Page 125: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

127

3.3 Social Security Nel campo della sicurezza sociale, inteso nella sua accezione più

ampia, il Semeion svolge la sua attività di ricerca dai tempi della sua fondazione. Alla fine degli anni novanta, l’esperienza acquista in quel progetto e la grande spinta prodotta da nuove scoperte effettuate dai ricercatori del Semeion nel campo dell’intelligenza artificiale, ha favorito la definizione di un’importante partnership con New Scotland Yard. Questa partnership si è concretizzata con la realizzazione del progetto Central Drug Trafficking Database (CDTD). Nel 2008 si sono concretizzate alcune collaborazioni istituzionali con settori del Ministero della Difesa e del Ministero dell’Interno, che hanno trovato nel lavoro di ricerca del Semeion sistemi e metodi nuovi per affrontare e risolvere numerosi problemi legati alla sicurezza interna ed esterna del nostro paese. Sempre in questo ambito sono iniziate alcuni progetti anche con aziende appartenenti al gruppo Finmeccanica, in particolare Selex Communications e Selex Sistemi Integrati.

In questa sezione possiamo comunque descrivere solo quei progetti che non hanno vincoli di riservatezza, e che sono la minoranza.

3.3.1 Analisi e previsione della concentrazione di gas sulla base

di sistemi di nanosensori Obiettivo del progetto Nel Piano Triennale 2008-2010 è stato annunciato un rapporto di

collaborazione fra la Selex Communications SpA (società del Gruppo Finmeccanica) e il Semeion, per applicare i modelli di elaborazione proprietari del Semeion per l’analisi dei dati prodotti da diversi tipi di nanosensori. Un primo progetto è stato realizzato nel 2008, progetto che, tra l’altro, ha consentito la scoperta e l’applicazione di alcuni algoritmi descritti nella sezione di ricerca di base di questo volume, complessivamente compresi sotto la sigla del metodo P-FAST.

L’obiettivo del progetto consisteva nell’effettuare una serie di sperimentazioni su un database (secondo il protocollo Training, Testing e Validation set) prodotto da regolari sessioni di misura per classificare la reale concentrazione di quattro sostanze (acetone, metanolo, etanolo e perossido) rilevate attraverso un nanosensori, utilizzando modelli di elaborazione proprietari del Semeion.

Page 126: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

128

Risultati conseguiti Il database utilizzato per le sperimentazioni è stato ottenuto

iniettando ognuna delle sostanze in esame in una ‘cella’ non isolata dall’atmosfera dell’ambiente. Per ogni esperimento sono stati rilevati i valori in uscita dal nanosensore.

Per ogni sostanza in analisi sono state raccolti sia dati a concentrazione costante che a concentrazione variabile, in particolare:

- Etanolo: 29 concentrazione costante; 10 concentrazione variabile;

- Metanolo: 45 concentrazione costante; 10 concentrazione variabile;

- Acetone: 41 concentrazione costante; 10 concentrazione variabile;

- Perossido: 47 concentrazione costante; 10 concentrazione variabile.

I dati in input per i modelli di elaborazione era costituiti dai 3 segnali prodotti in uscita dal nanosensore, più un segnale proporzionale all’umidità e un segnale di temperatura, per un totale di 5 valori.

Per generare i record, che dopo l’applicazione dei metodo P-FAST, sono diventati dati di ingresso per una rete neurale Back-Propagation (FF-BP) sono stati ideati 9 nuovi e diversi algoritmi dai ricercatori del Semeion che hanno lavorato al progetto:

- Algoritmo 0: PFE (Terzi); - Algoritmo 1: Dm (Buscema); - Algoritmo 2: Dv (Buscema); - Algoritmo 3: Eud (Buscema); - Algoritmo 4: Eus (Buscema); - Algoritmo 5: PP (Buscema); - Algoritmo 6: CM (Buscema); - Algoritmo 7: Nr (Massini); - Algoritmo 8: Sr (Massini). Il protocollo di elaborazione ha utilizzato il consueto 5x2 Cross

Validation, con il campione di Prediction esterno, descritto nella figura sottostante.

Page 127: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

129

DATA BASE

ValidationResults Analysis andSelection of best ANNs

Random Selection

Training Testing

TrainingTesting

ANN AB1ANN AB2

……..ANN ABn

ANN BA1ANN BA2

……..ANN BAn

Sub (A1)Sub (A2)………..Sub (An)

Sub (B1)Sub (B2)…………Sub (Bn)

Sub (P1)Sub (P2)…………Sub (Pn)

DATA BASE

ValidationResults Analysis andSelection of best ANNs

Random Selection

Training Testing

TrainingTesting

ANN AB1ANN AB2

……..ANN ABn

ANN BA1ANN BA2

……..ANN BAn

Sub (A1)Sub (A2)………..Sub (An)

Sub (B1)Sub (B2)…………Sub (Bn)

Sub (P1)Sub (P2)…………Sub (Pn)

Protocollo 5x2 CVcon campione di Prediction esterno

Nel corso del progetto sono state effettuate numerose

sperimentazioni, provando diverse combinazioni degli algoritmi disponibili. Nella tabella seguente riportiamo il miglior risultato ottenuto con un’accuratezza media del 92.40%.

92.40%94.70%89.39%87.50%98.00%Mean

93.14%91.67%90.91%100.00%90.00%FF_Bp(5ab)

94.60%90.91%100.00%87.50%100.00%FF_Bp(4ab)

90.63%100.00%100.00%62.50%100.00%FF_Bp(3ba)

90.91%90.91%72.73%100.00%100.00%FF_Bp(2ab)

92.71%100.00%83.33%87.50%100.00%FF_Bp(1ab)

A.Mean AccPerossidoMetanoloEtanoloAcetoneANN

92.40%94.70%89.39%87.50%98.00%Mean

93.14%91.67%90.91%100.00%90.00%FF_Bp(5ab)

94.60%90.91%100.00%87.50%100.00%FF_Bp(4ab)

90.63%100.00%100.00%62.50%100.00%FF_Bp(3ba)

90.91%90.91%72.73%100.00%100.00%FF_Bp(2ab)

92.71%100.00%83.33%87.50%100.00%FF_Bp(1ab)

A.Mean AccPerossidoMetanoloEtanoloAcetoneANN

Tabella riassuntiva dei risultati ottenuti

Questo risultato è stato ottenuto grazie alla combinazione di tutti gli algoritmi elencati con l’esclusione del primo.

Page 128: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

130

Equipe di ricerca e partner esterni I ricercatori che lavorano al progetto sono: M. Buscema, S. Terzi e

G. Massini. Il partner finanziatore del progetto è stata la Selex Communications SpA.

Sviluppi Gli sviluppi del progetto prevedono la realizzazione di una

sperimentazione sul campo nel 2009, al fine di consolidare i risultati raggiunti e predisporre la sviluppo di un modello prototipale.

Page 129: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

131

3.4 Industria, marketing e mondo del lavoro Nel Piano Triennale 2008-2010 si è affermato che il campo

denominato industria marketing e mondo del lavoro, è oggi più attento e predisposto ad accettare metodi innovativi per affrontare i problemi che sono recentemente emersi.

Accade sempre più spesso che le aziende si trovino di fronte a domande a cui i tradizionali metodi di elaborazione non riescono a dare risposta. In questa prospettiva la competenza e l’esperienza acquisita dal Semeion sui modelli di elaborazione intelligente, sta diventando sempre più ricercata. Nel corso del 2009 sono stati portati a termine alcuni interessanti progetti.

3.4.1 Reti Neurali per la classificazione di fumatori sulla base

di analisi cliniche e variabili socio-anagrafiche Obiettivo del progetto Il progetto è la continuazione e l’approfondimento di quello iniziato

nel 2007. Questa seconda parte di sperimentazione progettuale realizzata nel 2008 aveva l’obiettivo di valutare la capacità predittiva di classificatori basati su modelli di Reti Neurali Artificiali e Algoritmi Evolutivi (Semeion©), nel distinguere correttamente due gruppi omogenei di soggetti che fumano e un gruppo composto da soggetti che non hanno mai fumato.

Risultati conseguiti Il database complessivo su cui sono state effettuate tutte le

elaborazioni era dunque composto di 120 soggetti, così suddivisi: - Heavy Smokers (40); - Moderate Smokers (40); - Never Smokers (40). I 120 soggetti che compongono il campione sono stati descritti da

21 variabili articolate in tre sezioni: a. variabili anagrafiche; b. analisi del sangue; c. analisi delle urine. Su questo database sono state fatte 4 gruppi di elaborazioni,

articolando le classi dei soggetti secondo il seguente schema:

Page 130: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

132

1° Gruppo: classificazione 1 di 3, discriminare ogni classe di soggetti rispetto alle altre due: Heavy Smokers Vs Moderate Smokers Vs Never Smokers (database completo 120 soggetti);

2° Gruppo: classificazione 1 di 2, discriminare fra due classi così suddivise: Heavy Smokers + Moderate Smokers Vs Never Smokers (database completo 120 soggetti);

3° Gruppo: classificazione 1 di 2, discriminare fra due classi così suddivise: Heavy Smokers Vs Never Smokers (database 80 soggetti);

4° Gruppo: classificazione 1 di 2, discriminare fra due classi così suddivise: Heavy Smokers Vs Moderate Smokers (database 80 soggetti). In questo gruppo di elaborazioni sono state aggiunte 4 variabili, portando il numero complessivo degli input a 25.

Dal piano di lavoro dello studio è evidente che i quattro gruppi di elaborazioni presentano diversi gradi di difficoltà, quindi i risultati raggiunti vanno valutati in relazione ai diversi livelli di difficoltà.

Il primo gruppo di elaborazioni ha ovviamente il maggior grado di difficoltà perché si tratta di discriminare fra tre classi di soggetti, di cui 2 di fumatori e una di non fumatori.

Nel secondo gruppo le classi sono ridotte a due, ma la presenza di fumatori moderati e di non fumatori in un’unica classe rende la previsione anch’essa piuttosto difficoltosa.

Il terzo gruppo risulta il più semplice in quanto i soggetti appartengono alle due classi più distanti (Heavy Vs Never Smokers).

Il quarto gruppo, infine, risulta interessante in quanto si tratta di riuscire a discriminare fra le due classi più simili, composte da soggetti con diverso grado di consumo di sigarette.

Il protocollo di elaborazione è quello consueto 5x2cv più volte descritto, con il campione di Prediction esterno.

Nella tabella sottostante riportiamo i migliori risultati ottenuti, che si riferiscono alle elaborazioni del 4° gruppo.

Page 131: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

133

ANN Heavy Moderate A.Mean Acc W.Mean Acc ErrorsPrediction 01 78.13% 87.50% 82.82% 82.82% 6Prediction 02 68.75% 84.38% 76.57% 76.57% 8Prediction 03 71.88% 87.50% 79.69% 79.69% 7Prediction 04 78.13% 81.25% 79.69% 79.69% 7Prediction 05 75.00% 81.25% 78.13% 78.13% 7Mean 74.38% 84.38% 79.38% 79.38% 7

Linear Discriminant Heavy Moderate A.Mean Acc W.Mean Acc ErrorsLDA-Prediction 01 75.00% 81.25% 78.13% 78.13% 7LDA-Prediction 02 75.00% 87.50% 81.25% 81.25% 6LDA-Prediction 03 81.25% 62.50% 71.88% 71.88% 9LDA-Prediction 04 68.75% 68.75% 68.75% 68.75% 10LDA-Prediction 05 75.00% 81.25% 78.13% 78.13% 7Mean 75.00% 76.25% 75.63% 75.63% 8

Tabella dei risultati ottenuti nel 4° gruppo di elaborazioni Dalla tabella si può notare che l’accuratezza, sia in media aritmetica

che in media pesata, raggiunge il 79.38%. Il risultato è da considerarsi buono, se confrontato con le altre elaborazioni e nonostante il compito di distinguere le due classi di fumatori sia più difficile. Inoltre la classe dei Moderate Smokers è quella identificata meglio dalle reti neurali raggiungendo l’84.38% di accuratezza media, ottenendo il migliore risultato in prediction su una singola classe.

Equipe di ricerca e partner esterni I ricercatori che lavorano al progetto sono: M. Intraligi, M.

Capriotti, G. Maurelli. Il partner esterno, finanziatore del progetto è la British American Tobacco SpA.

Sviluppi Per questo progetto l’obiettivo principale è quello di poter

incrementare la casistica attualmente disponibile, tentando di confermare i risultati finora ottenuti. Nonostante l’esiguità del database le reti neurali sono riuscite ad ottenere risultati utili, ciò significa che mantenendo la stessa architettura dei protocolli di elaborazione (stesso numero di variabili, stessi modelli, stesso protocollo di validazione) con l’aumentare della numerosità del campione i risultati dovrebbero migliorare e consolidarsi.

Page 132: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

134

3.4.2 Analisi e simulazione dinamica dei comportamenti di consumo

Obiettivo del progetto Nel 2008 è diventata operativa la partnership fra il Semeion e la

GPF SpA, una società che si occupa da molti anni di analisi dei comportamenti di consumo della popolazione e di sondaggi nel campo del marketing strategico.

L’obiettivo della collaborazione consiste nella sperimentazione sul campo di algoritmi del Semeion applicandoli all’analisi dei comportamenti di consumo, in funzione della costruzione di nuove strategie di marketing per l’analisi dei mercati. Il progetto che riportiamo si riferisce alla soddisfazione di un campione di consumatori nella scelta dei punti vendita relativi ad alcuni brand di supermercati.

Risultati conseguiti Il database era composto complessivamente da 2.705 soggetti che

avevano espresso la loro opinione rispetto a 23 supermercati. Le variabili erano così composte:

- 23 supermercati scelti come preferiti; - 19 motivi di scelta del supermercato preferito; - 19 motivi di insoddisfazione del supermercato preferito; - 23 supermercati scelti come alternativa al preferito. Tra i 2.705 soggetti ne sono stati selezionati 2.333, che hanno dati

completi relativi alla scelta del supermercato preferito, di questi: - 1.351 soggetti sono stati considerati come “clienti fedeli”, cioè

che come alternativa non hanno scelto altri supermercati; - 892 soggetti sono stati considerati come “clienti non fedeli”, cioè

che hanno scelto come alternativa almeno un secondo supermercato.

Una prima sperimentazione è stata effettuata su 61 variabili (23 supermercato di prima scelta + 19 motivi di scelta + 19 motivi di insoddisfazione), alle quali è stata aggiunta l’informazione clienti fedeli/ non fedeli.

L’obiettivo dell’analisi era quello di visualizzare delle mappe che potessero far comprendere le relazioni esistenti fra i diversi brand dei

Page 133: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

135

supermercati in relazione alle scelte dei consumatori. Il modello di analisi è il sistema PST13, brevettato dal Semeion.

Mostriamo una delle mappe emerse dalle elaborazioni dove si evince la struttura del clustering, al sistema PST sono state imposti 4 cluster calcolati sulle distanze.

Mappa della distribuzione dei cluster con elaborazione PST

13 M.Buscema, S.Terzi, PST: An Evolutionary Approach to the Problem of Multi Dimensional Scaling, in WSEAS Transactions on Information Science & Applications, Issue 9, vol. 3, September 2006 pp. 1704-1710. Brevetto internazionale (Pick and Squash Tracking - PST), depositato il 22-06-2004, domanda PCT/EP2004/051190.

Page 134: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

136

Una seconda sperimentazione aveva lo scopo di mostrare le connessioni fra i diversi supermercati, individuando i prototipi e la diversa distribuzione su una mappa. Le variabili del database erano così composte:

- 23 supermercati scelti come preferiti; - 19 motivi di scelta del supermercato preferito; - 71 altre informazioni riconducibili al comportamento dei

consumatori, alla qualità del servizio e al giudizio sui prodotti. L’analisi è stata realizzata integrando più modelli, alcuni dei quali

proprietari del Semeion (Constraints Satisfaction Network CS, PST), altri di letteratura (Linear Correlation LC, Minimum Spanning Three MST).

Attraverso la LC si calcola la matrice di correlazioni tra tutte le variabili (113x113) con diagonale nulla. Attivando la rete CS si interroga la matrice delle connessioni (relazioni) per ottenere il prototipo di ogni supermercato. Poi si calcola la matrice delle distanze, tra i 23 supermercati, sulla base delle attivazioni delle altre variabili. Con il PST si calcola la mappa a partire dalla matrice delle distanze tra i 23 supermercati. Infine applicando il MST si visualizzano le relazioni tra i 23 supermercati.

Nella figura seguente mostriamo la mappa delle relazioni dei supermercati dopo aver attivato il marchio GS.

Page 135: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

137

Mappa delle distanze non-lineari tra il supermercato GS e gli altri

Il processo di elaborazione descritto visualizza il risultato attraverso questa mappa quando si utilizza il marchio GS come stimolo esterno. Per ognuno dei marchi è possibile effettuare le stesse interrogazioni, con innumerevoli forme di combinazioni.

Equipe di ricerca e partner esterni I ricercatori che lavorano al progetto sono: G. Massini, M. Intraligi e

G. Maurelli. Il partner finanziatore del progetto è la GPF SpA. Sviluppi La collaborazione fra GPF e Semeion è iniziata nel 2008, si prevede

di ampliare i progetti nei quali i modelli del Semeion verranno utilizzati per migliorare la comprensione dei fenomeni legati ai comportamenti di consumo.

Page 136: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

138

4. Pubblicazioni scientifiche Nel corso del 2008 l’attività di pubblicazione scientifica si è

concentrata principalmente su articoli scientifici finalizzati a presentare e descrivere i nuovi modelli matematici recentemente scoperti.

Per ogni articolo pubblicato riportiamo il frontespizio, che identifica, anche visivamente, la rivista, gli autori e contiene l’abstract. In questo modo chiunque sia interessato ad avere l’articolo completo può facilmente rivolgersi all’editore della rivista.

Complessivamente nel 2008 sono stati pubblicati 14 articoli scientifici su diverse riviste internazionali. Inoltre nel 2008 si è stabilito un accordo con la casa editrice Aracne per la pubblicazione di tutti i Technical Paper del Semeion in una nuova collana finalizzata a diffondere il lavoro di ricerca sviluppato in oltre 20 anni. Nel 2008 è stato pubblicato il Technical Paper n. 32 dedicato alla descrizione teorica della rete AutoContractive Maps:

M. Buscema, R. Petritoli, G. Pieri, P. Sacco AutoContractive Maps, Technical Paper n. 32, Collana Semeion, Aracne Editrice, Roma, 2008.

Page 137: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

139

Page 138: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

140

Page 139: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

141

Page 140: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

142

Page 141: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

143

Page 142: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

144

Page 143: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

145

Page 144: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

146

Page 145: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

147

Page 146: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

148

Page 147: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

149

Page 148: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

150

Page 149: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

151

Page 150: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

152

Page 151: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

153

Page 152: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

154

5. Attività di formazione A partire dal 2007 il Semeion ha iniziato l’attività di formazione nel

campo medico grazie alla consolidata partnership con il Gruppo Bracco.

Lo scopo dell’attività di formazione è quello di consentire ai medici di avvicinarsi ai temi della complessità acquisendo un bagaglio di competenze di base sui Sistemi Artificiali Adattivi. L’obiettivo centrale non solo è quello di favorire l’uso di nuovi strumenti di analisi delle malattie, ma anche di fornire gli strumenti pratici per lavorare in modo nuovo sui dati che vengono quotidianamente raccolti dai medici specialisti, in riferimento a determinate patologie. Per questa ragione oltre a diverse ore di lezione frontale, durante il corso vengono effettuati dei laboratori pratici, nei quali i medici hanno potuto sperimentare direttamente l’uso di strumenti software che implementano i modelli di elaborazione descritti nella parte teorica del corso.

I corsi sono organizzati in modo da fare due giorni pieni di formazione, per un totale di 16 ore complessive per ogni singolo corso. Il corso fornisce in primo luogo una guida alla costruzione corretta di un database, sia in termini di scelta delle variabili sia in termini di numerosità dei campioni da raccogliere, in secondo luogo insegna ad utilizzare modelli di elaborazione che rispondono a domande alle quali spesso la statistica tradizionale non è in grado di rispondere. Il vantaggio di possedere un database sui propri pazienti aggiornato e correttamente strutturato è certamente un aiuto utile anche all’attività clinica quotidiana, la possibilità di elaborarli facilmente con modelli matematici avanzati costituisce un valore aggiunto per la diagnosi clinica.

Nel 2008 si sono tenuti tre corsi di formazione, il cui programma è stato descritto nel paragrafo 3.2.1. di questo volume. Il corpo docente era costituito da alcuni ricercatori del Semeion: M. Buscema, G. Massini, S. Terzi, M. Intraligi, G. Maurelli, ed un associato di ricerca E. Grossi. I partecipanti ai corsi sono stati principalmente medici geriatri, neurologi, dietisti, endocrinologi.

I corsi si sono tenuti nelle seguenti date: - 1° Corso di formazione “Intelligenza Artificiale in Medicina II

anno”, organizzato in collaborazione con la Bracco SpA. Il

Page 153: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

155

corso si è tenuto a Roma presso la sede del Semeion dal 14 al 17 maggio 2008.

- 2° Corso di formazione “Intelligenza Artificiale in Medicina II anno”, organizzato in collaborazione con la Bracco SpA. Il corso si è tenuto a Roma presso la sede del Semeion dall’11 al 14 Giugno 2008.

- 3° Corso di formazione “Intelligenza Artificiale in Medicina II anno”, organizzato in collaborazione con la Bracco SpA. Il corso si è tenuto a Roma presso la sede del Semeion dal 9 al 12 Luglio 2008.

Page 154: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

156

6. Collaborazioni e brevetti Le relazioni più significative che il Semeion ha instaurato con

istituzioni pubbliche e private, centri di ricerca, enti ed aziende, delineano un quadro storico-evolutivo del Semeion nel tempo. Abbiamo pensato di fornire un elenco completo per consentire, a chi è interessato, di farsi un’idea di coloro che hanno contribuito all’esistenza Semeion, dalla sua nascita fino ad oggi.

Nel 2008 vanno segnalati due importanti accordi di collaborazione istituzionale internazionale sull’attività di ricerca di base stipulati con:

- Ithaca College School of Business, New York, USA; - University of Colorado, Denver, USA. Sempre nel 2008 il Semeion ha iniziato importanti collaborazioni

istituzionali con importanti settori del Ministero della Difesa e del Ministero dell’Interno.

6.1 Collaborazioni e cooperazioni istituzionali Le collaborazioni sono suddivise in 3 ambiti istituzionali: - Università e Centri di ricerca nazionali e internazionali; - Enti pubblici e privati; - Aziende. Delle Università e Centri di Ricerca nazionali e internazionali

forniamo un elenco, in ordine alfabetico: 1. Abo Academy University, Department of Pharmacy, Turku

(Finland) 2. ACFE (Association of Certified Fraud Examiners), Roma 3. (AFCEA) Armed Forces Communications and Electronics

Association, capitolo di Roma 4. Centro Sviluppo Materiali S.p.A., Roma-Terni 5. College of Medicine, University of Kentucky, NunStudy

Project, Lexington (KY-USA) 6. Consorzio Universitario Nettuno, Network per l’Università

Ovunque, Roma 7. Consorzio Universitario Padova Ricerche, Padova 8. ENEA - Centro Ricerche Energia della Casaccia, Roma 9. Istituto Galeazzi di Milano, Dipartimento di Radiologia,

Milano 10. Istituto Nazionale di Fisica Nucleare, Roma 11. Istituto di Ricovero e Cura “Santa Lucia” (Roma)

Page 155: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

157

12. Istituto di Ricovero e Cura “S. Giovanni di Dio Fatebenefratelli” (Brescia)

13. Jerusalem Methadone Centre, Jerusalem (Israel) 14. Middle Eastern Summer Institute on Drug Use, Jerusalem

(Israel) 15. National Institute of Health, Laboratory of Adaptive Systems,

John Hopkins University (USA) 16. New Scotland Yard, Specialist Crime Directorate,

Metropolitan Police Service, London (UK) 17. Osservatorio Sicurezza Nazionale (OSN) ente promosso dal

Centro Militare di Studi Strategici (CeMiSS) e dalla Elsag Datamat, Roma

18. Ospedale Niguarda Ca’ Granda, Laboratorio Clinico di Chimica e Ematologia, Milano

19. Politecnico di Milano, Facoltà di Architettura, Dipartimento di Scienze del Territorio, Milano

20. Prevention Research Centre Pacific Institute for Research & Evaluation, Berkeley (CA-USA)

21. Sanders-Brown Center on Aging, Department of Preventive Medicine, College of Medicine, University of Kentucky (USA)

22. Scuola Centrale Tributaria “Ezio Vanoni”, Ministero delle Finanze, Roma

23. SUPEA, Research Unit, Losanna (CH) 24. Tri-Ethnic Center for Prevention Research, Colorado State

University (Colorado, USA) 25. Università di Alessandria, Dipartimento di Scienze Sociali,

Alessandria 26. Università di Bologna, Dipartimento di Scienze

dell’Educazione, Bologna 27. Università degli Studi di Chieti-Pescara “G. d’Annunzio”,

Pescara 28. Università di Firenze, Dipartimento di Scienze Economiche,

Firenze 29. Università di Milano Bicocca, Facoltà di Sociologia, Milano 30. Università di Napoli, Dipartimento di Sociologia, Napoli 31. Università di Roma La Sapienza, Istituto di Farmacologia,

Roma 32. Università di Roma La Sapienza, Istituto di Radiologia, Facoltà

Medicina e Chirurgia, Roma

Page 156: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

158

33. Università degli Studi di Venezia, IUAV, Venezia 34. Università Campus Biomedico di Roma 35. University of Kentucky, Centre on Drug & Alcohol Research,

Lexington (KY-USA) 36. University of Mainz “J. Gutenberg”, Dipartimento di

Radiologia, Mainz (D). Per gli Enti pubblici e privati le collaborazioni più significative sono

e sono state con: 1. Ministero dell’Università e della Ricerca 2. Ministero del Lavoro 3. Ministero della Salute 4. Ministero Affari Sociali 5. Ufficio Italiano Cambi, Banca d’Italia 6. Confindustria 7. Regione Emilia-Romagna 8. Regione Veneto 9. Regione Basilicata 10. ASL di Vigevano 11. ASL di Castelfranco Veneto 12. ASL di Salerno 13. ASL di Siena 14. ASL di Bari 15. Ospedale Militare Marittimo di La Spezia

Nell’ambito del mondo aziendale segnaliamo alcune delle

collaborazioni più significative, relativamente all’applicazione dei modelli scientifici per la risoluzione di problemi:

1. Gruppo Bracco S.p.A. 2. Selex Communications S.p.A. (Gruppo Finmeccanica) 3. Selex Sistemi Intergrati S.p.A. (Gruppo Finmeccanica) 4. E-Stat S.r.l. (Gruppo Delta) 5. British American Tobacco – Italia, Roma 6. Santander Consumer-Banca S.p.A. 7. Experian S.p.A. 8. Consiel S.p.A. (Gruppo Telecom Finsiel) 9. Istituto di Credito Sportivo S.p.A. 10. Telesoft S.p.A. 11. Performa Confcommercio S.c. a r.l. 12. Computer Associates S.p.A.

Page 157: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

159

13. TNT Global Express S.p.A. 14. Union Key S.r.l. 15. Atlantis S.p.A.

6.2 Elenco dei brevetti Le domande di brevetto sono iniziate nel 2001, quando il Semeion

ha avuto l’opportunità di incontrare aziende interessate a sfruttare economicamente i risultati delle ricerche sviluppate al suo interno. L’inventore di tutti i brevetti è M. Buscema che, in qualche caso, ha condiviso l’ideazione con altri ricercatori. A titolo informativo forniamo un elenco completo dei brevetti depositati fino alla fine del 2008.

- Brevetto Internazionale, denominato: “Metodo e dispositivo per valutare la prestazione cognitiva di un individuo” (TSP GenD: Genetic Doping Algorithm for Resolution Traveling Sales Person Problem), coinventore Enzo Grossi, (domanda n. PCT/IT01/00542 depositata il 24-10-2001).

- Brevetto Europeo, denominato: “Metodo per la codifica di pixel di immagini e metodo di elaborazione d'immagine per il riconoscimento qualitativo dell'oggetto riprodotto da uno o più pixel di immagine” (Pixel Vector Theory PVT) (domanda n. 02425141.5 depositata il 11-03-2002).

- Brevetto USA, denominato: “Metodo per l'ottimizzazione di un database per eseguire il training ed il testing di un algoritmo di predizione, particolarmente di una rete neurale” (Sistema Training and Testing, T&T) (domanda n. US60/440, 210 depositata il 15-01-2003).

- Brevetto Internazionale, denominato: “Metodo per la codifica di pixel di immagini e metodo di elaborazione d'immagine per il riconoscimento qualitativo dell'oggetto riprodotto da uno o più pixel di immagine” (Pixel Vector Theory, PVT) (domanda n. PCT/EP03/02400 depositata il 10-03-2003).

- Brevetto Europeo, denominato: “Algoritmo per la proiezione di dati di informazioni appartenenti ad uno spazio multidimensionale in uno spazio avente meno dimensioni. Un metodo per l’analisi cognitiva dei dati di informazioni multidimensionali “basati su detto algoritmo e un programma comprendente il detto algoritmo memorizzato su un supporto registrabile” (Pick and Squash Tracking, PST) (domanda n. 03425436.7 depositata il 01-07-2003).

Page 158: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

160

- Brevetto Europeo, denominato “Un algoritmo per il riconoscimento di relazioni tra i dati di un database e un metodo per il riconoscimento di forme di immagini basato su detto algoritmo” (Active Connection Matrix, ACM), (domanda n. 03425559.6 depositata il 22-08-2003).

- Brevetto Europeo, denominato “Rete Neurale Artificiale” (Sine Net), (domanda n. 03425582.8 depositata il 09-09-2003).

- Brevetto Internazionale “Metodo per l'ottimizzazione di un database per eseguire il training ed il testing di un algoritmo di predizione particolarmente di una rete neurale” (Sistema Training and Testing, T&T), (domanda n. PCT/EP04/00157 depositata il 13-01-2004).

- Brevetto Internazionale, denominato: “An Algorithm for projecting information data belonging to a multidimensional space into a space having less dimensions a method for the cognitive analysis of multidimensional information data based on the said algorithm and a program comprising the said algorithm stored on a recordable support” (Pick and Squash Tracking, PST), (domanda n. PCT/EP2004/051190 depositata il 22-06-2004).

- Brevetto Internazionale, denominato “Un algoritmo per il riconoscimento di relazioni tra i dati di un database e un metodo per il riconoscimento di forme di immagini basato su detto algoritmo” (Active Connection Matrix, ACM), (domanda n. PCT/EP2004/05182 depositato il 18-08-2004).

- Brevetto Internazionale “Una Rete Neurale Artificiale” (Sine Net), (domanda PCT/EP2004/05189 depositata il 28-08-2004).

- Brevetto Europeo, denominato “Metodo di elaborazione di segnali multicanale e multivariati e metodo di classificazione di sorgenti di segnali multicanale operante in base a detto metodo di elaborazione” (Implicit Function As Squashing Time, IFAST), (domanda n. 06115223.7 depositata il 09-06-2006).

- Brevetto Internazionale “Metodo di elaborazione di segnali multicanale e multivariati e metodo di classificazione di sorgenti di segnali multicanale e multivariati operante in base al detto metodo di elaborazione” (Implicit Function As Squashing Time, IFAST), (domanda n. PCT/EP2007/055646 depositata il 08-06-2007).

Page 159: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

161

- Brevetto Europeo denominato “Un algoritmo per il processamento di immagini in grado di evidenziare l’informazione nascosta nei pixel” (Active Connection Matrix J-Net), (domanda n. 07425419.4 depositata il 06-07-2007).

Page 160: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

162

7. Partecipazione a conferenze e convegni Le relazioni che i ricercatori del Semeion tengono ogni anno,

partecipando a conferenze e convegni, costituiscono un’attività di comunicazione e divulgazione del lavoro di ricerca di base e sperimentale. Tale attività consente anche lo scambio e il confronto d’idee con altri ricercatori che lavorano nello stesso campo, o in campi simili.

Elenchiamo gli eventi più significativi ai quali hanno partecipato i ricercatori nell’anno 2008 in qualità di relatori ai seguenti congressi. Nell’elenco è indicato il titolo della relazione seguito dall’evento congressuale nel quale l’intervento è stata collocato.

- “L’Intelligenza Artificiale ed il Sistema delle Reti Neurali”

all’interno di “Incontro congiunto delegazioni regionali AIGO-AISF-SIED-SIGE” su “Statistica del Paziente Medio e Statistica del Paziente Reale: quale aiuto dalle reti neurali?”, Università Federico II, Napoli, 9 Gennaio 2008.

- “Il Ruolo dei Sistemi Artificiali nello sviluppo del Territorio” in “Festival delle Città Impresa” Rovereto, 19 Aprile 2008.

- “Infrastrutture critiche e loro protezione” al workshop organizzato da Sicurezza-Italia al “1º Salone Internazionale della Tecnologia per la Sicurezza” TechFOr 2008. Roma, 12-15 Maggio 2008.

- “Sistemi artificiali adattivi: teorie e metodi per rendere visibile l’invisibile” in occasione dell’Evento RES 2008 su “Etica, l’impossibile equilibrio tra profitto e benessere”. Siena, 15-16 Maggio 2008.

- “Four Models for Four Medical Applications” in occasione del “2008 Annual Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “Is Information Being Denied to the Scientific Community by the Reductionist Approach to Data Analysis in Stroke Related Clinical Trials ?” in occasione del “2008 Annual Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “J-Net System: a new paradigm for Artificial Neural Networks applied to diagnostic imaging” in occasione del “2008 Annual

Page 161: Rapporto di Ricerca Anno 2008 - semeion.it · matematici e algoritmi con particolare riferimento ai Sistemi Artificiali Adattivi; ... Inventore di 14 brevetti internazionali. Ricerca

163

Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “Powerful Computerized Spatial Epidemiology and Semantics Through the Use of Novel Mathematical Objects: Can Artificial Intelligence Systems Identify Outbreak Sources?” in occasione del “2008 Annual Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “The Transferal of Evidences Derived from Clinical Research to Single Patient Level: Automatic Distinction of Normal Elderly vs. Mild Cognitive Impairment Subjects by Resting EEG Data Processed by IFAST, a Novel Intelligent System” in occasione del “2008 Annual Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “The General Philosophy of Artificial Adaptive Systems” in occasione del “2008 Annual Meeting of the North American Fuzzy Information Processing Society (NAFIPS 2008)”. New York, USA, 20-22 Maggio 2008.

- “Nuovi modelli di analisi dei dati: le vocazioni del territorio” in occasione del “Convegno finale del Progetto DiCE, Distretto Culturale Evoluto, della Regione del Veneto”. Venezia, 30 Giugno 2008.

- “Modelli forti nei momenti deboli”, relazione tenuta nell’ambito del Festival di arte, cultura e scienza denominato “Generazioni creative”, organizzato dal Comune di Parma, Parma 11-14 Settembre 2008.

- “Culture-led local development: the case of the Veneto Region, Theory and Policy Issues”, Joint Conference “Art, Culture and Public Sphere, Expressive and Instrumental Values in Economic and Sociological Perspective, IUAV Università di Venezia, Venezia, 7 novembre 2008.

- “Artificial Adaptive Systems: applications in the Drug Trafficking and Medicine” al Convegno “From Technology to Values” organizzato da Finmeccanica, Civita Castellana (VT) 30 Novembre - 5 Dicembre 2008.