Upload
giuseppe-rosa
View
217
Download
0
Embed Size (px)
Citation preview
Relatore:Prof. Sonia BergamaschiCorrelatore:Alexandre Passant
Tesi di Laurea di:Fabrizio Orlandi
Laurea specialistica in Ingegneria Informatica Anno Accademico: 2007/2008
Università degli Studi di Modena e Reggio Emilia
Attività progettuale
• Svolta presso l’istituto di ricerca: DERI (Digital Enterprise Research Institute)
“Il più importante centro di ricerca sul Web Semantico al mondo”• Situato a Galway in Irlanda• Più di 30 progetti di ricerca internazionali• Obiettivo:
Estensione dell’ontologia del progetto SIOC (Semantically-Interlinked Online Communities) per poter
interconnettere semanticamente i wiki distribuiti sul Web e separati tra loro
2tesi di laurea di: Fabrizio Orlandi
Cos’è il Web Semantico?
• “Un’estensione del Web attuale” [Tim Berners-Lee et al.]
• Obiettivo: fornire significato all’informazione sul Webrendendola interpretabile dai computer per una migliore cooperazione uomo-macchina
• Comunemente identificato come Web 3.0
• Prevede di aggiungere metadati alle pagine Web basati su sottostanti schemi o ontologie (specificazione di una concettualizzazione)
3tesi di laurea di: Fabrizio Orlandi
SIOC project(Semantically-Interlinked Online Communities)
4
Obiettivi: • Interconnettere semanticamente le comunità online• Descrivere contenuto e struttura di siti sociali• Risolvere i problemi di interoperabilità del Social Web• Ricercare e navigare informazioni prodotte dalle comunitàonline sociali in modi innovativi e più interessanti
Ontologia adottata in più di 50 applicazioni Web e centinaia di sitihttp://sioc-project.org
Pubblicata come W3C Member Submission (Agosto 2007)
tesi di laurea di: Fabrizio Orlandi
5tesi di laurea di: Fabrizio Orlandi
FOAF + SSL(Per privacy e autenticazione)
Ontologia SIOC
Il nucleo dell’ontologia, con classi e proprietà principali:
6tesi di laurea di: Fabrizio Orlandi
Wiki Semantici
Combinano la capacità espressiva di:
7
Web Semantico:•Processabile dalle macchine•Integrazione dei dati•Interrogazioni complesse
Wiki:•Facili da usare e contribuire•Fortemente interconnessi•Collaborativi
• Permettono agli utenti di annotare semanticamente, attraverso semplici interfacce, i contenuti creati all’interno del wiki
• Consentono l’esecuzione di query complesse sui dati strutturati,quindi vanno oltre alla semplice ricerca di keyword
• Facilitano la manutenzione del wiki (grazie alla propagazione degli update)
• Possono essere usati anche come strumenti di Ontology Engineering
tesi di laurea di: Fabrizio Orlandi
Wiki Semantici - ontologie
Molti utilizzano una propria ontologia per definire la struttura del wiki
8
Ad esempio:
Esistono ontologie specifiche utilizzabili per la modellazione dei wiki
tesi di laurea di: Fabrizio Orlandi
SweetWikiINRIA (FR)
IkeWiki (Salzburg Research)
Semantic MediaWiki(Wikimedia Foundation)
Ad esempio: WikiOnt e WIF (Wiki Interchange Format)
Estensione dell’ontologia SIOC
Estensione di SIOC
Caratteristiche fondamentali dei wiki esaminate:
9
Multi-authoring: diversi utenti collaborano anche contemporaneamente Categorie: gli articoli dei wiki sono suddivisi e catalogati in gerarchieSocial Tagging: aggiunta di tag ai contenuti delle pagineDiscussioni: ad ogni pagina viene associato uno spazio di discussione tra gli utentiBacklinks: link entranti in una paginaVersioning: per ogni pagina viene mantenuta la storia delle versioni precedenti
tesi di laurea di: Fabrizio Orlandi
Modifiche all’ontologia SIOC:
• Definita la classe sioct:Category come sottoclasse di skos:Concept• Aggiunta la proprietà sioc:has_discussion• Aggiunta la proprietà sioc:latest_version• Aggiunte due proprietà inverse transitive earlier_version e later_version• Definite sioc:previous/next_version sotto-proprietà di earlier/later_version
Applicazioni
Create due applicazioni (una in Java e una in PHP) che esportano e traducono le informazioni strutturali di un qualsiasi wiki di tipo
MediaWiki (es. Wikipedia) in dati RDF basati sul nuovo modello SIOC
10tesi di laurea di: Fabrizio Orlandi
L’applicazione in PHP è stata sviluppata come webservice liberamente accessibile: http://ws.sioc-project.org/mediawiki/
Browsing dei dati generati
Una volta che vengono esportati e generati i dati RDF corrispondenti ad una pagina di un wiki, è possibile visualizzare i
risultati utilizzando ad esempio Tabulator
11tesi di laurea di: Fabrizio Orlandi
Il browsing è particolarmente efficace perché la modellazione è stata effettuata seguendo i principi del “Linked Data”
Per questo motivo è possibile anche il crawling di un intero wiki semplicemente partendo da una singola pagina
e seguendo i link rdfs:seeAlso
Query sui dati raccolti
Circa 1GB di dati RDF sono stati raccolti esportando 3 wiki diversiutilizzando il webservice PHP e un crawler
12tesi di laurea di: Fabrizio Orlandi
I dati estratti sono stati inseriti in un RDF Store con supporto per inferenza OWL (utilizzato Sesame + OWLIM)
Sono state eseguite query SPARQL sul triple-store per testare le possibilità offerte dalla modellazione proposta
Esempi di query inter-wiki:“Seleziona tutti gli utenti con stesso username”
“Seleziona le pagine che appartengono alla stessa categoria”“Seleziona le coppie di utenti che collaborano su wiki diversi”
Conclusioni e Sviluppi Futuri
• Il modello proposto rispetta appieno le aspettative, e permette di definire la struttura di un qualsiasi wiki
• Permette inoltre l’interconnessione e lo scambio di informazioni tra wiki differenti e tra le rispettive comunità sociali
• Articolo accettato al 4° Semantic Wiki workshop presso la conferenza ESWC (European Semantic Web Conference) 2009 a Creta, Grecia
13tesi di laurea di: Fabrizio Orlandi
• Le applicazioni create applicano il modello ai wiki di tipo MediaWiki, in futuro ulteriori esportatori possono essere implementati per aumentare la diffusione e l’interoperabilità
• Un ulteriore sviluppo può essere quello di fornire maggiore dettaglio sul contenuto di un articolo wiki, come nel caso dell’integrazione con il progetto DBPedia
Grazie per l’attenzione!
14tesi di laurea di: Fabrizio Orlandi