Upload
lyxuyen
View
215
Download
0
Embed Size (px)
Citation preview
Semantic Web
Ing. Federico Chesani
7 Novembre 2008
Outline
• Introduzione a Semantic Web
Out
line
• Tecnologie del Semantic Web
• SW oggi: problemi e critiche
Outline
Introduzione a Semantic Web
• Caratterizzazione del World Wide Web odierno
L S i W be–
Tecn
olog
ie -
Conc
lusi
oni
• La proposta Semantic Web
• Architettura del Semantic Web
• Applicazioni del Semantic Web
Intr
oduz
ione
Il Web oggi (Web 1.0) …
• L’informazione oggi è rappresentata tramite:– Linguaggio naturale– Immagini, multimedia, aspetto grafico
• Gli utenti utilizzano tutti questi mezzi (facilmente) per:e
–Te
cnol
ogie
-Co
nclu
sion
iper:– Dedurre fatti da informazioni parziali– Creare associazioni mentali
– Accedono contemporaneamente a diversi mezzi di comunicazione senza alcun problema (uso di più sensi)
Intr
oduz
ione
Il Web oggi (Web 1.0) …
• I contenuti sono pubblicati su web per essere “human-readable”– Standard HTML concentrato su “come”
rappresentare i contenuti
e–
Tecn
olog
ie -
Conc
lusi
oni
– Nessun meccanismo per definire “cosa” si sta rappresentando
– Alcuni tags (e.g. <title>) danno semantica implicitamente ma …
• … il loro contenuto non è strutturato• … il loro uso non è standardizzato
Intr
oduz
ione
Il Web oggi (Web 1.0) …Possiamo identificare il titolo in base alla sua presentazione (<h1>, <b>) …
… se domani il designer grafico cambia il formatoe
–Te
cnol
ogie
-Co
nclu
sion
i
<h1><!-- inizio TITOLO --><B>Finanziaria, il voto slitta a domani<br>
Al Senato va in scena l'assurdo</B><!-- fine TITOLO -->
</h1>
grafico cambia il formato esterno, il nostro program-ma non funziona più!!!
Intr
oduz
ione
Il Web oggi (Web 1.0) …
• Le pagine contengono collegamenti (links) ad altre pagine– Nessuna informazione sul link …
• cosa rappresenta un certo collegamento?e–
Tecn
olog
ie -
Conc
lusi
oni
… cosa rappresenta un certo collegamento?• … cosa rappresenta la pagina/risorsa riferita da un
link?
– E.g.: Nella mia home page esistono link ad altre home page…
• quali di questi sono i miei colleghi? • quali di questi sono semplicemente miei
conoscenti?
Intr
oduz
ione
Il Web oggi (Web 1.0) …
Actual Web = Layout + Routing
e–
Tecn
olog
ie -
Conc
lusi
oni
Problema: non è possibile ragionare in modo automatico sui datiIn
trod
uzio
ne
Il Web oggi (Web 1.0) …
• Web inteso come colossale archivio di dati, interrogato ogni giorno da milioni di utenti– L’accesso a tale archivio avviene tramite motori di
ricerca ed in base a keywords …
e–
Tecn
olog
ie -
Conc
lusi
oni
– … il successo di tale ricerca dipende da molti fattori
• Bontà dell’algoritmo di ricerca• Numero delle pagine indicizzate• Contenuti/meta-contenuti delle pagine indicizzate• Esempio: ultime elezioni americane
Intr
oduz
ione
Il Web oggi (Web 1.0) …
• Il web è universale– Qualunque pagina può contenere collegamenti ad
altre pagine
– Approssimativamente chiunque può pubblicaree–
Tecn
olog
ie -
Conc
lusi
oni
Approssimativamente, chiunque può pubblicare su web riguardo qualunque argomento
• Decentralizzazione delle informazioni
• Inconsistenza delle informazioni
• Incompletezza delle informazioni
Intr
oduz
ione
Semantic Web
Obiettivo: poter “utilizzare”/”ragionare su” la enorme quantità di dati disponibili sul web in maniera automatica
e–
Tecn
olog
ie -
Conc
lusi
oni
Come? Estendendo l’attuale web con informazioni sul contenuto (informazioni semantiche)
Proposto da Tim Berners-Lee nel 2001, in un articolo pubblicato su Scientific American
Intr
oduz
ione
Semantic Web
“The Semantic Web is about two things. It is about common formats for integration and combination of data drawn from diverse sources, where on the original Web mainly concentrated on the interchange of documents. It is also about e
–Te
cnol
ogie
-Co
nclu
sion
i
g flanguage for recording how the data relates to real world objects. That allows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing.”
W3C Semantic Web Initiative
Intr
oduz
ione
Semantic Web
Principi che si vogliono salvaguardare:
• Universalità del web• De-centralizzazione dell’informazionee
–Te
cnol
ogie
-Co
nclu
sion
i
De centralizzazione dell informazione• Inconsistenza dell’informazione
– Inconsistenza dei contenuti– Inconsistenza delle informazioni di routing (links)
• Incompletezza dell’informazione– … dei contenuti– … delle informazioni di routing (links)
Intr
oduz
ione
Aggiungere informazioni sul contenuto
Aggiungere informazioni sul contenuto non è sufficiente
• Tali informazioni devono essere opportunamente strutturate (e.g., classificazione di Linneo per il mondo animale)
– Ontologie?e–
Tecn
olog
ie -
Conc
lusi
oni
g• E’ necessario aggiungere anche regole di inferenza
(e.g., sillogismo aristotelico, FOL, DL)– Logica?
• Applicando regole a dati si ottengono nuove conoscenze– Processo di prova (proof) con cui si dimostrano le
conclusioni
Intr
oduz
ione
Proof e Trust
Le “proofs” usate per inferire nuove informa-zioni possono essere scambiate ed analizzate per…
• … giustificare i risultati ottenutie–
Tecn
olog
ie -
Conc
lusi
oni
g• … superare l’aspetto definitorio dell’IT• … ragionare ulteriormente sulla “fiducia”
riguardo i risultati ottenuti– Le informazioni sul web sono (e saranno)
incoerenti, contradditorie ed incomplete
Intr
oduz
ione
Architettura del Semantic Web
Rice
rca
e–
Tecn
olog
ie -
Conc
lusi
oni
Stan
dard
Ass
esta
ti
Intr
oduz
ione
SW – Applicazioni?
Qualche esempio …
• Sistemi di ricerca
• Assistente remoto
e–
Tecn
olog
ie -
Conc
lusi
oni
• Integrazione Database (ambito industriale)
• Biblioteche ed archivi digitali (XMP Adobe)
• Semantic Web Services
Intr
oduz
ione
ApplicazioniRicerca di documenti/risorse
• Aziende medio/grandi hanno il problema di gestire lo storico dei documenti interni– E.g., Google offre “(Mini) Search Appliance” ( $1,995 up to
50.000 docs, $30,000 up to 500.000 docs – 2007 prices)
e–
Tecn
olog
ie -
Conc
lusi
oni
• Vodafone Live! Mobile Portal ha adottato una soluzione basata su RDF (SW)– Pagine visitate per download diminuite del 50%– In due mesi, scaricate il 20% in più di suonerie (fonte:
Ivan Herman, SW lead)
Intr
oduz
ione
ApplicazioniAltri portali …
• Sun’s White Paper e System Handbook
• Nokia’s S60 – portale di supporto
• Harper’s Online magazine - collega gli articoli pubblicatitramite una ontologia interna
O l i le–
Tecn
olog
ie -
Conc
lusi
oni
• Oracle - virtual press room
• Opera’s community site
• Yahoo! Food
• FAO's Food
• Nutrition and Agriculture Journal - portale
Intr
oduz
ione
ApplicazioniAssistente Remoto
• Scenario originale proposto da Tim Berners-Lee• Due utenti, tramite il loro “Semantic Web Agent”
residente in un palmare/cellulare, riescono a:– Sincronizzare le rispettive agende
e–
Tecn
olog
ie -
Conc
lusi
oni
– Generare un piano di azioni e su questo giungere ad un agreement
– Delegare, in base ad un modello di trust, compiti l’uno all’altro
– Analizzare clausole di un contratto ed effettuare scelte in base a funzioni di costo/benefici
Intr
oduz
ione
ApplicazioniAssistente Remoto rivisto
– Ognuno di noi può accedere on-line a:• c/c bancario• agenda• album fotografico
T li f ti di d ti i t tie–
Tecn
olog
ie -
Conc
lusi
oni
– Tali fonti di dati non sono integrati:• Non possiamo ad esempio integrare l’agenda con i
movimenti bancari effettuati quel giorno…• Non possiamo collegare alcune fotografie al giorno in
cui sono state scattate…
• Minor enfasi sulla parte di ragionamento!
Intr
oduz
ione
ApplicazioniIntegrazione di database
• A livello intra-aziendale, è frequente la necessità di dover integrare differenti database in un unico nuovo modello
• In maniera approssimata:1 Si rappresentano i diversi dati tramite strutturee
–Te
cnol
ogie
-Co
nclu
sion
i
1. Si rappresentano i diversi dati tramite strutture astratte di rappresentazione
• Dati indipendenti dalla loro rappresentazione interna
2. Si fa il “merge” di tali rappresentazioni astratte• Merge reale tramite esportazione/importazione verso un nuovo db• Merge virtuale, tramite opportuni strati software che nascondono la realtà fisica
3. Si utilizza il risultato ponendo query di complessità/significato maggiore (rispetto a prima)
Intr
oduz
ione
ApplicazioniIntegrazione di database
• Il passo di merge ha successo se per ogni set di dati vengono identificate/definite opportune equivalenze Automatic merge
e–
Tecn
olog
ie -
Conc
lusi
oni
http://.../isbn/0747591059
Harry Potter and the Deathly Hallows
a:title
a:hasISBN
J.K. Rowling
a:author
a:name
http://.../isbn/0747591059
Harry Potter et les reliques de la mort
b:titre
b:ISBN
J.K. Rowling
b:ateur
b:nom
Additional relation
New relation
Intr
oduz
ione
ApplicazioniIntegrazione di database
• Semantic Web offre supporto a tale lavoro di definizione di relazione tra concetti
• Differenze:– Prospettiva sull’intero webe
–Te
cnol
ogie
-Co
nclu
sion
iProspettiva sull intero web
– De-centralizzazione dei dati
– Uso di ontologie per organizzare meglio le relazioni
• Strumenti:– RDF
– GRDDL
Intr
oduz
ione
ApplicazioniBiblioteche ed archivi digitali
• La maggior parte dei sistemi di catalogazione di documenti avviene per categorie– E.g., è possibile consultare lo schedario di una biblioteca
per argomenti
ò è b l l b de–
Tecn
olog
ie -
Conc
lusi
oni
• Ciò non è possibile con il web odierno• E.g.: se cerchiamo qualcosa attinente al concetto di
“Intelligenza Artificiale”…• …ci viene restituito un elenco di pagine che
contengono la keyword “Intelligenza Artificiale”…• … non è detto che le pagine siano effettivamente
relative all’AI
Intr
oduz
ione
ApplicazioniSemantic Web Services
“Un WS è un’applicazione software identificatada un URI, le cui interfacce pubbliche e relativi binding sono definiti e descritti in XML. La sua definizione può essere trovatada altre applicazioni software.
Q ti lti i i i t i il WSe–
Tecn
olog
ie -
Conc
lusi
oni
Questi ultimi possono poi interagire con il WS seguendo le direttive presenti nelladefinizione del servizio, usando messaggiXML trasportati da protocolli internet.”
(“Web Services Architecture”http://www.w3c.org/TR/2002/WD-ws-arch-20021114)
Intr
oduz
ione
ApplicazioniSemantic Web Services
• Tramite UDDI e WSDL si possono conoscere dinamicamente (a tempo di esecuzione) locazione ed interfaccia di un servizio
• Però nessuna informazione su cosa faccia veramente ile–
Tecn
olog
ie -
Conc
lusi
oni
• Però nessuna informazione su cosa faccia veramente il servizio in questione
• Es: posso invocare un servizio di nome somma, che riceve come parametri di ingresso due interi, e restituisce un intero. Chi mi assicura che il servizio svolga effettivamente la somma di due numeri?
Intr
oduz
ione
ApplicazioniSemantic Web Services
Sono necessari due tipi di informazione:
• Dati semantici su cosa faccia il metodo– E.g.: definito in termini di precondizioni, input,
output ed effettie–
Tecn
olog
ie -
Conc
lusi
oni
output ed effetti
• Regole su:– Come invocare il metodo
– Quali vincoli ci sono sui dati
Intr
oduz
ione
ApplicazioniSemantic Web Services
Fortissimo interesse a livello sia di ricerca che di industria IT
• Due “contest” presenti in ambito di ricerca:– IEEE Contest
e–
Tecn
olog
ie -
Conc
lusi
oni
http://insel.flp.cs.tu-berlin.de/wsc06/
– SWS Challengehttp://sws-challenge.org/wiki/index.php/Main_PageSposorizzato da Stanford, vi partecipa da qualche mese
anche IBM
Intr
oduz
ione
ApplicazioniSemantic Web Services
SWS Challenge suddiviso in tre task differenti:1. Date due società, Blue (customer) e Moon
(manufacturer), costruire un mediatore per permettere l’interazionee
–Te
cnol
ogie
-Co
nclu
sion
i
p– Blue utilizza RosettaNet PIP3A4– Moon utilizza un legacy system interno– I servizi dei singoli sono descritti tramite:
• Informazioni sintattiche (WSDL e XML Schemas)• Descrizioni in linguaggio naturale
Intr
oduz
ione
ApplicazioniSemantic Web Services
e–
Tecn
olog
ie -
Conc
lusi
oni
Intr
oduz
ione
ApplicazioniSemantic Web Services
2. Discovery di un servizio di spedizione, in base ad un certo obiettivo
• Sono fornite le descrizioni in linguaggio naturale di 5 servizi di spedizione
• Si devono rappresentare tramite SW tali descrizioni
To: Smithers (Bristol) No of packages: 1 Package dimensions: (l/w/h) 10/2/3 (inch) Package weight: 20 lbs For less than 120$
To: Szyslak (Tunis) Package dimensions: (l/w/h) 40/10/10 (inch) Package weight: 30 lbs Current Time is 9:30 ame
–Te
cnol
ogie
-Co
nclu
sion
i• Si devono rappresentare tramite SW tali descrizioni,
al fine di avere:– Discovery in base alla destinazione– Discovery in base alla destinazione e al peso del pacco– Discovery in base a destinazione, peso e prezzo– Discovery con composizione di differenti servizi– Discovery con deadline temporali
Current Time is 9:30 am Shipping is required in 2 business days
Intr
oduz
ione
ApplicazioniSemantic Web Services
3. Discovery (II) e composizione di servizi di vendita pc
• Descrizione in linguaggio naturale di 3 fornitori
Apple Mac Book 13” Intel Duo Core Processor 2.0 GHz at least 512 MB RAM at least 60 GB HDD color: white or black at most 1500 $
Apple Mac Book 13” at least Intel Duo Core Processor 1.8 GHz at least 512 MB RAM at least 60 GB HDD color: white or black at most 1500 $ e
–Te
cnol
ogie
-Co
nclu
sion
i
• Si deve supportare la ricerca di un servizio:– In base ad una definizione esatta di un prodotto– In base a criteri più o meno importanti– Componendo più servizi per un ordine di più
items
The price is most important to me, get me the cheapest offer if the other requirements are met
If the white notebook is significantly less expensive (more than 100$), then buy the white one instead of the black one.
Intr
oduz
ione
Outline
Tecnologie per il Semantic Web
• URI ed XML
• Informazione semantica (I): RDF e RDFS
e –
Tecn
olog
ie-C
oncl
usio
ni
• Informazione semantica (II): OWL
• Logiche, proof e trust
Intr
oduz
ione
Architettura del Semantic Web
e –
Tecn
olog
ie-C
oncl
usio
niIn
trod
uzio
ne
Identificazione dei concetti• In SW, i concetti vengono identificati tramite
URI (Uniform Resource Identifier)– Gli URI sono per definizione un sistema di nomi
uniciAd ogni URI corrisponde uno ed un soloe
–Te
cnol
ogie
-Con
clus
ioni
– Ad ogni URI corrisponde uno ed un solo concetto…
– … però più URI possono definire lo stesso concetto!
– non è necessario che vi corrisponda un contenuto
Esempi di URI:http://[email protected] 88-7750-483-8
Intr
oduz
ione
Uniform Resource Identifiers (URI)
• Gli URI sono identificatori unici usati nell’ambito di Internet
• Inizialmente (primi anni ’90) partizionati in U if R L t (URL)e
–Te
cnol
ogie
-Con
clus
ioni
– Uniform Resource Locator (URL)
– Uniform Resource Name (URN)
• Oggi tale distinzione non è più in “voga”, ed URI ed URL vengono usati in maniera quasi equivalente Esempi di URI:
http://[email protected] 88-7750-483-8
Intr
oduz
ione
Uniform Resource Locator
• Gli URL sono un tipo particolare di URI
• Identificano la risorsa tramite il principale meccanismo di accesso
e –
Tecn
olog
ie-C
oncl
usio
ni
• Non è necessario che ad un URI/URL corrisponda per forza qualche “cosa”
http://lia.deis.unibo.it/~fc/LIAIndex.htmlSchema di accesso Network location
Intr
oduz
ione
eXtensible Markup Language - XML
• Nasce per l’interscambio di dati tra sistemi diversi– No informazioni di presentazione– Accessibile da un utente umano e da una macchina
• Estensibile a piacimento, al fine di meglio rappresentare i dati in questione
e –
Tecn
olog
ie-C
oncl
usio
ni
• Strutturato gerarchicamente tramite tags• Un documento XML può contenere una descrizione
della sua grammatica (opzionale)
• Tecnologia molto assestata ed oramai ampiamente utilizzata
Intr
oduz
ione
eXtensible Markup Language - XML
• Offre due linguaggi ulteriori per specificare la grammatica di un dialetto XML– Document Type Definition (DTD)– XML Schema
e –
Tecn
olog
ie-C
oncl
usio
ni• Tipi di dato• Namespaces• Usa sintassi XML a sua volta• Maggiore potere espressivo nel vincolare il contenuto e la
strutturazione dei nodi figli
• Concetto di documento valido e documento ben formato
Intr
oduz
ione
eXtensible Markup Language - XML
• Esistono framework completi per la gestione di documenti XML (DOM e SAX)
• Linguaggio XSL (XML Stylesheet language)XSLT (XSL T f ti )e
–Te
cnol
ogie
-Con
clus
ioni
– XSLT (XSL Transformation)
– XPath, linguaggio per espressioni (query/matchingsu documenti XML)
– FO (Formatting Objects)
Intr
oduz
ione
Resource Description Framework (RDF/RDFS)
• Standard W3C• Linguaggio (XML based) per la
rappresentazione di conoscenza• Obiettivo: fornire uno strumento minimalistae
–Te
cnol
ogie
-Con
clus
ioni
• Obiettivo: fornire uno strumento minimalista• Basato sul concetto di tripla:
< soggetto, predicato, oggetto >
Diverse rappresentazioni possibili (N3, Grafo, RDF/XML)
< risorsa, attributo, valore >
Intr
oduz
ione
RDF – Rappresentazione a grafo• Un nodo per il soggetto
• Un nodo per l’oggetto
• Un arco etichettato per il predicato
e –
Tecn
olog
ie-C
oncl
usio
ni
http://www.example.org/index.html has a creatorwhose value is John Smith
Intr
oduz
ione
RDF – Rappresentazioni
e –
Tecn
olog
ie-C
oncl
usio
niIn
trod
uzio
ne
RDF – Rappresentazioni
<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:contact=http://www.w3.org/2000/10/swap/pim/contact#
>
e –
Tecn
olog
ie-C
oncl
usio
ni
<contact:Person rdf:about="http://www.w3.org/People/EM/contact#me">
<contact:fullName>Eric Miller</contact:fullName> <contact:mailboxrdf:resource="mailto:[email protected]"/><contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person>
</rdf:RDF>
Posso chiedere al computer la mailbox di Eric Miller, senza sapere a priori se usa una casella di posta elettronica, piuttosto che una casella postale fisica, o quant’altro…… e se Eric Miller cambia mailbox, il risultato della mia ricerca sarà sempre coerente!
Intr
oduz
ione
RDF - esempi
e –
Tecn
olog
ie-C
oncl
usio
ni
Empty Nodes
Intr
oduz
ione
RDF - esempi
e –
Tecn
olog
ie-C
oncl
usio
ni
Bags/Sets
Intr
oduz
ione
RDF – Capacità espressive
Supporta:
• tipizzazione tramite attributo type (che assume come valore un URI)
/ di fe –
Tecn
olog
ie-C
oncl
usio
ni• soggetto/oggetto di una frase possono essere
anche contenitori (bag, sequence, alternative)
• meta-asserzioni, tramite reificazione delle asserzioni (“Marco afferma che Federico è autore di una
certa pagina web”)
Intr
oduz
ione
RDF Schema
• RDF può essere inteso come descrizione di attributi di risorse e dei valori assunti da tali attributi
• RDFS permette di descrivere classi, proprietà e relazioni con altre risorse (simile ad OO)
e –
Tecn
olog
ie-C
oncl
usio
ni
– type
– subClassOf
– subPropertyOf
– range
– domain
Intr
oduz
ione
RDF e Modelli E/R
• Molte similarità con il modello E/R…– … ma rdf risulta essere più espressivo
• RDF inteso come E/R per il web
l “f l ”e –
Tecn
olog
ie-C
oncl
usio
ni
• Le relazioni in RDF sono “first class entities”• In RDF l’elenco delle proprietà di una entità non
è:– Fissato a priori– Centralizzato in un unico punto (DB)
• Conseguenza del fatto che chiunque può dire qualunque cosa di chiunque altro
Intr
oduz
ione
RDF e Database Relazionali
Esiste un mapping diretto con i DB relazionali• Un record è inteso come un nodo RDF• Il nome di una colonna è inteso come
rdf:propertyTypeIl i d l d è ie
–Te
cnol
ogie
-Con
clus
ioni
• Il corrispondente campo nel record è inteso come valore
• RDF è pensato per integrare più database con modelli differenti– DBMS tradizionali sono invece ottimizzati per
costruire nuovi modelli di dati all’interno dello stesso DB o nell’ambito di un numero ristretto di altri DB
Intr
oduz
ione
Framework per RDF
• JENA, framework Java per la rappresentazione di RDF statements
SPARQL Li i di R ie –
Tecn
olog
ie-C
oncl
usio
ni• SPARQL, Linguaggio di query per Repository
RDF, che supporta la navigazione dei grafi anche su Repository diversi e/o distribuiti– Agnostico rispetto al linguagio di implementazione
Intr
oduz
ione
Strumenti per RDF
Moltissimi strumenti già disponibili…
Solo nella wiki di W3C sono elencati:
• Editors e framework per più di 14 linguaggi
e –
Tecn
olog
ie-C
oncl
usio
ni
– Adobe XMP
– IBM Semantic Layered Research Platform
• Repository RDF: 24 sistemi– Oracle Spatial 10g
Intr
oduz
ione
RDF e RDFS - Limiti
• Limitato(?) potere espressivo
• Semantica non “ben definita”
• Non permette ancora di effettuare inferenze lle
–Te
cnol
ogie
-Con
clus
ioni
sulla conoscenza
• Non risolve l’ambiguità di più URI che si riferiscono ad uno stesso concetto
Soluzione proposta: Ontology Web Language(OWL)
Intr
oduz
ione
Modelli semantici
RDF
RDFS
Description Logic
UML, OWL
Modal Logic
First Order Logic
e –
Tecn
olog
ie-C
oncl
usio
ni
Tassonomie
Thesaurus
Modelliconcettuali
TeorieLogiche
XML
DB Schemas
XMLS
Intr
oduz
ione
Modelli semantici
• Tassonomia: insieme di termini organizzati in una gerarchia– rappresenta il fatto che esistono delle relazioni fra
termini …e –
Tecn
olog
ie-C
oncl
usio
ni
termini …
– … ma non permette di stabilire la natura di tali relazioni
– tipicamente gerarchie di tipo padre/figlio
– la ricerca di un termine ha successo solo se si conosce a priori “dove” cercare
Intr
oduz
ione
Modelli semantici
• Thesaurus: insieme di termini fra cui esistono più relazioni– oltre alla relazione padre/figlio (gerarchia), vi sono
ulteriori relazioni associative (e.g. sinonimia,e –
Tecn
olog
ie-C
oncl
usio
ni
ulteriori relazioni associative (e.g. sinonimia, iperonimia, iponimia, olonimia, meronimia)
– risolvono problemi tipici del linguaggio naturale, quali ambiguità e rindondanza
– Esempio: WordNet
Intr
oduz
ione
Modelli semantici
• Modello concettuale: è il modello di una particolare area di conoscenza (dominio). Definisce:– Entità del dominioe
–Te
cnol
ogie
-Con
clus
ioni
– Entità del dominio
– Relazioni fra le entità (in forma di proprietà ed attributi)
– Regole su classi, attributi e relazioni
– Regole di inferenza … Teorie Logiche!!!
Intr
oduz
ione
Ontologie – una definizione
Una ontologia è una descrizione formaleesplicita di un dominio di interesse
e –
Tecn
olog
ie-C
oncl
usio
ni
ClassiRelazioni semantiche tra classi
Proprietà associate ad un concetto (eventuali restrizioni)Eventuale livello logico (assiomi, regole di inferenza)
Intr
oduz
ione
Ontologie – un esempio
e –
Tecn
olog
ie-C
oncl
usio
niIn
trod
uzio
ne
OntologieNecessarie a prescindere da Semantic Web
Una ontologia è una descrizione formaleesplicita di un dominio di interesse
e –
Tecn
olog
ie-C
oncl
usio
ni
Il problema risiede nelle “sottili distinzioni di significato”Oggetto di studio in AI fin dagli anni ’80, per supportare knowledge sharing/integration
Intr
oduz
ione
OntologieChi ne ha sentito la mancanza?
Fallimento delle dotCom (2001)
e –
Tecn
olog
ie-C
oncl
usio
ni
Harvard Business Review, October 2001:
“Trying to engage with too many partners too fast is oneof the main reasons that so many online market makershave foundered.The transactions they had viewed as simple and routineactually involved many subtle distinctions interminology and meaning”
Intr
oduz
ione
OntologieChi ne ha sentito la mancanza?
e –
Tecn
olog
ie-C
oncl
usio
ni
Source:Prof. N. Guarino
Intr
oduz
ione
OntologieNon basta XML?
“XML is only the first step to ensuring thatcomputers can communicate freely. XML is ane
–Te
cnol
ogie
-Con
clus
ioni
p yalphabet for computers and as everyone whotravels in Europe knows, knowing the alphabetdoesn’t mean you can speak Italian or French”
Business Week, March 18, 2002
Intr
oduz
ione
Interesse per le ontologie
• Una ontologia fornisce un modello/strutturazione di un dominio– Risolve ambiguità di termini
Chiarifica/semplifica le peculiarità di un dominioe –
Tecn
olog
ie-C
oncl
usio
ni
– Chiarifica/semplifica le peculiarità di un dominio
– Come ricaduta, analisi approfondita di un dominio/processo …
– … elevato valore in ambito industriale/business
Intr
oduz
ione
Ontology Web Language (OWL)
• Standard W3C• Si basa ed estende RDF/RDFS• Dotato di semantica formale (supporta
Description Logic)e –
Tecn
olog
ie-C
oncl
usio
ni
Description Logic)• Tre livelli di espressività/complessità
– OWL Lite (semplice, poco espressivo)– OWL DL (complessità della Description Logic,
mediamente espressivo)– OWL Full (altamente espressivo, non decidibile)
Intr
oduz
ione
OWL – caratteristiche
• Classi: subClassOf, intersectionOf, unionOf, complementOf, enumerationm equivalnece, disjoint
• Proprietà: symmetric transitive functionale –
Tecn
olog
ie-C
oncl
usio
ni
• Proprietà: symmetric, transitive, functional, inverse Functional, range, domain, subPropertyOf, inverseOf, equivalentProperty
• sulle Istanze: sameIndividualAs, differentFrom, allDifferent
Intr
oduz
ione
Problemi ontologici e sol.
• Equivalenza tra ontologie diverse – Ontology matching problem – alignment problem– Una ditta vende un oggetto chiamato “golden”… una seconda ditta sta cercando di
comprare delle “mele”…
R i t /i t i ll b di t l ie –
Tecn
olog
ie-C
oncl
usio
ni• Ragionamento/interazione sulla base di ontologie
differenti– Ontology mediators
• Estensione degli algoritmi di ricerca, con le ontologie e metodi di ragionamento
Intr
oduz
ione
Esempi di “ontologie”
• Dublin Core, per documenti• WordNet, sistema lessicale• Gene Ontology, genomica• Protein Ontology proteomicae
–Te
cnol
ogie
-Con
clus
ioni
• Protein Ontology, proteomica• SnoMed, campo medico (costo 1500$/anno)
Strumenti per definire ontologie:• Protégé http://protege.stanford.edu/
Intr
oduz
ione
E gli altri strati di SW?
e –
Tecn
olog
ie-C
oncl
usio
ni
Stan
dard
Ass
esta
ti
Intr
oduz
ione
Logiche
• Le Description Logics si stanno affermando come logiche di riferimento per SW– Si sviluppano a partire dagli anni ’80
Tecnologia assestatae –
Tecn
olog
ie-C
oncl
usio
ni
– Tecnologia assestata
– Decidibili (la logica dei predicati è semi-decidibile)
– Hanno complessità computazionale molto buona(O(P) )
– Sono basate sul concetto di concetto e ruolo (non hanno le variabili)
Intr
oduz
ione
Description Logic
• Progettata per la descrizione delle definizioni e delle proprietà delle categorie (dei concetti)
• Concetti– Atomici (e g uomo)e
–Te
cnol
ogie
-Con
clus
ioni
– Atomici (e.g. uomo)– Complessi (e.g. (and persona maschio))
• Ruoli (e.g., (:età 27) )• Costanti (e.g., johnSmith, federicoChesani)
Le costanti sono per i singoli individui, i concetti per classi di individui, e i ruoli per relazioni binarie (nei frames, si parla di individual frames, genericframes, e slots)
Intr
oduz
ione
Description Logic - Sintassi
Simboli non logici:• Concetti atomici• Ruoli• Costanti
e –
Tecn
olog
ie-C
oncl
usio
ni
Simboli logici:• punteggiatura ed interi positivi, …• operatori di costruzione dei concetti (ALL, EXISTS,
FILLS, AND, e moltissimi altri!!!)• connettivi (=def, :<, →)
N.B.: Attenzione alla notazione, che non è univoca!!!
Intr
oduz
ione
Description Logic
Dato un dominio finito e ground, ogni concetto determina una estensione, cioè l’insieme di tutti gli individui del domino cui il termine si applica
• Definizione di un individuo:federico =def (
e –
Tecn
olog
ie-C
oncl
usio
ni
:natoIn italia:età 33
)
• Definizione di un concetto:cittadino_italiano =def (
( andpersona(ALL :natoIn italia)
))
Intr
oduz
ione
Description Logic
Operatori di costruzione dei concetti:• (EXISTS n r): tutti gli individui che sono in relazione r con
almeno altri n individui• (FILLS r c): tutti gli individui che sono in relazione r con
l’individuo ce –
Tecn
olog
ie-C
oncl
usio
ni
l individuo c• (ALL r d): tutti gli individui che sono in relazione r solo
con individui descritti da d• (AND d1…dn): tutti gli individui descritti da tutti i
concetti d1…dn (intersezione)• (at-most n r): tutti gli individui che sono in relazione r
con al massimo n individui• (one-of i1…in): uno degli individui tra i1…in• …
Intr
oduz
ione
Description Logic
“Courses taken by 60 to 90 students, who are all undergrads, and taught by a CS professor”
(and COURSE(at-least 60 takers)e
–Te
cnol
ogie
-Con
clus
ioni
(at least 60 takers)(at-most 90 takers)(all takers (and STUDENT
(all inYear (one-of 1 2 3 4))))(exactly 1 taughtBy)(all taughtBy (and PROFESSOR
(fills inDepartment “CS”))
))
Intr
oduz
ione
Description Logic
“Frasi” del linguaggio:
uomo =def (and persona maschio)uomo :< persona
definizione
e –
Tecn
olog
ie-C
oncl
usio
ni
uomo :< personajoe → (and uomo chirurgo)
La conoscenza è specificata tramite Abox(assertion box, riguardo i singoli individui) and Tbox (terminological box, riguardo i concetti, le relazioni tra di essi, i ruoli, etc.)
definizione parziale
proprietà di un individuo
Intr
oduz
ione
Description Logic
Principali metodi inferenziali
• Sussunzione– Una categoria è il sottoinsieme di un’altra
e –
Tecn
olog
ie-C
oncl
usio
ni
• Classificazione– Un oggetto appartiene ad una categoria?
• Consistenza di definizione di categoria– La definizione è logicamente insoddisfacibile?
Intr
oduz
ione
Description Logic
Sussunzione• Data la definizione terminologica di gatto• Data la def. term. di animale_domestico
– Non è detto che vi sia una relazione diretta tra ie –
Tecn
olog
ie-C
oncl
usio
ni
– Non è detto che vi sia una relazione diretta tra i due termini
• Dimostrare che gatto è sussunto (cioè è un iponimo, una specializzazione) di animale_domestico
gatto :< animale_dom
Intr
oduz
ione
Description Logic - Complessità
Constructors T box Subsumes? Members?
(prim :< D) (D :< C) cyclic
AL (and,all) - - - O(n^2)
e –
Tecn
olog
ie-C
oncl
usio
niIn
trod
uzio
ne
Regole
• Recentemente, un fortissimo interesse (industria e ricerca) per le regole
• Informazioni semantiche comprendono anche regole che descrivono aspetti caratteristici di un dominioe
–Te
cnol
ogie
-Con
clus
ioni
dominio• Problema aperto: ragionare sia sui dati semantici
che sulle regole• Rule Interchange Format: standard W3C
(tentativo) per la rappresentazione di regole• Applicazioni a Semantic Web Services, Business
Rules, e-Contracts,…
Intr
oduz
ione
Regole – diversi ambiti applicativi
Negli ultimi 3 anni è sorto un notevole interesse in ambito scientifico per l’uso delle regole…
…interesse motivato da alcuni interessi economici di tipo industriale
• Uso di regole per la definizione di processie –
Tecn
olog
ie-C
oncl
usio
ni
• Uso di regole per la definizione di processi– Controllo, verifica a priori e a run-time, enactment di
processi– Bussiness rules e ricerca di agreement– E-Contracts– Choreografie, Interoperability, paradigma “off-the-
shelf”
Intr
oduz
ione
Strumenti per SWS
• Diversi standard proposti, nessun vincitore– Semantic Annotations WSDL (SAWSDL) (W3C)
– Semantic Web Service Language (SWSL) (W3C)
OWL Web Services Ontology (OWL S)e –
Tecn
olog
ie-C
oncl
usio
ni
– OWL Web Services Ontology (OWL-S)• Supportata negli US da DAML (DARPA Agent Markup
Language)
– Web Service Modeling Ontology (WSMO)• Supportata principalemtente in Europa dal DERI (Digital
Enterprise Research Institute: Galway, Seoul, Stanford)
Intr
oduz
ione
Proof e Trust ?
• Prevalentemente argomento di ricerca– Argumentation dialogues
– Proof exchange
Trust modelse –
Tecn
olog
ie-C
oncl
usio
ni– Trust models
– Veridicità delle informazioni
– Incompletezza delle informazioni
– Informazioni contraddittorie
Intr
oduz
ione
Outline
Conclusioni
• Problemi nella diffuzione di SW
• Critiche a SW
e –
Tecn
olog
ie -
Conc
lusi
oni
• Considerazioni finali
• Qualche link
Intr
oduz
ione
Semantic Web – problemi?
• Nonostante il paradigma SW sia in discussione dal 2001 …
• … nel web attuale tale architettura stenta ad affermarsie
–Te
cnol
ogie
-Co
nclu
sion
i
– Molto discussa in ambito accademico– Meno apprezzata in ambito industriale
• Solo recentemente, con i Semantic Web Services, è (ri)sorto un notevole interesse nell’ambito business
• In generale, “fatica” a percepirne i vantaggi
Intr
oduz
ione
Semantic Web – problemi?
• Adozione di RDF– Aggiungere contenuto semantico è molto costoso– Finché non si raggiunge una “massa critica” di informazioni
semantiche disponibili su web …– … gli strumenti di SW appaiono essere “sterili”
e –
Tecn
olog
ie -
Conc
lusi
oni
– Recente proposta in W3C di Gleaning Resource Descriptions from Dialects of Languages (GRDDL)
• Ontologie– Costo elevato nel produrre una ontologia ex-novo– Una ontologia è “viva”, muta nel tempo
• Costo di manutenzione• Costo di gestione (uso di Temporal Logic per gestire il versioning)
Intr
oduz
ione
Semantic Web – critiche?
• Praticamente irrealizzabile– Problemi intrinseci quali ad esempio il “metacrap”
• Quale uso dei dati?– Problemi di censura
e –
Tecn
olog
ie -
Conc
lusi
oni
– Problemi di privacy
• I dati semantici sono già disponibili su web, è sufficiente estrapolarli opportunamente– SW inteso come una duplicazione non necessaria di
ciò che esiste già– GRDDL potrebbe essere usato anche a tale scopo
Intr
oduz
ione
Semantic Web – critiche?
• Computazionalmente difficile– … ma la Description Logic è pensata proprio
tenendo in mente tale dimensione
– non tutte le applicazioni necessitano die –
Tecn
olog
ie -
Conc
lusi
oni
… non tutte le applicazioni necessitano di espressioni di arbitraria complessità ( la complessità computazionale degli algoritmi si riduce, fino ad O(P) )In
trod
uzio
ne
Conclusioni
• Semantic Web: aggiunta di informazioni semantiche sul contenuto delle risorse presenti su web
• Grandi prospettive sulla carta …e –
Tecn
olog
ie -
Conc
lusi
oni
p p– Fortissimo interesse nell’ambito della ricerca,
specie nel settore dell’intelligenza artificiale
• … fatica ad affermarsi in realtà– Grande interesse recentemente per i Semantic
Web Services
Intr
oduz
ione
Conclusioni
• Recentemente, c’è chi propone di sostituire Semantic Web con Data Web
• Enfasi non più sulle possibilità di ragionamentoe
–Te
cnol
ogie
-Co
nclu
sion
i
ragionamento…
• …quanto sul fatto che alla fine si tratta di esporre in maniera organica, strutturata e comprensibile (standard) informazioni già disponibili
Intr
oduz
ione
Considerazioni personali
• Chi dovrebbe inserire informazioni semantiche sui contenuti web?– Singoli utenti a titolo personale
• Fenomeno del metacrap
e –
Tecn
olog
ie -
Conc
lusi
oni
• Fenomeno delle folksonomies (e.g. flickr)
• Fenomeno wiki
– Aziende• Possiedono già database con semantica più o meno definita
• Scenario di mercato globale estremamente concorrenziale
Intr
oduz
ione
Considerazioni personali
• Esistono fattori culturali importanti nell’organizzazione delle aziende italiane– Non è detto che un accesso facilitato alle informazioni sia
sempre desiderabile
• SW molto utile a livello intra aziendalee –
Tecn
olog
ie -
Conc
lusi
oni
• SW molto utile a livello intra-aziendale• Alcuni dubbi sul livello inter-aziendale
– Bussiness secrecy, nda, e altre pratiche commerciali possono essere un ostacolo
• Moltissimi dubbi sulla “disclosure” a livello di web pubblico– Una azienda deve poter controllare minuziosamente
• Quali dati rende pubblici• Che uso ne viene fatto (competitors?)
Intr
oduz
ione
Qualche link…
Sito ufficiale W3C:
• http://www.w3.org/2001/sw/
e –
Tecn
olog
ie -
Conc
lusi
oni
Sito comunità
• http://www.semanticweb.org/
• http://www.websemantico.org/
Intr
oduz
ione
Grazie per l’attenzione
Questions?
Ing. Federico Chesani, Phdc/o DEIS – Facoltà di Ingegneria
Viale Risorgimento 2
40136 - Bologna
Tel. 051 20 93086