Upload
lazoroljic
View
7
Download
0
Embed Size (px)
Citation preview
Semantiki web
FER, Zagreb, 14. sijeanj 2009Marin Prcela
Danas...
Meta-podaci
Trenutno se Web temelji na HTML-u:
FER web
Web stranice
Sadraj stranice opisan samo meta podacima Vrlo skromno esto zanemareno
Ideja Proiriti dananji Web Potrebno je uloiti rad
Semantiki web
... Je tek ideja u nastajanju!
Potreban je jezik koji omoguuje opis sadraja stranice
Pretpostavimo da takav jezik postoji Opis sadraja se takoer unosi runo Dakle potreban dodatni rad!
... NE zahtjeva obradu ljudskog jezika ... NE podrazumijeva umjetnu inteligenciju
Sintaksa - semantika
Semantika * - grana lingvistike koja prouava pojedine rijei, njihove oblike i grupacije kao nosioce odreenog znaenja te kao sredstva za oznaivanje predmeta, pojava i odnosa u materijalnom i duhovnom svijetu
Sintaksa * - dio gramatike koji prouava poredak, razmjetaj i meusobno slaganje rijei u izraze ili sintagme (sintaksa izraza), reenine slube (sintaksa reenica) i slaganje reenica u vee cjeline
* Vladimir Ani, Veliki rjenik hrvatskoga jezika, Novi liber, Zagreb, 2003.
Ontologija
specifikacija konceptualizacije
U nekoj specifinoj domeni: Definira koncepte i relacije Zajedniko shvaanje strukture informacije meu ljudima/raunalima
Ekplicitno definiranje pretpostavki Ponovna uporaba
Web 3.0?
Standardizacija
W3C Vrlo aktivno podruje istraivanja Ozbiljni problemi u realizaciji
Stog semantikog weba
URI
Uniform Resource Identidfier - jezina reprezentacija objekata
slui za imenovanje stvari kako bi ih mogli referencirati u jeziku
svaki koncept moe dobiti URI, npr. zgrada HNK u Zagrebu kia koja je pala juer u Dubrovniku enja za domom operacija zbrajanja itd.
URI - primjeri
http://www.fer.hr/ internet stranica Fakulteta elektrotehnike i raunarstva
urn:isbn:0-486-27557-4 posebno izdanje Shakespearove knjige Romeo i Julija
http://imago.irb.hr/~melody/Marin_Prcela/ osoba (autor ovog teksta, ne i internet stranica!)
vidimo da je URI samo niz znakova, koji moe imati razliite oblike
URL - podvrsta URI-a - identifikator web stranice IRI - International Resource Identifier
Dodjela URI-a
Centralizirana dodjela - DNS izbjeguta vietruka imena i dodjela istog imena za vie
objekata
Decentralizirana dodjela bilo tko moe dati ime bilo emu problem viestrukih imena
rjeenje: izjednaavanje idetifikatora (runo) problem dodjele istog imena za vie objekata
Zar je potrebna centralna ontologija koja sadri univerzalno ime za svaki pojam na svijetu? Ne, dovoljno je da se unutar organizacija koje meusobno
surauju uspostavi konsenzus Raunarci e definirati "procesor" a meteorolozi "anticiklonu"...
XML
Zato volimo XML? definirana i dobro poznata struktura definirana validacija dokumenta te najvanije: jednostavno parsiranje!
XML API podran od gotovo svih postojeih programskih jezika
DTD, XML Schema... - definiranje strukture elemenata i atributa u XML datoteci
... a namespace pospjeuje izbjegavanje vieznanosti kod URI-a
Istina, XML je sporiji od relacijskih baza
RDF
Resource Description Framework osnovni jezik za izraavanje na SW izraavanje relacija i struktura meu objektima
jedna RDF tvrdnja sadri: subjekt predikat objekt
razne sintakse RDF-a Notation3 RDF/XML ...
RDF primjer
subjekt: predikat: objekt: .
RDF Schema
objektno orjentirani RDF definiranje klasa i objekata
(classes and instances)
definiranje svojstava i relacija (properties and relations)
hijerarhija svojstava sub-properties
range svojstava - koja svojstva resurs smije imati
RDF Schema - primjer
OWL
Web Ontology Language proirenje logikim izrazima dodatni skup jezinih oznaka
unija i presjek klasa (i svojstava) logiki kvantifikatori
univerzalni i egzistancijalni
kardinalitet (dozvoljen broj instanci u klasi)
ureiva ontologija: Protege OWL
OWL i zakljuivanje
Koji su postojei algoritmi za zakljuivanje u deskriptivnoj logici?
Tableau Najbolji Lo
Sloenost Izraajnost ....
Jo uvijek aktivno podruje istraivanja
Pravila
Ako je automobil moj, onda su i svi
njegovi sastavni dijelovi moji.
produkcijska pravila: prirodno predstavljanje znanja opi oblik:
ako su ispunjeni uvjeti
tada vrijedi posljedica
proceduralno znanje problem: standardizacija - mnotvo oblika i sintaksi SWRL Semantic Web Rule Language
SPARQL
postavljanje upita nad RDF datotekama algoritmi indeksiranja podataka i dohvaanja odgovora
ne podrava stvaranje, mijenjanje, brisanje
SELECT ?nameWHERE {
?author m:name ?name ;m:author ?album .
?album m:year 2007 ;m:sold m:platinum .
}
Sigurnost i Povjerenje
problem sigunosti istovjetan onome na Webu najznaajnije: autentikacija
temelj za ostvarivanje povjerenja
ako bilo tko moe objaviti bilo to, kako izbjei kaos informacija
odgovor: povjerenje svatko e naznaiti stranke kojima vjeruje
socijalne mree: FOAF (Friend of a Friend) proirenje kruga povjerenja na odreenu dubinu u mrei
opadanje vjerodostjnosti sa dubinom: science fiction
Stog semantikog weba
Gdje smo danas? Gdje smo danas?
SW i baze podataka
Velika koliina podataka danas je u bazama podataka
Kako do njih GRDDL R2O ...
... dodatni uloeni rad
Problemi semantikog weba
sloenost rezoniranja nejednoznanost URI-a viestruki URI izgradnja ontologija izmjene u ontologiji integracija ontologija rezoniranje s vjerojatnostima
Problemi semantikog weba
transformacija Weba u semantiki web integracija u HTML web scraping baze podataka
priblino rezoniranje prezentacija ljudima
Meta-crap
Ljudi... Lau Lijeni su Ne znaju ...
Sheme Nisu neutralne ...
Microformats
Reakcija na kritike Vie usmjeren na praktinu realizaciju Primjeri
Razvijeni: hCard, hCalendar, hResume... Predloeni: hAudio, citation, currency...
Joe Doe The Example Company604-555-1234 http://example.com/
Microformats primjer
Firefox plugin: Operator Google maps vcard yahoo mail
Primjeri
Semantic web use cases:http://www.w3.org/2001/sw/sweo/public/UseCases/
Dublin core http://dublincore.org/documents/2006/12/18/dcmi-terms/ http://dublincore.org/documents/dcmi-terms/#classes-MediaType