Marin_Prcela_-_Semanticki_web.pdf

Embed Size (px)

Citation preview

  • Semantiki web

    FER, Zagreb, 14. sijeanj 2009Marin Prcela

  • Danas...

  • Meta-podaci

    Trenutno se Web temelji na HTML-u:

  • FER web

  • Web stranice

    Sadraj stranice opisan samo meta podacima Vrlo skromno esto zanemareno

    Ideja Proiriti dananji Web Potrebno je uloiti rad

  • Semantiki web

    ... Je tek ideja u nastajanju!

    Potreban je jezik koji omoguuje opis sadraja stranice

    Pretpostavimo da takav jezik postoji Opis sadraja se takoer unosi runo Dakle potreban dodatni rad!

    ... NE zahtjeva obradu ljudskog jezika ... NE podrazumijeva umjetnu inteligenciju

  • Sintaksa - semantika

    Semantika * - grana lingvistike koja prouava pojedine rijei, njihove oblike i grupacije kao nosioce odreenog znaenja te kao sredstva za oznaivanje predmeta, pojava i odnosa u materijalnom i duhovnom svijetu

    Sintaksa * - dio gramatike koji prouava poredak, razmjetaj i meusobno slaganje rijei u izraze ili sintagme (sintaksa izraza), reenine slube (sintaksa reenica) i slaganje reenica u vee cjeline

    * Vladimir Ani, Veliki rjenik hrvatskoga jezika, Novi liber, Zagreb, 2003.

  • Ontologija

    specifikacija konceptualizacije

    U nekoj specifinoj domeni: Definira koncepte i relacije Zajedniko shvaanje strukture informacije meu ljudima/raunalima

    Ekplicitno definiranje pretpostavki Ponovna uporaba

  • Web 3.0?

  • Standardizacija

    W3C Vrlo aktivno podruje istraivanja Ozbiljni problemi u realizaciji

  • Stog semantikog weba

  • URI

    Uniform Resource Identidfier - jezina reprezentacija objekata

    slui za imenovanje stvari kako bi ih mogli referencirati u jeziku

    svaki koncept moe dobiti URI, npr. zgrada HNK u Zagrebu kia koja je pala juer u Dubrovniku enja za domom operacija zbrajanja itd.

  • URI - primjeri

    http://www.fer.hr/ internet stranica Fakulteta elektrotehnike i raunarstva

    urn:isbn:0-486-27557-4 posebno izdanje Shakespearove knjige Romeo i Julija

    http://imago.irb.hr/~melody/Marin_Prcela/ osoba (autor ovog teksta, ne i internet stranica!)

    vidimo da je URI samo niz znakova, koji moe imati razliite oblike

    URL - podvrsta URI-a - identifikator web stranice IRI - International Resource Identifier

  • Dodjela URI-a

    Centralizirana dodjela - DNS izbjeguta vietruka imena i dodjela istog imena za vie

    objekata

    Decentralizirana dodjela bilo tko moe dati ime bilo emu problem viestrukih imena

    rjeenje: izjednaavanje idetifikatora (runo) problem dodjele istog imena za vie objekata

    Zar je potrebna centralna ontologija koja sadri univerzalno ime za svaki pojam na svijetu? Ne, dovoljno je da se unutar organizacija koje meusobno

    surauju uspostavi konsenzus Raunarci e definirati "procesor" a meteorolozi "anticiklonu"...

  • XML

    Zato volimo XML? definirana i dobro poznata struktura definirana validacija dokumenta te najvanije: jednostavno parsiranje!

    XML API podran od gotovo svih postojeih programskih jezika

    DTD, XML Schema... - definiranje strukture elemenata i atributa u XML datoteci

    ... a namespace pospjeuje izbjegavanje vieznanosti kod URI-a

    Istina, XML je sporiji od relacijskih baza

  • RDF

    Resource Description Framework osnovni jezik za izraavanje na SW izraavanje relacija i struktura meu objektima

    jedna RDF tvrdnja sadri: subjekt predikat objekt

    razne sintakse RDF-a Notation3 RDF/XML ...

  • RDF primjer

    subjekt: predikat: objekt: .

  • RDF Schema

    objektno orjentirani RDF definiranje klasa i objekata

    (classes and instances)

    definiranje svojstava i relacija (properties and relations)

    hijerarhija svojstava sub-properties

    range svojstava - koja svojstva resurs smije imati

  • RDF Schema - primjer

  • OWL

    Web Ontology Language proirenje logikim izrazima dodatni skup jezinih oznaka

    unija i presjek klasa (i svojstava) logiki kvantifikatori

    univerzalni i egzistancijalni

    kardinalitet (dozvoljen broj instanci u klasi)

    ureiva ontologija: Protege OWL

  • OWL i zakljuivanje

    Koji su postojei algoritmi za zakljuivanje u deskriptivnoj logici?

    Tableau Najbolji Lo

    Sloenost Izraajnost ....

    Jo uvijek aktivno podruje istraivanja

  • Pravila

    Ako je automobil moj, onda su i svi

    njegovi sastavni dijelovi moji.

    produkcijska pravila: prirodno predstavljanje znanja opi oblik:

    ako su ispunjeni uvjeti

    tada vrijedi posljedica

    proceduralno znanje problem: standardizacija - mnotvo oblika i sintaksi SWRL Semantic Web Rule Language

  • SPARQL

    postavljanje upita nad RDF datotekama algoritmi indeksiranja podataka i dohvaanja odgovora

    ne podrava stvaranje, mijenjanje, brisanje

    SELECT ?nameWHERE {

    ?author m:name ?name ;m:author ?album .

    ?album m:year 2007 ;m:sold m:platinum .

    }

  • Sigurnost i Povjerenje

    problem sigunosti istovjetan onome na Webu najznaajnije: autentikacija

    temelj za ostvarivanje povjerenja

    ako bilo tko moe objaviti bilo to, kako izbjei kaos informacija

    odgovor: povjerenje svatko e naznaiti stranke kojima vjeruje

    socijalne mree: FOAF (Friend of a Friend) proirenje kruga povjerenja na odreenu dubinu u mrei

    opadanje vjerodostjnosti sa dubinom: science fiction

  • Stog semantikog weba

    Gdje smo danas? Gdje smo danas?

  • SW i baze podataka

    Velika koliina podataka danas je u bazama podataka

    Kako do njih GRDDL R2O ...

    ... dodatni uloeni rad

  • Problemi semantikog weba

    sloenost rezoniranja nejednoznanost URI-a viestruki URI izgradnja ontologija izmjene u ontologiji integracija ontologija rezoniranje s vjerojatnostima

  • Problemi semantikog weba

    transformacija Weba u semantiki web integracija u HTML web scraping baze podataka

    priblino rezoniranje prezentacija ljudima

  • Meta-crap

    Ljudi... Lau Lijeni su Ne znaju ...

    Sheme Nisu neutralne ...

  • Microformats

    Reakcija na kritike Vie usmjeren na praktinu realizaciju Primjeri

    Razvijeni: hCard, hCalendar, hResume... Predloeni: hAudio, citation, currency...

    Joe Doe The Example Company604-555-1234 http://example.com/

  • Microformats primjer

    Firefox plugin: Operator Google maps vcard yahoo mail

  • Primjeri

    Semantic web use cases:http://www.w3.org/2001/sw/sweo/public/UseCases/

  • Dublin core http://dublincore.org/documents/2006/12/18/dcmi-terms/ http://dublincore.org/documents/dcmi-terms/#classes-MediaType