Upload
duongthien
View
213
Download
0
Embed Size (px)
Citation preview
2011.10.14. Rácz Gábor 2
Alkalmazások
� Cégek közötti együttműködés (Searchy)� Telekommunikáció
� Mobiltelefonos tartalomszolgáltatás (KTF)� DBPedia Mobile� OntoWiki Mobile
� Kockázatkezelés (POKM)� Kompetenciamenedzsment (CONTO)� Hírek, releváns adatok (dayta.me)
2011.10.14. Rácz Gábor 3
Searchy
� Vállalkozási Információ Integrációs Rendszer� Ontológiákon és web-szolgáltatásokon alapul� Az adatokat hangolja össze úgy, hogy az
adatok belső szerkezete ne változzon.� Főbb alapelvek:
� Elosztottság (distribution)� Együttműködés (collaboration)� Összefonódás (federation)� Laza kapcsolódás (no intrusion)
2011.10.14. Rácz Gábor 4
Searchy
� Komm. réteg: SOAP üzenetek az ágensek között
� R.mag: ágensek igényeinek kezelése, leképezése
� Wrapperek: minden információtípushoz egy-egy közös interface(SQL, LDAP, Google, Harvest)
� Adatforrások: Webszerverek, indexek, hagyományos adatbázisok, algoritmus kimenete, …
OntológiákAdatin
tegráció
2011.10.14. Rácz Gábor 9
Területek
� Adatgyűjtés� Tárolás� Adatforrások� Integráció� Lekérdezés� Megjelenítés
2011.10.14. Rácz Gábor 10
Adatok gyűjtése, kinyerése
� A Weben rengeteg adat található, de többségében strukturálatlan ul vagy csak félig strukturáltan.
� Ahhoz hogy a számítógép el tudjon köztük igazodni, valamilyen eszközt kell adni neki segítségül.
� E célból születtek, születnek a különbözőszemantikus technológiák.
� A feladat, hogy a Weben már megtalálható, illetve az időközben keletkező adatokat annotálni tudjuk.
2011.10.14. Rácz Gábor 11
Manuálisan
� Az internetes közösség tagjainak bevonásával.
� A meglévő oldalak felcímkézése. (Szemantikus annotátorok segítségével.)
� Direkt hármasok felvitele.� Példa:
� Annotea, OntoMat, SMORE, …
2011.10.14. Rácz Gábor 12
Félig automatizálva
� Egy algoritmusnak valahogy betanítjuk, mit is szeretnénk kinyerni. Aztán a hasonlóoldalakat már önállóan feldogozza.
� Példa:� Web2RDF
2011.10.14. Rácz Gábor 14
Teljesen automatikusan
� Fájlok, weboldalak metaadatainak gyűjtése� Sindice, NEPOMUK, …
� Oldalak, fájlok szövegéből kinyerve� NLP eszközök bevonásával többé-kevésbé
automatizálni lehet a nyers szövegek feldolgozását.
� A pontosság még nem éri el azt a szintet, hogy a gyakorlatban jól alkalmazhatóak legyenek ezek az eszközök.
2011.10.14. Rácz Gábor 15
Tárolás
� Relációs adatbázisban:� Jena� Sesame
� Speciális adatbáziskezelők:� Virtuoso� RDF-3X
2011.10.14. Rácz Gábor 16
Tárolás
� Gyakran nagy méretű, több száz milliós adathalmazok jönnek létre.
� Elosztott tárolás� Adatintegráció
2011.10.14. Rácz Gábor 172011. 10. 09.
Adatforrások
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
2011.10.14. Rácz Gábor 18
Adatforrások
� DBPedia: a Wikipediában tárolt információ RDF átirata.
� GeoNames: földrajzi adatok országokról és egyéb helyekről.
� BBC Music: kritikák és egyéb jellemzők zenei albumokról, előadókról.
� education.data.gov.uk: az Egyesült Királyság oktatási adatai
� Gene Ontology: a gén kutatással kapcsolatos eredmények.
2011.10.14. Rácz Gábor 19
Entity Resolution
� Minden objektumhoz egyértelmű azonosítót rendelünk, azonban egy objektumhoz több ilyet is megadhatunk.
� Ezekről jó lenne tudni.� SameAs� Felismerni, hogy két azonosító ugyanazt az
objektumot azonosítja:� Joachim Kleb, Andreas Abecker: Disambiguating Entity References Within an
Ontological Model
2011.10.14. Rácz Gábor 20
Adatintegráció
� Cél: transzparens módon hozzáférni több, heterogén adatforráshoz
2011.10.14. Rácz Gábor 21
Adatintegráció
� Problémák:� Sémaintegráció� Lekérdezések átírása minden forráshoz� Lekérdezések optimalizálása� Források autonómiája� Wrapperek
� Megoldás: RDF� Szabványos séma (subjecte, predicate, object)� Szabványos lekérdezőnyelv (SPARQL)
2011.10.14. Rácz Gábor 22
Lekérdezés
� Már vannak adataink, el vannak tárolva. Most el kéne érni, le kellene kérdezni ezeket.
� SPARQL 1.0 / 1.1� SPARQL végpontok:
� Virtuoso� Joseki, ARQ� Sesame
� Végpontok listája
2011.10.14. Rácz Gábor 24
VisualQuery Rácz Gábor munkájaELTE, IK MSc hallgató
SELECT ?x ?mbox
WHERE{
?x foaf:name „Peter Goodguy” .
?x foaf:mbox ?mbox .
}
2011.10.14. Rácz Gábor 25
Megjelenítés
� Vannak adataink, el vannak tárolva, le tudjuk őket kérdezni. Valamilyen formában meg kéne jeleníteni őket:� az adatokat,� a lekérdezések eredményeit.
2011.10.14. Rácz Gábor 26
Megjelenítés
� Az RDF adatok jól reprezentálhatók gráffal.(csúcsok – objektumok, ir. élek - tulajdonságok)
� Cytoscape Web� Relfinder
� Egyéb megjelenítők� SemLens: táblázatok, grafikonok� Fresnel: HTML oldal generálása� Sima táblázatos forma� …
2011.10.14. Rácz Gábor 28
EU’s 7th Framework Programme (FP7)
� 2007 – 2013-ig tartó EU-s projekt� Tudományos kutatásokat támogat� A ‘semantic web ’ kifejezésre rákeresve a
több ezer támogatott projektek között, 206 találat ot kapunk.
2011.10.14. Rácz Gábor 29
Fontosabb konferenciák, folyóiratok,
versenyek
� ISCW (International Semantic Web Conference: Linked Data-a-thon)
� ESCW (Extended Semantic Web Conference)
� WIMS (International Conference on Web Intelligence, Mining and Semantics)
� FoIKS (Foundations of Information and KnowledgeSystems)
� Journal of Web Semantics� Semantic Web Challenge