30
Szemantikus technológiák területei Rácz Gábor, 2011.10.14.

Szemantikus technológiák területei - people.inf.elte.hu fileKomm. réteg : SOAP üzenetek az ágensek között R.mag : ágensek igényeinek kezelése, leképezése Wrapperek : minden

Embed Size (px)

Citation preview

Szemantikus

technológiák területei

Rácz Gábor, 2011.10.14.

2011.10.14. Rácz Gábor 2

Alkalmazások

� Cégek közötti együttműködés (Searchy)� Telekommunikáció

� Mobiltelefonos tartalomszolgáltatás (KTF)� DBPedia Mobile� OntoWiki Mobile

� Kockázatkezelés (POKM)� Kompetenciamenedzsment (CONTO)� Hírek, releváns adatok (dayta.me)

2011.10.14. Rácz Gábor 3

Searchy

� Vállalkozási Információ Integrációs Rendszer� Ontológiákon és web-szolgáltatásokon alapul� Az adatokat hangolja össze úgy, hogy az

adatok belső szerkezete ne változzon.� Főbb alapelvek:

� Elosztottság (distribution)� Együttműködés (collaboration)� Összefonódás (federation)� Laza kapcsolódás (no intrusion)

2011.10.14. Rácz Gábor 4

Searchy

� Komm. réteg: SOAP üzenetek az ágensek között

� R.mag: ágensek igényeinek kezelése, leképezése

� Wrapperek: minden információtípushoz egy-egy közös interface(SQL, LDAP, Google, Harvest)

� Adatforrások: Webszerverek, indexek, hagyományos adatbázisok, algoritmus kimenete, …

OntológiákAdatin

tegráció

2011.10.14. Rácz Gábor 5

DBPedia Mobil

2011.10.14. Rácz Gábor 6

DBPedia Mobil

2011.10.14. Rácz Gábor 7

DBPedia Mobil

2011.10.14. Rácz Gábor 8

Competencies Management System

2011.10.14. Rácz Gábor 9

Területek

� Adatgyűjtés� Tárolás� Adatforrások� Integráció� Lekérdezés� Megjelenítés

2011.10.14. Rácz Gábor 10

Adatok gyűjtése, kinyerése

� A Weben rengeteg adat található, de többségében strukturálatlan ul vagy csak félig strukturáltan.

� Ahhoz hogy a számítógép el tudjon köztük igazodni, valamilyen eszközt kell adni neki segítségül.

� E célból születtek, születnek a különbözőszemantikus technológiák.

� A feladat, hogy a Weben már megtalálható, illetve az időközben keletkező adatokat annotálni tudjuk.

2011.10.14. Rácz Gábor 11

Manuálisan

� Az internetes közösség tagjainak bevonásával.

� A meglévő oldalak felcímkézése. (Szemantikus annotátorok segítségével.)

� Direkt hármasok felvitele.� Példa:

� Annotea, OntoMat, SMORE, …

2011.10.14. Rácz Gábor 12

Félig automatizálva

� Egy algoritmusnak valahogy betanítjuk, mit is szeretnénk kinyerni. Aztán a hasonlóoldalakat már önállóan feldogozza.

� Példa:� Web2RDF

2011.10.14. Rácz Gábor 13

Web 2 RDF

?name

Pinczel Balázs munkájaELTE, IK MSc hallgató

2011.10.14. Rácz Gábor 14

Teljesen automatikusan

� Fájlok, weboldalak metaadatainak gyűjtése� Sindice, NEPOMUK, …

� Oldalak, fájlok szövegéből kinyerve� NLP eszközök bevonásával többé-kevésbé

automatizálni lehet a nyers szövegek feldolgozását.

� A pontosság még nem éri el azt a szintet, hogy a gyakorlatban jól alkalmazhatóak legyenek ezek az eszközök.

2011.10.14. Rácz Gábor 15

Tárolás

� Relációs adatbázisban:� Jena� Sesame

� Speciális adatbáziskezelők:� Virtuoso� RDF-3X

2011.10.14. Rácz Gábor 16

Tárolás

� Gyakran nagy méretű, több száz milliós adathalmazok jönnek létre.

� Elosztott tárolás� Adatintegráció

2011.10.14. Rácz Gábor 172011. 10. 09.

Adatforrások

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

2011.10.14. Rácz Gábor 18

Adatforrások

� DBPedia: a Wikipediában tárolt információ RDF átirata.

� GeoNames: földrajzi adatok országokról és egyéb helyekről.

� BBC Music: kritikák és egyéb jellemzők zenei albumokról, előadókról.

� education.data.gov.uk: az Egyesült Királyság oktatási adatai

� Gene Ontology: a gén kutatással kapcsolatos eredmények.

2011.10.14. Rácz Gábor 19

Entity Resolution

� Minden objektumhoz egyértelmű azonosítót rendelünk, azonban egy objektumhoz több ilyet is megadhatunk.

� Ezekről jó lenne tudni.� SameAs� Felismerni, hogy két azonosító ugyanazt az

objektumot azonosítja:� Joachim Kleb, Andreas Abecker: Disambiguating Entity References Within an

Ontological Model

2011.10.14. Rácz Gábor 20

Adatintegráció

� Cél: transzparens módon hozzáférni több, heterogén adatforráshoz

2011.10.14. Rácz Gábor 21

Adatintegráció

� Problémák:� Sémaintegráció� Lekérdezések átírása minden forráshoz� Lekérdezések optimalizálása� Források autonómiája� Wrapperek

� Megoldás: RDF� Szabványos séma (subjecte, predicate, object)� Szabványos lekérdezőnyelv (SPARQL)

2011.10.14. Rácz Gábor 22

Lekérdezés

� Már vannak adataink, el vannak tárolva. Most el kéne érni, le kellene kérdezni ezeket.

� SPARQL 1.0 / 1.1� SPARQL végpontok:

� Virtuoso� Joseki, ARQ� Sesame

� Végpontok listája

2011.10.14. Rácz Gábor 23

LekérdezésJens Lehmann, Lorenz Bühmann: AutoSPARQL

2011.10.14. Rácz Gábor 24

VisualQuery Rácz Gábor munkájaELTE, IK MSc hallgató

SELECT ?x ?mbox

WHERE{

?x foaf:name „Peter Goodguy” .

?x foaf:mbox ?mbox .

}

2011.10.14. Rácz Gábor 25

Megjelenítés

� Vannak adataink, el vannak tárolva, le tudjuk őket kérdezni. Valamilyen formában meg kéne jeleníteni őket:� az adatokat,� a lekérdezések eredményeit.

2011.10.14. Rácz Gábor 26

Megjelenítés

� Az RDF adatok jól reprezentálhatók gráffal.(csúcsok – objektumok, ir. élek - tulajdonságok)

� Cytoscape Web� Relfinder

� Egyéb megjelenítők� SemLens: táblázatok, grafikonok� Fresnel: HTML oldal generálása� Sima táblázatos forma� …

2011.10.14. Rácz Gábor 27

Cytoscape Gombos Gerg ő munkájaELTE, IK MSc hallgató

2011.10.14. Rácz Gábor 28

EU’s 7th Framework Programme (FP7)

� 2007 – 2013-ig tartó EU-s projekt� Tudományos kutatásokat támogat� A ‘semantic web ’ kifejezésre rákeresve a

több ezer támogatott projektek között, 206 találat ot kapunk.

2011.10.14. Rácz Gábor 29

Fontosabb konferenciák, folyóiratok,

versenyek

� ISCW (International Semantic Web Conference: Linked Data-a-thon)

� ESCW (Extended Semantic Web Conference)

� WIMS (International Conference on Web Intelligence, Mining and Semantics)

� FoIKS (Foundations of Information and KnowledgeSystems)

� Journal of Web Semantics� Semantic Web Challenge

2011.10.14. Rácz Gábor 30

Köszönöm a figyelmet!