Upload
kawena
View
20
Download
0
Embed Size (px)
DESCRIPTION
RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski. Inhalt. Speicherung: RDF Source related Storage System ( RDF-S3 ) Anfrage: easy RDF Query Language ( eRQL ) Darstellung und Ranking der Ergebnisse. Ausgangspunkt. Zentrale Speicherung - PowerPoint PPT Presentation
Citation preview
RDF-S3 und eRQL:RDF-S3 und eRQL:RDF-Technologien für RDF-Technologien für
InformationsportaleInformationsportale
Karsten Tolle undKarsten Tolle undFabian WleklinskiFabian Wleklinski
InhaltInhaltSpeicherung:RDF Source related Storage System (RDF-S3)
Anfrage:easy RDF Query Language (eRQL)
Darstellung und Ranking der Ergebnisse
AusgangspunktAusgangspunkt
Zentrale SpeicherungDatenbanken, ad-hoc Anfragen
Dezentrale SpeicherungAgenten, Peer-Peer,
Alert-Systeme
Fehlende Quellinformationen Fehlende Quellinformationen
Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur:– Überprüfung der Daten (Aktualität)
– Bezug weiterer Informationen (HTML)
– Glaubwürdigkeit
Jeder kann beliebige Aussagen ins Internet stellen.
http://www.abc.com vom 23.09.2004
GlaubwürdigkeitGlaubwürdigkeitStimmen die Angaben?
http://www.abc.com vom 23.09.2004
http://www.xyz.com
P 100 $ s:offer
s:by
s:price
http://www.abc.com
80 $ s:offer
s:by
s:price
????
RDF-S3 EigenschaftenRDF-S3 Eigenschaften
Speicherung der Quellinformation zu jedem RDF Tripel
Möglichkeit zum Löschen und Aktualisieren einzelner Quellen
Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF-Daten innerhalb der Datenbank
RDF-S3 AufbauRDF-S3 Aufbau
hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet
VRP Internal
RDF Model
ICS-VRP
Validator
RDF-S3 Loader
JDBC - SQL Stream Based API
RDF-S3
RDF/XML files
RDF-S3
Repository
RDF-S3 API
RDF-S3 DemoRDF-S3 Demo
Problem – VerständnisProblem – Verständnis
Real-World-Beispiel:– Zur Erzeugung dieser Präsentation wurde die Länge
der Tower Bridge gesucht– Suche mit "Tower Bridge" length lieferte eine
Menge Ergebnisseiten, aber:• Einheiten verschieden (z. B. “Fuß”) oder fehlend
• “Länge” einer Brücke?– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?
– Zwei „Kontexte“ nötig: Einheit und Längendefinition
Golden Gate Bridge
s:width
s:name
90 s:widthofsidewalk
10.5
Problem – VerständnisProblem – Verständnis
RDF Aussagen können oft nur in ihrem Kontext verstanden werden– Beispiel: Width of Golden Gate Bridge?
• 90! 90? 90 Meter, 90 Inch, 90 Feet?
All units of measurements are in feet. rdf:comment
Ziele1. So einfach wie möglich!
2. Nutzung der Möglichkeitendurch die Speicherung derQuellinformation!
3. Darstellung der Ergebnissein ihrem Kontext (sieheGolden Gate Bridge Beispiel)!
eRQLeRQL
Ein-Wort-Abfragen
Dokumenten-Modus
PointOfInterest-Modus
Ein-Wort-AnfrageEin-Wort-Anfrage
Sehr einfach und ohne Vorwissen einsetzbar!– Idee: nicht komplizierter als Google
Beispiel: Tripel, die „bridge“ enthalten– eRQL: bridge
– RQL: select * from {X}@P{Y} where @P like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG]
[eE]*" or Y like "*[bB][rR][iI][dD][gG]
[eE]*"
– RDQL: ähnlich wie RQL• Perl ähnliche Notation
SELECT ?s, ?p, ?o WHERE ?s =~ „bridge“ AND ?p =~ „bridge“ AND ?o =~ „bridge“
??????
Dokumenten-ModusDokumenten-Modus
Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen)Syntax: <Anfrage;Quellen-Liste;0|1>– Beispiel: <bridge;3,4;1>
In RQL nicht vorgesehen!In RDQL können in der from-Klausel Einschränkungen definiert werden– Aber kein gezieltes Weglassen
0: weglassen1: einschränken
PointOfInterest-ModusPointOfInterest-ModusGibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an – Ergebnisse können besser verstanden werden (siehe Golden Gate
Bridge)
Die Größe des zu zeigenden Kontextes wird in der Anfrage definiertBeispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default)~ bridge Kontextgröße 2~~ bridge Kontextgröße 3 ...
eRQL eRQL PointOfInterestPointOfInterest
eRQL erweitert Fundstellen zu “POIs”– benachbarte Aussagen werden hinzugefügt
• z. B. “comment” zu “Golden Gate Bridge”
s:width
90
Golden Gate Bridge
s:name
s:widthofsidewalk
10.5
All units of measurements are feet.rdf:comment
eRQL eRQL PointOfInterestPointOfInterest
POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" OR "Tower Bridge"
s:width90
Golden Gate Bridge s:name
s:length
Tower Bridges:name
268
eRQL eRQL PointOfInterestPointOfInterest
POIs werden auch für Sub-Queries gebildet– "Golden Gate Bridge" AND width
• POIs für “Golden Gate Bridge” und “width” werden gebildet
• Vereinigung der POIs, falls diese überlappen, sonst leer
• übereinstimmend mit “Google-Query”
s:width90
Golden Gate Bridges:name
eRqlEngineeRqlEngine
eRQL-Prototyp– kein Datenbank-Backend
• arbeitet mit RDF-Dateien
• einfache Installation
Details und Download:– www.dbis.informatik.uni-
frankfurt.de/~tolle/RDF/eRQL/
– www.wleklinski.de/rdf/
eRQL DemoeRQL Demo
ZusammenfassungZusammenfassung
RDF-S3 und eRQL bieten:
Überprüfbare Daten mehr Glaubwürdigkeit
Antworten mit Kontext mehr Verständnis der Ergebnisse
Anfragen können auf ausgewählte Quellen eingeschränkt werden bessere Ergebnisse
sehr einfach kann ohne Vorwissen genutzt werden (wichtig für Portale)
Zukünftige ZieleZukünftige Ziele
Steigerung der Performance von RDF-S3 und eRQLWeitere nützliche Anfragemöglichkeiten untersuchen Verbesserung der ErgebnisdarstellungVersionsunterstützung für Quellen unter RDF-S3...
Danke für die AufmerksamkeitDanke für die Aufmerksamkeit
Fragen?
Weitere Infos und Downloads:
http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/
Kontakt:
Karsten Tolle: [email protected]
Fabian Wleklinski: [email protected]