EINFÜHRUNG WAS IST SEMANTIC WEB? CHRISTIAN FUCHS KOMPOSITIONALITÄTSPRINZIP LINGUISTISCHE SEMANTIK...

Preview:

Citation preview

EINFÜHRUNGWAS IST SEMANTIC WEB?

C H R I S T I A N F U C H S

KOMPOSITIONALITÄTSPRINZIPLINGUISTISCHE SEMANTIK

G A B R I E L R E I T Z

XML & RDFA N D R E A S K R Ä M E R

RDFS & OWLL E O N A R D K R A M E R

Semantic Web

E N T W I C K LU N G D E S W O R L D W I D E W E BP R O B L E M E D E S W O R L D W I D E W E B

S E M A N T I C W E B A L S L Ö SU N GA N W E N D U N G S M Ö G L I C H K E I T E N

M E TA D AT E NTA XO N O M I E U N D O N T O L O G I E

Gliederung

Entwicklung des World Wide Web

1989: Entstehung des World Wide Web (WWW)

1993: Veröffentlichung des ersten Browsers „Mosaik“ ermöglichte die private Nutzung des WWW

Erschließung des Web durch die Wirtschaft z.B. Online-Handel, Werbung

Web 2.0 verstärkte soziale Interaktion im WWW

3

Probleme des World Wide Web

Große Informationsvielfalt unüberschaubar vorhandene Informationen werden nicht gefunden

Suchmaschinen helfen nur bedingt suchen Strings suchen keine Inhalte/Informationen Informationen müssen z.T. impliziert werden

4

Probleme des World Wide Web

Welche Gründe liegen diesem Problem zu Grunde?

klassisches Web richtet sich an den Menschen

der Mensch kann: die Bedeutung von Informationen verstehen Beziehungen zwischen Informationen herstellen auf neue Informationen schließen

5

Semantic Web als Lösung6

Semantic Web als Lösung

Teilaufgaben: Suchmaschine: „Augenarzt“, „München“ Augenärzte herausfiltern Adressen im Stadtplan auf Erreichbarkeit prüfen Sprechstunden mit eigenem Kalender vergleichen Termin vereinbaren Termin in eigenen Kalender eintragen Chef informieren optimale Verkehrsverbindung herausfinden Fahrkarte kaufen

7

Semantic Web als Lösung

klassisches Web: Online-Suche Kommunikation über E-Mail

Semantic Web: Informationen über Informationen (Metadaten) Beziehungen zwischen Informationen kann hergestellt

werden neue Informationen können impliziert werden=> ermöglicht maschinelle Erfassung von komplexen

Systemen

8

Navigieren und Suchen

Kreuzkatalog Eingrenzen der Suche durch vorgegebene Optionen

9

Navigieren und Suchen

Semantische Suchmaschine lässt Eingaben in natürlicher Sprache zu große Bedeutung von Fragewörtern sucht nach der Information, nicht nach dem String kann aus vorhandenen Informationen auf nicht

vorhandene schließen

10

Personalisierte Informationssysteme

Unterstützt die individuelle Informationsverwaltung Übernehmen von operativen und administrativen

Aufgaben

Beispiel: Arztbesuch Kalender mit Terminplanung automatischer E-Mail-Versand Reiseplanung und -buchung

11

Metadaten

Daten, die Informationen über andere Daten zur Verfügung stellen z.B. Buch -> Autor, ISBN keine eindeutige Unterscheidung (Frage des

Standpunkts)Speicherung von Metadaten

im Dokument selbst zugeordnetes Nachschlagewerk (z.B. Bücherkatalog,

Bibliotheksverzeichnis)

12

Metadaten

Interoperable Metadaten inter: zwischen operabel: es kann damit gearbeitet werden

Standards machen Metadaten aus unterschiedlichen Quellen

nutzbar

13

Taxonomie

Baumstruktur monohierarchisch jede Klasse hat nur eine Oberklasse

wird schon häufig verwendet z.B. Bibliothek -> Stockwerke -> Regale -> Bücher

Problem: Keine Darstellung von Vernetzungen Lösung: Ontologie!

14

Ontologie

Netzwerk von Informationen mit logischen Relationen formale Beschreibung der Daten Regeln zu deren Zusammenhang kann nicht eingegebene Informationen ergänzen kann Widersprüche erkennen

15

Ontologie

Bestandteile: Begriffe: Stadt, Land Instanzen: München, Deutschland Relationen: München liegt in Deutschland Vererbung: München erbt Eigenschaft „liegt in

Europa“ von Deutschland Axiome: „zwischen Deutschland und Amerika gibt es

keine Zugverbindung“

16

Gliederung

Linguistische Semantik Intensional

Klassematisch Distinktiv

Extensional Denotation Konnotation

Kompositionalitätsprinzip, Formale Semantik Metasprache Objektsprache

17

Linguistische Semantik

Inhaltliche Bedeutung von sprachlichen Zeichen Zeichen (Morpheme), Wörter (Lexeme), Satzglieder, Teilsätze,

Sätze

ZeichenHier: Buchstabe „G“

Gabriel hält einen Vortrag über die Semantik, der unglaublich interessant ist.

Wort / Ausdruck TeilsatzHier: Satzglied Subjekt Hier: Relativsatz

Satz

18

Unterscheidung: Intensional / Extensional

Intensionale Semantik Beziehung zwischen verschiedenen Wörtern

Gemeinsamkeiten Unterschiede

Extensionale Semantik Denotation Konnotation

19

Intensionale Semantik

Merkmale: Unterschiede und Gemeinsamkeiten

Gleiche Generation

männlich / weiblich

Unterschied: männlich / weiblich distinktives Merkmal Gemeinsamkeit: gleiche Generation klassematisches

Merkmal

Oma Opa

Mutter Vater

Sohn Tochter

20

Intensionale Semantik

Sonne

Mond

Licht

Tag

Regen

hell

Sterne

Nacht

nass

trocken

dunkel

Klassematische Merkmale: grün Distinktive Merkmale: rot

21

Extensionale Semantik

Denotation Sachliche, wörtliche Bedeutung Bezug auf Gegenstände aus der Wirklichkeit

Konnotation Nebenbedeutungen, Emotionen, Bewertungen Bezug auf Sprecher Zuhörer / Leser

22

Denotation23

Denotation24

Konnotation

Tatsächliche Bedeutung oft nicht erkennbar:

Gabriel hält einen Vortrag über die Semantik,

…der unglaublich interessant ist.

…der uuunglaublich interessant ist… ;-)

…der UNGLAUBlich interessant ist!!!

25

Fazit: Kompositionalität

Anwendung mehrerer Prinzipien notwendig Gottlob Frege: Kompositionalitätsprinzip

„Die Bedeutung eines komplexen, d.h. aus Teilausdrücken zusammengesetzten Ausdrucks ist durch die Bedeutungen seiner Teile sowie die Art ihrer Zusammenfügung bestimmt.“

Anwendung auf 3 Ebenen: Wortsemantisch

z.B. Determativkomposition: rabenschwarz Satzsemantisch

Wörter und deren Verknüpfung Satzbedeutung Formal

Metasprachen, Objektsprachen

26

Formale Semantik

Metasprache „Regeln“ zur Analyse der Bedeutung von Komplexen

aus der Objektsprache

Subjekt: GabrielPrädikat: hältObjekt: Vortrag

Gabriel hält einen Vortrag.

Zähler: 3Nenner:

5Ergebnis: 0,6

3/5 = 0,6

Kopfgesteuerte Schleife zum Errechnen der Fakultät.

while(i<zahl){fakultaet = fakultaet*i;i++;}

Metasprache

Objektsprache

27

XML – eXtensible Markup Language

XML steht für “erweiterbare Auszeichnungssprache”

XML ist eine Meta-Sprache (“Sprache über Sprache”)

DTD (Document Type Definition) grenzen Namensraum für Tags ein

Unicode Zeichenkodierung

28

XML – eXtensible Markup Language

XML Dokumente können “wohlgeformt” sein Das Dokument besitzt genau ein Wurzelelement Alle Elemente besitzen eine Start- und eine

Endkennung Ein Element darf nicht mehrere Attribute mit dem

gleichen Namen besitzen

...

Volle Spezifikation unter: http://www.edition-w3c.de/TR/2000/REC-xml-20001006/

#sec-well-formed

29

XML – eXtensible Markup Language

Ein Beispieldokument:

<?xml version="1.0" encoding="utf-8"?><person>

<name>Andreas Krämer</name><geschlecht>männlich</geschlecht>

</person>

Deklaration

<person name="Andreas Krämer" geschlecht="männlich" />

Start-Tag

Ende-Tag

Wurzelelement

Attribut Selbstschließendes Tag

30

RDF – Resource Description Framework

1999 von W3C veröffentlichtFormale Sprache zur Beschreibung von

InformationenKombination und Weiterverarbeitung von

InformationenBesteht aus Subjekt, Prädikat und ObjektGrundlegendes Darstellungsformat für die

Entwicklung des Semantic WebRSS (RDF Site Summary) 1.0 baut auf RDF

auf

31

RDF – Resource Description Framework

Darstellung

Gerichteter GraphKnoten mit gerichteten KantenKnoten und Kanten haben eindeutige

BezeichnerKeine Baumstruktur

http://stammbaum.org/Säugetier

http://stammbaum.org/Tier

http://stammbaum.org/StammtAbVon

32

RDF – Resource Description Framework

Problem: Unterschiedliche Resourcen können gleiche Bezeichnungen in unterschiedlichen Dokumenten besitzen

Lösung: Eindeutige Bezeichner, sogenannte URIs (=Uniform Resource Identifier)

URIs beginnen in RDF immer mit http://Beispiel:

http://stammbaum.org/Tier

33

RDF – Resource Description Framework

Beispiel eines RDF Dokuments<?xml version="1.0" encoding="utf-8"?><rdf:RDF xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#

xmlns:ex ="http://stammbaum.org/"><rdf:Description rdf:about="http://stammbaum.org/Säugetier">

<ex:StammtAbVon><rdf:Description rdf:about="http://stammbaum.org/Tier"></rdf:Description>

</ex:StammtAbVon></rdf:Description>

</rdf:RDF>

Deklaration

Namensraum

34

RDFS - Einordnung

XML

RDFS •Legt Vokabular für RDF fest•Besteht aus Klassen und deren Beziehungen

RDF •Besteht aus Instanzen•Nutzt die in RDFS festgelegten Klassen

RDFS: Ressource Description Framework SchemaFür leichtgewichtige (eng: lightweight) Ontologien

35

Zusammenhang RDF und RDFS

RDFS:

<rdf:RDF xmlns:ex=“http://www.ba-mannheim.de/Semantic/“><rdfs:Class rdf:about=“&ex;BAStudent“>

<rdfs:label>Student an der BA Mannheim</rdfs:label></rdfs:Class>

RDF:

<ex:BAStudent rdf:about=“Leonard Kramer“ />

36

Typische RDFS-Elemente

Klassen: Class

subClass of (vgl. Java: extends) Label (Erklärung / Bezeichnung für die Klasse)

Beziehungen Propertys

subPropertyOf domain (schränkt den Wertebereich des Subjekts ein) range (schränkt den Wertebereich des Objekts ein)

Piepmatz wirdGefressenVon Raubvogel

37

Beispiel: Biologischer Stammbaum

<rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“xmlns:ex=“http://www.stammbaum.org#“>

<rdfs:Class rdf:about=“&ex;Tiere“><rdfs:label xml:lang=“de“>Gesamte Tierwelt</rdfs:label>

</rdfs:Class><rdfs:Class rdf:about=“&ex;Säugetiere“>

<rdfs:label xml:lang=“de“>Alle Säugetiere</rdfs:label><rdfs:subClassOf rdfs:resource=“&ex;Tiere“ />

</rdfs:Class>

Tiere

Säugetiere

Unpaarhufer

Pferde

38

Beispiel: Biologischer Stammbaum

Stammbaum mit Hierarchie abgebildet

Säugetiere gehören zur Gruppe der Tiere

Tiere

Säugetiere

Unpaarhufer

Pferde

Hausesel

Hauspferd

39

Beispiel: Propertys

<rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“xmlns:ex=“http://www.stammbaum.org#“>

<rdf:Property rdf:about=“&ex;hatFohlenMit“><rdfs:Range rdf:resource=“#Pferd“ /><rdfs:Range rdf:resource=“#weiblich“ /><rdfs:Domain rdf:resource=“#Pferd“ /><rdfs:Domain rdf:resource=“#männlich“ />

</rdf:Property>Pferd Pferdweiblich männlich

hatFohlenMit

40

Probleme von RDFS

Weitere differenzierte Beschreibung von Beziehungen nicht möglich Keine Mengenaussagen Kaum Logikaussagen ableitbar

41

OWL

OWL: Web Ontology LanguageIm Februar 2004 vom W3C als

Ontologiesprache standardisiertSprich \ˈau_ (-ə)l\ (Englisch: Eule)

Hintergrund: Eulen werden mit Weisheit assoziiert

42

OWL-Versionen

OWL Full Sehr ausdrucksstark Wird von aktueller Software nur bedingt unterstützt

OWL DL (Description Logics) Teilsprache von OWL Full Wird von aktueller Software fast vollständig

unterstützt Quasi-Standard

OWL Lite Teilsprache von OWL Full und OWL DL Weniger ausdrucksstark

43

OWL - Einordnung

XML

RDFS

OWL •Nutzt Sprachteile von RDFS•Kann Klassen und Beziehungen differenzierter anlegen

Für schwergewichtige (eng: heavyweight) Ontologien

44

Beispiel-OWL-Implementierungen

FOAF (Friend of a Friend) Modellierung sozialer Netzwerke Angaben über eine Person, wie Hobbys, Name, Fotos

etc…Beer

Ontologie zur Beschreibung und Kategorisierung von Biersorten

Angaben über Auszeichnungen, Bierart, Brauerei, Zutaten…

45

OWL in der Praxis

Vodafone Live! Mobile Portal Vodafone-Portal für Handy-Downloads (Spiele, Filme,

etc…) interne Datenverwaltung mit RDF Verbesserung in der Suche: 50% weniger

Seitenaufrufe pro DownloadSemantic-Web-Suchmaschinen

Aggregation von semantischen Daten (s. vorherige Folie)

Beispiele: Swoogle, Sindice Ergebnisse können noch nicht überzeugen

46

Zukunftsperspektive

Implementierungen werden ausgereifterAnwendungsspektrum wird wachsenOntologien stellen die nächste Stufe des Web

dar (Web 3.0)Täglich mehr Ontologien verfügbarNeue Geschäftsfelder entstehen

Suchmaschinen Spezifische Portale, die in der Lage sind Wissen zu

verknüpfen …

47