Upload
stephan-maes
View
265
Download
2
Embed Size (px)
DESCRIPTION
Stephan Mäs PHD defense On the consistency of spatial semantic integrity constraints University of the Bundeswehr Munich
Citation preview
On the Consistency of Spatial
Semantic Integrity Constraints
Konsistenzprüfung von räumlichen
semantischen Integritätsregeln
Stephan Mäs
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 2 / 31
Problemstellung
Geographische Daten werden immer häufiger dezentral gehalten und mithilfe vernetzter Dienste ausgetauscht
Detailliertes Wissen über die jeweiligen Daten ist notwendig für deren Beurteilung und Nutzung
Modellbasierter Datenaustausch objektstrukturierter Geodaten
das Datenmodell wird zusammen mit den Daten bereitgestellt
semantische Integritätsregeln sind Teil dieser Datenmodelle und Teil der Qualitätsbeschreibung der Daten
Häufig mehrere tausend Integritätsregeln in einem Datenmodell
Prüfung der Integritätsregeln über hardcodierte Prüfroutinen
Management und Transfer der Integritätsregeln kaum möglich
Vergleich und Prüfung der internen Konsistenz der Regelsätze ist bisher nicht möglich
Methodik zum Vergleich und zur Konsistenzprüfung von räumlichen semantischen Integritätsregeln
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 3 / 31
Beispiel
Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.
Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.
Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 4 / 31
Beispiel
Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.
Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.
Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 5 / 31
Beispiel
Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.
Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.
Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.
Alle Auwälder beinhalten (contains) ein Atomkraftwerk.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 6 / 31
Gliederung
1. Wissenschaftliche Grundlagen
Definition von semantischen Integritätsregeln
Logisches Schließen auf Basis von räumlichen Relationen
2. Ansatz für das Logische Schließen mit semantischen Integritätsregeln
Trennung von Instanz- und Klassenrelationen
Komposition von Klassenrelationen
3. Anwendungsszenario Daten Integration
4. Zusammenfassung & Ausblick
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 7 / 31
Arten von Integritätsregeln
Domain Constraints
z.B. Einschränkungen von Attributwerten
Key and Relationship Constraints
z.B. Eindeutigkeit von Schlüsselattributen, Kardinalitätseinschränkungen
Semantic Integrity Constraints
schränken Relationen zwischen den Elementen des Datenmodells ein
spezifizieren wie die Semantik des Datenmodells im Datensatz umgesetzt / erzwungen wird
i.d.R. werden die eingeschränkten Relationen nicht explizit abgespeichert
Fokus der Arbeit liegt auf:
Semantischen Integritätsregeln welche auf binären räumlichen Relationen zwischen Objektklassen basieren
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 8 / 31
Räumliche semantische Integritätsregeln
Beispiele aus der natürlichen Sprache:
Topologische Einschränkungen:
Höhenlinien dürfen sich nicht mit Seen überschneiden.
Auwälder müssen innerhalb einer Flussaue liegen.
Orientierung / Richtungseinschränkungen:
Ein Hinterhof muss sich immer hinter einem Gebäude befinden.
Metrische Einschränkungen:
Eine Tankstelle muss mindestens 300m Abstand zu Schulen haben.
Untersuchungsziel:
Konsistenzprüfung von solchen Regelsätzen durch logisches Schließen.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 9 / 31
Arten semantischer Integritätsregeln
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 10 / 31
Logisches Schließen mit räumlichen Relationen
Komposition von räumlichen Relationen
A B C
Finites Set von räumlichen Relationen
Komposition Beispiel: Explizites Wissen:
A berührt (meet) B
B beinhaltet (contains) C
Implizites Wissen:
A ist disjunkt (disjoint) von C
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 11 / 31
Komposition von räumlichen Relationen
Egenhofer, M. (1994): Deriving the Composition of Binary Topological Relations.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 12 / 31
Constraint Satisfaction Problems
Herleitung von implizitem Wissen und Detektion von Inkonsistenzen und Redundanzen in Relationennetzen
Knoten repräsentieren Objekte
Kanten repräsentieren die (räumlichen) Relationen
Konsistenzprüfung der Relationen aller Objekttriple
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 13 / 31
Komposition Semantischer Integritätsregeln
Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.
Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.
???
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 14 / 31
Lösungsansatz
Aufteilung in 2 Ebenen:
getrennte Betrachtung der Kompositionen
von Instanzrelationen und
Kardinalitätseinschränkungen
Kombinierte
Kompositionen der
Klassenrelationen
Kompositionen der
Kardinalitätseinschränkungen
Klassenebene
Kompositionen der
Instanzrelationen
Instanzebene
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 15 / 31
Komposition von Klassenrelationen
k1
inside disjoint
k2
k3
f1
f2
f3
a1
a2
a3
a4
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 16 / 31
Komposition von Klassenrelationen
Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)
k1
inside disjoint
k2
k3
f1
f2
f3
a1
a2
a3
a4
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 17 / 31
Komposition von Klassenrelationen
Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)
k1
inside disjoint
k2
k3
f1
f2
f3
a1
a2
a3
a4
Klassenebene: Alle Auwälder stehen in Relation r1 zu genau einer Flussaue ;
Alle Flussauen stehen in Relation r2 zu allen Atomkraftwerken
Alle Auwälder stehen in Relation r3 zu allen Atomkraftwerken.
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 18 / 31
Komposition von Klassenrelationen
Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)
k1
inside disjoint
k2
k3
f1
f2
f3
a1
a2
a3
a4
Klassenebene: Alle Auwälder stehen in Relation r1 zu genau einer Flussaue ;
Alle Flussauen stehen in Relation r2 zu allen Atomkraftwerken
Alle Auwälder stehen in Relation r3 zu allen Atomkraftwerken.
Kombinierte Komposition der Klassenrelationen:
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 19 / 31
Berücksichtigte Kardinalitätsbedingungen
Links-Totalität:
Jedes a steht in einer Relation r zu mindestens einem b.
Rechts-Totalität:
Jedes b steht in einer Relation r zu mindestens einem a.
To
tal
Pa
rtic
ipa
tio
n
Rechts-Eindeutigkeit:
Kein a steht in einer Relation r zu mehr als einem b.
Links-Eindeutigkeit:
Kein b steht in einer Relation r zu mehr als einem a.
Ca
rdin
ali
ty
Ra
tio
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 20 / 31
Definition von Klassenrelationen
RLD (A,B)
RRD (A,B)
RLT (A,B)
RRT (A,B)
RLD RD LT (A,B)
RLD RD RT (A,B)
RLD LT RT (A,B)
RRD LT RT (A,B)
RLD RD LT RT (A,B)
17 Abstrakte Klassenrelationen
RLD RD (A,B)
RLD LT (A,B)
RLD RT (A,B)
RRD LT (A,B)
RRD RT (A,B)
RLT RT (A,B)
Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.
INSIDE RD LT (Auwälder, Flussauen)
links-total rechts-eindeutig
Sonderfall: RLT RT-all (A,B)
Rsome (A,B)
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 21 / 31
Komposition von Klassenrelationen
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 22 / 31
Prototypische Umsetzung
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 23 / 31
Anwendungsszenario: Datenintegration
Hochwasser-analyse
Integration möglich?
Brauchbarkeit?
Datenquelle 2 Datenquelle 1
Implizite Restriktionen?
Implizite Restriktionen?
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 24 / 31
Instanzebene: contains(fa,a); meet(a,f)
contains covers overlap(fa,f)
Alle Auwälder müssen an mindestens einem Fluss liegen (meet).
Alle Auwälder müssen innerhalb
(inside) einer Flussaue liegen.
Klassenebene:
Anwendungsszenario: Datenintegration
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 25 / 31
Datenquelle 2 Datenquelle 1
overlapcoverscontains
overlapcoveredBy
insidemeetdisjoint
Anwendungsszenario: Datenintegration
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 26 / 31
Datenquelle 2 Datenquelle 1
overlapcoverscontains
overlapcoveredBy
insidemeetdisjoint
Anwendungsszenario: Datenintegration
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 27 / 31
Datenquelle 2 Datenquelle 1
overlapcoverscontains
overlapcoveredBy
insidemeetdisjoint
Widersprüche ?
Anwendungsszenario: Datenintegration
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 28 / 31
Datenquelle 2 Datenquelle 1
overlapcoverscontains
overlapcoveredBy
insidemeetdisjoint
Widersprüche ?
Anwendungsszenario: Datenintegration
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 29 / 31
Auflösung des Beispiels
Hochwasser-analyse
Integration ist möglich
Konsistenzprüfung notwendig
Datenquelle 2 Datenquelle 1
Implizite Restriktionen
vorhanden
Implizite Restriktionen
vorhanden
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 30 / 31
Zusammenfassung
Kategorisierung von semantischen Integritätsregeln
Konsistenzprüfung von räumlichen semantischen Integritätsregeln / Klassenrelationen
Formale Beschreibung der semantischen Integritätsregeln
Generische Methodik zur Erkennung von Konflikten und Redundanzen
Die entwickelte Methodik ermöglicht die Erkennung von:
impliziten Restriktionen
widersprüchlichen Integritätsregeln
semantische Heterogenitäten und Konflikte in verschiedenen Datenmodellen
redundanten Restriktionen
Anwendungsgebiete:
Qualitätssicherung
Management von semantischen Integritätsregeln
Datenintegration
• Heterogenitäten der Qualitätsanforderungen
• Qualitätsunzulänglichkeiten in Bezug auf eine bestimme Nutzung
Stephan Mäs Konsistenzprüfung von räumlichen semantischen
Integritätsregeln 31 / 31
Ausblick
Erweiterungsmöglichkeiten:
Vererbung von semantischen Integritätsregeln
Ternäre Relationen (a befindet sich zwischen b und c)
Erweiterung der Formalisierung (z.B. 0..2 als Kardinalität)
Berechnung von minimalen Regelsätzen
Minimierung des Rechenaufwandes bei der Qualitätssicherung
Räumliche Relationen und ihre Kompositionen
Relationen über mehrere räumliche Aspekte
Kognitive Plausibilität
Weitere Anwendungsgebiete:
Ontologien und konzeptionelle Datenmodellierung
Messung semantischer Ähnlichkeit (Semantic Similarity Measurement)