35
Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Embed Size (px)

Citation preview

Page 1: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Semantisches Datenmodell für flächenbezogene Daten

Von Solveig VelteHauptseminar: Nichtrelationale

DatenbankenProf. Dr. Thaller

Page 2: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Gliederung

• Flächenbezogene Daten

• Semantisches Datenmodell– Entwurfsebenen– Beschreibung konsistenter Zustände– Definition von Produktionen– Konsistenz– Schemadefinition

• Fazit

Page 3: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Flächenbezogene Daten

• Zweidimensionales Ordnungskriterium

• Höhe als gesondertes, sekundäres Kriterium

• Z.B.: Linien, Strecken, Punkte

• Unterschied zu administrativen Daten: stärkere innere Verknüpfung

Page 4: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Flächenbezogene Daten

• Durch den Raumbezug müssen neben messbaren auch topologische Eigenschaften (z.B. Nachbarschaftsbeziehungen) und deren Manipulation modelliert werden. Nachteile der klassischen Datenmodelle:– Topologische Eigenschaften und andere semantische

Zusammenhänge müssen umständlich und oft indirekt dargestellt werden.

– Relationen- und Netzwerkmodell legen Schwerpunkt auf Informationsstrukturierung und nicht auf Datenmodellierung. Dynamische Aspekte sind nicht voll im Datenmodell integriert.

Page 5: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Flächenbezogene Daten

• Flächenbezogene Konsistenzbedingungen stellen zusätzliche Anforderungen an ein Datenbanksystem, diese betreffen metrische und topologische Beziehungen, z.B.:– Ein Grenzpunkt einer Parzelle ist mindestens an zwei

Grenzstrecken beteiligt, d.h. es gibt keine „freiliegenden“ Grenzpunkte

– Jeder Streckenzug hat genau einen Anfangs- und Endpunkt

– Jede Parzelle verweist auf mindestens einen Eigentümer

Page 6: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Anforderungen an ein flächenbezogenes Datenmodell

• Berücksichtigung von semantische Zusammenhängen bei flächenbezogenen Daten. Geometrische Daten und deren Beziehungen müssen gleichberechtigt beschrieben und behandelt werden.

• Soll deskriptiv sein, da die Struktur und die Permanenz der Daten im Vordergrund stehen. Der deskriptive Ansatz zur Datenbeschreibung gilt auch für die Manipulationsseite.

• Muss der Datendefinition wie der -manipulation gleichermaßen gerecht werden.

• Soll problemorientiert sein, d.h. es soll eine möglichst große Klasse flächenbezogener Daten bewältigen.

• Muss einen formalen Rahmen haben, d.h. durch eine mathematische Theorie begründet sein.

• Das Modell muss für Erweiterungen und Ergänzungen offen bleiben. Neue Erkenntnisse und Anwendungsbeispiele sollten ohne allzu großen Aufwand ins bestehende System integriert werden können.

Page 7: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Semantisches Datenmodell

• Das Modell kombiniert semantischen Untersuchungen (Theorie der Graphgrammatik) mit dem klassischen Relationenmodells („relationale“ Graphgrammatik)

• Von zentraler Bedeutung beim diesem Modell ist die einheitliche Beschreibung statischer und dynamischer AspekteDamit unterscheidet sich das Modell von andern

Ansätzen, welche zwischen der formalen Beschreibung der Datenstruktur und der Formalisierung von Manipulationssprachen trennen.

Page 8: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Semantisches Datenmodell

• Beinhaltet Schichtenmodell – Verschiedene Abstraktionsniveaus der

Modellbildung erleichtern den Entwurf der Daten- und Manipulationsstruktur.

• Drei Entwurfsebenen: Zustandsebene, Darstellungsebene, Objektebene

• Zur Beschreibung der Datenstruktur werden allgemein markierte Graphen verwendet

Page 9: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Graphen

• Def.: Ein markierter Graph besteht aus einer Menge V von Knoten, einer Menge E von Kanten und einer Funktion a, welche der Menge der Kanten eine Menge ungeordneter Paare koinzidenter Knoten zuordnet.

• Def.: Ein gerichteter Graph oder Digraph ist ein markierter Graph, bei welchem die Funktion a, der Menge der Kanten eine Menge geordneter Paare verschiedener Knoten zuordnet.

Page 10: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Zustandsebene• Die Zustandsebene beschreibt das eigentliche Vorkommen der

Entitäten. Eine Entität wird durch Eigenschaft-Wertpaare charakterisiert.

• Entitäten lassen sich anschaulich durch Knoten und Kanten eines Graphen darstellen. Die Knoten eines solchen Zustandsgraphen entsprechen einzelnen Datenwerten, die Kanten zeigen die Bedeutung der Beziehung zwischen zwei Datenwerten auf.

• Def.: Ein Zustandsgraph besteht aus einer Menge von Datenwerten (Knotenmenge) und Beziehungen (Kantenmenge). Jede Beziehung ist mit der entsprechenden Eigenschaft der zugehörigen Eigenschaft-Wertpaare markiert.

• Der Zustandsgraph ist nicht gerichtet d.h. die Kanten repräsentieren gleichzeitig beide Beziehungsrichtungen. Diese Regelung gilt auf sämtlichen Entwurfsebenen.

Der Zustandgraph beschreibt das Datenvorkommen und wichtige semantische Zusammenhänge.

Page 11: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Zustandsebene

Page 12: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Darstellungsebene

• Ideen und Begriffe basieren auf einer Erweiterung des Relationenmodells, bei welchem globale und lokale Datenaspekte unterschieden werden.

• Auf der Darstellungsebene werden einzelne Knoten und Kanten des Zustandsgraphen (Datenwert, Eigenschaft) in Klassen zusammengefasst. Diese Ebene dient also der Abstraktion, d.h. der datenmäßigen Beschreibung von Entitätsmengen.

• Die Zusammenfassung von Entitäten zu Entitätsmengen entspricht der Bildung von mathematischen Relationen (Tabellen).

• Pro Relation muss mindestens eine Schlüsselkombination vorhanden sein.

Page 13: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Darstellungsebene• Zur Beschreibung von Eigenschaften einer Entitätsmenge werden

Attribute verwendet. • Attribut: Funktion, welche eine Entitätsmenge in einen Wertebereich

oder ein kartesisches Produkt von Wertebereichen abbildet. – Bsp.: Entitätsmenge: PUNKT

Wertemenge: pktart = (´GP`, ´TP1`, ´TP2`, ´TP3´)

Attribut: Punktart

• Stimmen zwei Entitäten und sämtliche ihrer Wertkombinationen überein, so werden die beiden Entitäten identisch genannt. Diese identifizierende Eigenschaft kann bereits für einen Teil der Attributskombination gelten. Ist sie minimal, so dass bei Weglassen eines der Attribute der Kombination die eindeutige Identifizierbarkeit verletzt würde, so führt dies zum Begriff des Indentifikationsschlüssels.

Page 14: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Darstellungsebene

• Wertebereiche eines Primärschlüssels nennen wir global, solche einzelner Nichtprimärattribute heißen lokal. Die Attribute welche in globale bzw. lokale Wertebereiche abbilden, werden entsprechend global bzw. lokal genannt. Durch globale bzw. lokale Betrachtungen wird geklärt, ob gewisse Wertebereiche in verschiedenen oder ausschließlich einzelnen Entitätsmengen verwendet werden dürfen.

• DEF.: Ein Darstellungsgraph besteht aus globalen und lokalen Wertebereichen (Knotenmenge) und aus globalen und lokalen Attributen (Kantenmenge). Die Funktionen, markiert durch Attributsnamen, dürfen nur von globalen in globale bzw. von globalen in lokale Wertebereich abbilden.

Page 15: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Darstellungsebene

Page 16: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Objektebene

• Auf der Objektebene werden die einzelnen Entitätsmengen und Beziehungen modelliert.

• Durch die dritte Normalform werden (m,n) Beziehungen zwischen Relationen aufgespalten. Dies ergibt eine sogennante Beziehungsrelation, in welche die globalen Attribute der zugehörigen Stammrelation eingehen. Allgemein wird jede Beziehung zwischen Entitätsmengen mittels globalen Attributen dargestellt.

• Unter der Rolle einer bestimmten Relation verstehen wir ein Attribut, welches in einer fremden Relation einen globalen Wertebereich referenziert -> Beziehungen zwischen verschiedenen Relationen werden ermöglicht/Globaleigenschaften

Page 17: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Objektebene

• Unterscheidung von drei Relationentypen:– Entitätsrelation: besitzt ausschließlich eigene Globalattribute– Beziehungsrelation: darf nur Globalattribute fremder Relationen

aufweisen– Gemischte Relation: enthält eigene Globalattribute und solche

fremder Relationen

Page 18: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Objektebene

• Def.: Ein Objektgraph besteht aus Relationen (in dritter Normalform) als Knotenmenge und Globalattributen als Kantenmenge.

Page 19: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Beschreibung konsistenter Zustände

• Der geschilderte Entwurfsprozess führt iterativ zur relevanten Information und deren Struktur. Je nach Entwurfsebene stehen globale oder lokale Fakten im Vordergrund. Um die Menge sämtlicher konsistenter Zustände zu beschreiben, werden gerichtete Graphen verwendet.

• Die Einführung gerichteter Graphen ermöglicht, die Datendefinition und –manipulation einheitlich anzugeben. Bei der Datendefinition wird die Struktur der Daten und ihrer Beziehungen beschrieben, indem jedem konsistenten Zustand ein gerichteter Graph zugeordnet wird. Die Anwendung von Ableitungsregeln gerichteter (Prozess-) Graphen auf konsistente Zustände entspricht einer abstrakten Beschreibung der Datenmanipulation.

Page 20: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Strukturgraph

• Def.: Ein Strukturgraph ist ein gerichteter Graph und wie folgt definiert:– Die Knoten entsprechen Relationen

(Objektebene) oder globalen bzw. lokalen Wertebereichen (Darstellungsebene).

– Die Kanten sind gerichtet und zeigen die zu einer Relation gehörigen Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall)

Page 21: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Strukturgraph

Page 22: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Definition von Produktionen• Def.: Eine Produktion (auch Produktionsregel) hat die folgende

Form:

<plist;plist>: <left side> <right side>

wobei die Parameterliste die zu substituierenden Größen für die Linke bzw. rechte Seite angibt, und die linke bzw. rechte Seite der Produktionsregel je einen Prozessgraphen darstellt. Die implizit gegebene Verklebungsvorschrift ermöglicht das Ersetzen des linken Prozessgraphen durch den rechten.

• Bei Graphersetzung muss im Restgraphen das Vorkommen der rechten Seite der Produktionsregel richtig eingebettet werden. Hier stellt sich im allgemeinen die Frage, welche Knoten des Restgraphen verbunden werden sollen. Die Produktionsregel enthält deshalb zusätzlich eine Verklebungsvorschrift.

Page 23: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Definition von Produktionen

Page 24: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Konsistenztheorem

• Jede Produktion überführt einen konsistenten in einen konsistenten Zustand (Abgeschlossenheit oder Konsistenzerhaltung)

• Jeder konsistente Zustand kann erzeugt werden (Vollständigkeit oder Konsistenzerzeugung)

• Die Produktionsregeln modellieren das dynamische Verhalten, indem jeder konsistente Zustand aus dem (initialen) Startgraphen hergeleitet wird. Konsistenzbedingungen lassen sich durch Eigenschaften der Prozessgraphen formulieren.

Page 25: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Seiteneffekte bei Datenmanipulationen

• Verlangen wir bei Mutationsoperationen Konsistenzerhaltung, so müssen vor und nach der eigentlichen Ausführung gewisse Konsistenzbedingungen erfüllt sein. Bei den meisten Anwendungen können diese Konditionen isoliert überprüft werden; dies ist bei flächenbezogenen Daten selten der Fall. Geometrische Daten sind oft as Teilstrukturen zusammengesetzt und zeigen verschiedenste semantische Verbindungen.

Page 26: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Seiteneffekte bei Datenmanipulationen

• Durch die Graphennotation werden die Seiteneffekte einer Produktion auf anschauliche Art freigelegt.

• Vor der eigentlichen Ausführung einer Manipulation müssen oft einzelne Datenwerte und semantische Verbindungen überprüft werden. Solche auftretenden Nachbarschaften und damit gekoppelte Seiteneffekte werden durch Prozessgraphen modelliert.

Page 27: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Seiteneffekte bei Datenmanipulationen

• Def.: Ein Prozessgraph ist ein gerichteter Graph und wie folgt definiert:– Die Knoten entsprechen Relationen (Objektebene)

oder einzelnen Datenwerten, Konstanten oder Parameter (Zustandsebene).

– Die Kanten sind gerichtet und zeigen die zu einer Relation gehörenden Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall)

• Definition des Prozessgraphen illustriert die Verwandtschaft zum Strukturgraphen der Datendefinition. Dabei liegt die Idee zugrunde, die Datenmanipulation aus der Daten und Strukturbeschreibung herzuleiten.

Page 28: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Seiteneffekte bei Datenmanipulationen

Page 29: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Entwurfsebenen

Page 30: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Schema

• Schema: enthält zentral verwaltete Angaben über den Aufbau, Zugriffsbefugnisse, Restriktionen bei Manipulationen etc. -> Datenbank kann konsistenzerhaltend benutzt werden

• Schemadefinition soll sich nicht nur auf die Datenstruktur begrenzt sein, sondern auch Manipulationsaspekte miteinbeziehen

• Def.: Ein Schema ist durch folgende Regel gegeben: <schema definition> ::= schema <static part> <dynamic part>

Wobei der statische Teil (Datenschema) die Wertebereiche und die Relationen festlegt und der dynamische Teil (Manipulationsschema) einen vollständigen Satz von Transaktionen definiert.

Page 31: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Datenschema

• Für das statische Datenschema werden die Objekt- und die Darstellungsebene gebraucht.

• Def.: <static part> ::= <domain definition> <relation definition>

umfasst die Definition der lokalen bzw. globalen Wertebereiche und Entitäts-, gemischte- bzw. Beziehungsrelationen.

Page 32: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Manipulationsschema

• Objekt- und die Zustandsebene relevant • Konsistenzerhaltende Produktionen werden

spezifiziert• Übersetzung einer Produktion in eine lineare

Programmprozedur, welche einen konsistenten Datenbankzustand in einen neuen konsistenten Zustand überführt

• Einbezug von Konsistenzbedingungen und semantischen Regeln in Manipulationsoperationen mit Fehlerbehandlung bei Regelverstoß

Page 33: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Fazit• Graphen eignen sich gut um Strukturzusammenhänge direkt

aufzuzeigen

• Neben der statischen Struktur der Daten ist ihre Dynamik miteinbezogen. Der Entwurf von konsistenzerhaltenden Prozessen basiert auf der einheitlichen Datenbeschreibung (drei Ebenen). Die Kanten der Prozessgraphen drücken wichtige Zusammenhänge aus. Diese Seiteneffekte werden durch Graphen anschaulich und übersichtlich modelliert. Schon eine einfache Mutation, wie z.B. die Änderung der Koordinaten eines Grenzpunktes betrifft mehrere Entitäsmengen.

• Die vorgestellten Graphtheoretischen Konzepte erlauben eine einheitliche Darstellung verschiedener Datenbankaspekte, welche bis anhin mit heterogenen Methoden untersucht werden mussten.

Page 34: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Ende

Page 35: Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

Fragen?