View
111
Download
1
Category
Preview:
Citation preview
Informationsdarstellung mit XML
Klaus Becker
2013
2 Informationsdarstellung mit XML
<zufi> </zufi>
3 Teil 1
Darstellung von Information
4 Die "Welt" der Grafiken
Grafiken begegnen einem überall, natürlich auch auf Computerbildschirmen. Grafiken werden eingesetzt, um Information nach dem Motto "ein Bild sagt mehr als tausend Worte" zu übermitteln.
Wie kommen Grafiken "in den Computer"? Wie werden sie dargestellt, so dass sie von einem Computer bzw. von einem speziellen Computerprogramm angezeigt werden können? Mit diesen Fragen sollst du dich hier beschäftigen.
5 Pixelgrafik
Eine Pixelgrafik (man sagt auch Rastergrafik) setzt sich aus sehr vielen Pixeln (Bildelementen / Rasterzellen) zusammen.
Wenn man eine Pixelgrafik vergrößert, ist die Pixelstruktur deutlich zu erkennen.
Pixelgrafiken verwendet man insbesondere bei Fotos.
6 Vektorgrafik
Eine Vektorgrafik setzt sich aus geometrischen Objekten zusammen.
Vektorgrafiken eignen sich zur Darstellung von Bildern, die aus geometrischen Objekten zusammengesetzt sind. Die Beschreibung solcher Grafiken mit geometrischen Objekten ermöglicht es, die Grafiken strukturgetreu zu vergrößern oder verkleinern.
Wir werden im Folgenden solche Vektorgrafiken genauer betrachten.
7 Aufgabe
(a) Stelle dir vor, du sollst die vorliegende Grafik jemandem - der die Grafik nicht sieht - möglichst genau beschreiben. Welche Informationen würdest du übermittel? Ergänze hierzu die folgende Auflistung.
Es handelt sich um eine quadratische Grafik mit orangem Hintergrund.
Die Grafik enthält ein Polygon (Vieleck), das aus 11 Punkten besteht. Das Polygon ist im Innern mit der Farbe weiß gefüllt.
...
(b) Welche weiteren Daten (wie z.B. Ausmaße der Grafik) müsste man angeben, damit jemand die Grafik reproduzieren kann?
8
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd" ><svg xmlns="http://www.w3.org/2000/svg" width="240" height="240"><rect x="0" y="0" width="240" height="240" fill="orange"></rect> <polygon points="160 10 20 100 60 170 110 160 150 220 200 230 210 180 190 110 160 120 150 100 170 60" fill="white"></polygon><polygon points="110 50 100 70 130 70 140 50" fill="red"></polygon><polygon points="160 190 150 210 180 210 190 190" fill="red"></polygon><polygon points="120 120 100 130 120 140 140 130" fill="blue"></polygon><rect x="100" y="90" width="40" height="20" fill="green" stroke="none"></rect><rect x="150" y="160" width="40" height="20" fill="green" stroke="none"></rect><line x1="120" y1="70" x2="120" y2="90" stroke="gray" stroke-width="4px"></line> <line x1="120" y1="110" x2="120" y2="120" stroke="gray" stroke-width="4px"></line> <line x1="100" y1="130" x2="78" y2="130" stroke="gray" stroke-width="4px"></line> <line x1="80" y1="130" x2="80" y2="80" stroke="gray" stroke-width="4px"></line> <line x1="78" y1="80" x2="120" y2="80" stroke="gray" stroke-width="4px"></line> <line x1="120" y1="140" x2="120" y2="150" stroke="gray" stroke-width="4px"></line> <line x1="118" y1="150" x2="172" y2="150" stroke="gray" stroke-width="4px"></line> <line x1="170" y1="150" x2="170" y2="160" stroke="gray" stroke-width="4px"></line> <line x1="170" y1="180" x2="170" y2="190" stroke="gray" stroke-width="4px"></line> </svg>
Aufgabe
Versuche, die Bedeutung möglichst vieler Bestandteile des gezeigten Quelltextes herauszufinden. Markiere und kommentiere im Quelltext die Teile, die du auf der Webseite wiederfinden.
9
Informationsmodellierung - Grafiken
Vektorgrafiken werden mit Hilfe geometrischer Objekte beschrieben.
rect
rect
svg
polygon
polygon
polygon
polygon
line
line
...
rect
svg
xmlns=... width="240" height="240"
rect
x="0" y="0" width="240" height="240" fill="orange"
polygon
points="160 10 ..." fill="white"
...
polygon
points="110 50 ..." fill="red"
10
Informationsmodellierung - Grafiken
SVG steht für Scalable Vector Graphics. SVG ist eine Sprache, mit der man die Objekte einer Grafik präzise beschreiben kann.
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd" ><svg xmlns="http://www.w3.org/2000/svg" width="240" height="240"><rect x="0" y="0" width="240" height="240" fill="orange"></rect> <polygon points="160 10 20 100 60 170 110 160 150 220 200 230 210 180 190 110 160 120 150 100 170 60" fill="white"></polygon><polygon points="110 50 100 70 130 70 140 50" fill="red"></polygon><polygon points="160 190 150 210 180 210 190 190" fill="red"></polygon><polygon points="120 120 100 130 120 140 140 130" fill="blue"></polygon><rect x="100" y="90" width="40" height="20" fill="green" stroke="none"></rect><rect x="150" y="160" width="40" height="20" fill="green" stroke="none"></rect><line x1="120" y1="70" x2="120" y2="90" stroke="gray" stroke-width="4px"></line> <line x1="120" y1="110" x2="120" y2="120" stroke="gray" stroke-width="4px"></line> <line x1="100" y1="130" x2="78" y2="130" stroke="gray" stroke-width="4px"></line> <line x1="80" y1="130" x2="80" y2="80" stroke="gray" stroke-width="4px"></line> <line x1="78" y1="80" x2="120" y2="80" stroke="gray" stroke-width="4px"></line> <line x1="120" y1="140" x2="120" y2="150" stroke="gray" stroke-width="4px"></line> <line x1="118" y1="150" x2="172" y2="150" stroke="gray" stroke-width="4px"></line> <line x1="170" y1="150" x2="170" y2="160" stroke="gray" stroke-width="4px"></line> <line x1="170" y1="180" x2="170" y2="190" stroke="gray" stroke-width="4px"></line> </svg>
11 Die "Welt" der Musik
Früher haben Komponisten die Noten zu ihren neuen Musikstücken per Hand auf Notenpapier übertragen. Heute können sie die Musik direkt "einspielen", der Computer überträgt die Töne dann automatisch in das Notensystem.
Wie kann man ein Musikstück so darstellen, dass die Noten von einem Computer bzw. von einem speziellen Computerprogramm angezeigt und auch abgespielt werden können?
12 Aufgabe
Wir schauen uns zunächst die Darstellung von Noten in der Sprache MusicXML an.
Schaue dir die MusicXML-Darstellung zu den Noten des Liedes "Bruder Jakob" an (siehe I: ...). Versuche, möglichst viele Informationen zur Notendarstellung des Liedes "Bruder Jakob" in der MusicXML-Darstellung wiederzufinden.
Experimentiere auch mit dem Programm MuseScore.
13 Informationsmodellierung - MusikNote
Spieldauer
Tonhöhe
Bezeichner
Oktave
eingestrichen
f
...
Notentyp
Viertelnote
Notenhals
nach oben
Lyrik
Text
Silbe
Anfang
'Bru'
14 Informationsmodellierung - Musik
MusicXML ist eine Sprache, mit der man die Noten eines Musikstücks präzise beschreiben kann.
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE score-partwise PUBLIC "-//Recordare//DTD MusicXML 2.0 Partwise//EN" "http://www.musicxml.org/dtds/partwise.dtd"><score-partwise> <identification> <encoding> <software>MuseScore 1.1</software> <encoding-date>2012-02-16</encoding-date> </encoding> </identification> ... <note default-x="102.19" default-y="-35.00"> <pitch> <step>F</step> <octave>4</octave> </pitch> <duration>2</duration> <voice>1</voice> <type>quarter</type> <stem>up</stem> <lyric number="1"> <syllabic>begin</syllabic> <text>Bru</text> </lyric> </note>...
15 Informationsmodellierung - Musik
ABC ist eine Sprache, mit der man die Noten eines Musikstücks präzise beschreiben kann.
X: 1T: Bruder JakobC: TraditionalL: 1/4K: FFGAF|FGAF|w: Bru-der Ja-kob! Bru-der Ja-kob!ABc2|ABc2|w: Schläfst du noch? Schläfst du noch?c/ d/ c/ B/ AF|c/ d/ c/ B/ AF|w: Hörst du nicht die Glo-cken? Hörst du nicht die Glo-cken?FCF2|FCF2|]w: Ding dong ding ding dong ding.
16 Darstellung von Information Lied: „Bruder
Jakob, ..."Information
Repräsentieren Darstellen
Interpretieren Deuten
X: 1T: Bruder JakobC: TraditionalL: 1/4K: FFGAF|FGAF|w: Bru-der Ja-kob! Bru-der Ja-kob!ABc2|ABc2|w: Schläfst du noch? Schläfst du noch?c/ d/ c/ B/ AF|c/ d/ c/ B/ AF|w: Hörst du nicht die Glo-cken? Hörst du nicht die Glo-cken?FCF2|FCF2|]w: Ding dong ding ding dong ding.
Daten
... <note default-x="102.19" default-y="-35.00"> <pitch> <step>F</step> <octave>4</octave> </pitch> <duration>2</duration> <voice>1</voice> <type>quarter</type> <stem>up</stem> <lyric number="1"> <syllabic>begin</syllabic> <text>Bru</text> </lyric> </note>...
Musik kann man auf unterschiedliche Weise (in Form von Daten) so darstellen, dass sie automatisiert verarbeitet werden kann.
17 Eine "Geo-Welt"
Früher musste man in einen Atlas schauen oder sich spezielle Karten besorgen, um an die gewünschte Geo-Information heranzukommen. Heute kann man spezielle Webseiten aufrufen, die neben der gesuchten Information eine Vielzahl an weiteren Funktionalitäten bereit stellen.
Wie kann man Geo-Information so darstellen, dass sie von einem Computer bzw. von einem speziellen Computerprogramm verwaltet und angezeigt werden kann?
18 Exkurs - OpenStreetMap
Die Karten von OpenStreetMap werden erstellt, indem freiwillige Helfer Geodaten sammeln und in eine Datenbank hochladen. Wenn ein Benutzer sich einen Kartenausschnitt anzeigen lässt, dann werden die benötigten Geodaten aus der Datenbank zusammengesucht.
Wir werden uns im Folgenden hier genauer anschauen, wie Geoinformation so in Form von Geodaten dargestellt werden kann, dass sie von einem Computerprogramm verarbeitet werden kann.
19 Aufgabe
Die Webseite zu OpenStreetMap bietet einen Export von Karten an. Wir wählen als Export-Format "OpenStreetMap-XML-Daten" und speichern die Daten in einer Datei mit einem passenden Dateinamen (z.B. "map_palastgarten.osm") ab. Die Datei enthält dann eine Beschreibung des gewählten Kartenausschnitts in der Sprache OSM.
(a) Suche verschiedene Geo-Objekte in der OSM-Beschreibung, z.B. den Teich, die Stadtmauer, das Landesmuseum, ....
(b) Stelle erste Vermutungen auf, wie Geo-Objekte in der Sprache OSM dargestellt werden.
20 Aufgabe
Zur Bearbeitung von OpenStreetMap-Geodaten verwenden wir das Softwarewerkzeug JOSM.
Jetzt geht es ans Experimentieren. Hierdurch kannst du dir die Darstellung einzelner Geo-Objekte teilweise selbst erschließen.
(a) Verändere mit dem Werkzeug JOSM Schritt für Schritt den Kartenausschnitt und beobachte, wie sich die Veränderungen in der zugehörigen OSM-Beschreibung zeigen. Die folgende Abbildung zeigt eine veränderte Karte, bei der der Teich und das Toilettenhäuschen verlegt wurden und bei der ein Baum eingezeichnet wurde.
(b) Führe auch gezielt kleinere Veränderungen im Quelltext map_palastgarten.osm durch. Schaue dir anschließend die zugehörige Karte mit dem Werkzeug JOSM an.
21
Informationsmodell. - Geo-Information
Polygonzug
Punkt
Längengrad: 6.6445699
Breitengrad: 49.7522382
Beschreibung: Spielfeld
...
<?xml version="1.0" encoding="UTF-8"?><osm version="0.6" generator="CGImap 0.0.2">... <way id="111469539" ...> <nd ref="1269920115"/> <nd ref="1269920121"/> <nd ref="1269920123"/> <nd ref="1269920110"/> <nd ref="1269920115"/> <tag k="leisure" v="pitch"/> </way>... <node id="1269920115" lat="49.7522382" lon="6.6445699" .../> <node id="1269920121" lat="49.7523975" lon="6.6443980" ..."/> <node id="1269920123" lat="49.7525854" lon="6.6448151" ..."/> <node id="1269920110" lat="49.7524260" lon="6.6449870" .../>...</osm>
22
Informationsmodell. - Geo-Information
OSM ist eine Sprache, mit der im OpenStreetMap-Projekt Geoinformation präzise beschrieben wird.
<?xml version="1.0" encoding="UTF-8"?><osm version="0.6" generator="CGImap 0.0.2">... <way id="111469539" ...> <nd ref="1269920115"/> <nd ref="1269920121"/> <nd ref="1269920123"/> <nd ref="1269920110"/> <nd ref="1269920115"/> <tag k="leisure" v="pitch"/> </way>... <node id="1269920115" lat="49.7522382" lon="6.6445699" .../> <node id="1269920121" lat="49.7523975" lon="6.6443980" ..."/> <node id="1269920123" lat="49.7525854" lon="6.6448151" ..."/> <node id="1269920110" lat="49.7524260" lon="6.6449870" .../>...</osm>
23 Darstellung von Information
...Information
Repräsentieren Darstellen
Interpretieren Deuten
Darstellung von
Information
Menschen versuchen seit eh und je, "Lebenswelten" mit Hilfe von Darstellungen zu erfassen.
24 Darstellung von Information
...Geo-Information...Information
Repräsentieren Darstellen
Interpretieren Deuten
Darstellung von
Information
Für bestimmte "Lebenswelten" wurden im Laufe der Zeit charakteristische Darstellungsformen entwickelt. So wird die "Geo-Lebenswelt" (z.B. Gewässer, Berge, Grenzen, ...) üblicherweise mit Hilfe von Karten dargestellt.
25 Darstellung von Information
...Geo-Information...Information
Repräsentieren Darstellen
Interpretieren Deuten
Daten
Heute versucht man, "Lebenswelten" im Computer zu repräsentieren. Hierzu ist es erforderlich, die gesamte relevante Information, die eine "Lebenswelt" ausmacht, computergerecht (in Form von Daten) darzustellen.
<?xml version="1.0" encoding="UTF-8"?><osm version="0.6" generator="CGImap 0.0.2">... <way id="111469539" ...> <nd ref="1269920115"/> <nd ref="1269920121"/> <nd ref="1269920123"/> <nd ref="1269920110"/> <nd ref="1269920115"/> <tag k="leisure" v="pitch"/> </way>...</osm>
26 Darstellung von Information
Daten
"Lebenswelten" sind meist recht komplex. Es ist daher gar nicht so einfach, die Struktur einer "Lebenswelt" adäquat zu erfassen.
Zur computergerechten Darstellung von "Lebenswelten" benutzt man heute sehr oft Auszeichnungssprachen. Das sind Sprachen, die Auszeichnungen zur Beschreibung der Struktur von "Lebenswelten" benutzen.
<?xml version="1.0" encoding="UTF-8"?><osm version="0.6" generator="CGImap 0.0.2">... <way id="111469539" ...> <nd ref="1269920115"/> <nd ref="1269920121"/> <nd ref="1269920123"/> <nd ref="1269920110"/> <nd ref="1269920115"/> <tag k="leisure" v="pitch"/> </way>...</osm>
So benutzt die Sprache OSM Auszeichnungen wie <way>...</way>, um bestimmte Geo-Objekte (hier Wege zur Begrenzung eines Objektes) zu charakterisieren. Auszeichnungen bestehend aus einem öffnenden Tag <way> und einem schließenden Tag </way> werden dabei benutzt, um den umschließenden Inhalt in einer bestimmten Weise zu charakterisieren.
Beachte, dass es auch andere Formen der Informationsdarstellung gibt.
27 Teil 2
XML-Dokumente
28 Beispiel - XHTML-Dokument
29 Beispiel - SVG-Dokument
30 Beispiel - MusicXML-Dokument
31 Ein selbst erstelltes Dokument <?xml version="1.0" encoding="iso-8859-1"?><Kurs> <!-- Organisation --> <Fach>Informatik</Fach> <Typ>Grundkurs</Typ> <Stufe>11</Stufe> <Bezeichner>11-in-1</Bezeichner> <Unterricht> <Einheit> <Tag>Montag</Tag> <Stunde>7</Stunde> <Raum>B04</Raum> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>3</Stunde> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>4</Stunde> </Einheit> </Unterricht> <!-- Personen --> ...
... <Lehrer kürzel="SU" geschlecht="w"> <Name>Schuster</Name> <Vorname>Christiane</Vorname> </Lehrer> <Schüler geschlecht="m"> <Name>Schwarz</Name> <Vorname>Tobias</Vorname> </Schüler> <Schüler geschlecht="w"> <Name>Baum</Name> <Vorname>Nina</Vorname> </Schüler> <Schüler geschlecht="w"> <Name>Müller</Name> <Vorname>Katrin</Vorname> <Kurssprecher/> </Schüler> <Schüler geschlecht="m"> <Name>Roth</Name> <Vorname>Andreas</Vorname> </Schüler> <!-- ... --></Kurs>
Welche "Welt" wird hier beschrieben? Beschreibe sie in Worten.
Welche Informationen sind im gezeigten XML-Dokument dargestellt? Beschreibe sie in Worten.
32 Fachkonzept - XML <?xml version="1.0" encoding="iso-8859-1"?><Kurs> <!-- Organisation --> <Fach>Informatik</Fach> <Typ>Grundkurs</Typ> <Stufe>11</Stufe> <Bezeichner>11-in-1</Bezeichner> <Unterricht> <Einheit> <Tag>Montag</Tag> <Stunde>7</Stunde> <Raum>B04</Raum> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>3</Stunde> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>4</Stunde> </Einheit> </Unterricht> <!-- Personen --> ...
... <Lehrer kürzel="SU" geschlecht="w"> <Name>Schuster</Name> <Vorname>Christiane</Vorname> </Lehrer> <Schüler geschlecht="m"> <Name>Schwarz</Name> <Vorname>Tobias</Vorname> </Schüler> <Schüler geschlecht="w"> <Name>Baum</Name> <Vorname>Nina</Vorname> </Schüler> <Schüler geschlecht="w"> <Name>Müller</Name> <Vorname>Katrin</Vorname> <Kurssprecher/> </Schüler> <Schüler geschlecht="m"> <Name>Roth</Name> <Vorname>Andreas</Vorname> </Schüler> <!-- ... --></Kurs>
XML steht für "eXtensible Markup Language". XML ist eine universelle, erweiterbare Sprache, mit der man konkrete Auszeichnungssprachen erzeugen kann.
33 XML-Dokumente<?xml version="1.0" encoding="iso-8859-1"?><Kurs> <!-- Organisation --> <Fach>Informatik</Fach> <Typ>Grundkurs</Typ> <Stufe>11</Stufe> <Bezeichner>11-in-1</Bezeichner> <Unterricht> <Einheit> <Tag>Montag</Tag> <Stunde>7</Stunde> <Raum>B04</Raum> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>3</Stunde> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>4</Stunde> </Einheit> </Unterricht> <!-- Personen --> ...
XML-Dokumente werden benutzt, um Information strukturiert darzustellen. Die Strukturierung erfolgt in Form eines Baumes.
Anzeige mit einem Browser
Darstellung im Editor
34 XML-Elemente Grundbausteine eines XML-Dokuments sind die XML-Elemente.
Ein XML-Element besteht dabei aus einem öffnenden Tag, einem Inhalt und einem schließenden Tag.
Ein Element kann selbst wieder Elemente enthalten (Container) oder nur noch Zeichen (eigentliche Daten) oder beides (gemischter Inhalt) oder auch gar nichts (leeres Element).
Das erste Element eines XML-Dokuments ist das Wurzelelement, das alle anderen Elemente in sich einschließt.
Wurzelelement
Element mit Zeicheninhalt
Element als Container
leeres Element
35 Tags Elemente werden mit Hilfe von Tags beschrieben.
Tags werden mit Hilfe von spitzen Klammern gebildet. Die Tag-Namen sind (fast) frei wählbar.
Anfangs- und Endtag müssen immer exakt zueinander passen. Dabei wird auf Groß- und Kleinschreibung geachtet.
Tags müssen korrekt geschachtelt werden.
Bei einem leeren Element wird i. d. Regel eine verkürzte Tag-Schreibweise benutzt.
<Kurssprecher></Kurssprecher>
Anfangstag
Endtag
36 Attribute Elemente können mit Hilfe von Attributen näher beschrieben werden. Attribute können dabei zusätzliche Informationen über den Inhalt eines Elements liefern, ohne selbst Teil des Inhalts zu sein. Jedem Attribut muss ein bestimmter Wert zugewiesen werden, der in Anführungszeichen geschrieben wird.
Attribut
Attributwert
37 Prolog / Kommentare Ein XML-Dokument beginnt in der Regel mit dem Prolog <?xml ... ?>. Der Prolog kennzeichnet das Dokument als XML-Dokument.
Im Prolog kann der Zeichensatz festgelegt werden, der zur Kodierung benutzt wird. Fehlt die Angabe des Zeichensatzes, so wird utf-8 als Vorgabe benutzt.
<?xml version="1.0" encoding="iso-8859-1"?><Kurs> <!-- Organisation --> <Fach>Informatik</Fach> <Typ>Grundkurs</Typ> <Stufe>11</Stufe> <Bezeichner>11-in-1</Bezeichner> <Unterricht> <Einheit> <Tag>Montag</Tag> <Stunde>7</Stunde> <Raum>B04</Raum> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>3</Stunde> </Einheit> <Einheit> <Tag>Mittwoch</Tag> <Stunde>4</Stunde> </Einheit> </Unterricht> <!-- Personen --> ...
Prolog
Kommentare erleichtern das Verständnis und werden vom Browser mit angezeigt.
Kommentar
38 Wohlgeforme XML-Dokumente
Ein XML-Dokument, das alle Regeln von XML erfüllt, heißt wohlgeformt.
39 Anwendung - FilmXML
Aufgaben
(a) Recherchiere entsprechende Filmdaten auch zu anderen Filmen.
(b) Erstelle eine Liste mit den Informationen, die erfasst werden sollen.
(c) Entwickle ein XML-Dokument, mit dem die (gewünschten) Informationen über der Film "Titanic" adäquat dargestellt werden.
(d) Erstelle ein XML-Dokument mit der gleichen XML-Dokumentenstruktur zu einem weiteren Film.
(e) Öffne die XML-Dokumente mit einem Browser und teste auf diese Weise, ob sie wohlgeformt sind.
<?xml version="1.0" encoding="iso-8859-1"?><Film> <!-- Rahmendaten --> <Titel>Titanic</Titel> <Erscheinungsjahr>1997</Erscheinungsjahr> ... <!-- Darstellung der Figuren --> ...</Film>
40 Anwendung - FußballXMLAufgaben
(a) Recherchiere entsprechende Daten auch zu anderen Spielen.
(b) Erstelle eine Liste mit den Informationen, die erfasst werden sollen.
(c) Entwickle ein XML-Dokument, mit dem die (gewünschten) Informationen über das gezeigte Fußballspiel adäquat dargestellt werden.
(d) Erstelle ein XML-Dokument mit der gleichen XML-Dokumentenstruktur zu einem weiteren Fußballspiel.
(e) Öffne die XML-Dokumente mit einem Browser und teste auf diese Weise, ob sie wohlgeformt sind.
<?xml version="1.0" encoding="iso-8859-1"?><Fußballspiel> <!-- Rahmendaten --> <Heim>1. FC Kaiserslautern</Heim> <Gast>1. FSV Mainz 05</Gast>... </Fußballspiel>
41 Teil 3
XML-Dokumenttypen
42 Einheitliche Dokumentstruktur
43 Dokumenttypdefinition<?xml version="1.0" encoding="iso-8859-1"?><!ELEMENT Kurs (Fach, Typ, Stufe, Bezeichner, Unterricht, Lehrer, Schüler*)><!ELEMENT Fach (#PCDATA)><!ELEMENT Typ (#PCDATA)><!ELEMENT Stufe (#PCDATA)><!ELEMENT Bezeichner (#PCDATA)><!ELEMENT Unterricht (Einheit+)><!ELEMENT Einheit (Tag, Stunde, Raum?)><!ELEMENT Tag (#PCDATA)><!ELEMENT Stunde (#PCDATA)><!ELEMENT Raum (#PCDATA)><!ELEMENT Lehrer (Name, Vorname)><!ATTLIST Lehrer kürzel CDATA #REQUIRED geschlecht CDATA #REQUIRED> <!ELEMENT Name (#PCDATA)><!ELEMENT Vorname (#PCDATA)><!ELEMENT Schüler (Name, Vorname, Kurssprecher?)><!ATTLIST Schüler geschlecht CDATA #REQUIRED><!ELEMENT Kurssprecher EMPTY>
<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE Kurs SYSTEM "kurs.dtd">
<Kurs> ...</Kurs>
kurs.dtd
Einbindung der DTD
Dokumenttyp-definition
XML-Dokument
Eine Dokumenttypdefinition (kurz DTD) legt einen Dokumenttyp präzise fest.
Notepad++
44 Validierung eines XML-Dokuments
Ein XML-Dokument, das alle Festlegungen einer DTD erfüllt, heißt gültig bzw. valide bzgl. dieser DTD.
Man kann die Gültigkeit eines XML-Dokuments mit Hilfe spezieller Validierer überprüfen lassen. Ein XML-Validierer / XML-Parser ist ein Programm, das überprüft, ob das XML-Dokument die von der angegebenen DTD geforderte Struktur hat.
45 Exkurs - Dokumenttypdefinitionen
<!ELEMENT Kurs (Fach, Typ, Stufe, Bezeichner, Unterricht, Lehrer, Schüler*)><!ELEMENT Fach (#PCDATA)><!ELEMENT Typ (#PCDATA)><!ELEMENT Stufe (#PCDATA)><!ELEMENT Bezeichner (#PCDATA)><!ELEMENT Unterricht (Einheit+)><!ELEMENT Einheit (Tag, Stunde, Raum?)><!ELEMENT Tag (#PCDATA)><!ELEMENT Stunde (#PCDATA)><!ELEMENT Raum (#PCDATA)><!ELEMENT Lehrer (Name, Vorname)><!ATTLIST Lehrer kürzel CDATA #REQUIRED geschlecht CDATA #REQUIRED> <!ELEMENT Name (#PCDATA)><!ELEMENT Vorname (#PCDATA)><!ELEMENT Schüler (Name, Vorname, Kurssprecher?)><!ATTLIST Schüler geschlecht CDATA #REQUIRED><!ELEMENT Kurssprecher EMPTY>
DTD in automat.dtd
Eine Dokumenttypdefinition beschreibt den Aufbau eines XML-Dokuments aus Elementen sowie die Attributstruktur der Elemente.
Das Wurzelelement hat den Namen "Kurs".
Ein Element vom Typ "Kurs" besteht aus einer Folge/Sequenz aus Elementen: einem Element vom Typ "Fach" gefolgt von einem Element vom Typ "Typ" ... gefolgt von beliebig vielen Elementen vom Typ "Schüler".
Ein Element vom Typ "Fach" besteht aus Zeichen (parsed character data).
...
Ein Element vom Typ "Unterricht" besteht aus beliebig vielen Elementen (aber mindestens einem) vom Typ "Einheit".
Ein Element vom Typ "Einheit" besteht aus einer Folge/Sequenz aus Elementen: einem Element vom Typ "Tag" gefolgt von einem Element vom Typ "Stunde" evtl. gefolgt einem Element vom Typ "Raum".
...
Ein Element vom Typ "Lehrer" hat die Attribute "Name" und "Vorname", die beide nicht weggelassen werden können und deren Werte Zeichenketten sind.
...
Ein Element vom Typ "Kurssprecher" ist ein leeres Element.
46 Exkurs - Dokumenttypdefinitionen
Elementtyp-Deklaration
Operator Bedeutung
() Bildung von Elementgruppen
, Trennzeichen innerhalb einer Sequenz von Elementen
| Trennzeichen zwischen sich ausschließenden Alternativen
* Element(gruppe) kann beliebig oft (auch gar nicht) vorkommen
+ Element(gruppe) muss mindestens einmal, kann mehrfach vorkommen? Element(gruppe) kann einmal oder kein mal vorkommen
<!ELEMENT Name Inhaltsmodell> <!ELEMENT Kurs (Fach, Typ, Stufe, Bezeichner, Unterricht, Lehrer, Schüler*)><!ELEMENT Fach (#PCDATA)><!ELEMENT Typ (#PCDATA)><!ELEMENT Stufe (#PCDATA)><!ELEMENT Bezeichner (#PCDATA)><!ELEMENT Unterricht (Einheit+)><!ELEMENT Einheit (Tag, Stunde, Raum?)><!ELEMENT Tag (#PCDATA)><!ELEMENT Stunde (#PCDATA)><!ELEMENT Raum (#PCDATA)><!ELEMENT Lehrer (Name, Vorname)><!ELEMENT Name (#PCDATA)><!ELEMENT Vorname (#PCDATA)><!ELEMENT Schüler (Name, Vorname, Kurssprecher?)><!ELEMENT Kurssprecher EMPTY>
47 Exkurs - Dokumenttypdefinitionen
<!ELEMENT Einheit (Tag, Stunde, Raum?)>
Inhaltsmodell Beschreibung
Elementinhalt Das Element enthält ausschließlich Unterelemente.
<!ELEMENT Fach (#PCDATA)>
#PCDATA Das Element enthält nur Zeichendaten.
<!ELEMENT anrede (#PCDATA?, vormame, name)>
gemischter Inhalt
Das Element kann Zeichendaten und Unterelemente enthalten
<!ELEMENT Kurssprecher EMPTY>
EMPTY Das Element hat keinen Inhalt.
<anrede>Frau<vorname>Christiane</vorname><name>Meier</name></anrede>
<Einheit><Tag>Montag</Tag><Stunde>7</Stunde><Raum>B04</Raum></Einheit>
<Fach>Informatik</Fach>
<Kurssprecher/>
ANY Das Element kann beliebige Inhalte haben.
48 Exkurs - Dokumenttypdefinitionen<!ATTLIST Lehrer kürzel CDATA #REQUIRED geschlecht CDATA #REQUIRED>
Attributlisten-Deklaration
CDATA: nur einfache Zeichenketten erlaubt, keine Tags
...
#REQUIRED: Attributwert muss in jeder Elementinstanz vorkommen
#IMPLIED: Attributwert kann optional in einer Elementinstanz vorkommen
...
<!ATTLIST Elementname Attributname Attributtyp Vorgabewert Attributname Attributtyp Vorgabewert Attributname Attributtyp Vorgabewert ... >
49 Einbindung einer DTD
interne DTD
Eine Dokumenttypdefinition kann direkt in das XML-Dokument nach dem XML-Prolog eingebunden werden (interne DTD).
Eine Dokumenttypdefinition kann auch über eine Referenz auf eine Datei mit dem XML-Dokument verbunden werden (externe DTD).
Mit dem Schlüsselwort PUBLIC wird auf eine veröffentlichte DTD verwiesen.
Als Name der DTD wird der Name d. Wurzelelement benutzt.
<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE Kurs [...]>
<Kurs> ...</Kurs>
<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE Kurs SYSTEM "kurs.dtd">
<Kurs> ...</Kurs>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>...</html>
externe DTD
externe DTD
<!DOCTYPE Name [...]>
50
Anwendung – FilmXML / FussballXML
Aufgaben
(a) Entwickle eine geeignete Dokumenttypdefinition zur Beschreibung der Struktur gültigen FilmXML-Dokumente bzw. FussbalXML-Dokuments.
(b) Validiere selbst erstellte XML-Dokumente bzgl. Der festgelegten DTD.
51 Exkurs - Sprachen
Sprachen sind Zeichensysteme, die u. a. für Kommunikation genutzt werden.
Ido esas internaciona linguo kun poka polisemio sate konciza kreita da Louis de Beaufront en 1907 kom Esperanto reformita, adoptita internacione en Paris ye oktobro 1907, kom “idiomo helpanta internaciona”, da la Delegitaro (Délégation pour l’adoption d’une langue auxiliaire internationale).
http://io.wikipedia.org/wiki/Ido
<mrow> <mrow> <msup> <mi>x</mi> <mn>2</mn> </msup> <mo>+</mo> <mrow> <mn>4</mn> <mo>⁢</mo> <mi>x</mi> </mrow> <mo>+</mo> <mn>4</mn> </mrow> <mo>=</mo> <mn>0</mn> </mrow>
52 Lexik, Syntax, Semantik, Pragmatik
Aspekte von Sprachen:
Pragmatik: Lehre von der Verwendung sprachlicher Konstrukte in Handlungssituationen
Pragmatik: Lehre von der Verwendung sprachlicher Konstrukte in Handlungssituationen
Semantik: Bedeutungslehre
Bedeutung von Wörtern, Sätzen, ...
Semantik: Bedeutungslehre
Bedeutung von Wörtern, Sätzen, ...
Syntax: Lehre vom Satzbau
Regeln, nach denen Sätze gebildet werden
Syntax: Lehre vom Satzbau
Regeln, nach denen Sätze gebildet werden
Lexik: Lehre vom Wortschatz
Gesamtheit der Wörter der Sprache
Lexik: Lehre vom Wortschatz
Gesamtheit der Wörter der Sprache
53 Sprachfestlegung mit XML
<!DOCTYPE html [<!ELEMENT html (head, body)><!ELEMENT head (title)><!ELEMENT title (#PCDATA)><!ELEMENT body (h1 | p)+><!ELEMENT h1 (#PCDATA)><!ELEMENT p (#PCDATA | img | a)*><!ELEMENT img EMPTY><!ATTLIST img src CDATA #REQUIRED alt CDATA #REQUIRED><!ELEMENT a (#PCDATA)><!ATTLIST a href CDATA #REQUIRED >] >
Grammatik einer sehr einfachen Variante von HTML
XML ermöglicht es, mit Hilfe von DTD neue Sprachen formal festzulegen. Die DTD ist die Grammatik der betreffenden Sprache, dargestellt unter Verwendung der erweiterten Backus-Naur-Form.
"Die Erweiterte Backus-Naur-Form, kurz EBNF, ist eine Erweiterung der Backus-Naur-Form (BNF), die ursprünglich von Niklaus Wirth zur Darstellung der Syntax der Programmiersprache Pascal eingeführt wurde. Sie ist eine formale Metasyntax (Metasprache), die benutzt wird, um kontextfreie Grammatiken darzustellen." (wikipedia)
Recommended