Physische • einfache Suche Nachteile: • optionale Felder in jedem Satz • Felder variabler Lأ¤nge

  • View
    0

  • Download
    0

Embed Size (px)

Text of Physische • einfache Suche Nachteile: • optionale Felder in jedem Satz • Felder...

  • Datenmodellierung Physische Datenorganisation 1

    TU Wien

    tion

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Physische Datenorganisa

  • Datenmodellierung Physische Datenorganisation 2

    TU Wien

    Zielvorstellung

    Sätzen bestehen.

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Speichern von Dateien, die aus einzelnen

  • Datenmodellierung Physische Datenorganisation 3

    TU Wien

    INHALT

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    1. Sätze und Blöcke

    2. Arten der Primärorganisation

    3. Arten der Sekundärorganisation

    4. Speicherstrukturen für Relationen

    5. Join-Algorithmen

  • Datenmodellierung Physische Datenorganisation 4

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme TU Wien

    1. Sätze und Blöcke

    (a) Felder und Blöcke

    (b) Sätze mit konstanter bzw. variabler Länge

    (c) Aufteilung der Sätze auf Blöcke

    (d) Zugriff auf Sätze

  • Datenmodellierung Physische Datenorganisation 5

    TU Wien

    (a) Felder und Blöcke

    ür die physische

    en

    tensatz

    . 3

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Sätze bestehen aus Feldern und werden f Speicherung auf Blöcke verteilt.

    Blöcke bestehen aus:

    (a) Header: speichert Kontrollinformation

    (b) Teilblöcke: enthalten jeweils einen Da

    Header Teilb. 1 Teilb. 2 TeilbBlock

  • Datenmodellierung Physische Datenorganisation 6

    TU Wien

    (b) Sätze mit konstanter und variabler Länge

    4

    8

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Konstante Länge:

    Variable Länge:

    Satz 1 Satz 2 Satz 3 Satz

    Satz 5 Satz 6 Satz 7 Satz

    Block 1

    Block 2

    Satz 1 Satz 2 Satz 3 Satz 4

    Satz 5 Satz 6 Satz 7

    Block 1

    Block 2

  • Datenmodellierung Physische Datenorganisation 7

    TU Wien

    Sätze mit konstanter Länge

    ximaler Länge

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Vorteil:

    • einfache Suche

    Nachteile:

    • optionale Felder in jedem Satz

    • Felder variabler Länge müssen mit ma gespeichert werden

  • Datenmodellierung Physische Datenorganisation 8

    TU Wien

    Sätze mit variabler Länge

    gespeichert wer-

    erden

    ndig

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Vorteile:

    • Sätze unterschiedlicher Länge können den

    • Optionale Felder können gespeichert w

    Nachteile:

    • Fragmentierung, Reorganisation notwe (Defragmentierung)

    • Höherer Suchaufwand

  • Datenmodellierung Physische Datenorganisation 9

    TU Wien

    (c) Aufteilung der Sätze auf Blöcke

    Satz 4

    Satz 8

    P

    P

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Unspanned Records:

    Spanned Records:

    Satz 1 Satz 2 Satz 3

    Satz 5 Satz 6 Satz 7

    Block 1

    Block 2

    Satz 1 Satz 2 Satz 3 Satz 4

    Satz 4 (Rest) Satz 6 Satz 7

    Block 1

    Block 2

  • Datenmodellierung Physische Datenorganisation 10

    TU Wien

    Unspanned Records

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Vorteile:

    • Ein Satz ist in genau einem Block

    • Einfache Verwaltung

    Nachteile:

    • Satzlänge ≤ Blocklänge

    • Platzverlust

  • Datenmodellierung Physische Datenorganisation 11

    TU Wien

    (d) Zugriff auf Sätze

    sel

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Grundlegende Zugriffsarten:

    • Finden eines Satzes

    • Einfügen eines Satzes

    • Löschen eines Satzes

    Der Zugriff erfolgt

    • über den Schlüssel oder

    • über die vollständige Adresse oder

    • über die Blockadresse und den Schlüs

  • Datenmodellierung Physische Datenorganisation 12

    TU Wien

    Pinned Records

    r

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Seite Offset Meie

  • Datenmodellierung Physische Datenorganisation 13

    TU Wien

    Im Block verschiebbare Datensätze

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    SEITE SCHLÜSSEL

    MEIER MEIER

    HEADER

  • Datenmodellierung Physische Datenorganisation 14

    TU Wien

    Tuple Identifiers (TID’s - System R)

    z R

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    TID für R

    Sat

    Seite P

    Seite Nr.

    Position innerhalb der Seite

  • Datenmodellierung Physische Datenorganisation 15

    TU Wien

    Vereinfachende Annahmen

    hl von Feldern

    Zugriff auf Blöcke

    ltet unbenutzte

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    • Ein Satz besteht aus einer festen Anza

    • Schlüssel analog Relationenmodell

    • Blockzugriff über Blockadresse

    • Das Speicherverwaltungsystem bietet bestimmter Größe

    • Das Speicherverwaltungsystem verwa und gelöschte Blöcke

  • Datenmodellierung Physische Datenorganisation 16

    TU Wien

    Primär- und Sekundärorganisation

    auptdatei (en- truktur

    Zugriffsstruktur

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    • Primärorganisation: Organisation der H thält die Daten) und der Hauptzugriffss

    • Sekundärorganisation: Eine alternative neben der primären Zugriffsstruktur

  • Datenmodellierung Physische Datenorganisation 17

    TU Wien

    2. Arten der Primärorganisation

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    (a) Ungeordnete Dateien

    (b) Indexsequentiell

    (c) Clustered

    (d) Hashorganisation

    (e) B*-Baum

  • Datenmodellierung Physische Datenorganisation 18

    TU Wien

    (a) Ungeordnete Datei

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    • Einfügen

    • Suchen

    • Löschen

    6 3 5 4 18

  • Datenmodellierung Physische Datenorganisation 19

    TU Wien

    (b) Indexsequentiell

    nten Zugriff nach

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    2 Dateien:

    • Hauptdatei: enthält die Datensätze

    • Indexdatei: ermöglicht einen effizie dem Schlüssel

  • Datenmodellierung Physische Datenorganisation 20

    TU Wien

    Speicherungsalternativen - Hauptdatei

    .............

    .............

    .............

    .............

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    .............

    (a)

    (b)

    (c)

    .............

    .............

    .............

    .............

  • Datenmodellierung Physische Datenorganisation 21

    TU Wien

    Index

    atei, deren Sätze er Schlüsselwert w. die Block-

    atei (main file)

    ro Block → weni-

    Dateien) oder n)

    Abt. f. Datenbanken und Artificial Intelligence Institut für Informationssysteme

    Def.: Ein Index I zu einer Datei D ist eine D Paare der Form (vi,bi) darstellen, wobei vi d eines Satzes in D ist und bi die Adresse bz adresse dieses Satzes. D wird als Hauptd bezeichnet.

    Motivation:

    • Indexeintrag kleiner → mehr Einträge p ger Lesezugriffe → schnellere Suche!

    • Einsatz als Primärindex (bei sortierten Sekundärindex (bei unsortierten Dateie

  • Datenmodellierung Physische Datenorganisation 22

    TU Wien

    Einfügen - Indexsequentiell

    9

    Abt. f. Datenbanken und Artificial Intelligence Institut für Inf