38
Data Warehousing Data Warehousing Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel

Data Warehousing

  • Upload
    mura

  • View
    26

  • Download
    0

Embed Size (px)

DESCRIPTION

Data Warehousing. Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel. Agenda. Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit. Agenda. Begriffe Historie Anwendungsbereiche Aufbau eines DW-Systems OLAP vs. OLTP Fazit. Begriffe. - PowerPoint PPT Presentation

Citation preview

Page 1: Data Warehousing

Data WarehousingData Warehousing

Abgrenzung, Einordnung und Anwendungen

Sebastian Hentschel

Page 2: Data Warehousing

09. Juni 2005 2

Page 3: Data Warehousing

09. Juni 2005 3

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 4: Data Warehousing

09. Juni 2005 4

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 5: Data Warehousing

09. Juni 2005 5

BegriffeBegriffe

Definition nach Inmon (1996):

„A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management‘s decisions.“

William H. Inmon

Page 6: Data Warehousing

09. Juni 2005 6

BegriffeBegriffe

Definition nach Bauer/Günzel:

„Ein Data-Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“

Page 7: Data Warehousing

09. Juni 2005 7

BegriffeBegriffe

Definition nach Zeh:

„Ein Data-Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf zugrundeliegende Datenquellen ermöglicht.“

Page 8: Data Warehousing

09. Juni 2005 8

BegriffeBegriffe

Data WarehousePhysische DatenbankIntegrierte Sicht auf DatenHäufig historisierte DatenPeriodische Updates, aber keine

VeränderungenAusgangspunkt für OLAP und Data

Mining

Page 9: Data Warehousing

09. Juni 2005 9

BegriffeBegriffe

Unterschiede zu klassischen DBMS:– Zusätzlich Datenverdichtung,

Partitionierung, Redundanz– Anwendungssicht, Datensicht,

Entwicklungssicht siehe OLTP/OLAP

Page 10: Data Warehousing

09. Juni 2005 10

BegriffeBegriffe

Data Warehouse SystemeInformationssystemKomponenten zur Integration und

AnalyseStatischer Charakter

Page 11: Data Warehousing

09. Juni 2005 11

BegriffeBegriffe

Data WarehousingProsess zur Planung, zum Aufbau

und zum Betrieb eines DW-SystemsDynamischer Vorgang von der

Datenbeschaffung über das Speichern bis zur Analyse der Daten

Page 12: Data Warehousing

09. Juni 2005 12

BegriffeBegriffe

Data Mart„kleines“ Data Warehouseauf bestimmte Geschäftsprozesse

oder Problemstellungen bezogendezentralEinführung kostengünstiger und

schneller als DW

Page 13: Data Warehousing

09. Juni 2005 13

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 14: Data Warehousing

09. Juni 2005 14

HistorieHistorie

Triebfedern – Betriebswirtschaftliches Berichtswesen– Statistik– Integration

Page 15: Data Warehousing

09. Juni 2005 15

HistorieHistorie

1960er: Executive Information Systems (EIS) 1980er: Management Information Systems (MIS) 1988: EBIS-Architektur von IBM 1992: Einführung DW-Konzept (Inmon) 1993: OLAP (Codd) Heute: Business-Warehouse-Systeme bzw.

Business-Intelligence-Systeme

Page 16: Data Warehousing

09. Juni 2005 16

HistorieHistorie

Fehlende Voraussetzungen der Anfangszeit– Schnelle und flächendeckende

Kommunikationstechnologie– Grafische Benutzeroberflächen– Ausreichende, kostengünstige und schnelle

Datenspeicher– Kostengünstige und leistungsfähige

Prozessoren– Große Datenbasen durch integrierte operative

Systeme Scheitern der MIS-Ansätze der 60er, 70er, 80er

Page 17: Data Warehousing

09. Juni 2005 17

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 18: Data Warehousing

09. Juni 2005 18

AnwendungsbereicheAnwendungsbereiche

Betriebswirtschaft– Informationsbereitstellung zur

erfolgreichen Abwicklung von Geschäftsprozessen (Kennzahlen)

– Analyse zur Untersuchung von Abweichungen und Auffälligkeiten

– Planung– Kampagnenmanagement

Page 19: Data Warehousing

09. Juni 2005 19

AnwendungsbereicheAnwendungsbereiche

Wissenschaft (statistical and scientific databases)– Bsp. Project Earth Observing System

Technik– Umweltdaten, geografische Daten– Bsp. Wasseranalysen

Page 20: Data Warehousing

09. Juni 2005 20

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 21: Data Warehousing

09. Juni 2005 21

Aufbau eines DW-SystemsAufbau eines DW-Systems

Quelle: Uni Kaiserslautern

Page 22: Data Warehousing

09. Juni 2005 22

AufbauAufbau

DatenquellenMetadatenOLAP-ServerData Mining

Page 23: Data Warehousing

09. Juni 2005 23

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 24: Data Warehousing

09. Juni 2005 24

OLAP vs. OLAP vs. OLTPOLTP

OLTP: Online Transactional Processing– Operative Systeme (viele kurze

Transaktionen im Mittelpunkt)– Keine Redundanz, Normalisierung (reine

Lehre)– Aktueller Datenbankzustand– Bsp.: Flugbuchung– Ziel: viele TA pro sek, TA-Sicherheit bei

parallelen Anfragen, Minimierung der Antwortzeit

Page 25: Data Warehousing

09. Juni 2005 25

OLAPOLAP vs. OLTP vs. OLTP

OLAP: Online Analytical Processing– Informative Systeme– Große Anfragen– Redundanz notwendig– Historisierung– Tages-/Wochenaktualität ausreichend– Voraggregation– Bsp.: Getränkemarkt (Quelle: Sattler/Saake)– Ziel: Antwortzeit von wenigen sek

Page 26: Data Warehousing

09. Juni 2005 26

OLAPOLAP vs. OLTP vs. OLTP

SauflandSWerbung

Umsatz,Portfolio

Quelle: Sattler/Saake

Beispiel

Page 27: Data Warehousing

09. Juni 2005 27

OLAPOLAP vs. OLTP vs. OLTP

Anfragen– Wie viele Flaschen Cola wurden letzten

Monat verkauft?– Wie hat sich der Verkauf von Rotwein im

letzten Jahr in den Regionen entwickelt?– Wer sind unsere Top-Kunden?– Von welchem Lieferanten beziehen wir die

meisten Kisten?

Page 28: Data Warehousing

09. Juni 2005 28

OLAPOLAP vs. OLTP vs. OLTP

Anforderungen– Ständig neue Anfragen

(Gliederungsebenen, Fokus, …)– Schnelle Berichterstellung– Gleiche Antwortzeit für Standard- und Ad-

hoc-Anfragen– Keine Einbindung von IT-Abteilungen bei

neuer Anfragestruktur

Page 29: Data Warehousing

09. Juni 2005 29

OLAP vs. OLTPOLAP vs. OLTP

operativ informativ Typ/Zahl der Anwender

sehr viele Sachbearbeiter

wenige Manager, Controller

Transaktionen kurze Lese-/Schreibtransaktionen

nur Lesen

Struktur der Anfragen einfach komplex Anfragebereich wenige Datensätze viele Datensätze Zahl gleichzeitiger Zugriffe

sehr viele wenige

Datenquellen zentraler Datenbestand

Vielzahl heterogener Quellen

Eigenschaften der Daten

originär, zeitaktuell, dynamisch

abgeleitet, historisiert, integriert, stabil

Datenvolumen MB - GB GB - TB Antwortzeiten ms - s s - min

Page 30: Data Warehousing

09. Juni 2005 30

OLAP vs. OLTPOLAP vs. OLTP

OLTP

UPDATE Personal

SET Bonus = Bonus * 1.1,

Gehalt = Gehalt * 0.95

WHERE Name = ‘Meier‘;

UPDATE Kunden

SET Betreuer = ‘Meier‘

WHERE Name = ‘Huber‘;

COMMIT;

OLAP

SELECT MONTH(V.Datum),R.Region,P.Produktfamilie

FROM Verkäufe V ,Produkte P ,Regionen R

WHERE V.ProduktNr = P.ProduktNr

AND V.RegionNr = R.RegionNr

AND YEAR(V.Datum) = 2004

AND P.Produktfamilie = ‘Rotwein‘

GROUP BY MONTH(V.Datum), R.Region

Bsp. Anfragen

Page 31: Data Warehousing

09. Juni 2005 31

OLAPOLAP vs. OLTP vs. OLTP

Codd`sche Regeln1. Multidimensionale konzeptionelle Sicht2. Transparenz3. Zugriffsmöglichkeiten4. Konstante Antwortzeiten5. Client/Server-Architektur6. Generische Dimensionalität7. Dynamische Behandlung dünn

besetzter Matrizen

Ted Codd

Page 32: Data Warehousing

09. Juni 2005 32

OLAPOLAP vs. OLTP vs. OLTP

Codd`sche Regeln8. Mehrbenutzerunterstützung9. Kreuzdimensionale Operationen10. Intuitive Datenbearbeitung11. Flexible Berichterstellung12. Unbegrenzte Anzahl von Dimensionen

und Klassifikationshierarchien

1995 Erweiterung um 6 weitere Regeln

Page 33: Data Warehousing

09. Juni 2005 33

OLAPOLAP vs. OLTP vs. OLTP

FASMI (fast analysis of shared multidimensional information)– Geschwindigkeit– Analysemöglichkeit– Sicherheit– Multidimensionalität– Kapazität

Page 34: Data Warehousing

09. Juni 2005 34

AgendaAgenda

1. Begriffe

2. Historie

3. Anwendungsbereiche

4. Aufbau eines DW-Systems

5. OLAP vs. OLTP

6. Fazit

Page 35: Data Warehousing

09. Juni 2005 35

FazitFazit

„Wir ertrinken in Informationen und dürsten nach Einsicht.“

John Naisbitt

Page 36: Data Warehousing

09. Juni 2005 36

FazitFazit

DW kann helfenAber Einführung allein genügt nichtSorgfältige Planung, Kostenanalyse

und Nutzenabschätzung unumgänglichSonst Gefahr des Scheiterns

Dennoch immenses Marktwachstum

Page 37: Data Warehousing

09. Juni 2005 37

FazitFazit

Quelle: http://www. Olapreport.com

Page 38: Data Warehousing

09. Juni 2005 38

Vielen Dank für die Aufmerksamkeit…