16
© Andreas Meier, Universität Freiburg/Schweiz ETH Zürich, 31. August 2010 www.privacy-security.ch 1 Andreas Meier, Departement für Informatik, Universität Fribourg Folie 1 DW Data Warehousing – Funktionsweise, Einsatz- und Problemfelder Andreas Meier, Universität Fribourg Andreas Meier, Departement für Informatik, Universität Fribourg DW Cartoon Folie 2 Quelle: Knoll M., Meier A. (Hrsg): Web & Data Mining. Praxis der Wirtschaftsinformatik, HMD Nr. 268, August 2009, dpunkt Verlag, Heidelberg, Seite 2.

DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

1

Andreas Meier, Departement für Informatik, Universität Fribourg Folie 1

DW Data Warehousing – Funktionsweise, Einsatz- und Problemfelder

Andreas Meier, Universität Fribourg

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Cartoon …

Folie 2

Quelle: Knoll M., Meier A. (Hrsg): Web & Data Mining. Praxis der Wirtschaftsinformatik, HMD Nr. 268, August 2009, dpunkt Verlag, Heidelberg, Seite 2.

Page 2: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

2

Andreas Meier, Departement für Informatik, Universität Fribourg Folie 3

DW Inhaltsübersicht

•  Unterschiede zwischen OLTP und OLAP

•  Was versteht man unter einem Data Warehouse?

•  Wie wird ein Data Warehouse modelliert?

•  Welche Nutzungsfunktionen hat ein Data Warehouse?

•  Anwendungsfall I: Kundenbeziehungsmanagement mit Web Analytics

•  Anwendungsfall II: Medizinisches Communication Center

•  Welches sind die wichtigsten Problemfelder?

•  Welche Lösungsansätze bestehen?

•  Ausblick

Andreas Meier, Departement für Informatik, Universität Fribourg

DW OLTP versus OLAP

Folie 4

Page 3: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

3

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Definition eines Data Warehouse

Folie 5

«A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management’s decisions.»

Quelle: Inmon W. H.: Building the Data Warehouse. Wiley 2005

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Subject Orientation

Folie 6

Customer Becker Account 25 Product 532

Product 532 Supplier B Amount=43

Product 532 Supplier B Machine 3

Manufacturing

Sales

Operational Systems: process orientation

Inventory

Data Warehouse: subject orientation

Supplier

Customer

Product

Page 4: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

4

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Integration

Folie 7

Application A: Pipeline-centimeters

Application B: Pipeline-inches

Application C: Pipeline-feet

Application D: Pipeline-yards

Pipeline-cm

= Consistent Conversion

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Nonvolatility

Folie 8

read insert

delete

insert change

read only

read only

read only

Operational Systems: record by record / manipulation of data

Data Warehouse: periodic mass load / access of data

snap

shot

Page 5: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

5

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Time Variancy

Folie 9

Operational Systems: Data Warehouse:

•  time horizon - current or eventually 60 to 90 days

•  update of records •  key structure may/may not

contain an element of time

current data

•  time horizon - 5 to 10 years •  sophisticated snapshots of data •  key structure contains an element

of time (data is associated with specific time periods)

Andreas Meier, Departement für Informatik, Universität Fribourg

Architektur eines Data Warehouse

Folie 10

interne Quellen

externe Quellen

Daten- integration DATACUBE

Metadaten

Archiv

Daten- distribution

Data Warehouse

Werkzeuge für Abfragen u. Daten- analyse

Page 6: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

6

Andreas Meier, Departement für Informatik, Universität Fribourg

Beispiel eines mehrdimensionalen Würfels

Folie 11

Um- satz

Gebiet

Zeit

Produkt

Fakten: •  Umsatz

Dimensionen: •  Zeit •  Gebiet •  Produkt

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Definition von Fakten

Folie 12

Beispiele: •  Umsatz •  Produktionskosten •  Verkaufspreis •  Kundenwert •  Marktanteil •  Mitarbeiter-

zufriedenheit •  …

Fakten (Mass, Indikator, …) sind Kennzahlen für die Analyse und fürs Reporting. Oft sind es numerische Werte.

Fakten können aggregiert und mit der Hilfe der Zeitdimension für Trendanalysen verwendet werden.

Page 7: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

7

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Definition von Dimensionen

Folie 13

Dimensionen sind Auswertungsmerkmale für unterschiedliche Aggregationsstufen.

Beispiele: •  Zeit •  Produkt •  Gebiet •  Kunde •  Lieferant •  ...

1:m

1:1

Aggregationsstufen:

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Beispiel zweier Dimensionen

Folie 14

ZEIT

Jahr

Quartal

Monat

Tag

Woche

GEBIET

Land

Region

Stadt

Filiale

Page 8: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

8

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Sternschema definiert Data Warehouse

Folie 15

Produkt- kategorie

Produkt- linie

Produkt- gruppe

Artikel

DIMENSION Produkt

DIMENSIONGebiet Land

Region

Stadt

Filiale

DIMENSION Zeit Jahr

Quartal

Monat

Tag

Woche

985

FAKTENTABELLE Umsatz shop id day id

4562

Umsatz

€ 132.- 568

article id

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Die vier wichtigsten Operationen

•  Drill Down

•  Roll Up

•  Slicing und

•  Dicing

Folie 16

Page 9: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

9

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Drill Down und Roll Up

Folie 17

2001 2000

1999 ...

Bern

Genf

Zürich

… Vid

eo

Aud

io TV ...

Bahnhof

Bellevue

Juli Juni

Mai ...

Milchbuck

… Son

y

Met

z

Sam

sung

...

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Visualisierung in Tabellen

Folie 18

Page 10: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

10

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Slicing

Folie 19

CFO

alle Produkte und Gebiete während einer Zeitperiode

Area Manager alle Produkte zu beliebigen Zeiten für ein bestimmtes Gebiet

Product Manager alle Gebiete und Zeitabschnitte für ein bestimmtes Produkt

Produkt G

ebie

t

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Dicing

Folie 20

Gebiet

Zeit

Produkt

bevorzugte Dimensionen: Gebiet und Produkt

Gebiet

Zeit Produkt

bevorzugte Dimensionen: Gebiet und Zeit

Page 11: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

11

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Beispiel einer Dicing-Operation

Folie 21

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Nutzenpotenziale

•  Ein Data Warehouse ist für die Steuerung des Geschäfts unabdingbar.

•  Ein Data Warehouse lässt sich für unterschiedliche Dimensionen und Aggregationsstufen auswerten.

•  Ein Reporting ohne DW ist aus Sicht des Controllings kaum realistisch, da eine gemeinsame Datenbasis konsistent gehalten werden muss.

•  Auswertungen können bereichsübergreifend oder subjektorientiert vorgenommen werden.

•  Flexible Auswertungsfunktionen für den mehrdimensionalen Würfel erlauben den Führungskräften detaillierte Analysen.

•  Vergleiche, Analysen und Prognosen mit Zeitbezug sind machbar.

•  Operative Systeme werden entlastet.

Folie 22

Page 12: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

12

Andreas Meier, Departement für Informatik, Universität Fribourg Folie 23

DW Inhaltsübersicht

•  Unterschiede zwischen OLTP und OLAP

•  Was versteht man unter einem Data Warehouse?

•  Wie wird ein Data Warehouse modelliert?

•  Welche Nutzungsfunktionen hat ein Data Warehouse?

•  Anwendungsfall I: Kundenbeziehungsmanagement mit Web Analytics

•  Anwendungsfall II: Medizinisches Communication Center

•  Welches sind die wichtigsten Problemfelder?

•  Welche Lösungsansätze bestehen?

•  Ausblick

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Definition von Web Analytics

Folie 24

“Web Analytics is the measurement, collection, analysis and reporting of Internet data for the purposes of understanding and optimizing Web usage.”

Quelle: Web Analytics Association, siehe http://www.webanalyticsassociation.org

Page 13: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

13

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Kreislauf für das Kundenbeziehungsmanagement

Folie 25

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Definition medizinisches Communication Centers

Folie 26

“Ein medizinisches Communcation Center bietet der Bevölkerung Demand-, Disease- und Case-Management über unterschiedliche Kommunikationskanäle an.”

Quelle: Ionas A.: Modellierung, Entwicklung und Nutzung eines Data Warehouse für medizinische Communication Centers. Dissertation, Universität Fribourg, 2008 (als eThesis verfügbar)

Page 14: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

14

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Dienstleistungen eines MCC

Folie 27

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Problemfelder

•  Ein DW enthält alle entscheidungsrelevanten Informationen einer Organisation und muss speziell geschützt werden.

•  Ein differenziertes User Management (wer hat auf welche Daten welchen Zugriff) ist aufwendig und muss laufend kontrolliert werden.

•  Mit Web Analytics lassen sich Kundenprofile herstellen und das Kundenverhalten voraussagen (z.B. für absprunggefährdete Kunden).

•  Kundengruppen und Kundennetzwerke erlangen dank neueren Webtechnologien (Stichwort Web 2.0 resp. Web 3.0) an Macht.

•  Unterschiedliche Länder resp. Regionen haben unterschiedliche Datenschutzbestimmungen. Dies ist im Global Village eine besondere Herausforderung, die noch nicht gelöst ist ….

Folie 28

Page 15: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

15

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Lösungsansätze 1.  Geschäftsrelevante Daten im Land des Domizils speichern.

2.  Identifikation, Authentifikation und Autorisierung aller Anspruchsgruppen regeln.

3.  Datenmanagement mit Datenarchitektur, Datenadministration und Datentechnik organisatorisch verankern.

4.  Datenschutzbeauftragte im Unternehmen bei der Revision resp. beim Controlling ansiedeln (Vieraugenprinzip).

5.  Deklarationspflicht für personenbezogene Daten (Umfang, Dauer) auch auf Websites wahrnehmen.

6.  Technische Sicherheits- und Backup-Systeme nutzen und regelmässig auf Tauglichkeit testen.

7.  Kryptographische Verfahren für Speicherung und Übermittlung von Daten anwenden.

Folie 29

Andreas Meier, Departement für Informatik, Universität Fribourg Folie 30

CobiT = Control Objectives for Information and Related Technology

ISACA = Information Systems Audit and Control Association

DW Framework CobiT für Ordnungsmässigkeit verwenden

Page 16: DW Data Warehousing – Funktionsweise, Einsatz- und ... · 3 Andreas Meier, Departement für Informatik, Universität Fribourg DW Definition eines Data Warehouse Folie 5 «A data

© Andreas Meier, Universität Freiburg/Schweiz

ETH Zürich, 31. August 2010 www.privacy-security.ch

16

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Ausblick

Die Informations- und Wissensgesellschaft ist auf die Nutzung von Internet-

technologien angewiesen. Auch hier gilt im Sinne von Immanuel Kant:

Folie 31

“Handle nur nach derjenigen Maxime, durch die du zugleich möchtest, dass sie ein allgemeines Gesetz werde”.

Die fünf Dimensionen ethischen Handelns nach Laudon/Laudon

Andreas Meier, Departement für Informatik, Universität Fribourg

DW Literaturangaben

•  Bauer A., Günzel H.: Data-Warehouse-Systeme – Architektur, Entwicklung, Anwendung. dpunkt 2008

•  Gabriel R., Gluchowski P., Pastwa A.: Datawarehouse und Data Mining. W3L-Verlag 2009

•  Inmon W. H.: Building the Data Warehouse. Wiley 2005

•  Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.: Fundamentals of Data Warehouses. Springer 2000

•  Kimball R., Ross M.: The Data Warehouse Toolkit. Wiley 2002

•  Meier A.: Relationale und postrelationale Datenbanken. Springer 2010

Weitere Angaben unter

•  Forschungsgruppe Information Systems http://diuf.unifr.ch/is

•  Forschungszentrum Fuzzy Marketing Methods http://www.FMsquare.org

Folie 32