28
MARKTÜBERSICHT Business-Intelligence-Werkzeuge Marktübersicht Open-Source-Werkzeuge aus dem Bereich Business Intelligence Abb. © Dreaming Andy - Fotolia.com

Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Embed Size (px)

Citation preview

Page 1: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

MARKTÜBERSICHT

Business-Intelligence-WerkzeugeMarktübersicht Open-Source-Werkzeuge aus dem Bereich Business Intelligence

Abb. © Dreaming Andy - Fotolia.com

Page 2: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Impressum

HerausgebereBusiness-Lotse Oberschwaben-Ulmwww.eloum.net

c/o Hochschule Ravensburg-Weingarten Doggenriedstraße88250 WeingartenTelefon: +49 (0) 751 501-0

Verantwortlicher Redakteur Prof. Dr. Wolfram Höpken Lazarettstr. 1 88250 Weingarten Telefon: +49 (0) 751 4917 [email protected]

AutorDimitri Keil StandJanuar 2015

Träger

Partner

2

Page 3: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Inhalt

1. Einleitung .................................................................. 4

2. Vorauswahl ............................................................... 6

3. Überblick .................................................................. 7

4. Berichtswesen .......................................................... 9

4.1 BIRT ...............................................................11

4.2 SQL Power Wabit ..........................................12

5. ETL ..........................................................................14

5.1 Pentaho Data Integration (Pentaho DI) ..........15

5.2 Talend Open Studio .......................................16

5.3 Jaspersoft ETL ..............................................16

6. OLAP .......................................................................17

6.1 Mondrian ........................................................18

6.2 Jedox .............................................................19

7. Data Mining ............................................................. 20

7.1 KNIME ............................................................21

7.2 RapidMiner .................................................... 22

7.3 Weka ............................................................. 23

8. Integrierte BI-Lösungen ........................................ 24

8.1 Jaspersoft ..................................................... 24

8.2 Pentaho ........................................................ 25

8.3 SpagoBI ........................................................ 26

9. Fazit ........................................................................ 27

eBusiness-Lotse Oberschwaben-Ulm ....................... 28

3

Page 4: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

1. Einleitung

Business Intelligence (BI) ist heute ein vielfach verwendeter Begriff in der Wirtschaft. Er fasst die Analyse geschäftsrelevanter Daten zur Ver-besserung operativer und strategischer Ent-scheidungen zusammen. Es geht also um das Sammeln, Auswerten und Darstellen von ent-scheidungsrelevanten Daten.

Dieses Dokument soll kleinen und mittelständi-schen Unternehmen (KMU) dabei helfen, sich einen Überblick über die für sie geeigneten Werkzeuge im Bereich Business Intelligence zu verschaffen. Schritt für Schritt werden die Werk-zeuge in den folgenden Kapiteln in derselben Reihenfolge vorgestellt, wie sie auch in einem konkreten BI-Projekt eingesetzt werden. Abge-schlossen wird die Marktübersicht mit einer kur-zen Vorstellung von Anbietern von integrierten BI-Lösungen, welche das gesamte BI-Spektrum abdecken.

Die einzelnen Kapitel hängen hierbei nicht zwangsläufi g voneinander ab, sondern können auch separat gelesen werden. Sind also Vor-

kenntnisse vorhanden bzw. besteht beispiels-weise der Wunsch, lediglich Unterstützung bei der konkreten Auswahl einer Software-Lösung in einer der Teildisziplinen zu erhalten, so ist es ohne weiteres möglich, direkt in dem ent-sprechenden Kapitel einzusteigen. Für einen leichteren Einstieg in das Thema BI sowie die einzelnen Teildisziplinen wird Lesern ohne Vor-kenntnisse jedoch die Orientierung entlang der Kapitelstruktur empfohlen.

BI beginnt schon bei der Datenintegration, also dem Zusammenführen der Daten aus allen möglichen Quellen. Zunächst besteht die größte Herausforderung darin, überhaupt Datenquellen im Unternehmen zu identifi zieren, deren Aus-wertung einen ganz konkreten Nutzen gene-riert. Das automatische und unternehmensweit einheitliche Erfassen geschäftsrelevanter Daten mittels komplexer IT-Systeme ist für kleine und mittelständische Unternehmen nicht bezahlbar.

Abb. © NAN - Fotolia.com

4

Page 5: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Häufig werden diese Informationen stattdessen von mehreren Mitarbeitern separat unter Ver-wendung unterschiedlicher Software erfasst. In der Folge unterscheiden sich die abgeleg-ten Informationen in Form und Inhalt. Durch die manuelle Erfassung sind die Informatio-nen außerdem oft unvollständig und fehlerhaft. Die Bereinigung und Zusammenführung sol-cher Datenbestände ist sehr aufwändig und verursacht hohe Kosten. Es ist daher zwingend erforderlich, sich im Einzelfall für jedes Unter-nehmen genau zu überlegen, welche Daten für die Geschäftstätigkeit wichtig sind und in wel-cher Form diese in Zukunft erfasst und gespei-chert werden sollen.

Hierfür sollten aber zunächst die Geschäftspro-zesse sowie die unterstützenden Informations- und Kommunikationssysteme analysiert und bei Bedarf entsprechend angepasst werden. Neben Informationen zu internen Geschäftsprozes-sen wie der Produktion oder dem Vertrieb kön-nen hier auch externe Informationen wie Ver-änderungen von Rohstoffpreisen an der Börse relevant sein. Neben der reinen Verfügbarkeit der Daten ist aber auch deren Qualität eine ent-scheidende Voraussetzung für die erfolgreiche Durchführung eines BI-Projekts und auch diese muss gegebenenfalls durch Anpassungen in den IT-Systemen sichergestellt werden.

Stehen nun die Daten in hinreichend guter Qua-lität zur Verfügung, können diese je nach einge-setzter BI-Software direkt für die Analyse ver-wendet werden. Dazu müssen diese zunächst aus den IT-Systemen extrahiert, in ein einheit-liches Format gebracht und in einen zentralen Datenbestand, ein Data Warehouse, geladen werden. Sogenannte ETL-Werkzeuge unterstüt-zen den Nutzer dabei, genau diese Herausfor-derungen erfolgreich zu meistern.

Erst nach einer solchen Integration der Quell-daten in einen zentralen Datenbestand kön-nen Berichts- sowie kennzahlengetriebene Planungs-, Kontroll- und Entscheidungsunter-stützungssysteme auf den Daten aufsetzen und für den entscheidenden Wissensvorsprung sor-gen. Neben Übersichten der wichtigsten Kenn-zahlen ermöglichen BI-Werkzeuge über das sogenannte OLAP dann auch die flexible Ana-lyse der verfügbaren Quelldaten. So lassen sich

beispielsweise Umsätze gruppiert nach unter-schiedlichen Merkmalen (z.B. Produktgruppen oder Regionen) sowie über einen festgelegten Zeitraum übersichtlich und schnell anzeigen.

Darüber hinaus bietet das sogenannte Data Mining tiefergehende Analysemöglichkeiten auf Basis der vorhandenen Daten. So lassen sich beispielsweise Cross-Selling-Potenziale identi-fizieren oder auch Kundensegmente auf Basis der Verkaufsvorgänge erstellen. Diese Art der Datenauswertung ermöglicht kürzere Reakti-onszeiten auf Änderungen am Markt und stellt somit einen deutlichen Wettbewerbsvorteil dar.

Ein Data Warehouse ist eine Sammlung von Daten aus unterschiedlichen Quellen, die in einer vordefi-nierten Struktur abgespeichert werden und so einen einheitlichen Zugriff auf die vorhandenen Daten erlaubt.

Unter ETL (Extraction, Transformation und Load) versteht man einen Prozess, bei dem Daten aus einem oder mehreren Quellsystemen in das entspre-chende Format und die Struktur einer Zieldatenbank (meist ein Data Warehouse) transformiert und gela-den werden. Beispiele können die Datumsformatie-rung oder Umrechnung von Maßeinheiten sein. Auch die Anreicherung von Daten wie etwa Schufa-Aus-kunftsdaten fallen in diesen Bereich.

Unter OLAP (On-Line Analytical Processing) ver-steht man das flexible Betrachten einer oder mehre-rer Kennzahlen gruppiert nach beliebig vielen Merk-malen. Mehr Informationen zum Thema erhalten Sie in Kapitel 5 dieser Marktübersicht.

Unter Data Mining versteht man die tiefergehende Analyse von Daten hinsichtlich der Erkennung von Mustern oder Trends. Mittels Methoden des Data Mining lassen sich Wechselwirkungen und Bezie-hungen innerhalb der Daten ermitteln. So kann bei-spielsweise erklärt werden, warum Kunden einen Vertrag kündigen oder mit einem Produkt unzufrie-den sind oder welche Produkte von Kunden häufig gemeinsam gekauft werden (Warenkorbanalyse).

Einleitung

5

Page 6: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Mittlerweile wird eine Vielzahl von Werkzeu-gen im Bereich BI eingesetzt. Im folgenden Abschnitt wird deshalb eine Auswahl von Werk-zeugen vorgestellt, die sich für KMU bzw. einen ersten Einsatz besonders eignen. Ein geringer Einarbeitungsaufwand und Komplexitätsgrad stehen hierbei bei der Auswahl im Vordergrund.

Software im Bereich BI steht sowohl als kom-merzielle als auch als Open Source-Vari-ante zur Verfügung. Dabei gibt es Anbieter, die von einzelnen Schwerpunktthemen bis hin zu umfangreichen Komplettlösungen alle Berei-che abdecken. In einigen Branchen ist aber auch der Einsatz unternehmensweiter oder gar unternehmensübergreifender Software weit verbreitet. Ein Beispiel für ein solches Pro-dukt stellen die Enterprise-Ressource-Plan-ning-Systeme (ERP) dar. Diese meist modular aufgebauten Lösungen bieten heute zusätzli-che Funktionalitäten im Bereich BI an bzw. ver-fügen zumindest über Schnittstellen zur Integra-tion verschiedenster Zusatzmodule desselben Herstellers, aber auch von Drittanbietern. Diese Lösungen sowie kommerzielle BI-Werkzeuge allgemein haben allerdings eine Gemeinsam-keit: die Lizenzkosten für den Betrieb sowie die regelmäßig anfallenden Zusatzkosten in Form von Release-Wechseln, Wartung und Sup-port bewegen sich oft in Regionen, die für KMU nicht bezahlbar sind.

Kommerzielle Software versus Open Source

Etablierte kommerzielle Software zeichnet sich in der Regel durch eine hohe Beständigkeit und Zuverlässigkeit aus, ist aber oftmals mit hohen Kosten verbunden. Open-Source-Produkte hin-gegen stehen typischerweise kostenlos zur Ver-fügung, können jedoch jederzeit aufgekauft und kommerzialisiert oder durch die Einstellung der Weiterentwicklung auch komplett vom Markt verschwinden. Unzureichende oder auch veral-tete Dokumentation führt darüber hinaus beim Einsatz von Open-Source-Software oftmals zu Problemen und kann im Einzelfall sogar die geplante Realisierung der eigenen Anwendung unmöglich machen. Der in der Regel ange-botene Premium-Support als „letzte Rettung“ des eigenen Projekts ist meist relativ teuer und macht die beabsichtige Kostenersparnis gegen-

über kommerzieller Software schnell zunichte. Bei der Auswahl eines Open-Source-Werk-zeugs sollte man sich deshalb immer vorab informieren, inwieweit eine vollständige Doku-mentation zur aktuell verfügbaren Version der Software vorliegt.

Auch für den Bereich BI existiert eine Vielzahl an Open Source Software, sowohl für einzelne Themenbereiche wie beispielsweise die Daten-integration, das Data Warehousing oder Data Mining als auch integrierte Gesamtlösungen. Die Basisvarianten decken überwiegend alle Grundfunktionalitäten im jeweiligen Themen-gebiet ab und sind meist um Spezialmodule für besondere Aufgabenstellungen erweiterbar.

Zusammenfassend lässt sich festhalten, dass etablierte kommerzielle Software im Bereich BI zwar durchaus seine Vorzüge hat (mehr Funk-tionen, verlässlichere Verfügbarkeit), allerdings durch die hohen Kosten nur für wenige KMU infrage kommt. Open-Source-Lösungen hin-gegen bieten für KMU den idealen Einstieg in das BI-Umfeld, da Basisfunktionalitäten kos-tenlos zur Verfügung stehen und somit die Ein-stiegshürden minimal ausfallen. Die vorliegende Marktübersicht beschränkt sich daher auf gän-gige Open-Source-Software im Bereich BI und wird kommerzielle Software nicht berücksichti-gen.

Open-Source-Software im Bereich BI

► Im vollen Funktionsumfang ohne zeitliche Beschränkung kostenlos nutzbar

► Alle Schwerpunktthemen im Bereich BI abgedeckt

► Oftmals Erweiterungen für spezielle Aufga-benstellungen vorhanden

► Community-Forum für Fragen und Antwor-ten verfügbar

► In der Regel gut integrierbar in bestehende IT-Infrastruktur

► Open Source Werkzeuge für unterschied- liche Themenbereiche können in der Regel flexibel kombiniert werden

2. Vorauswahl

6

Page 7: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Tabelle 1: Funktionsmatrix - Übersicht BI-Werkzeuge

3. Überblick

Die Funktionsmatrix in Tabelle 1 gibt einen Überblick über die Einsatzmöglichkeiten ver-schiedener BI-Werkzeuge. In den folgenden Kapiteln werden die Open-Source-Werkzeuge vorgestellt und weiterführende Informationen zu den BI-Themen ETL, OLAP, DataMining und dem Berichtswesen sowie zu integrierten BI-Lö-sungen gegeben.

Software Rohdaten extrahieren

Rohdaten transfor-mieren

Trans- formierte

Daten laden

OLAP Data Mining Dashboards Berichte

Pentaho DI X X X

Talend OS X X X

Jasper ETL X X X

Mondrian X X X

Jedox X X X X

BIRT X X X

SQL Power W X X X X

KNIME X X X X X X

RapidMiner X X X X X X X

Weka X X X X

JasperSoft X X X X X X

Pentaho X X X X X X X

SpagoBI X X X X X X X

Neben der Funktionsmatrix sollen zusätzliche, allgemeine Hinweise den Einstieg erleichtern. Diese umfassen neben allgemeinen Syste-manforderungen auch eine Bewertung wichti-ger anderer Faktoren wie unter anderem den Umfang der Dokumentation oder auch den Grad an Aktivität innerhalb der User-Communi-ties einzelner Werkzeuge.

7

Page 8: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

alle wichtigen Einstiegsinformationen für Nutzer des Werkzeugs enthalten sollte. Oft sind diese Dokumentationen nur auf Englisch verfügbar und erhöhen somit den Einarbeitungsaufwand. Bei der Installation und bei dem Punkt Usabi-lity schneiden die Werkzeuge meist gut bis sehr gut ab und sind somit auch für Einsteiger in das Thema Business Intelligence zu empfehlen.

*) Siehe Talend OS Dokumentation

Bewertung

Es folgt eine Bewertung der einzelnen BI-Werk-zeuge anhand wichtiger Kriterien, die neben der reinen Funktionalität für die Auswahl eines Werkzeugs entscheidend sein können. Als Nut-zerprofil wird von einem IT-affinen Mitarbei-

Software Community Dokumentation Installation UsabilityETL

Pentaho DI *** * * **Talend OS *** * *** **Jasper ETL *** *) * **

OLAP

Mondrian ** * * *Jedox ** *** *** ***

Berichtswesen

BIRT *** * * ***SQL Power W * * *** **Data Mining

KNIME *** * *** *RapidMiner *** *** *** *

Weka ** * *** * Integrierte BI-Lösungen

JasperSoft *** * *** **Pentaho *** * * **SpagoBI *** * *** **

ter ausgegangen, der sicher im Umgang mit gängigen Büroanwendungen ist und darü-ber hinaus über grundlegende Erfahrungen im Bereich Datenbanken verfügt.

Die Bewertungsmatrix zeigt deutlich, dass fast alle aufgeführten Werkzeuge durch eine starke und aktive Community begleitet werden. In Wikis und Foren findet man schnell Antwor-ten auf die häufigsten Fragen. Der Punkt Doku-mentation hingegen ist bei fast allen Werkzeu-gen schlecht bewertet worden. Dies ist vor dem Hintergrund wichtig, dass die Dokumentation

Bewertungskriterien für Sternevergabe in aufsteigender Reihenfolge:

Community: Forum vorhanden, Wiki vorhanden, Zahl der diskutierten Beiträge im Forum, zusätzliche Funktionalität im Werkzeug (Marketplace etc.) Dokumentation: Handbuch (u.a. auf Deutsch) verfügbar, Tutorials als Video vorhanden, Tutorials vom Hersteller oder anderen Personen vorhanden Installation: Manuelle Installation und Konfiguration bzw. Installationsroutine mit entsprechenden Bildschirmanweisungen vorhanden Usability: Hilfe- und Hinweis-Funktionen vorhanden, gute Benutzerführung, für Business-Anwender geeignet

Tabelle 2: Bewertungsmatrix der ausgewählten Open Source BI-Tools

8

Überblick

Page 9: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

4. Berichtswesen

Im Berichtswesen werden Daten übersichtlich dargestellt. Neben klassischen Monats-, Quar-tals- und Jahresberichten schließt dieser Be-reich auch das ad-hoc-Berichtswesen ein. Da-bei können nicht nur relevante Informationen in Echtzeit bereitgestellt, sondern über Filteroptio-nen auch tiefergehende Details dargestellt wer-den. Abb. 1a zeigt einen einfachen Bericht zu Umsätzen je Produkt. In der Darstellung Abb. 1b auf der nächsten Seite ist ein Dashboard zu sehen, das wesentliche Kennzahlen zur Unter-nehmenssteuerung in verschiedenen Diagram-men zusammenfasst.

Abb. 1a: Beispiele für einfache Berichte (mit freundlicher Genehmigung der Eclipse Foundation)

ad-hoc Berichtswesen: Über ein ad-hoc Berichts-wesen werden dem Nutzer nicht nur die für ihn rele-vanten Informationen in Echtzeit bereitgestellt, son-dern er kann über Filteroptionen auch ins Detail gehen und so Zusammenhänge zügig erschließen. Solche Systeme erlauben oft das IT-unterstützte Ver-teilen der Informationen, egal ob über eine E-Mail-Push-Funktion, eine Exportfunktion der Daten in andere Office-Programme oder auch in andere For-mate wie PDF.

9

Page 10: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Abb. 1b: Beispiel eines Dashboards (mit freundlicher Genehmigung der Eclipse Foundation)

In einem Dashboard werden alle Informationen, die zur Planung, Steuerung und Kontrolle eines Unter-nehmens notwendig sind, in geeigneter Form zusam-mengefasst. Analog zur Instrumententafel von Maschinenanlagen oder auch dem Armaturenbrett in einem Kraftfahrzeug sollte ein Dashboard dem-nach neben gängigen finanzorientierten Kennzahlen alle weiteren Schlüsselindikatoren beinhalten, um ein Unternehmen weiter ‚auf Kurs‘ zu halten.

Wie ein solches Dashboard gestaltet ist, wem es zur Verfügung steht und ob es lediglich statische Infor-mationen enthält oder sich durch Nutzerinteraktion dynamisch verändert, das hängt am Ende von den Wünschen und Bedürfnissen der jeweiligen Unter-nehmensführung ab.

Berichtswesen

10

Page 11: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

4.1 BIRT

Die gemeinnützige Gesellschaft Eclipse stellt mit BIRT (Business Intelligence and Repor-ting Tools) ein Open-Source-Werkzeug für den Bereich Berichtswesen bereit.

Über den „BIRT Report Designer“ lassen sich Berichte jeder Art erstellen. Zunächst müssen Datenquellen konfiguriert werden. Hier können alle gängigen Datenbanksysteme oder Datei-formate wie z.B. CSV-Dateien als Datenbasis dienen (Abb. 2/1). Das Design des Berichtes kann beliebig auf das Unternehmen ange-passt werden (Farben, Abstände, Rahmen etc.). Der konkrete Bericht wird dann erstellt, in dem die gewünschten Bausteine wie Tabellen oder Grafiken (Abb. 2/2) im Arbeitsbereich wie gewünscht angeordnet werden (Abb. 2/3).

Die Pflichtparameter für jeden Baustein des Berichtes werden nach deren Platzierung über eine unmittelbare Eingabeaufforderung durch das Programm erfragt, was nur ein Beispiel für die gute Nutzerführung in der Software darstellt. Neben klassischen Berichten mit Firmenlogo, Adressbereich und tabellarischer Darstellung von Inhalten lassen sich auch ganze Dash-boards mit Grafiken auf Basis von Inhalten aus einem Data Warehouse erzeugen (vgl. Fehler! Verweisquelle konnte nicht gefunden werden.). Exportieren lassen sich die Berichte am Ende natürlich auch, so zum Beispiel als Word-, Pow-erpoint- und PDF-Dokument oder als HTML-Do-kument zur Einbettung in Webseiten (Abb. 2/4).

Abb. 2: BIRT Oberfläche (mit freundlicher Genehmigung der Eclipse Foundation)

11

Berichtswesen

Page 12: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

4.2. SQL Power Wabit

Das Reporting-Werkzeug SQL Power Wabit dient primär der intuitiven Erstellung von Berich-ten auf Basis von Datenbankabfragen. Hierfür sollte im besten Fall eine Verbindung zum eige-nen Data Warehouse hergestellt werden. SQL Power Wabit kommt aber auch mit OLAP-Wür-feln zurecht. Voraussetzung ist, dass neben der Datenbankverbindung eine Beschreibung der Datenstruktur bereitgestellt wird.

Anschließend lassen sich beliebige Daten-banktabellen aus einem Auswahlbereich heraus (Abb. 3/1) per Drag&Drop in den Arbeitsbereich ziehen (Abb. 3/2). Dort wird dem Nutzer gra-fisch angezeigt, über welche Attribute die ein-zelnen Tabellen verfügen und wie diese mitein-ander verknüpft sind. Nun können genau die At-tribute ausgewählt werden, welche später auch im Bericht dargestellt werden sollen. Zusätzlich lassen sich Filter für die Attributswerte setzen, wahlweise wiederum innerhalb der grafischen Darstellung oder über einen Editor. Die Syntax innerhalb des Editors richtet sich nach dem je-

weils vorliegenden Datenbankmanagementsys-tem (Beispiel MySQL).

Unter der Arbeitsfläche werden dem Nutzer die ausgewählten Daten in Form einer Ergebnista-belle angezeigt (Abb. 3/3). Die Ergebnistabelle reagiert dabei automatisch auf jede Änderung durch den Nutzer. Möchte man abschließend die Ergebnistabelle direkt in einen Bericht um-wandeln bzw. daraus eine Grafik erstellen, nutzt man eine der Schaltflächen über dem Arbeits-bereich (Abb. 3/4).

Neue Elemente wie z.B. Berichte oder Dia-gramme werden über einen Rechtsklick auf den jeweiligen Ordner (Bsp. ‚Templates‘ für Berichtsvorlagen) angelegt (Abb. 3/5). Alle Ergebniselemente – also Datenbankabfragen als Tabellen, daraus erzeugte Grafiken sowie eigene Bilder – können innerhalb der Berichts-erstellung per Drag&Drop in den Bericht gezo-gen werden.

Abb. 3: SQL Power Wabit Oberfläche (mit freundlicher Genehmigung der SQL Power Group Inc.)

12

Berichtswesen

Page 13: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

chende Information muss in diesem Fall natür-lich über die Datenbank hinterlegt sein. Ist man mit dem Ergebnis zufrieden, können die Berichte gedruckt bzw. als PDF-Datei exportiert werden.

Die Inhalte sowie eigene Grafiken können dabei bearbeitet und angepasst werden. Neben der Position und Größe der Inhaltselemente können Ergebnisse aus Datenbankabfragen durch Filter ergänzt werden. Umsatzzahlen lassen sich auf diese Weise zusätzlich nach dem Geschäfts-jahr bzw. anderen Kriterien filtern. Die entspre-

Abb. 4: SQL Power Wabit - Beispiel-Bericht in Form einer PDF-Datei (mit freundlicher Genehmigung der SQL Power Group Inc.)

13

Berichtswesen

Page 14: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Unter ETL (Extraction, Transformation und Load) sind alle Werkzeuge für das Extrahie-ren, Transformieren und Laden von Roh- bzw. Quelldaten zusammengefasst. Diese Teildiszi-plinen sollen kurz näher beschrieben werden, da sie in der Übersichtsmatrix separat aufge-führt sind.

Extrahieren

Der erste Schritt des ETL-Prozesses befasst sich mit dem Extrahieren relevanter Daten aus unterschiedlichen Datenquellen, um diese für weitere Schritte verfügbar zu machen. Dies können strukturierte Datenquellen wie Daten-banken (z.B. MySQL, MS SQL Server, Oracle) oder verschiedene Dateiformate (z.B. CSV, Excel, XML, usw.) sein, oder auch unstruktu-rierte bzw. teilweise strukturierte Datenquellen in Form von Freitexten oder HTML-Dokumen-ten.

Transformieren

Die Transformation hat zum Ziel, die zu analy-sierenden Daten in eine Form zu bringen, in der sie später durch Analysewerkzeuge bestmög-lich ausgewertet werden können. Dies schließt neben der Beseitigung von Fehlern oder Aus-reißern die Aufspaltung der Daten in möglichst viele Einzelinformationen sowie deren Anpas-sung an den jeweils gewünschten Datentyp ein.

5. ETL

Laden

Das Laden befasst sich schließlich mit der Ablage der transformierten Quelldaten in den Datenbankstrukturen des Data Warehouses. Hierbei werden üblicherweise nur neue oder geänderte Daten berücksichtigt und das Data Warehouse entsprechend aktualisiert.

Die im Data Warehouse bereitgestellten Daten sind die Basis für alle weiteren Schritte im BI-Prozess. Die Qualität dieser Daten bestimmt im wesentlichen Maße auch die Qualität der anschließenden Auswertungen. Somit wird dem ETL-Prozess und den entsprechenden Werk-zeugen ein großer Stellenwert beigemessen.

Abb. © deusexlupus - Fotolia.com

14

Page 15: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

5.1 Pentaho Data Integration (Pentaho DI)

Bei Pentaho DI handelt es sich um ein reines ETL-Werkzeug aus dem BI-Portfolio des Soft-ware-Anbieters Pentaho.

Über einen visuellen Editor können die jewei-ligen ETL-Prozesse ohne Programmierkennt-nisse erstellt werden (siehe Abbildung 1). Hierzu wählt man die jeweiligen Bausteine aus der Auswahlpalette (Abb. 5/1), platziert sie auf der Arbeitsfläche (Abb. 5/2) und definiert das konkrete Verhalten des Bausteins über ent-sprechende Einstellungen (Abb. 5/3). Ein Bau-stein übernimmt jeweils einen Arbeitsschritt des ETL-Prozesses wie beispielsweise das Ein-lesen einer Quelldatei, das Umbenennen von Attributen, das Löschen von Ausreißern usw.

Als Quelldaten werden neben CSV- oder Textdateien alle gängigen Datenbanksys-teme unterstützt. Zudem gibt es Schnittstel-len zu Systemen wie SAS, SAP, Google Ana-lytics, Salesforce usw. sowie die Möglichkeit, Inhalte aus Emails zu importieren. Unterhalb der Arbeitsfläche (Abb. 5/4) befindet sich ein Bereich mit Informationen zum aktuellen ETL- Prozess. Neben der Anzeige des Ereignisproto-kolls oder der Ausführungshistorie können hier beispielsweise über einen Klick auf den jewei-

ligen Baustein die Daten eingesehen werden, welche an den nächsten Baustein weitergege-ben werden. So lässt sich zügig ermitteln, ob in den einzelnen Bearbeitungsschritten alles kor-rekt ausgeführt worden ist.

Wenn größere Datenmengen betrachtet und weiterverarbeitet werden sollen, ist die Analyse des grundsätzlichen Aufbaus der Daten interes-sant (Data Profiling). Nach der Installation einer kostenlosen Erweiterung können verschiedene Informationen zu den Daten berechnet werden. Neben dem Hinweis, wie viele Einträge inner-halb der Daten gänzlich fehlen, bekommt der Nutzer auf diese Weise zusätzliche Informatio-nen, die er zur Optimierung der Datenstruktur heranziehen kann. Zudem gibt die Analyse Auf-schluss über die allgemeine Datenqualität.

Mit Data Profiling ist die (meist) automatisierte Ana-lyse grundlegender Eigenschaften von Datenbestän-den gemeint. Neben der Gesamtzahl der Einträge je Spalte (einer Tabelle) kann auch die Anzahl der lee-ren Einträge, Durchschnitts-, Minimum- und Maxi-mum-Werte, das Zeitfenster (von-bis) für Datumsfel-der sowie die Häufigkeit einzelner Werte angezeigt werden.

Abb. 5: Pentaho Data Integration Oberfläche (mit freundlicher Genehmigung von Pentaho)

15

ETL

Page 16: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

5.2. Talend Open Studio

Der Anbieter Talend bietet verschiedene Werk-zeuge im Bereich Datenintegration an, insbe-sondere das Werkezeug Talend Open Studio. Ähnlich wie bei der Lösung von Pentaho sind die „Jobs“ – so werden Datenintegrationspro-zesse bei Talend genannt – Prozesse, die aus bis zu 450 verschiedenen (parametrisierbaren) Bausteinen bestehen können. Es werden Kon-nektoren zum Einlesen aller gängigen Daten-quellen bereitgestellt sowie unzählige Baustei-nen für die Datentransformation angeboten. Über den sogenannten „Map Editor“ lassen sich Datenelemente aus verschiedenen Datenquel-len einer vorher festgelegten Zielstruktur zuord-nen. Ohne jeglichen Programmieraufwand las-sen sich ETL-Prozesse auf diese Weise mit überschaubarem Aufwand umsetzen.

Abbildung 6 zeigt die Arbeitsoberfläche von Ta-lend Open Studio. Im Arbeitsbereich ist ein ver-einfachtes Modell des Datenflusses dargestellt,

was als Vorlage für die spätere Implementie-rung des ETL-Prozesses dienen soll. So erhal-ten auch nicht IT-affine Personen im Unterneh-men einen Überblick über die Funktionsweise einzelner Prozesse, ohne tiefer mit der Funkti-onsweise des Werkzeuges vertraut zu sein.

5.3 Jaspersoft ETL

Jaspersoft ETL stellt bei der Datenintegration keine wirklich neue Alternative dar, sondern ist als Community-Version eine angepasste Ver-sion von Talend Open Studio. Der Einsatz die-ser leicht angepassten Version macht aber nur dann Sinn, wenn in anderen Bereichen der BI-Landschaft ebenfalls Werkzeuge des BI-An-bieters Jaspersoft eingesetzt werden.

Abb. 6: Talend Open Studio Oberfläche (mit freundlicher Genehmigung der Public Footprint GmbH)

ETL

16

Page 17: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

6. OLAP

Abb. 7: OLAP, tabellarisch und als sogenannter OLAP-Würfel

(mit freundlicher Genehmigung des Urhebers Tobias Wäschle)

Unter OLAP (on-line analytical processing) wer-den alle Werkzeuge zusammengefasst, die bei großen Datenmengen das flexible Betrach-ten betriebswirtschaftlicher Kennzahlen (z.B. die Anzahl verkaufter Produkte oder der Um-satz) gruppiert nach beliebig vielen Merkma-len (z.B. Datum/Monat, Region oder Produkt) ermöglichen. Oft wird auch von sogenannten

OLAP-Würfeln gesprochen (siehe dazu auch Abb. 7). Derartige Software bietet unter ande-rem die Möglichkeit, über verschiedene Hierar-chieebenen hinweg (z.B. Jahr-Monat-Tag) so-wie gefiltert nach mehreren Attributen Daten zu betrachten.

Drill-Down bzw. Drill-Up sind gängige Filteroperationen in meist hierarchisch aufgebauten OLAP-Würfeln. Drill-Down bezeichnet demnach das Betrachten der Ergebnisse auf der nächstniedrigeren Hierarchieebene. Am Beispiel der Zeitdimension lässt sich dies einfach erklären. Werden beispielsweise Umsatzzahlen nach Monaten dargestellt, wäre eine mögliche Drill-Down-Option die Anzeige der Umsätze nach Kalenderwochen oder Tagen im jeweiligen Monat. Der Nutzer kann also über Drill-Down immer mehr ins Detail gehen. Drill-Up steht im Gegensatz dazu für eine Betrachtung der Daten auf einer abstrakteren Ebene. Im Falle der Anzeige von Umsätzen nach Monaten wäre eine mögliche Drill-Up-Option somit die Anzeige nach Geschäftsjahren.

17

Page 18: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

6.1 Mondrian

Mondrian ist das OLAP-Modul im BI-Portfolio von Pentaho. Es handelt sich hierbei um eine Sammlung verschiedener Funktionen, die in Summe ein recht umfangreiches OLAP-Werk-zeug bilden. Bevor diese Funktionen aber an-wendbar sind, müssen die zugrundeliegenden Datenelemente zuvor in Kennzahlen (sog. Fak-ten) und Dimensionen unterteilt werden.

Informationen zum Aufbau und zur Funktions-weise von Business Intelligence finden Sie im Leitfaden „Business Intelligence - Architektu-rüberblick“. Hierzu liefert Pentaho ein zusätzli-ches Werkzeug, um den Nutzer bei der Erstel-lung dieser Metainformationen zu unterstützen.

Abb. 8 zeigt beispielhaft, wie Daten mit Hilfe von Mondrian im Browser angezeigt werden

können. Die einzelnen Funktionen von Mond-rian werden über Schaltflächen aktiviert bzw. deaktiviert (Abb. 8/1). Neben klassischen OLAP-Funktionen findet man dort Schaltflächen zur Anpassung bzw. Erweiterung der Ergebnis-darstellung oder auch Exportfunktionen im PDF oder Excel-Format.

Direkt darunter findet sich die Ergebnistabelle, die je nach Benutzerinteraktion und vorherge-hender Anpassung der Darstellungs- und sons-tiger Einstellungen die gewünschten Informa-tionen anzeigt (Abb. 8/2). Die Darstellung der Ergebnistabelle als Grafik erfolgt separat unter-halb der Ergebnistabelle (Abb. 8/3)

Abb. 8: Mondrian als Java-Web-Applikation (mit freundlicher Genehmigung von Pentaho)

OLAP

18

Page 19: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

6.2 Jedox

Jedox bietet eine komplette BI-Suite an, die alle Bereiche von ETL über OLAP bis hin zu Dashboards (siehe Kap. 6) und Berichten um-fasst. Das Steckenpferd war und ist aber das mächtige OLAP-Modul Jedox. Durch die Inte-gration in Excel bietet Jedox für viele KMU ei-nen großen Mehrwert, da verschiedenste Da-ten oft bereits Excel-Tabellen gepflegt werden. Jedox lässt sich in Excel integrieren und ersetzt die Pivot-Funktion, bietet aber viele zusätzliche Funktionen wie beispielsweise die Anzeige von Soll-Ist-Abweichungen. Der große Vorteil der Integration in Excel liegt vor allem in der „ge-wohnten“ Umgebung, denn Office-Anwendun-

gen sind in KMUs weit verbreitet. Dadurch fällt der Einarbeitungsaufwand hier insgesamt rela-tiv niedrig aus.

Abb. 9 zeigt, dass die Optik der eigenständigen Jedox-Oberfläche starke Parallelen zu Excel aufweist. Zu verschiedenen Produktgruppen er-hält der Anwender hier die wichtigsten Kenn-zahlen beispielhaft für ein fiktives Unternehmen übersichtlich dargestellt. Neben den Zahlenwer-ten heben zusätzliche Diagramme die derzeiti-ge Situation wie auch die Entwicklung hervor.

Abb. 9: Jedox Beispiel Spreadsheet (mit freundlicher Genehmigung der Jedox AG)

19

OLAP

Page 20: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Abschließend seien noch die Warenkorbanaly-sen erwähnt (Abb. 12), anhand derer ermittelt werden kann, welche Warengruppen häufig zu-sammen gekauft werden.

Derartige Verfahren nutzen mathematische Al-gorithmen für die Berechnung von Mustern in-nerhalb der Datenbasis und übernehmen damit die Aufgabe, Trends und Zusammenhänge in großen Datenmengen zu ermitteln.

7. Data Mining

Unter Data Mining werden Werkzeuge zusam-mengefasst, die tiefergehende Analysen auf Daten jeglicher Art ermöglichen.

Ein Beispiel hierfür ist die Kundensegmentie-rung (Abb. 10a). Typische Merkmale zur Markt-segmentbildung sind in Abb. 10b zu sehen.

Ein anderes Beispiel sind Entscheidungsbäu-me. Abb. 11 zeigt auf stark vereinfachte Weise, ob ein Kunde kreditwürdig ist.

Abb. 10a: Beispiel für eine Kundensegmentierung

(© eBusiness-Lotse Oberschwaben-Ulm)

Abb. 11: Beispiele zum Einsatz von Entscheidungsbäumen

(© eBusiness-Lotse Oberschwaben-Ulm)

Abb. 12: Warenkorbanalysen (© Olivier Le Moal - Fotolia.com)

Abb. 10b: Typische Merkmale zur Marktsegmentbildung

(© thingamajiggs - Fotolia.com)

20

Page 21: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Die einzelnen Bausteine stehen in einer sortier-ten Liste zur Verfügung (Abb. 13/1). Sie können per Drag&Drop in den Arbeitsbereich gezogen und einfach miteinander verbunden werden. Eine Art Ampelsystem zeigt dabei dem Nutzer an, ob ein Baustein noch konfiguriert werden muss (Abb. 13/2).

Spezielle Bausteine zur Visualisierung der Da-ten können hierbei genutzt werden, um ers-te manuelle Analysen der Daten durchzuführen (Abb. 13/3). Ein möglicher Baustein ist hier z.B. der ‚Interactive Table‘, der die Daten, welche ihm übergeben werden, in einer interaktiven Ta-belle verfügbar macht. Gängige Verfahren für tiefergehende Analysen wie Entscheidungsbäu-me oder auch Warenkorbanalysen können an-schließend automatisch komplexe Muster in den Daten erkennen und liefern so relevantes Wissen zur Entscheidungsunterstützung. Analy-seergebnisse können nach Abschluss der Ana-lyse wiederum in gängige Formate exportiert werden (Abb. 13/4).

7.1 KNIME

Das Data-Mining-Werkzeug namens „Konstanz Information Miner“ wurde ursprünglich an der Universität Konstanz entwickelt. Heute bietet die KNIME.com AG mit Sitz in Zürich zusätzlich professionelle technische Unterstützung und Beratungsdienstleistungen für die KNIME-Platt-formen. Das in Java entwickelte Projekt wird zudem als Plugin für das Programmierwerk-zeug Eclipse angeboten.

KNIME kann alle gängigen Datenformate und Datenbanken als Quelle für Rohdaten anbinden und bietet zudem eine Vielzahl von Bausteinen für die Datenmanipulation und Bereinigung. Der Schwerpunkt liegt allerdings in der Analyse von Datenbeständen. Hier bietet das Werkzeug ne-ben eigenen Analysemöglichkeiten die Integ-ration zahlreicher anderer Algorithmen aus der Software Weka (näheres dazu in 7.3) oder auch der Statistiksoftware „R“. Abschließend bietet das Werkzeug neben einer integrierten Möglich-keit zur Visualisierung der Ergebnisse den Ex-port der Daten zur Weiterverarbeitung oder Ver-öffentlichung.

Abb. 13: KNIME Oberfläche und Analysevarianten (mit freundlicher Genehmigung von KNIME)

Abb. 10b: Typische Merkmale zur Marktsegmentbildung

(© thingamajiggs - Fotolia.com)

21

Data Mining

Page 22: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Unter dem Arbeitsbereich befindet sich noch ein Ereignisprotokoll (Abb. 14/4), welches einzelne Arbeitsschritte im Prozessablauf erfasst und an-zeigt. Rechts daneben erhält der Nutzer zusätz-liche Informationen je Baustein (Abb. 14/5). Für den leichteren Einstieg bietet RapidMiner kos-tenlose Schulungsvideos an.

7.2 RapidMiner

RapidMiner ist ein in Java geschriebenes Werk-zeug für maschinelles Lernen und Data Mining. Alle Algorithmen aus dem Projekt der Software Weka sowie der Statistiksoftware „R“ sind als Erweiterung über den RapidMiner Marketpla-ce kostenlos verfügbar. Es wurden weitere Bau-steine zur Datenmanipulation und -auswertung integriert, die RapidMiner zum derzeit wohl um-fangreichsten Open-Source-Werkzeug im Be-reich Data Mining machen. Über den Market-place lässt sich die Software unter anderem um Lösungen im Bereich Text- oder Web Mining sowie um ein Berichts-Plugin erweitern.

Ähnlich wie die Lösungen zur Datenintegration oder KNIME folgt auch RapidMiner dem Work-flow-Prinzip. Über die Benutzeroberfläche kön-nen alle verfügbaren Bausteine aus der linken Spalte (Abb. 14/1) über Drag&Drop in den Ar-beitsbereich (Abb. 14/2) in der Mitte gezogen werden. In der rechten Spalte werden alle Para-meter für den gesamten Prozess oder aber ein-zelne Bausteine gesetzt (Abb. 14/3).

Text Mining fasst Algorithmen zusammen, die über statistische und linguistische Verfahren Informati-onen aus unstrukturierten Texten generieren. So lassen sich beispielsweise Texte einem konkreten Themenbereich zuordnen oder Kundenfeedback in positive oder negative Aussagen unterteilen.

Web Mining ist eine Teildisziplin des Data Mining, die sich auf Inhalte aus dem Internet beschränkt. Neben der allgemeinen Analyse von Internetinhalten (Web Content Mining) schließt es auch das Nutzer-verhalten (Web Usage Mining) sowie die Beziehung zwischen Webseiten (Web Structure Mining) ein. So lassen sich z.B. Stimmungen von Kunden oder der Fachpresse zu Produkten eines Unternehmens ein-fangen oder die eigene Unternehmenswebseite auf Basis des Klickverhaltens der Besucher optimieren.

Abb. 14: RapidMiner Oberfläche (mit freundlicher Genehmigung von RapidMiner)

22

Data Mining

Page 23: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Die Oberfläche zum Workflow-Design ist bei Weka im Vergleich zu anderen vorgestellten Werkzeugen weniger benutzerfreundlich. So ist beispielsweise nur wenig oder gar keine Doku-mentation zu einzelnen Bausteinen sowie de-ren Parametern verfügbar. Auch die Regeln für der Anordnung und Verknüpfung von einzel-nen Bausteinen sind oftmals unklar. Dem Nut-zer werden zudem keine Hinweise für mögliche Fehler vor Ausführung eines Prozesses ange-zeigt und so bleibt das Werkzeug Experten vor-behalten, die sich damit bereits umfassend aus-kennen.

Alle Algorithmen aus dem Weka-Projekt können jedoch - wie weiter oben schon erwähnt - in be-nutzerfreundlichere Anwendungen wie KNIME oder RapidMiner eingebunden werden.

7.3 Weka

Weka ist ein Projekt der „Machine Learning Group“ an der Universität von Waikato, Neu-seeland. Die gleichnamige Software umfasst eine Sammlung verschiedenster Algorithmen zum maschinellen Lernen. Diese Algorithmen können über das Werkzeug direkt auf verfüg-baren Rohdaten oder aber über die Einbindung in den Java-Code innerhalb einer eigenen Soft-warelösung ausgeführt werden.

Neben klassischen Verfahren wie der Klassifi-kation, Regressions- und Cluster-Analyse so-wie der Ermittlung von Assoziationsregeln bie-tet das Werkzeug zusätzlich Bausteine zur Da-tenvorverarbeitung wie auch zur Visualisierung von Analyseergebnissen. Das Werkzeug wird an der Waikato-Universität ständig weiterentwi-ckelt und als losgelöstes, eigenständiges Pro-dukt angeboten.

Abb. 15: Weka Oberfläche: KnowledgeFlow

(mit freundlicher Genehmigung der Machine Learning Group an der University of Waikato)

23

Data Mining

Page 24: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

8. Integrierte BI-Lösungen

boten, die über Schnittstellen ohne großen Auf-wand miteinander verbunden werden können. Es folgt eine Liste der einzelnen Module:

► Jaspersoft ETL (siehe 4.2)

► JasperReports Server (Berichts-Server) mit - JasperReports Library (Java-Bibliothek zur Erstellung von Berichten) - Jaspersoft OLAP (angepasste Mondrian- Lösung, siehe 5.1)

► Jaspersoft Studio (Editor zum Erstellen von Berichten)

Im Bereich ETL und OLAP setzt Jaspersoft auf Drittanbieter, passt die Module allerdings auf die eigene Produktlinie an. Alle Teilmodule kön-nen auch getrennt voneinander genutzt wer-den. Jaspersoft legt den Fokus auf die Berichts-erstellung sowie -verteilung. Der Berichtsserver stellt damit das Herzstück der Lösung dar. Bei-spielberichte zeigt Abb. 16.

Integrierte BI-Lösungen sind meist modulare Systeme, die das gesamte Leistungsspektrum im Bereich BI abdecken. In der kostenlosen Va-riante dieser Systeme fehlt jedoch eine über-greifende Installationsroutine und die einzelnen Module müssen separat installiert werden. Auf Basis entsprechender Schnittstellen lassen sich unterschiedliche Module aber im Rahmen eines Gesamtprojekts einsetzen und die Ergebnis-se eines Moduls können in der Regel ohne Pro-bleme in den anderen Modulen weiterverarbei-tet werden. In den sogenannten ‚Enterprise‘-Va-rianten werden die einzelnen Module oft als Komplettpaket angeboten, sowohl in Bezug auf die Installationsroutine als auch Bedienoberflä-che. Da der Fokus dieser Marktübersicht jedoch auf kostenlosen Produkten liegt, wird auf diese Varianten nicht näher eingegangen.

8.1 Jaspersoft

Jaspersoft ist einer der großen Anbieter inte-grierter BI-Lösungen. Es werden verschiede-ne Module für die einzelnen Teilaufgaben ange-

Abb. 16: Beispiel-Bericht - Jaspersoft Reports Server, Community-Version (mit freundlicher Genehmigung der TIBCO Software Inc.)

24

Page 25: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

► Aggregation Designer & Schema Work-bench Zwei Werkzeuge zur Erstellung und Optimie-rung der Datenbankinhalte. Als Basis hierfür dient Mondrian (siehe 5.1).

► Metadata-Editor Mit ihm lassen sich die zugrundeliegenden Datenstrukturen mit Hilfe einer XML-Da-tei detaillierter beschreiben. Diese Meta-Be-schreibung dient den anderen Werkzeugen als Input für weitergehende Auswertungen der Daten. So lassen sich hier die Dimensi-onen selbst sowie die beinhaltenden Hierar-chien beschreiben. Die XML-Datei dient am Ende Mondrian (siehe 5.1) als Basis für wei-tere Operationen auf den Daten.

Abb. 17 zeigt ein Dashboard mit verschiedenen Diagrammen zu einem fiktiven Unternehmen (z.B. Umsatz nach Region). Kommen neue Da-ten hinzu, aktualisieren sich die Diagramme au-tomatisch.

8.2 Pentaho

Pentaho setzt ähnlich wie Jaspersoft auf an-gepasste, teils bestehende Open-Source-Pro-jekte, die von Pentaho aufgekauft worden sind. Die Schwerpunkte liegen in der Datenintegrati-on sowie der Berichtsautomatisierung. Das Pro-duktportfolio besteht aus:

► Business Analytics Platform Eigenentwickelte Webapplikation zur zent-ralen Zusammenführung aller Informationen auf einer Plattform. Möglichkeit zur Integra-tion zusätzlicher Erweiterungen.

► Data Integration ETL-Werkzeug (siehe 4.1).

► Report Designer Weiterentwicklung des aufgekauften Pro-jekts JFreeReport. Kann separat oder als Erweiterung der ETL-Lösung von Pentaho eingesetzt werden.

Abb. 17: Beispiel-Bericht - Pentaho BI Server (mit freundlicher Genehmigung von Pentaho)

25

Integrierte BI-Lösungen

Page 26: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

8.3 SpagoBI

Als einziger Anbieter integrierter BI-Lösun-gen bietet SpagoBI alle Module nur in einer Open-Source-Variante an. Es gibt keine ‚Enter-prise‘-Version von SpagoBI. Das Geschäftsmo-dell besteht darin, Dienstleistungen im Bereich der Einrichtung und Anpassung der Module auf kundenspezifische Anforderungen anzubieten.

Im Wesentlichen bietet SpagoBI den Vorteil, dass alle angebotenen Software-Lösungen über eine zentrale Plattform über den Brow-ser verwaltet werden können. So kann eine Lösung, die mit SpagoBI entwickelt worden ist, in den BI-Schwerpunktthemen ETL, OLAP, Data Mining sowie Berichtswesen unter anderem aus den folgenden Werkzeugen zusammengesetzt sein:

► ETL - Talend (siehe 4.2)

► OLAP - Jedox (siehe 5.2) - Mondrian (siehe 5.1)

► Data Mining - Weka (siehe 7.3) - Statistiksoftware R

► Berichtswesen - BIRT (siehe 6.1) - JasperReports Library (siehe 8.1)

Darüber hinaus bietet SpagoBI noch wei-tere Module an. Sie dienen vor allem zur Opti-mierung der Darstellung von BI-Ergebnissen auf mobilen Endgeräten oder auch zur Unter-stützung der Verbindung von geographischen Daten mit geschäftsrelevanten Daten.

Abb. © SpagoWorld Communications

26

Integrierte BI-Lösungen

Page 27: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

Anschließend können Lücken innerhalb der nun verfügbaren Berichte durch eine Reorganisation der Datenerfassung geschlossen werden. Hier-für kommen Werkzeuge aus dem Bereich ETL zum Einsatz. Gleichzeitig kann das Berichtswe-sen um spezifische OLAP-Auswertungen auf der Basis der vorgestellten Werkzeuge ergänzt werden. Sollen weitergehende Analysen wie Cluster-Analysen oder Warenkorbanalysen zur Unterstützung von Entscheidungen beitragen, können Data Mining Werkzeuge zum Einsatz kommen. So kann das unternehmenseigene BI-Portfolio sukzessive auf die jeweiligen Anfor-derungen angepasst werden.

9. FazitDie Auswahl an brauchbaren Open Source Werkzeugen für jeden Einsatzzweckim Bereich BI ist mittlerweile recht groß. Der Einarbeitungs-aufwand ist bei den meisten Werkzeugen über-schaubar. Wenn hierfür die Dokumentation des Anbieters selbst nicht ausreichen sollte, wird der Einstieg in nahezu jedes Software-Pro-dukt durch zusätzliche Inhalte aus den sozialen Medien unterstützt. Ist man auf professionelle Hilfe angewiesen, besteht immer die Möglich-keit, kostenpflichtigen Support in Anspruch zu nehmen bzw. auf eine ‚Enterprise‘-Version der jeweiligen Lösung umzusteigen.

Der Einstieg in die BI-Welt wird über die vorge-stellten Werkzeuge im Bereich des Berichtswe-sens empfohlen, da sich auf diese Weise erste Mehrwerte durch die Zusammenführung der bestehenden Daten erzielen lassen.

Abb. © DOC RABE Media - Fotolia.com

Abb. © z_amir - Fotolia.com

2727

Page 28: Marktübersicht 2014 BI - eBusiness-Lotse Sigmaringen · Impressum Herausgeber eBusiness-Lotse Oberschwaben-Ulm c/o Hochschule Ravensburg-Weingarten Doggenriedstraße 88250 Weingarten

eBusiness-Lotse Oberschwaben-Ulm

Der eBusiness-Lotse Oberschwaben-Ulm ist Teil der Förderinitiative „eKompetenz-Netzwerk für Unternehmen“, die im Rahmen des Förder-schwerpunkts „Mittelstand-Digital – IKT-Anwen- dungen in der Wirtschaft“ vom Bundesministe-rium für Wirtschaft und Energie (BMWi) geför-dert wird.

Der Förderschwerpunkt unterstützt gezielt kleine und mittlere Unternehmen (KMU) sowie das Handwerk bei der Entwicklung und Nut-zung moderner Informations- und Kommunika- tionstechnologien (IKT).

„Mittelstand-Digital“ setzt sich zusammen aus den Förderinitiativen

► „eKompetenz-Netzwerk für Unternehmen“ mit 38 eBusiness-Lotsen,

► „eStandards: Geschäftsprozesse standardi-sieren, Erfolg sichern“ mit derzeit 16 Förderprojekten, und

► „Einfach intuitiv – Usability für den Mittel-stand“ mit zurzeit 14 Förderprojekten.

Weitere Informationen finden Sie unter www.mittelstand-digital.de.

© Yuri Arcurs - Fotolia.com