View
812
Download
9
Category
Preview:
Citation preview
Hadziq Fabroyir . Department of Informatics
1
Introduction toData Warehouse & Business Intelligence
Hadziq Fabroyir . Department of Informatics
2
Makin Banyak IstilahOLTP, OLAP, DSS, Data Warehouse, Data Mining.
Tapi intinya adalah:Teknologi untuk mengambil keputusan berdasarkan data
yang cukup
Hadziq Fabroyir . Department of Informatics
3
Sejarah SingkatPemakaian Komputer
Hadziq Fabroyir . Department of Informatics
4
Hadziq Fabroyir . Department of Informatics
5
Cuma Beda: “Online”
1978
DSS
Hadziq Fabroyir . Department of Informatics
6
Perkembangan Teknologi Database
1950•Komputer hanya di AS•terbatas di kalangan militer, pemerintah, dan akademis•Belum ada Model Basis Data
1960•komputer untuk bisnis •IMS dari IBM •model pohon dan model jaringan
Hadziq Fabroyir . Department of Informatics
7
Model Kebanyakan Jaman DuluModel Pohon Model Jaringan
Hadziq Fabroyir . Department of Informatics
8
Model Relational
Hadziq Fabroyir . Department of Informatics
9
Perkembangan Teknologi Database
1970 •baru ada model relasional. Digagas oleh Edgar F. Codd.
1972 •prototipe relational database dibuat.
1975 •IBM bikin DBMS versi komersialnya.
1977 •Oracle menyusul.
1980 •dBASE banyak yang pake, karena running di atas DOS yang lagi naik daun.
Hadziq Fabroyir . Department of Informatics
10
Relational ModelFounding Father
Hadziq Fabroyir . Department of Informatics
11
Hadziq Fabroyir . Department of Informatics
12
OLTP(OnLine Transaction Processing)
Tidak semua transaksi yang online bisa dibilang online.
Seperti contohnya adalah proses transaksi kliring
Dulu tahun 1980, transaksi online mungkin dapat disebut sebagai pemrosesan yang interaktif atau waktu-nyata (real-time).
Sehingga kliring seperti contoh di atas itu termasuk offline atau lebih dikenal dengan istilah batch.
Hadziq Fabroyir . Department of Informatics
13
Decision Support System
Istilah Decision Support System diperkenalkan P.G.W Keen dan M.S.Scott Morton lewat bukunya : Decision Support System: An Organizational Perspective” tahun 1978.
Arsitekturnya terdiri atas: Database (knowledge base),
Model (the Decision context and user criteria), dan
Antar muka.
Hadziq Fabroyir . Department of Informatics
14
Sejarah Pengambilan Keputusan
Sampai dekade 1970 masih banyak software yang belum memakai SQL dan relational database.
Pada masa itu, data komputer sudah dipakai untuk membantu pengambilan keputusan menggunakan: Riset Operasional, Teori Manajemen, dan Teori Perilaku.
DSS pada saat itu berkenaan dengan data agregat (data yang diperoleh dengan memakai operasi-operasi agregat seperti SUM, COUNT, AVG, MIN, MAX).
Jelasnya RDBMS dan SQL sangat memudahkan pembuatan data agregat, hal yang sulit dalam COBOL.
Hadziq Fabroyir . Department of Informatics
15
Data WarehouseIstilah ini baru diperkenalkan pada tahun 1988 (10 tahun setelah diperkenalkannya istilah DSS)
Yang memperkenalkan adalah W. H. Inmon dalam bukunya “Data Architecture: The Information Paradigm”
Hadziq Fabroyir . Department of Informatics
16
Data WarehouseMuncullah rumusan bahwa subjek datawarehouse berkenaan dengan:
Pengolahan data agregatTipe snapshot, bitmap index, function indexTipe Table Partition dan Index PartitionOperasi star join dan operasi-operasi yang aware terhadap partitionStar-schema (ad0hoc database design)
Hadziq Fabroyir . Department of Informatics
17
OLAP(OnLine Analytical Processing)
Muncul tahun 1993 oleh Edgar F. Codd, S. B. Codd, dan C. T. Salley dalam dokumen untuk Arbor Corporation berjudul “Providing OLAP (OnLine Analytical Processing) to User-Analyst: An IT Mandate”.
Analytical Processing diterapkan ke datawarehousing bukan production database.
Lagi-lagi tidak ada dasar ilmiah. Kejadian yang mirip dengan DSS.
Hadziq Fabroyir . Department of Informatics
18
OLAP(OnLine Analytical Processing)
Euforia banyak saintis dan akademis tentang OLAP telah mereda. Berikut adalah butir-butir berikut sebagai dasar ilmiah untuk OLAP:
Tipe: TABLE, REPORT, dan CUBEOperasi: GROUPING, ROLLUP, CUBENilai: pemakaian nilai NULL bagi nilai-nilai ‘sel’ di kubus (cube) dan report untuk data agregat.
Hadziq Fabroyir . Department of Informatics
19
Hadziq Fabroyir . Department of Informatics
20
Data MiningIstilah ini dikenalkan tahun 1996 oleh Peter Adriaans dan Dolf Zatinge dalam bukungan “Data Mining” oleh Addison-Wesley. Mereka menulis aspek-aspek dan teknik-teknik ilmiah yang bisa dipakai untuk Data Mining.
Secara umum Data Mining adalah mengolah data.
Hadziq Fabroyir . Department of Informatics
21
Teknik & Aturan Data Mining
Secara khusus, data mining sebagai pengolahan data memakai teknik atau aturan yang di antaranya adalah sebagai berikut:
Association ruleClassification ruleClustering rulePrediction rule
Hadziq Fabroyir . Department of Informatics
22
Analisis dan Pengambilan Keputusan
Hadziq Fabroyir . Department of Informatics
23
It’s All About Technology …
Apabila Data Mining, OLAP, Datawarehouse, dan lain-lain dianggap sebagai teknologi, maka:
Semuanya mengarah ke satu hal: untuk mengambil keputusanSia-sia menyimpan data, membuat algoritme, dan lain-lain, jika tidak dipakai untuk mengambil keputusan.Dengan memanfaatkan semua teknologi tersebut (dengan bijaksana), keputusan yang diambil adalah well-informed decision.
Hadziq Fabroyir . Department of Informatics
24
KesamaanSelain kesamaan tujuan inti, semua teknologi di atas juga memiliki kesamaan:
Untuk mengolah data-data agregatMemakai sumber data yang berukuran sangat besarMemakai analisis
Hadziq Fabroyir . Department of Informatics
25
Microsoft’s MindMicrosoft Corp memakai frasa Analysis
Service untuk semua fasilitas-fasilitas di SQL Server 9 DBMS.
Hadziq Fabroyir . Department of Informatics
26
Restropeksi Sejarah
Relational Model (1969)
DSS(1978)
OLAP(1993)
Hadziq Fabroyir . Department of Informatics
27
Hadziq Fabroyir . Department of Informatics
28
Business Intelligence
Analysis of corporate data that influences business decision making
Hadziq Fabroyir . Department of Informatics
29
Hadziq Fabroyir . Department of Informatics
30
The Tools Evolution
EM 2000
QA 2000
AM 2000
EM 2000
QA 2000
AM 2000
SQL 2000 SQL 2005
SQL Management
Studio
BI Development
Studio
Target Audience:
DBA
Developer
Hadziq Fabroyir . Department of Informatics
31
SQL ’05 BI Components
•SQL Server Management StudioManage•Business Intelligence Development StudioDesign•Integration ServicesSynthesize
•Universal Dimensional Model (UDM)Store•Reporting ServicesDeliver
Hadziq Fabroyir . Department of Informatics
32
SQL Server Management Studio
“Replacement” for SQL Server Enterprise Manager and Query Analyzer
Visual Studio 2005 IDE
Manage all DatabasesRelational Databases
Analysis Databases
CE Databases
Hadziq Fabroyir . Department of Informatics
33
Hadziq Fabroyir . Department of Informatics
34
Integration Services
Formerly Data Transformation Services (DTS)
Build and debug complex integration packages
Separation of Control Flow and Data Flow
Integrated Source Control
Hadziq Fabroyir . Department of Informatics
35
Integration Services
New England Code Camp IV: “Developer’s Gone Wild”
Universal Dimensional
ModelUnified logical model for both relational and OLAP analysis databases with high performance and scalability
Capture and model all of your data
Relational reporting and OLAP converge through a single relational model
New England Code Camp IV: “Developer’s Gone Wild”
SQL Server 2005 Enterprise BI A Unified Dimensional Model
DW
Datamart
DatamartBI Applications
MOLAP
MOLAP
OLAP Browser
Reporting Tool
UDM
New England Code Camp IV: “Developer’s Gone Wild”
Illustration
New England Code Camp IV: “Developer’s Gone Wild”
Which models are available with SQL ’05?
Analytical problem Examples AlgorithmsClassification: Assign cases to predefined classes
Credit risk analysisChurn analysisCustomer retention
Decision TreesNaive BayesNeural Nets
Segmentation: Taxonomy for grouping similar cases
Customer profile analysisMailing campaign
ClusteringSequence Clustering
Association: Advanced counting for correlations
Market basket analysisAdvanced data exploration
Decision TreesAssociation
Time Series Forecasting: Predict the future
Forecast salesPredict stock prices
Time Series
Prediction: Predict a value for a new case based on values for similar cases
Quote insurance ratesPredict customer income
All
Deviation analysis: Discover how a case or segment differs from others
Credit card fraud detectionNetwork infusion analysis
All
New England Code Camp IV: “Developer’s Gone Wild”
Reporting Services
Deliver traditional and interactive reports
Single platform and tools for all types of structured data (relational, hierarchical, multidimensional)
Single platform for authoring, management, and delivery of reports
New England Code Camp IV: “Developer’s Gone Wild”
Reporting Services
New England Code Camp IV: “Developer’s Gone Wild”
Reporting Services
Server Middle Tier Client
AnalysisServerAnalysisServer
IIS
IIS
XM
LA
IS
AP
IX
MLA
IS
AP
I
PTS
/OLED
BP
TS
/OLED
B
AnalysisServerAnalysisServer
TCP
HTTP IISIIS
AS2005
AS2000
XM
LA
XM
LA
Application
XMLA
XMLA
Application
HTTP
XML for Analysis AS 2000 vs. AS 2005
New England Code Camp IV: “Developer’s Gone Wild”
ResourcesSQL Server Developer Center
http://msdn.microsoft.com/sql/
OLAP Bloghttp://www.sqljunkies.com/weblog/mosha
SQL Server 2005 Data Mininghttp://www.sqlserverdatamining.com
SQL Server Integration Serviceshttp://www.sqlis.com
Introduction to SQL Server Report Builderhttp://www.developer.com/db/article.php/3520116
Recommended