08 sip datawarehouse

Preview:

DESCRIPTION

 

Citation preview

DATA WAREHOUSE

Merupakan database yang menyimpan data sekarang dan data historis yang dibutuhkan oleh pengambil keputusan perusahaan

Data Warehouse?

Komponen Data Warehouse/Model Data Warehouse

Data mart adalah merupakan bagian dari informasi data warehouse.

Data warehouse fokus pada data organisasi, data mart fokus pada informasi unit tertentu seperti keuangan, produksi, atau operasi.

Data mart

QueryKemampuan untuk menampilkan suatu data dari

database dimana mengambil dari tabel-tabel yang ada di database.

Perintah-perintah untuk mengakses data pada sistem basis data.

Struktur bahasa query standar:SELECT nama data item

FROM nama file

WHERE kondisi

Akses dan Analisis Data

Sebagai misal penggunaan bahasa query adalah sebagai berikut:

SELECT no_mhs, nama_mhs, ip_mhs

FROM file_mhs

WHERE ip_mhs>=3

Query di atas digunakan untuk menampilkan data mahasiswa dari file database yang bernama file_mhs untuk mahasiswa yang indeks prestasinya paling sedikit 3.

OLAP (Online Analytical Processing/OLAP) Analisis data multidimensi

Mendukung manipulasi dan analisis data dalam jumlah besar dari beragam dimensi/perspektif

Multidimensional Data Model

Data Mining Proses selecting, exploring, and

modeling sejumlah besar data untuk menemukan pola tersembunyi dan hubungan yang belum diketahui sebelumnya untuk mendukung pembuatan keputusan guna memprediksi perilaku masa depan.

Tipe informasi yang diperoleh dari data mining: Assosiasi Sequence Klasifikasi Kluster Forecasting (peramalan) Analisis Statistik

AsosiasiInformasi yang dikaitkan dengan event tunggal tertentu.Contoh: Pembelian pop corn -> kenaikan pembelian coca cola 65%Ada promosi -> kenaikan pembelian coca-cola 85%

Sequence (tahapan)Informasi yang menghubungkan kejadian lintas waktu.Contoh: Pembelian rumah -> pembelian kulkas naik 65% -> pembelian oven naik 45%

KlasifikasiPola yang menggambarkan suatu item masuk dalam kelompok mana dengan menguji item yang sudah diklasifikasi dan menyimpulkan suatu aturan.Contoh: Bisnis kartu kredit khawatir tentang konsumen yang loyal/tidak -> klasifikasi untuk mengetahui klasifikasi konsumen loyal/tidak menentukan kampanye untuk mempertahankan konsumen

KlasterSama seperti melakukan klasifikasi tapi ketika belum ada kelompok yang teridentifikasiContoh: data dalam kartu kredit yang membagi konsumen berdasar demografi

Forecasting (peramalan)Menggunakan data yang ada untuk meramalkan informasi yang akan terjadi.Contoh: data historis penjualan 5 tahun terakhir untuk meramalkan penjualan tahun depan

Analisis StatistikMenggunakan fungsi2 Statistik seperti: korelasi, regresi, variance, dll untuk menganalisa data

Korelasi: membahas keeratan hubungan antar variabel X dg Y

Regresi: membahas prediksi (peramalan), jenisnya: Regresi tunggal: Y = a + bX Regresi berganda; Y = a + b1X1 + b2X2, dst…

Perusahaan perlu memformulasi strategi untuk: meningkatkan kualitas informasi organisasi Efektifitas pengambilan keputusan

“information cleansing / scrubbingAktivitas untuk menyelesaikan masalah informasi

yang inconsistent, incorrect, atau incomplete.(dengan bantuan software, misal: Oracle, SAS, dll)

Kualitas Informasi

Contoh (gambar 6.17)Perubahan dari CUSTOMER ID menjadi

CONTACToContoh (gambar 6.18)Diperlukannya standarisasi nama

konsumen

Terima kasih atas perhatiannya

ada pertanyaan?