7
BAB 2
LANDASAN TEORI
2.1 Konsep Dasar Data Warehouse
2.1.1 Pengertian Data dan Informasi
Pengertian data dan informasi menurut Turban, Rainer, dan Potter
(2003,p15), data adalah fakta-fakta yang belum diolah atau gambaran-gambaran
lebih lanjut dari benda-benda, kejadian-kejadian, kegiatan-kegiatan, dan
transaksi-transaksi yang ditangkap, direkam, disimpan, dan diklasifikasikan
tetapi tidak disusun untuk menyampaikan arti khusus lainnya. Informasi adalah
sebuah kumpulan dari fakta-fakta (data) yang disusun di dalam beberapa cara
sehingga kumpulan fakta tersebut bisa berarti untuk penerimanya.
2.1.2 Pengertian Teknologi Informasi
Menurut Steven Alter (1999, p42) teknologi informasi adalah perangkat
keras dan piranti lunak yg digunakan dalam sistem informasi.
1. Perangkat keras
Mengarah pada peralatan dan obyek fisik lain yang terlibat dalam proses
informasi seperti komputer, workstation, physical network, data storage,
dan transmission device.
2. Piranti lunak
Mengarah pada program komputer untuk proses penerjemahan input user
dan menyampaikan pada perangkat keras mengenai apa yang harus
dilakukan. Yang termasuk dalam piranti lunak yaitu sistem operasi, end
8
user software seperti word processor, dan application software yang
berhubungan dengan tugas bisnis yang khusus seperti merekam transaksi
kartu kredit atau merancang mobil.
Menurut Wikipedia, http://en.wikipedia.org/wiki/infromation_technology,
“Information technology is the technology required for information processing,
deals with the use of electronic computers and computer software to convert,
store, protect, process, transmit, and retrieve information.“, yang artinya
teknologi informasi adalah teknologi yang dibutuhkan dalam pengolahan
informasi, yang berhubungan dengan penggunaan komputer elektronik dan
piranti lunak untuk mengubah, menyimpan, memproteksi, mengolah, mengirim
dan mengambil informasi.
2.1.3 Pengertian Database
Menurut Connoly & Begg (2002,p14), “Database is a shared collections of
logically related data, and a description of this data, designed to meet the
information needs of an organization”, artinya database adalah suatu kumpulan
logikal data yang terhubung satu sama lain dan deskripsi dari suatu data yang
dirancang sebagai informasi yang dibutuhkan oleh suatu organisasi.
2.1.4 Pengertian Data Warehouse
Pengertian data warehouse dari beberapa ahli dapat bermacam – macam
namun mempunyai inti yang sama, seperti dari beberapa ahli di bawah ini :
9
Menurut W.H. Inmon (2002, p31), “A data warehouse is a subject-
oriented, integrated, nonvolatile and time-variant colection of data in support of
management’s decisions.”, artinya data warehouse adalah koleksi data yang
mempunyai sifat berorientasi subjek, terintegrasi, tidak mengalami perubahan
dan memiliki rentang waktu tertentu yang mendukung pengambilan keputusan
dari pihak manajemen.
Menurut Vidette Poe (1996, p6), “A data warehouse is a read only
analytical database that is used as the foundation of a decision support system”,
artinya data warehouse adalah database yang bersifat analis dan hanya dapat
dibaca saja, yang digunakan sebagai dasar dari sistem pendukung keputusan.
Menurut Wikipedia (2007), http://id.wikipedia.org/wiki/Gudang_data,
Gudang data (data warehouse) adalah suatu sistem komputer untuk
mengarsipkan dan menganalisis data historis suatu organisasi seperti data
penjualan, gaji, dan informasi lain dari operasi harian.
Jadi, data warehouse merupakan kumpulan data yang berasal dari berbagai
sumber yang memiliki sifat hanya dapat dibaca serta dapat membantu dalam
proses pengambilan keputusan dari pihak manajemen.
2.1.5 Pengertian Data Mart
Menurut Thomas Connoly (2002,p1067), “ Data mart is a subset of a data
warehouse that support the requirements of a particular department of business
function”, artinya data mart merupakan subset / bagian dari data warehouse yang
mendukung kebutuhan informasi dari suatu departemen atau fungsi bisnis
tertentu.
10
Perbedaan antara data mart dengan data warehouse adalah :
1 Data mart hanya berfokus pada kebutuhan user yang berkaitan dengan
suatu departemen atau fungsi bisnis.
2 Data mart tidak mengandung data operasional secara detil, tidak seperti
data warehouse.
3 Data yang ada dalam data mart lebih sedikit daripada yang ada dalam data
warehouse, data mart juga lebih mudah dimengerti karena lebih
sederhana.
2.2 Karakteristik Data Warehouse
Menurut W.H. Inmon (2000, p467), “A subject-oriented, integrated, non-
volatile, and time-variant colection of data in support of management’s
decision.” Berdasarkan definisi menurut W.H. Immon, karakteristik data
warehouse adalah sebagai berikut:
2.2.1 Subject oriented (Berorientasi subjek)
Karakteristik pertama dari data warehouse adalah berorientasi pada subjek
yang memiliki makna bahwa data warehouse berfokus pada masing-masing
subjek yang terdapat dalam suatu perusahaan, bukan berdasarkan proses sehari –
hari yang dilakukan perusahaan. Untuk memudahkan pemahaman, dapat dilihat
pada tabel perbandingan antara subjek pada data warehouse dengan subjek yang
ada pada proses sehari – hari atau kegiatan operasional.
11
Tabel 2.1 Perbandingan subjek pada data warehouse dengan
subjek yang ada pada proses sehari – hari atau kegiatan operasional
Perbedaaan Data Warehouse Data Operasional
Maksud perancangan Untuk kegiatan analisis
perusahaan
Untuk kegiatan
operasional perusahaan
Lingkungan
perancangan Pada subjek utama
Pada proses yang
dilakukan perusahaan
Data yang disimpan Data analisis dari
kumpulan data
operasional dan bersifat
statis
Data detil dari hasil
kegiatan perusahaan dan
bersifat dinamis
Pengguna Managerial user dalam
jumlah yang relatif sedikit
Operational user dalam
jumlah yang relatif
banyak
2.2.2 Time variant (variasi waktu)
Dalam pembuatan data warehouse, dimensi waktu adalah suatu hal yang
penting, dimana rentang waktu yang digunakan merupakan rentang waktu yang
panjang atau bentuk variasi waktu. Horizon waktu yang digunakan dapat berkisar
antara 5 – 10 tahun dan semakin banyak data yang kita miliki, semakin baik kita
menganalisa masalah dalam perusahaan kita. Karena dimensi ini merupakan hal
yang penting maka pada bagian waktu diperlukan suatu pembagian dengan
aturan-aturan tertentu seperti per bulan, per kuartal, per tahun dan sebagainya.
12
2.2.3 Integrated (saling terintegrasi)
Sifat ini berarti bahwa data yang digunakan dalam pembuatan data
warehouse harus data yang terpadu atau terintegrasi, sehingga tercipta
konsistensi yang tinggi pada data warehouse. Konsistensi yang ditunjukkan data
warehouse dapat dilihat pada :
1. Encoding (pengkodean)
Sebagai contoh, software developer harus memberi kode “m” untuk jenis
kelamin pria, “f” untuk jenis kelamin wanita. Dapat juga memberi kode “1”
atau “male” untuk pria serta “0” atau “female” untuk wanita.
2. Attribute measurement (pengukuran atribut)
Sebagai contoh, ada beberapa satuan ukuran yang digunakan untuk satuan
panjang dalam database seperti cm, inchi, meter, dan yard. Dengan
karakteristik integrasi data, maka ukuran tersebut harus konsisten seperti
menetapkan ukuran satuan panjang yaitu cm.
3. Multiple source (banyak sumber)
Dalam database ada kemungkinan banyaknya deskripsi dari suatu
informasi, namun dengan prinsip integrasi data, seluruh informasi tersebut
harus memiliki kesamaan deskripsi yang konsisten.
4. Confilcting Keys (kunci yang berbeda)
Sebagai contoh, dalam database ada beberapa tipe data yang berbeda dalam
field yang sama seperti field kode barang dalam tabel penjualan memiliki
tipe data character (char) dengan field size 10 sedangkan dalam tabel lain
berbeda, misal char (12). Semua perbedaan itu harus dintegrasikan menjadi
satu tipe data yaitu char dengan ukuran 12.
13
2.2.4 Non-volatile (tidak berubah-ubah)
Data pada data warehouse tidak dapat mengalami perubahan, lain halnya
pada database operasional dimana dapat dilakukan operasi update, insert, dan
delete terhadap data yang menyebabkan perubahan isi pada database namun pada
data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data
(mengambil data yang dibutuhkan data warehouse) dan akses data (proses
mengakses data warehouse, seperti melakukan query atau menampilkan laporan
yang dibutuhkan), tidak ada kegiatan update data.
2.3 Granularity
Salah satu aspek terpenting dalam perancangan data warehouse adalah
granularity. Granularity menunjukkan tingkat kerincian atau keringkasan data
dalam data warehouse. Semakin rinci atau detil suatu data, maka tingkat
granularitynya semakin rendah, dan juga sebaliknya. Contoh : Sebuah transaksi
memiliki tingkat granularity yang rendah. Dengan meringkas seluruh transaksi
tersebut selama sebulan akan menyebabkan tingkat granularitynya menjadi
tinggi. Keuntungan dari granularity, yaitu :
1. Sebagai kunci untuk reusability, karena data warehouse dapat digunakan
oleh banyak user dalam berbagai cara. Misalnya dalam sebuah perusahaan,
bagian marketing dapat melihat penjualan bulanan berdasarkan wilayah
pemasaran sedangkan bagian penjualan per sales person menurut wilayah
penjualan dalam rentang waktu minggu.
2. Fleksibilitas dalam penampilan data
3. Dapat mengakomodasi kebutuhan mendatang yang belum diketahui
14
2.4 Kegiatan Inti Data Warehouse
Untuk melakukan penganalisaan dan pelaporan informasi bagi pihak –
pihak yang mengambil keputusan maka dalam merancang data warehouse
terdapat kegiatan – kegiatan yang harus ada di dalamnya, antara lain :
1. Memperoleh dan menggabungkan Data
Mendapatkan data dari berbagai sumber dan melakukan penggabungan
pada suatu tempat tertentu, data yang digabung adalah data yang akan
membantu kita dalam pembuatan laporan, karena data tersebut merupakan
suatu bentuk kesatuan.
2. Transformasi data
Pengolahan data dari awal ke bentuk data yang telah disepakati. Dengan
mengalami pemrosesan atau pengolahan terlebih dahulu, yang sama artinya
dengan pengubahan data ke bentuk yang diharapkan.
3. Pendistribusian data
Data yang akan kita gunakan dalam data warehouse berkaitan dengan
lingkungan kerja dalam lingkungan perusahaan. Bagi perusahaan yang
terhubung dengan jaringan, pemakaian data warehouse mendukung
kegiatan ini secara lebih fleksibel dan merata pada masing – masing bagian
yang ada dalam perusahaan.
4. Penggunaan data
Data yang telah disaring akan menghasilkan ringkasan yang dapat
memudahkan pengguna dalam mengambil suatu keputusan. Kegiatan
pemakaian data ini akan menjadi lebih sering jika misalnya para pengambil
15
keputusan ingin menganalisa performa karyawan dalam menjalankan dan
mengembangkan perusahaan.
2.5 Struktur Data Warehouse
Menurut W.H. Inmon (2002, p35) terdapat tingkat detil data yang berbeda
dalam data warehouse mulai dari current detail data, old detail data, lightly
summarized data dan highly summarized data. Tingkat detil data tersebut
merupakan hasil transformasi data dari tingkat operasional menuju tingkat data
warehouse. Perbedaan tingkat detil data ini dikenal dengan struktur data
warehouse. Di bawah ini akan dijelaskan lebih lanjut mengenai struktur data
warehouse.
2.5.1 Current Detail Data (Detil data saat ini)
Current detail data adalah data detil yang aktif sekarang, mencerminkan
keadaan yang sedang berjalan dan merupakan level terendah dalam data
warehouse. Curent detail data ini biasanya memerlukan media penyimpanan
data yang besar. Berikut ini beberapa alasan mengapa current detail data
menjadi perhatian utama :
1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian
utama.
2. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan
terendah.
3. Hampir selalu disimpan di media penyimpanan karena cepat diakses tetapi
mahal dan kompleks dalam pengaturannya.
16
4. Bisa digunakan dalam membuat rekapitulasi sehingga datanya harus
akurat.
2.5.2 Old Detail Data (Detil data historis)
Old Detail data merupakan data history yang dapat berupa hasil back up
yang disimpan dalam media penyimpanan yang terpisah dan pada saat tertentu
dapat diakses kembali. Data ini jarang diakses sehingga biasanya disimpan dalam
media penyimpanan alternatif seperti tape disk. Penyusunan direktori untuk data
ini harus menggambarkan umur dari data agar memudahkan untuk pengaksesan
kembali.
2.5.3 Lightly Summarized Data (Rangkuman data secara khusus)
Lightly summarized data merupakan ringkasan dari curent detil data. Di
dalam tahap ini data belum dapat digunakan untuk pengambilan keputusan
karena sifat data belum “total summary” yang artinya data masih bersifat detil.
Lightly summarized data seringkali digunakan sebagai gambaran dari keadaan
yang sedang berlangsung maupun yang belum berlangsung. Data ini hampir
selalu tersimpan dalam disk dan yang diperlukan adalah satuan waktu ringkasan
dan atribut Lightly Summarized Data.
2.5.4 Highly Summarized Data (Rangkuman data secara umum)
Highly summarized data (rangkuman data secara umum) merupakan hasil
proses ringkasan yang bersifat total, solid, serta mudah diakses. Digunakan untuk
melakukan analisa perbandingan data berdasarkan urutan waktu dan analisa yang
17
menggunakan data multidimensi. Database multi dimensi adalah suatu
tekonologi software komputer yang dirancang untuk meningkatkan efisiensi
dalam mencari tabel (query) sehingga menjadi media penyimpanan yang lebih
baik, serta memudahkan pengambilan data dengan volume yang besar.
2.5.5 Metadata
Metadata bukanlah merupakan hasil kegiatan operasional seperti keempat
jenis data diatas, namun merupakan komponen penting dalam data warehouse.
Metadata seringkali disebut ‘data tentang data’. Metadata memberikan peranan
yang penting untuk keefektifan penggunaan data warehouse karena dengan
adanya metadata, maka akan mempermudah end user dalam melakukan analisis
dan menghemat waktu. Metadata bertindak seperti indeks mengenai isi dari data
warehouse. Metadata mengandung :
1. Struktur Data
Suatu direktori untuk membantu analisis DSS (Decision Support System)
untuk mencari lokasi / tempat data dalam data warehouse.
2. Algoritma untuk meringkas data
Suatu algoritma untuk proses summary data antara curent detail data
dengan lightly summarized data dan antara lightly summarized data dengan
highly summarized data, dan lain-lain.
3. Pemetaan dari data operasional ke data warehouse
Suatu panduan pemetaan data pada saat data ditransformasi / diubah dari
lingkup data operasional menjadi lingkup data warehouse.
18
Gambar 2.1 Struktur Data warehouse
2.6 Arsitektur Data Warehouse
Menurut Vidette Poe (1996, p24), arsitektur adalah sekumpulan aturan atau
struktur yang memberikan kerangka untuk keseluruhan rancangan pada suatu
sistem atau produk. Arsitektur data menyediakan kerangka dengan
mengidentifikasi dan memahami bagaimana data akan dipindahkan melalui
sistem dan digunakan dalam perusahaan. Arsitektur data untuk data warehouse
mempunyai komponen utama yaitu database yang hanya dapat dibaca atau read-
only database. Menurut Vidette Poe (1996, p40 – 41) karakteristik arsitektur
data warehouse yaitu :
1. Data diambil dari sistem asal (sistem informasi yang ada), database dan
file.
Highly summarized
Monthly sales by product line 1981-1992
Monthly sales by subproduct line 1984-1992
lightly summarized ( datamart )
Current detail
Sales detail 1990-1991
Sales detail 1984-1989
Old detail
Operational transformatin
metadata
19
2. Data dari sistem asal dintegrasikan dan ditransformasikan sebelum
disimpan ke dalam Database Management System (DBMS) seperti Oracle,
Ms SQL Server, IBM DB2, Sybase dan masih banyak yang lainnya.
3. Data warehouse adalah jenis database read-only yang diciptakan untuk
mengambil keputusan.
4. User mengakses data warehouse melalui front - end tool atau aplikasi.
Front End Tool
Gambar 2.2 Arsitektur Data warehouse
(Sumber : Poe,1996,p41)
2.7 Bentuk / Anatomi Data warehouse
Dalam menentukan bentuk data warehouse yang akan digunakan oleh suatu
perusahaan, terlebih dahulu harus diketahui kebutuhan yang diperlukan dalam
menjalankan aplikasi yang dirancang. Bentuk umum yang sering digunakan
dalam data warehouse adalah :
1. Functional Data Warehouse (Data warehouse Fungsional)
2. Centralized Data Warehouse (Data warehouse Terpusat)
3. Distributed Data Warehouse (Data warehouse Terdistribusi)
source
source
Data
Warehouse
source
Transformasi data dan informasi
20
2.7.1 Functional Data Warehouse (Data warehouse Fungsional)
Data warehouse dibuat lebih dari satu dan dikelompokkan berdasarkan
masing–masing fungsinya seperti fungsi keuangan (financial), fungsi marketing,
fungsi kinerja personalia dan lain- lainnya. Keuntungan dari bentuk ini adalah
dapat dengan mudah dibangun dengan biaya yang relatif murah, sedangkan
kerugiannya adalah terbatasnya kemampuan dalam pengumpulan data bagi
pengguna. Penerapan jenis sistem pengumpulan data seperti ini beresiko
kehilangan konsistensi data di luar lingkungan bisnis bersangkutan. Apabila
pendekatan ini lingkupnya diperbesar dari lingkungan fungsional menjadi
lingkup perusahaan, konsistensi data perusahaan tidak lagi dapat dijamin.
Gambar 2.3 Functional Data Warehouse
2.7.2 Centralized Data Warehouse (Data warehouse Terpusat)
Bentuk ini terlihat seperti bentuk functional data warehouse, namun disini
sumber data terlebih dahulu dikumpulkan dan dintegrasikan pada suatu tempat
terpusat, kemudian barulah data tersebut dibagi – bagi berdasarkan fungsi –
source
source
source
Functional Data
Warehouse
Workstation
Workstation
Functional Data
Warehouse
21
fungsi yang dibutuhkan oleh perusahaan dan bentuk ini sering digunakan oleh
perusahaan yang belum memiliki jaringan eksternal. Keuntungan bentuk ini
dibandingkan dengan data warehouse fungsional adalah data benar-benar
terpadu. Bentuk ini mengharuskan pemasok data mengirimkan data tepat pada
waktunya supaya tetap konsisten dengan pemasok lainnya. Di samping itu,
pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak
dapat secara langsung berhubungan dengan pemasok datanya sendiri.
Gambar 2.4 Centralized Data Warehouse
2.7.3 Distributed Data Warehouse (Data warehouse Terdistribusi)
Bentuk ini dikembangkan berdasarkan konsep data warehouse gateway
yang memungkinkan pemakai untuk langsung berhubungan dengan sumber data
maupun dengan pusat pengumpul data lainnya. Gambaran pemakai atas data
adalah berupa gambaran logikal karena data mungkin diambil dari berbagai
sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi
“client-server” untuk mengambil data dari berbagai sumber. Pendekatan ini
memungkinkan tiap departemen atau divisi untuk membangun pengumpul data
source
source
source
Centralized Data
Warehouse
Functional Data
Warehouse
Functional Data
Warehouse
Workstation
Workstation
22
fungsionalnya masing-masing atau bahkan sistem operasionalnya dan
memadukan bagian-bagian tersebut dengan teknologi client-server. Pendekatan
ini memerlukan biaya yang sangat besar karena setiap sistem pengumpulan data
fungsional dan sistem operasinya dikelola secara terpisah. Di samping itu,
supaya berguna bagi perusahaan data harus disinkronisasikan untuk memelihara
keterpaduannya. Metode ini akan sangat efektif apabila data telah tersedia dalam
bentuk yang konsisten dan pemakai dapat menambah data tersebut dengan
informasi baru apabila ingin memperoleh gambaran baru atas informasi.
Gambar 2.5 Distributed Data Warehouse
2.8 Kegunaan dan Keuntungan Data warehouse
Ada beberapa kegunaan dari Data warehouse, yaitu :
1. Pembuatan laporan
Pembuatan laporan adalah salah satu kegunaan data warehouse yang paling
umum. Dengan melakukan query data dalam data warehouse dapat
source
source
source
Data Warehouse Gateway
Workstation
Workstation
23
dihasilkan informasi pertahun, perkuartal, dan bahkan perhari. Query
tersebut digunakan dengan tujuan memperoleh jawaban atas pertanyaan-
pertanyaan khusus, seperti siapa, kapan, dimana dan sebagainya.
2. On-Line Analytical Processing (OLAP)
Data warehouse digunakan dalam melakukan analisis bisnis untuk
menyelidiki kecenderungan pasar atau faktor-faktor penyebabnya. Dengan
adanya data warehouse semua informasi baik rincian maupun ringkasan
yang dibutuhkan dalam proses analisis mudah didapat. Dalam hal ini, data
warehouse merupakan tool yang handal dalam menganalisis data yang
kompleks.
3. Data mining
Penggunaan data warehouse tingkat lanjut, dimana data warehouse
digunakan dalam pencarian pola dan hubungan antara data dengan tujuan
membuat keputusan bisnis bagi pihak manajemen. Dalam hal ini, software
dirancang untuk pola statistik dalam data sehingga dapat mengetahui
kecenderungan yang ada.
4. Proses Informasi Eksekutif
Data warehouse digunakan untuk mencari ringkasan informasi yang
penting dengan tujuan membuat keputusan bisnis tanpa harus menjelajahi
keseluruhan data. Dengan menggunakan data warehouse, segala laporan
telah diringkas dan dapat pula diketahui rinciannya secara lengkap
sehingga mempermudah proses pengambilan keputusan. Informasi dan data
pada laporan menjadi lebih informatif bagi pengguna, dalam hal ini pihak
manajemen dan eksekutif.
24
Berdasarkan Connoly (2002, p1048), implementasi yang baik dari data
warehouse dapat memberikan banyak keuntungan terhadap suatu perusahaan
meliputi :
1. Potensi yang Tinggi terhadap Return of Investment (ROI)
Perusahaan harus mengakui bahwa implementasi data warehouse
membutuhkan sumber daya dan biaya yang sangat besar. Tapi berdasarkan
penelitian yang dilakukan oleh International Data Corporation (IDC)
tahun 1996, dilaporkan bahwa rata – rata ROI dalam 3 tahun, dengan data
warehouse, mencapai 401%.
2. Keuntungan dalam persaingan
ROI yang besar bagi perusahaan – perusahaan yang berhasil menerapkan
data warehouse adalah fakta atas keuntungan bersaing yang tinggi yang
menyertai teknologi tersebut. Kelebihan ini bertambah dengan
menyediakan akses bagi para pembuat keputusan, ke data yang dapat
menampilkan informasi yang sebelumnya tidak tersedia dan tidak
diketahui, seperti trends dan demands.
3. Peningkatan produktivitas pada Corporate Decision-Makers
Data warehouse meningkatkan produktivitas para pembuat keputusan
dengan membuat database gabungan yang konsisten, subject – oriented
dan berisi data historis. Data gabungan dari berbagai sistem menghasilkan
satu pandangan yang konsisten dari sebuah perusahaan. Jadi, dengan
mengubah data menjadi informasi yang berarti, data warehouse membuat
para manajer bisnis menghasilkan analisa yang lebih akurat dan konsisten.
25
2.9 Perancangan Data warehouse
Menurut Kimball (2002, p30), urutan tahap-tahap perancangan logical data
warehouse yaitu :
1 Memilih proses bisnis
User memegang peranan penting dalam pemilihan proses bisnis. Ukuran
performance data warehouse yang diharapkan oleh user merupakan hasil
dari proses pengukuran bisnis. Contoh proses bisnis meliputi, pembelian
bahan mentah, pemesanan, pengiriman, invoice, dan persediaan.
Dengan berfokus pada proses bisnis, dan bukan pada departemen bisnis,
maka dapat dicapai informasi yang konsisten bagi perusahaan secara
keseluruhan. Jika data warehouse dibangun berdasarkan departemen,
maka akan terdapat data duplikat dengan label dan istilah yang berbeda-
beda, yang mengakibatkan data tidak konsisten.
2 Menentukan grain dari proses bisnis
Menentukan grain berarti menspesifikasikan secara tepat apa yang
direpresentasikan oleh baris tabel fakta individual. Grain menyampaikan
level detil yang berhubungan dengan tabel fakta. Penentuan grain
merupakan tahap critical dalam perancangan logikal data warehouse.
3 Memilih dimensi-dimensi untuk setiap tabel fakta
Jika grain telah ditentukan dengan benar maka dimensi-dimensi dapat
diidentifikasikan dengan mudah. Pada dimensi, atribut-atribut berupa teks
dapat disertakan guna menyempurnakan tabel dimensi. Contoh lazim dari
dimensi meliputi waktu, produk, pelanggan, tipe transaksi, dan status.
26
4 Mengidentifikasi fakta-fakta
Fakta dapat diidentifikasi dengan memberikan jawaban atas pertanyaan
“Apa yang ingin diukur?“. Semua candidate fact haruslah sesuai dengan
grain yang telah didefinisikan dalam tahap 2. Fakta bagi grain yang
berbeda ditempatkan dalam tabel fakta terpisah. Nilai fakta berupa
numerik, seperti jumlah pesanan atau total dolar.
Menurut Vidette Poe (1996, p133), alat yang digunakan untuk merancang
data warehouse adalah skema bintang (star schema). Skema bintang merupakan
struktur sederhana dengan tabel – tabel yang relatif sedikit dan menggambarkan
hubungan antara tabel fakta dan tabel dimensi dengan jelas. Rancangan ini
mampu melakukan query dengan cepat serta mudah dimengerti bahkan oleh
analis dan pengguna akhir atau orang awam yang tidak mengerti struktur
database.
2.9.1 Definisi Skema Bintang
Menurut Thomas Connoly (2002,p1079), “Star schema is a logical
structure that has a fact table containing factual data in the center, surrounded
by dimension tables containing reference data (which can be denormalized)”,
yang berarti skema bintang merupakan struktur logikal yang memiliki tabel fakta
yang berisi data fakta, dikelilingi oleh tabel dimensi yang berisi data referensi
(yang dapat didenormalisasikan). Teori Connoly ini didukung oleh
A.Silberschatz., Korth, H. F. Sudarshan, S.(2003) dan Ralph Kimball (1996).
27
2.9.2 Keuntungan Skema Bintang
Keuntungan menggunakan skema bintang menurut Connoly adalah :
1. Efisiensi, struktur database yang konsisten sehingga lebih efisien dalam
mengakses data dengan menggunakan alat / tool untuk menampilkan data
termasuk laporan tertulis dan query.
2. Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang dapat
beradaptasi terhadap perubahan kebutuhan pengguna, karena semua tabel
dimensi memiliki kesamaan dalam hal menyediakan akses ke tabel fakta.
3. Extensibility, model dimensional dapat dikembangkan. Seperti menambah
tabel fakta selama data masih konsisten, menambah tabel dimensi selama
ada nilai tunggal di tabel dimensi tersebut yang mendefinisikan setiap
record tabel fakta yang ada, menambahkan attribute tabel dimensi, dan
memecah record tabel dimensi yang ada menjadi level yang lebih rendah
dari level sebelumnya.
4. Kemampuan untuk menggambarkan situasi bisnis pada umumnya,
pendekatan standar untuk menangani situasi umum didunia bisnis yang
terus bertambah.
5. Proses query yang bisa diprediksi, aplikasi data warehouse yang mencari
data dari level yang dibawahnya akan dengan mudah menambah jumlah
atribut pada tabel dimensi dari sebuah skema bintang. Aplikasi yang
mencari data dari level yang setara akan menghubungkan tabel fakta yang
terpisah melalui tabel dimensi yang dapat diakses bersama.
28
2.9.3 Tabel dalam Skema Bintang
Dalam skema bintang terdapat dua tipe tabel, yaitu tabel fakta dan tabel
dimensi. Tabel fakta disebut juga sebagai tabel mayor, berisi data aktual yang
akan dianalisis, yang terdiri dari data kuantitatif atau data fakta mengenai bisnis
serta informasi yang diquery. Informasi pada tabel fakta ini berupa :
• Measure, biasanya diukur secara numerik karena bersifat data kuantitatif.
• Foreign key dari primary key yang ada pada masing – masing tabel
dimensi yang berhubungan.
• Mengandung banyak kolom dan jutaan baris.
Tabel dimensi disebut juga sebagai tabel minor karena lebih kecil dan
berisi kategori dengan ringkasan data detil, yang merupakan deskripsi lebih
lanjut dari data yang ada pada tabel fakta (mencerminkan dimensi bisnis).
Misalnya laporan mutasi pada tabel fakta dapat dilaporkan dalam dimensi waktu,
yang berupa per-bulan atau per-tahun. Kolom pada tabel fakta yang bukan
primary key atau foreign key disebut kolom data, sedangkan pada tabel dimensi
disebut atribut.
2.9.4 Jenis Skema Bintang
Dalam perancangan data warehouse, terdapat beberapa jenis skema bintang
yang dapat digunakan sesuai dengan kebutuhan, yaitu skema bintang sederhana,
skema bintang majemuk, dan skema bintang snowflake.
2.9.4.1 Skema Bintang Sederhana
Alasan memilih skema bintang sederhana antara lain :
29
1. Menyediakan response time yang lebih baik.
2. Struktur rancangan yang sederhana mudah dimengerti pemakai.
Dalam skema ini, setiap tabel harus memiliki primary key yang terdiri dari
satu kolom atau lebih dan primary key tersebut harus bersifat unik. Primary key
dari tabel fakta terdiri dari satu atau lebih foreign key. Foreign key adalah kolom
pada satu tabel yang nilainya didefinisikan oleh primary key pada tabel yang lain.
Gambar dibawah ini menggambarkan hubungan antara tabel fakta dan tabel
dimensi. Tabel fakta memiliki tiga foreign key, dimana masing-masing foreign
key itu merupakan primary key pada tabel dimensi.
Gambar 2.6 Skema Bintang Sederhana
Dalam sebuah skema bintang, dapat juga memiliki lebih dari satu tabel
fakta, karena adanya fakta yang tidak saling berhubungan. Misalnya disamping
penjualan terdapat tabel fakta forecasting dan tabel fakta result. Tetapi
walaupun terdapat banyak tabel fakta, tabel dimensinya tetap digunakan secara
30
bersama-sama. Skema ini juga disebut Constellation Schema dan sering
digunakan untuk jumlah data yang besar.
Gambar di bawah ini menunjukkan adanya dua tabel fakta dan tiga tabel
dimensi yang memperlihatkan hubungan many to one antara foreign key pada
kedua tabel fakta tersebut dengan primary key pada masing – masing tabel
dimensi.
Gambar 2.7 Skema Bintang Dengan Beberapa Tabel Fakta
Tabel fakta juga dapat digunakan untuk menggambarkan hubungan many-
to-many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis
skema bintang ini dikenal dengan tabel asosiasi. Tabel asosiasi berguna untuk
menyelaraskan hubungan many-to-many di antara dimensi yang berbeda.
31
Gambar 2.8 Skema bintang dengan tabel Asosiasi
Tabel dimensi mungkin mengandung foreign key yang mereferensikan
primary key di tabel dimensi yang lain. Tabel dimensi yang direferensikan ini
yang dinamakan outboard table / secondary dimension table. Pada gambar
berikut, tabel dimensi-2 mempunyai 2 outboard table, yaitu tabel dimensi-4 dan
tabel dimensi-5.
32
Gambar 2.9 Skema Bintang Dengan Tabel Dimensi Tambahan
2.9.4.2 Skema Bintang Majemuk
Dalam skema bintang majemuk, tabel fakta memiliki dua kumpulan
foreign key, yang pertama mengandung suatu referensi dengan tabel dimensi
yang lain sedangkan sisanya adalah primary key yang merupakan gabungan dari
satu atau lebih kolom yang menghasilkan suatu identifikasi untuk setiap barisnya.
Bedanya skema bintang majemuk dengan skema bintang sederhana adalah saling
tidak identiknya primary key dan foreign key dalam skema bintang majemuk.
33
Gambar 2.10 Skema Bintang Majemuk
2.9.4.3 Skema Snowflake
Menurut Thomas Connoly (2002, p1080), “Snowflake schema is a variant
of the star schema where dimension table do not contain denormalized data”,
yang berarti skema snowflake merupakan bentuk lain dari skema bintang dimana
data dalam tabel dimensi belum dinormalisasi. Suatu tabel dimensi dapat
memiliki tabel dimensi lainnya.
Ciri-ciri dari skema snowflake adalah:
1. Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut.
2. Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi
3. Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan
tabel atribut berlevel rendah
Keuntungan dari skema snowflake adalah :
1. Kecepatan memindahkan data dari data OLTP kedalam metadata
2. Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana
dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya
34
3. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal
ketiga.
Sedangkan kerugiannya adalah mempunyai masalah yang besar dalam hal
kinerja (performance), hal ini disebabkan semakin banyaknya join antar tabel-
tabel yang dilakukan dalam skema snowflake ini, maka semakin lambat juga
kinerja yang dilakukan.
Gambar 2.11 Skema Snowflake
2.10 Agregasi
Agregasi adalah proses perhitungan data fakta terhadap atribut – atribut
yang telah didefinisikan. Sebagai contoh, dapat dibuat dari jumlah mahasiswa
berdasarkan jurusan dan program studi dengan menghitung jumlah mahasiswa
dari data transaksi yang terjadi. Agregasi dapat dibuat selama proses transformasi
dan pemuatan data ke dalam data warehouse. Menurut Poe (1996, p136), faktor
yang mendorong pembuatan agregasi adalah :
• Meningkatkan penampilan pencarian (searching).
35
• Mengurangi jumlah penggunaan kode produk universal.
Suatu agregasi yang baik dapat dibuat untuk digunakan oleh tiga ratus user
dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan
membuat agregasi yang membutuhkan waktu dua jam tetapi hanya digunakan
sekali dalam setahun oleh satu user saja.
Salah satu teknik yang harus dicatat adalah saat pemuatan data warehouse,
kita tetap membutuhkan teknik data warehouse klasik seperti partisi tabel secara
fisik. Hal ini menjadi penting bilamana data warehouse mencapai gigabyte data.
2.11 Denormalisasi
Menurut Inmon (2002, p389) denormalisasi adalah teknik dari penempatan
data normalisasi dalam lokasi fisik yang mengoptimasikan kinerja dari sistem.
Menurut Vidette Poe (1996,p137) denormalisasi adalah proses
penggabungan table-tabel untuk meningkatkan penampilan
Jadi, denormalisasi adalah suatu proses yang merubah bentuk normalisasi
dari database dengan cara penggabungan tabel dan merupakan sebuah proses
yang secara sengaja dilakukan dengan melanggar peraturan bentuk normal dari
normalisasi dengan tujuan untuk meningkatkan kinerja (performance)
pengaksesan data yang ada.
Keuntungan melakukan proses denormalisasi adalah :
• Mengurangi jumlah relasi yang terjadi antar tabel – tabel yang harus
mengalami proses pada waktu pencarian sehingga akan meningkatkan
kecepatan proses query data.
36
• Membuat struktur fisik database agar mudah dimengerti menurut model
dimensi dari pemakai. Struktur tabel yang dibuat sesuai keinginan
pemakai memungkinkan terjadinya akses langsung yang sekali lagi akan
meningkatkan kinerja.
Kelemahan melakukan proses denormalisasi adalah :
• Proses denormalisasi secara tidak langsung akan membuat redundansi
data.
• Proses ini memerlukan alokasi memori dan storage (tempat
penyimpanan) yang besar.
2.12 Matriks
Matriks menurut Kimball (2002, p398) adalah tool yang digunakan untuk
membuat, mendokumentasikan, dan mengkomunikasikan arsitektur data, di
mana baris-baris pada matriks mengidentifikasikan proses bisnis perusahaan dan
kolom – kolomnya merepresentasikan dimensi-dimensi yang sesuai dengan
proses bisnis perusahaan. Intersection dari dimensi-dimensi yang relevan dengan
masing - masing proses bisnis diberi tanda untuk menunjukkan ada hubungan
antara dimensi dengan proses bisnis tertentu.
Matriks merupakan suatu device yang membantu penggunanya baik dalam
hal perencanaan maupun proses komunikasi. Meskipun matriks hanya terdiri dari
baris dan kolom, namun mampu mendefinisikan keseluruhan arsitektur data bagi
warehouse. Matriks memperlihatkan keseluruhan rencana yang dirancang dalam
suatu bentuk yang ringkas sehingga dapat digunakan untuk membantu senior IT
37
dan manajemen bisnis dalam mengkomunikasikan rancangan rencana
(Kimball,2002, p81).
2.13 State Transition Diagram (STD)
State-Transition Diagram (STD) menggambarkan bagaimana perilaku
sistem saat mendapatkan event dari luar (External Events). STD mewakili
berbagai mode perilaku dari sistem dan perlakuan yang terdapat pada transisi
antar state. STD menjadi dasar dari model perilaku.
Gambar 2.12 State Transition Diagram (STD)
2.14 Kunci Sukses Data warehouse
Membangun data warehouse tidaklah mudah seperti membalikkan
telapak tangan, kita harus memperhatikan hal-hal berikut ini untuk mencapai
kesuksesan dalam perancangan kita (Vidette Poe, 1996,p90-95), hal-hal tersebut
adalah:
1. Kejelasan dalam tujuan, yang memberikan gambaran awal untuk memulai data
warehouse sesuai dengan kebutuhan perusahaan, di mana akan membatasi
State 1
State 2
Condition
Action
38
ruang kerja kita untuk selalu konsisten.
2. Memahami arsitektur data warehouse yang digunakan, ini merupakan blue
print yang akan digunakan dalam mengembangkan sistem pendukung
keputusan, dan menyangkut dengan banyak aspek dalam hal bagaimana
sistem tersebut akan dikembangkan.
3. Dukungan infrastruktur teknikal yang benar, seperti alat-alat, platform,
database, jaringan komunikasi, pelatihan dan sebagainya yang akan
menentukan proses pembuatan sebelum data warehouse mulai
dikembangkan.
4. Kejelasan tanggung jawab tim, masing-masing anggota tim harus bertanggung
jawab untuk masing-masing bagian yang ia tangani, seperti pemodelan data,
pelatihan dan pengaturan jaringan.
5. Menjamin anggota tim dan pengguna memahami perbedaan antara data
operasional dan data pendukung keputusan, dengan memperhatikan definisi awal
dari data warehouse yang digunakan dalam pemrosesan analisis
perusahaan.
6. Mendapatkan pelatihan secara benar, untuk mendapatkan landasan yang
kuat berupa pengetahuan yang mendukung keputusan bagi semua anggota
sebelum proyek mulai dijalankan.
7. Mendapatkan sumber yang benar, untuk mendapatkan ini kita dapat
mencari suatu badan atau konsultan yang memahami benar proses data
warehouse yang akan kita buat atau kita dapat pula mencari perusahaan
yang sukses dalam mengimplementasikan data warehousenya, sehingga
kita dapat belajar dari pengalaman yang telah mereka miliki sebelumnya.
39
8. Pemilihan aplikasi pengaksesan data front end berdasarkan kebutuhan
dan kemampuan, sehingga aplikasi yang dipakai benar-benar terpakai
secara optimal dan memudahkan dalam pengaksesan data yang dibutuhkan
oleh pengguna.
2.15 Teori Persediaan dan Penjualan
2.13.1 Pengertian Persediaan
Dalam perusahaan manufaktur, persediaan terdiri dari persediaan produk
jadi, persediaan produk dalam proses, persediaan bahan baku, persediaan bahan
penolong, persediaan bahan habis pakai pabrik, dan persediaan suku cadang.
Dalam perusahaan dagang, persediaan hanya terdiri dari 1 (satu) golongan, yaitu
persediaan barang dagangan, yang merupakan barang yang dibeli untuk tujuan
dijual kembali. Transaksi persediaan yang terjadi di gudang, biasanya mencakup
hal berikut ini :
• Penerimaan produk
• Penempatan produk di bagian pemeriksaan
• Pengambilan produk dari bagian pemeriksaan
• Pengembalian produk kepada vendor jika produk tidak sesuai dengan
yang diharapkan
• Penempatan produk pada tempat penyimpanannya
• Pengesahan produk untuk dijual
• Pengambilan produk dari tempat penyimpanannya
• Pengepakan produk untuk pengiriman
• Pengiriman produk ke pelanggan
40
• Penerimaan produk dari pelanggan
• Pengembalian produk ke bagian persediaan dari pengembalian pelanggan
• Produk yang dikembalikan pelanggan dipisahkan dari bagian persediaan
2.13.2 Pengertian Penjualan
Mulyadi (1997, p204) berpendapat bahwa kegiatan penjualan terdiri dari
transaksi penjualan barang atau jasa, baik secara kredit maupun secara tunai.
Dalam transaksi penjualan kredit, jika order dari pelanggan telah dipenuhi
dengan pengiriman barang atau penyerahan jasa, untuk jangka waktu tertentu
perusahaan memiliki piutang kepada pelanggannya. Dalam transaksi penjualan
tunai, barang atau jasa baru diserahkan oleh perusahaan kepada pembeli jika
perusahaan telah menerima kas dari pembeli.
Jadi dapat dikatakan bahwa penjualan merupakan suatu kegiatan yang
dilakukan oleh penjual (perusahaan) dengan jalan menukarkan barang/ jasanya
kepada pembeli, dengan timbal balik berupa suatu imbalan yang sepadan dengan
besarnya nilai dari barang/ jasa yang diberikan tersebut. Imbalan tersebut dapat
diperoleh sebelum penyerahan barang/ jasa dilakukan (penjualan tunai), ataupun
dalam jangka waktu tertentu setelah barang/ jasa diserahkan (penjualan kredit).