54
TUGAS DATA WAREHOUSING DAN DATA MINING S Di Susun Oleh : Nama : Fahrizal Umam NIM : 2012081057 Kelas : TI. B 2012 FAKULTAS ILMU KOMPUTER

Tugas Data Warehousing Dan Data Mining

Embed Size (px)

DESCRIPTION

tugas

Citation preview

Page 1: Tugas Data Warehousing Dan Data Mining

TUGAS

DATA WAREHOUSING DAN DATA MINING

S

Di Susun Oleh :

Nama : Fahrizal Umam

NIM : 2012081057

Kelas : TI. B 2012

FAKULTAS ILMU KOMPUTER

UNIVERSITAS KUNINGAN

2015

Page 2: Tugas Data Warehousing Dan Data Mining

BAB 16

DATA PERGUDANGAN DAN WEB

TUJUAN BAB

Memahami apa yang Web-memungkinkan sarana gudang data dan memeriksa alasan untuk melakukannya.

Menghargai implikasi dari konvergensi teknologi Web dan orang-orang dari data gudang.

Menyelidiki semua aspek penyampaian informasi berbasis Web Mempelajari bagaimana OLAP dan Web menghubungkan dan

mempelajari pendekatan yang berbeda untuk menipu-necting mereka. Memeriksa langkah-langkah untuk membangun sebuah gudang data

Web-diaktifkan.

Apa fenomena yang paling dominan dalam komputasi dan komunikasi yang dimulai pada 1990-an? Tidak diragukan lagi, itu adalah Internet dengan Web Seluruh Dunia. Dampak dari Web pada kehidupan kita dan bisnis dapat cocok hanya oleh sangat sedikit perkembangan lain selama beberapa tahun terakhir.

Pada 1970-an, kita mengalami terobosan besar ketika komputer pribadi diantar dengan antarmuka yang grafis, perangkat penunjuk, dan ikon. Hari ini adalah terobosan Web, yang dibangun di atas revolusi sebelumnya. Membuat komputer pribadi yang berguna dan efektif adalah tujuan kami pada 1970-an dan 1980-an. Pembuatan Web berguna dan efektif adalah tujuan kami hari ini. Pertumbuhan Internet dan penggunaan Web telah dibayangi revolusi sebelumnya. Pada awal tahun 2000, sekitar 50 juta rumah tangga di seluruh dunia diperkirakan akan menggunakan Internet. Pada akhir tahun 2005, jumlah ini diperkirakan akan tumbuh sepuluh kali lipat. Sekitar 500 juta rumah tangga di seluruh dunia akan browsing Web saat itu.

Web mengubah segalanya, seperti yang mereka katakan. Data pergudangan tidak terkecuali. Pada 1980-an, data warehousing masih sedang didefinisikan dan berkembang. Selama tahun 1990-an, itu

377

378   DATA PERGUDANGAN DAN WEB

Page 3: Tugas Data Warehousing Dan Data Mining

jatuh tempo. Sekarang, setelah revolusi Web dari tahun 1990-an, data warehousing telah mengambil tempat yang menonjol dalam gerakan Web. Mengapa?

Apa salah satu manfaat utama dari revolusi Web? Secara dramatis mengurangi biaya komunikasi-kation. Web telah tajam berkurang biaya penyampaian informasi. Apa relevansi itu? Apa satu tujuan utama dari data warehouse? Ini adalah penyampaian informasi strategis. Jadi mereka cocok dengan sempurna. Data warehouse adalah untuk memberikan in-formasi; Internet membuatnya hemat biaya untuk melakukannya. Kami telah tiba di konsep data warehouse Web-enabled atau "Data Webhouse." Web memaksa kita untuk memikirkan kembali desain data warehouse dan penyebaran.

Dalam Bab 3, kami sempat mempertimbangkan data warehouse Web-enabled. Secara khusus, kita membahas dua aspek topik ini. Pertama, kita dianggap cara menggunakan Web sebagai salah satu saluran penyampaian informasi. Ini adalah mengambil gudang ke Web, membuka gudang data ke lebih dari set tradisional pengguna. Bab ini berfokus pada ini sebagai-pect dari hubungan antara Web dan data warehouse.

Aspek lain, dibahas secara singkat dalam Bab 3, berkaitan dengan membawa Web untuk gudang. Aspek ini berhubungan dengan e-commerce perusahaan Anda, di mana data klik aliran situs Web perusahaan Anda dibawa ke Webhouse data untuk analisis. Dalam bab ini, kita akan melewati aspek koneksi Web-gudang. Banyak artikel oleh beberapa penulis dan praktisi, dan sebuah buku yang sangat baik co-ditulis oleh Dr Ralph Kimball jangan keadilan yang memadai baru ke topik Webhouse data. Silakan lihat Referensi untuk informasi lebih lanjut.

WEB-ENABLED DATA WAREHOUSE

Sebuah gudang data Web-enabled menggunakan Web untuk pengiriman informasi dan kolaborasi di antara pengguna. Seperti bulan berlalu, semakin banyak gudang data sedang terhubung ke Web. Pada dasarnya, ini berarti peningkatan akses informasi dalam data gudang-rumah. Peningkatan akses informasi, pada gilirannya, berarti peningkatan tingkat pengetahuan dari perusahaan. Memang benar bahwa bahkan sebelum menghubungkan ke Web, Anda bisa memberikan akses informasi untuk lebih banyak pengguna Anda, tetapi dengan banyak kesulitan dan peningkatan proporsional dalam biaya komunikasi. Web telah mengubah semua itu. Sekarang jauh lebih mudah untuk menambahkan lebih banyak pengguna. Infrastruktur komunikasi yang sudah ada. Hampir semua pengguna Anda memiliki browser Web. Tidak ada perangkat lunak klien

Page 4: Tugas Data Warehousing Dan Data Mining

tambahan diperlukan. Anda dapat memanfaatkan Web yang al-siap ada. Pertumbuhan eksponensial dari Web, dengan jaringan, server, pengguna, dan halaman, telah membawa adopsi dari internet, intranet, dan ekstranet sebagai media transmisi informa-tion. Data warehouse Web-enabled mengambil tengah panggung dalam revolusi Web. Mari kita melihat mengapa.

Mengapa Web?

Ini tampaknya cukup alami untuk menghubungkan data warehouse ke Web. Mengapa kita mengatakan ini? Untuk sesaat, memikirkan bagaimana pengguna Anda melihat Web. Pertama, mereka melihat Web sebagai sumber besar informasi. Mereka menemukan konten data yang berguna dan menarik. Pengguna internal Anda, pelanggan, dan mitra bisnis yang sudah menggunakan Web sering. Mereka tahu bagaimana untuk bisa terhubung. Web di mana-mana. Matahari tidak pernah terbenam di Web. Satu-satunya perangkat lunak klien dibutuhkan adalah browser Web, dan hampir semua orang, tua dan muda, telah belajar bagaimana untuk memulai dan menggunakan browser. Sejumlah besar vendor perangkat lunak memiliki al-siap membuat produk mereka Web-siap.

Page 5: Tugas Data Warehousing Dan Data Mining

WEB-ENABLED DATA WAREHOUSE

379

Sekarang perhatikan gudang data Anda dalam kaitannya dengan Web. Pengguna Anda membutuhkan data warehouse untuk informasi. Mitra bisnis Anda dapat menggunakan beberapa informa-tion dari data warehouse. Apa semua ini memiliki kesamaan? Keakraban dengan Web dan kemampuan untuk mengaksesnya dengan mudah. Ini adalah alasan yang kuat untuk data gudang-rumah Web-enabled.

Bagaimana Anda memanfaatkan teknologi Web untuk gudang data Anda? Bagaimana Anda menghubungkan gudang ke Web? Mari kita segera meninjau mekanisme pengiriman tiga informasi yang perusahaan telah mengadopsi berbasis teknologi Web. Dalam setiap kasus, pengguna mengakses informasi dengan Web browser.

Internet. Media pertama adalah, tentu saja, internet, yang menyediakan penerbangan murah trans-misi informasi. Anda dapat bertukar informasi dengan siapa pun dalam atau di luar perusahaan. Karena informasi yang dikirimkan melalui jaringan publik, masalah keamanan harus diatasi.

Intranet. Dari waktu istilah "intranet" diciptakan pada tahun 1995, konsep ini dari jaringan pri-swasta telah mencengkeram dunia usaha. Intranet adalah jaringan komputer pribadi berdasarkan standar komunikasi data Internet publik. Aplikasi pasca-ing informasi lebih intranet semua berada dalam firewall dan, karena itu, lebih se-menyembuhkan. Anda dapat memiliki semua manfaat dari teknologi web populer. Selain itu, Anda dapat mengatur keamanan yang lebih baik pada intranet.

Extranet. Internet dan intranet telah diikuti oleh ekstranet. Extranet tidak sepenuhnya terbuka seperti Internet, tidak juga dibatasi hanya untuk penggunaan internal seperti di-tranet. Extranet adalah intranet yang terbuka untuk akses selektif oleh pihak luar. Dari intranet Anda, selain mencari ke dalam dan ke bawah, Anda bisa melihat keluar untuk pelanggan, pemasok, dan mitra bisnis Anda.

Gambar 16-1 mengilustrasikan bagaimana informasi dari gudang data dapat dikirim melalui mekanisme penyampaian informasi tersebut. Perhatikan bagaimana data warehouse Anda dapat dikerahkan melalui Web. Jika Anda memilih untuk membatasi data warehouse untuk pengguna internal, maka Anda mengadopsi intranet. Jika itu harus dibuka kepada pihak luar dengan otorisasi

Page 6: Tugas Data Warehousing Dan Data Mining

yang tepat, Anda pergi dengan ekstranet. Dalam kedua kasus, teknologi penyampaian informasi dan protokol trans-misi yang sama.

Intranet dan extranet yang datang dengan beberapa keunggulan. Berikut adalah beberapa:

Dengan browser universal, pengguna Anda akan memiliki satu titik masuk untuk informa-tion.

Pelatihan yang minimal diperlukan untuk mengakses informasi. Pengguna sudah tahu bagaimana menggunakan browser.

Browser Universal akan berjalan pada sistem. Teknologi web membuka berbagai format informasi kepada pengguna.

Mereka dapat kembali ceive teks, gambar, grafik, bahkan video dan audio.

Sangat mudah untuk menjaga intranet / extranet diperbarui sehingga akan ada satu sumber di-formasi.

Membuka gudang data untuk mitra bisnis Anda selama menumbuhkan extranet dan memperkuat kemitraan.

Penyebaran dan biaya pemeliharaan rendah untuk Web-memungkinkan gudang data Anda. Terutama, biaya jaringan kurang. Biaya infrastruktur juga rendah.

Page 7: Tugas Data Warehousing Dan Data Mining

380   DATA PERGUDANGAN DAN WEB

Konvergensi Teknologi

Tidak ada semakin jauh dari kenyataan bahwa teknologi Web dan data pergudangan telah berkumpul, dan obligasi hanya semakin kuat. Jika Anda tidak mengaktifkan Web-gudang data Anda, Anda akan tertinggal. Dari tengah tahun 1990-an, vendor telah rac-ing satu sama lain untuk merilis versi Web-enabled produk mereka. Persembahan Web dari produk yang melebihi persembahan client / server untuk pertama kalinya sejak Web tawaran-temuan mulai muncul. Secara tidak langsung, versi ini memaksa konvergensi Web dan gudang data lebih jauh.

Ingat bahwa Web adalah lebih penting daripada data warehouse. Web dan fitur-fiturnya akan memimpin dan gudang data harus mengikuti. Web telah dipatok harapan para pengguna pada tingkat tinggi. Pengguna karena itu akan mengharapkan data warehouse untuk tampil di tingkat tinggi. Mempertimbangkan beberapa harapan yang dipromosikan oleh Web yang sekarang diharapkan akan diadopsi oleh data warehouse:

Respon cepat, meskipun beberapa halaman Web yang relatif lebih lambat.

Sangat mudah dan intuitif untuk digunakan Sampai 24 jam sehari, 7 hari seminggu konten Lebih up-to-date Grafis, dinamis, dan user interface fleksibel display Hampir pribadi Harapan untuk menghubungkan ke mana saja dan bor di

Page 8: Tugas Data Warehousing Dan Data Mining

Selama beberapa tahun terakhir, jumlah gudang data Web-enabled telah meningkat secara substansial. Bagaimana ini gudang data Web-enabled bernasib sejauh ini? Untuk mengerti

WEB-ENABLED DATA WAREHOUSE

381

efek konvergensi dari dua teknologi, kita harus mempertimbangkan tiga perintah efek dari penurunan biaya seperti yang didokumentasikan oleh Thomas W. Malone dan John F. Rockart di awal 1990-an:

Pertama-Order Effect: substitusi sederhana dari teknologi baru untuk tua.

Kedua-Order Effect: Peningkatan permintaan untuk fungsi yang disediakan oleh baru technol-ogy.

Ketiga-Order Effect: Munculnya struktur teknologi intensif baru.

Apa yang telah konvergensi teknologi Web dan data pergudangan dibawa sejauh ini? Web pergudangan tampaknya telah melewati dua tahap pertama. Perusahaan yang memiliki gudang data Web-enabled telah mengurangi biaya dengan substitusi metode baru penyampaian informasi. Juga, permintaan untuk informasi meningkat-follow ing tahap pertama. Bagi kebanyakan perusahaan dengan gudang data Web-enabled, kemajuan berhenti ketika mereka mencapai akhir tahap kedua.

Mengadaptasi Data Warehouse untuk Web

Banyak yang diharapkan dari sebuah gudang data Web-enabled. Itu berarti Anda harus menemukan kembali data warehouse Anda. Anda harus melakukan sejumlah tugas untuk beradaptasi gudang data untuk Web. Mari kita mempertimbangkan ketentuan khusus untuk Web-memungkinkan gudang data Anda.

Pertama, mari kita kembali ke pembahasan tiga tahapan sebagai berikut pengenalan teknologi baru. Terlepas dari mengurangi biaya dari substitusi, permintaan data informasi gudang-rumah telah meningkat. Sebagian besar perusahaan tampaknya akan terjebak pada akhir tahap sec-ond. Hanya beberapa perusahaan telah pindah ke tahap berikutnya dan telah menyadari hasil orde ketiga. Apa hasil ini? Beberapa hasil tersebut termasuk extranet dan data konsumen mart, manajemen dengan pengecualian, dan pasokan otomatis dan

Page 9: Tugas Data Warehousing Dan Data Mining

rantai nilai. Ketika Anda beradaptasi gudang data Anda untuk Web, pastikan bahwa Anda tidak tetap menaruh pada tahap kedua. Membuat rencana untuk memanfaatkan potensi dari Web dan beralih ke tahap ketiga di mana manfaat nyata ditemukan.

Mempelajari daftar berikut syarat untuk mengadaptasi data warehouse ke Web.

Informasi "push" Teknik. Data warehouse dirancang dan diimplementasikan menggunakan "tarik" teknik. Sistem penyampaian informasi menarik informasi dari gudang data berdasarkan permintaan, dan kemudian memberikan ke pengguna. Web of-fers teknik lain. Web dapat "mendorong" informasi kepada pengguna tanpa mereka minta-ing untuk itu setiap kali. Gudang data Anda harus dapat mengadopsi "push" teknologi-nique.

Kemudahan Penggunaan. Dengan ketersediaan data klik aliran, Anda dapat dengan cepat memeriksa perilaku pengguna di situs. Antara lain, data klik aliran mengungkapkan seberapa mudah atau sulitnya bagi pengguna untuk menelusuri halaman. Kemudahan penggunaan muncul di bagian atas daftar persyaratan.

Respon cepat. Beberapa data warehouse memungkinkan pekerjaan untuk menjalankan panjang untuk menghasilkan hasil de-bapak. Dalam model Web, kecepatan yang diharapkan dan tidak dapat dinegosiasikan atau com dijanjikan.

Tidak Downtime. Model Web dirancang sehingga sistem tersedia sepanjang waktu. Demikian pula, data warehouse Web-enabled memiliki downtime.

Page 10: Tugas Data Warehousing Dan Data Mining

382   DATA PERGUDANGAN DAN WEB

Multimedia Output. Halaman Web memiliki beberapa jenis-tekstual data, angka, grafik, suara, video, animasi, audio, dan peta. Jenis ini diharapkan untuk menunjukkan sebagai keluar-menempatkan dalam sistem penyampaian informasi dari data warehouse Web-enabled.

Pasar penyampaian informasi Satu Web. Yang cenderung menjadi sangat personal, dengan halaman XML yang dibuat secara dinamis mengganti statis coding HTML. Gudang data web-enabled harus mengikutinya.

Skalabilitas. Akses lebih, lebih banyak pengguna, dan lebih banyak data-ini adalah hasil dari Web-en-abling data warehouse. Oleh karena itu, skalabilitas menjadi perhatian utama.

Web sebagai Sumber Data

Ketika Anda berbicara tentang Web-memungkinkan data warehouse, yang pertama, dan mungkin satu-satunya pikiran yang datang ke pikiran adalah penggunaan teknologi Web sebagai mekanisme penyampaian informasi. Ironisnya, jarang melintasi pikiran Anda bahwa konten Web adalah sumber data berharga dan po-tenda untuk gudang data Anda. Anda mungkin ragu-ragu sebelum penggalian data dari Web untuk data warehouse Web-enabled Anda.

Konten informasi di Web begitu berbeda dan terfragmentasi. Anda perlu membangun pencarian dan ekstrak sistem khusus untuk menyaring melalui gundukan informasi dan mengambil apa yang relevan untuk gudang data Anda. Asumsikan bahwa tim proyek Anda mampu membangun suatu sistem ekstraksi, maka seleksi dan ekstraksi terdiri dari langkah-langkah yang berbeda beberapa. Sebelum ekstraksi, Anda harus memverifikasi keakuratan data sumber. Hanya karena data ditemukan di Web, Anda tidak dapat secara otomatis menganggap itu adalah akurat. Anda bisa mendapatkan petunjuk untuk ac-wilayah gereja dari jenis sumber. Silakan lihat Gambar 16-2 menunjukkan susunan komponen untuk seleksi data dan ekstraksi dari Web.

Page 11: Tugas Data Warehousing Dan Data Mining
Page 12: Tugas Data Warehousing Dan Data Mining

BERBASIS WEB INFORMASI PENGIRIMAN

383

Bagaimana Anda dapat menggunakan konten Web untuk memperkaya data warehouse Anda? Berikut adalah impor-tant beberapa menggunakan:

Menambahkan atribut lebih deskriptif dengan dimensi bisnis. Sertakan data nominal atau ordinal tentang dimensi sehingga lebih

banyak pilihan yang berhasil-mampu untuk berputar dan tabulasi silang. Menambahkan data linkage ke dimensi sehingga analisis korelasi

dengan dimensi lain dapat dilakukan. Membuat tabel dimensi baru. Buat tabel fakta baru.

Apa yang telah kita bahas di sini adalah lebih jauh penggunaan biasa dari Web sebagai media penyampaian informa-tion. Seleksi data dan ekstraksi data dari Web adalah paradigma baru yang radikal. Jika tim proyek Anda bersedia untuk mencobanya di lingkungan data warehouse Anda, hasilnya akan berharga.

BERBASIS WEB INFORMASI PENGIRIMAN

Kita telah melihat bagaimana konvergensi teknologi Web dan data pergudangan tidak bisa dihindari. Dua teknologi berurusan dengan memberikan informasi. Teknologi web mampu memberikan informasi lebih mudah, sekitar jam. Hal ini tidak mengherankan bahwa perusahaan ingin web-mengaktifkan gudang data mereka.

Keuntungan dan kemungkinan lain juga muncul ketika Anda menghubungkan gudang ke Web. Salah satu manfaat tersebut adalah kemampuan untuk menemukan cara-cara baru untuk membuat data gudang-rumah yang lebih efektif melalui data mart extranet dan sejenisnya. Kami juga melihat di possi-bility menggunakan Web sebagai sumber data untuk gudang Anda.

Namun demikian, pengiriman informasi yang lebih baik tetap alasan yang paling menarik untuk mengadaptasi gudang data untuk Web. Web membawa pandangan baru pada penyampaian informasi dan merevolusi proses. Mari kita, oleh karena itu, meluangkan waktu pengiriman informasi berbasis Web. Bagaimana Web meningkat penggunaan data warehouse? Apa manfaat dan apa saja tantangan? Bagaimana Anda menangani perubahan dramatis dalam penyampaian informasi yang dibawa oleh Web?

Page 13: Tugas Data Warehousing Dan Data Mining

Penggunaan diperluas

Tidak peduli bagaimana Anda melihatnya, keuntungan dari menghubungkan data warehouse ke Web tampak menakjubkan. Pengguna dapat menggunakan browser untuk melakukan permintaan mereka dengan mudah dan setiap saat sepanjang hari. Tidak ada sakit kepala yang berhubungan dengan sinkronisasi didistribusikan gudang data yang ada di lingkungan client / server. Penggunaan data warehouse memperluas melampaui pengguna internal. Pihak yang berkepentingan dari luar sekarang dapat diberikan penggunaan konten gudang. Sebagai penggunaan mengembang, skalabilitas tidak lagi menimbulkan masalah serius. Bagaimana dengan biaya pelatihan pengguna? Tentu saja, biaya pelatihan yang minimal karena penggunaan browser Web. Semuanya tampak mengembang baik dan penggunaan.

Mari kita memahami apa yang terjadi pada pertumbuhan. Awalnya, data gudang-rumah Web-enabled Anda mungkin menerima hanya 500 sampai 5000 hits sehari, tapi tergantung pada audiens Anda, num- ini

Page 14: Tugas Data Warehousing Dan Data Mining

384   DATA PERGUDANGAN DAN WEB

ber bisa meroket dalam waktu singkat. Apa lebih banyak pengguna menyiratkan? Cukup, lebih banyak data. Juga, lebih banyak data dalam lingkungan 24 × 7. Web tidak pernah dimatikan.

Memeriksa fenomena ini pertumbuhan yang luar biasa. Akses universal menghasilkan seluruh rangkaian tantangan yang harus dihadapi. Terutama, ini membebankan beban tambahan pada data warehouse Web-enabled Anda. Meskipun skalabilitas untuk mengakomodasi lebih banyak pengguna dan ekspansi yang cepat dalam penggunaan tidak lagi sebagai berat seperti dalam lingkungan client / server, itu masih merupakan tantangan dasar.

Mari kita memahami pola pertumbuhan ini dalam penggunaan. Dua faktor yang berbeda mendorong pertumbuhan: pertama, jendela benar-benar terbuka yang pernah menutup, selanjutnya, mekanisme akses mudah dan intuitif melalui browser Web di mana-mana. Akibatnya, Anda memiliki dua tantangan untuk con-cenderung dengan. Yang pertama adalah peningkatan populasi pengguna. Yang kedua adalah cepat acceler-asi pertumbuhan. Jika Anda telah membuka gudang data untuk pelanggan dan mitra bisnis melalui extranet, Anda akan melihat kurva ekspansi curam bahkan lebih.

Mari kita sebut pertumbuhan yang luar biasa ini "supergrowth" dan memeriksa fenomena tersebut. Silakan lihat Gambar 16-3, yang grafik fenomena ini. Fitur mencolok dari super-pertumbuhan memanifestasikan dirinya dalam ketidakmampuan Anda untuk meningkatkan dalam waktu mengandung pertumbuhan. Basis pengguna akan tumbuh lebih cepat dari kemampuan Anda untuk meningkatkan data warehouse Web-enabled Anda untuk memenuhi persyaratan penggunaan berkembang. Anda tidak dapat hanya menambahkan prosesor, disk drive, atau memori cukup cepat untuk memenuhi permintaan yang meningkat, jadi bagaimana Anda menangani super pertumbuhan?

Mari kita mengusulkan pendekatan awal. Apakah mungkin untuk mengantisipasi masalah dan menghindari sama sekali di tempat pertama? Dengan kata lain, Anda dapat mengontrol pertumbuhan dan dengan demikian datang untuk mengatasi masalah ini. Bila Anda Web-mengaktifkan gudang data Anda, naluri pertama adalah menjadi overenthusiastic dan membuka gudang langsung kepada publik. Ini seperti pembukaan pintu air tanpa peringatan. Tetapi untuk mengontrol pertumbuhan, Anda harus mengandung semangat Anda dan membuka

Page 15: Tugas Data Warehousing Dan Data Mining

gudang di tahap didefinisikan dengan baik. Hal ini menjadi ab-solutely diperlukan jika pola penggunaan sangat tidak jelas. Jangan membuka gudang ke

Page 16: Tugas Data Warehousing Dan Data Mining

BERBASIS WEB INFORMASI PENGIRIMAN

385

publik sama sekali, awalnya. Pertama, biarkan beberapa pengguna internal Anda memiliki akses. Kemudian tambahkan beberapa pengguna ke dalam grup. Termasuk lebih dan lebih secara bertahap bertahap. Dengan cara ini, Anda terus-menerus dapat memantau pola pertumbuhan dalam penggunaan. Mengadopsi pendekatan peringatan yang sama ketika datang ke membuka data warehouse untuk umum pada gelombang kedua.

Bagaimana jika keadaan Anda menjamin membuka data warehouse Web-enabled dalam satu kali untuk semua pengguna, internal dan eksternal? Bagaimana jika pendekatan bertahap yang dijelaskan di atas tidak layak dalam kasus Anda? Bagaimana jika Anda tidak dapat menghindari supergrowth? Kunci untuk menjawab pertanyaan-pertanyaan ini terletak pada karakteristik khusus dari kurva pertumbuhan. Perhatikan bahwa super-pertumbuhan hanya terjadi dalam tahap sangat awal. Setelah tahap awal, kurva penggunaan tampaknya tingkat off, atau setidaknya laju peningkatan menjadi dikelola. Dengan fakta ini dalam pikiran, mari kita lihat bagaimana kita dapat menangani supergrowth.

Rahasianya terletak pada menemukan titik hingga yang penggunaan akan tumbuh dan kemudian tingkat off. Kembali ke Gambar 16-3 menunjukkan kurva supergrowth. Grafik menunjukkan bahwa tahap hiper-pertumbuhan berlangsung sampai awal November dan diharapkan tingkat off di pengguna 750. Bahkan jika Anda mulai dengan 100 pengguna, Anda cenderung memukul tingkat pengguna 750 segera. Jadi, bahkan jika tujuannya adalah untuk memulai dengan hanya 100 pengguna, biarkan penawaran awal Anda dari gudang data Web-enabled memiliki sumber daya yang cukup untuk mengakomodasi pengguna 750. Tapi bagaimana Anda datang dengan jumlah pengguna 750 dan bahwa titik meratakan off adalah awal November? Tidak ada grafik standar industri untuk memprediksi pola supergrowth. Pola supergrowth gudang data Anda sepenuhnya tergantung pada situasi dan kondisi lingkungan Anda. Anda harus menentukan grafik untuk lingkungan Anda dengan menggunakan teknik terbaik untuk estimasi.

Informasi baru Strategi

Ketika gudang data dan teknologi Web bertemu, apa harapan dari data warehouse? Bagaimana seharusnya user interface untuk data warehouse menjadi modi-fied dan ditingkatkan pada model Web? Sampai gudang data Anda adalah Web-enabled, harapan pengguna diperintah oleh satu set standar yang ditetapkan. Sekarang, setelah Web-memungkinkan, ketika pengguna pendekatan gudang

Page 17: Tugas Data Warehousing Dan Data Mining

menggunakan browser yang sama seperti yang mereka lakukan untuk data internet lainnya, tolak ukur yang berbeda. Sekarang pengguna mengharapkan jenis yang sama antarmuka informasi seperti yang digunakan dalam sesi Internet. Memahami harapan ini akan membantu Anda dalam strategi penyampaian informasi baru de-veloping untuk Anda gudang Web-enabled.

Informasi Pedoman Pengiriman. Mari kita meringkas pedoman untuk merumuskan strategi penyampaian informasi baru. Mempelajari daftar berikut.

Kinerja. Industri ahli setuju pada waktu respon kurang dari 10 detik untuk Halaman untuk memberikan layar pertama dari isi berguna. Halaman dapat menyimpan beban untuk waktu yang lama, asalkan isi berguna dapat dilihat dalam waktu 10 detik. Desain untuk modem dengan kecepatan terendah. Tombol navigasi layar segera. Mengungkapkan con-tenda dalam rangka direncanakan: yang berguna segera, diikuti oleh orang-orang di tingkat berikutnya kegunaan. Kembali grafis lambat dan berlebihan. Gunakan halaman teknik caching. Memastikan bahwa desain database fisik memungkinkan waktu respon yang cepat.

Pilihan Pengguna. Pengguna dikondisikan untuk mengharapkan untuk melihat beberapa pilihan standar ketika mereka tiba di halaman Web. Ini termasuk pilihan navigasi. Tombol navigasi untuk data warehouse Web-enabled termasuk pilihan drill-down, halaman rumah,

Page 18: Tugas Data Warehousing Dan Data Mining

386   DATA PERGUDANGAN DAN WEB

mata pelajaran utama, peta situs, pencarian, dan website rincian sponsor. Juga, termasuk pilihan-gudang tertentu, menu bantuan, dan pilihan untuk berkomunikasi dengan perusahaan sponsor. Lebih khusus, untuk data warehouse, pilihan pengguna harus menyertakan navigasi untuk perpustakaan laporan, pilihan untuk menelusuri bisnis Dimen-keputusan dan atribut dalam setiap dimensi, dan antarmuka untuk metadata bisnis.

Pengalaman pengguna. Tujuan terindah Setiap Web desainer adalah untuk membuat setiap halaman menyenangkan pengalaman bagi pengguna. Pengguna bersemangat untuk mengunjungi dan tinggal di sebuah halaman yang baik untuk-kusut. Jika ada terlalu banyak gangguan dan masalah, pengguna cenderung menghindari halaman. Jadilah bijaksana dalam penggunaan font, warna, berkedip grafis, teks tebal, di bawah-garis, klip audio, dan segmen video.

Proses. Adalah penting bahwa proses bisnis harus dibuat untuk bekerja dengan lancar dan jahitan-lessly di Web. Untuk data warehouse Web-enabled, persyaratan ini diterjemahkan ke dalam perampingan interaksi Web saat sesi analisis. Membiarkan pengguna dapat berpindah dari satu langkah ke depan, mudah dan anggun.

Dukungan Pengguna. Dalam proses yang panjang, pengguna harus memiliki jaminan bahwa tidak akan ada hilang di tengah proses. Pengguna harus tahu di mana dia berada dalam proses sehingga melanjutkan lebih lanjut tidak akan terganggu. Selama akses ke data warehouse Web-enabled, membiarkan pengguna mengetahui informasi status perantara. Misalnya, dalam menjalankan laporan, memberikan status laporan kepada pengguna.

Menyelesaikan Masalah. Pengguna harus dapat mundur dari kesalahan mereka, membuat koreksi, dan kemudian lanjutkan. Pengguna juga harus mampu untuk melaporkan masalah.

Informasi dalam Konteks. Membuka gudang data dengan cara Web menyediakan miring baru tentang bagaimana informasi dapat dilihat dalam konteks yang lebih luas. Sampai sekarang, queriers bisa menemukan jawaban atas pertanyaan langsung dari "berapa banyak" dan "seberapa sering." Jawaban untuk pertanyaan seperti itu ditemukan dalam batas sempit kerangka perusahaan. Dengan dibukanya intelijen bisnis melalui Web, lingkaran

Page 19: Tugas Data Warehousing Dan Data Mining

melebar dalam-clude seluruh rantai pasokan dan beberapa kekhawatiran yang kompetitif. Informasi sekarang bisa diperoleh dalam kerangka strategis yang lebih besar.

Personalized Informasi. Hal ini hampir mustahil untuk memberikan pertanyaan yang telah ditetapkan bahwa akan memenuhi persyaratan setiap orang dalam rantai nilai, sehingga berusaha untuk memberikan kemampuan ad hoc untuk meminta jenis pertanyaan yang terkait dengan jenis data di gudang.

Swalayan Access. Sebagai Web membuka data warehouse untuk lebih banyak pengguna, baik di sisi dan di luar perusahaan, alat harus menyediakan akses otonom untuk informa-tion. Pengguna harus dapat menavigasi dan bor keluar untuk sumber informasi. Ini harus menjadi praktis lingkungan dengan akses layanan mandiri di mana pengguna dapat melayani mereka-diri.

HTML File. Dalam lingkungan data warehouse Web-enabled, standar HTML dokumen atau berkas, juga dikenal sebagai halaman Web, adalah sarana utama untuk komunikasi. Halaman Web adalah sumber daya untuk menampilkan informasi di internet atau net-kerja internal. Alat antarmuka informasi menghasilkan file HTML dari query pengguna ad hoc atau dari prosedur yang tersimpan dalam database.

Anda dapat menghasilkan HTML mengajukan satu waktu atau secara teratur menggunakan pemicu. Seperti yang Anda tahu, pemicu adalah jenis khusus dari prosedur yang tersimpan yang secara otomatis dijalankan ketika sebuah pernyataan manipulasi data ditentukan di meja tertentu ditemui. Sebagai contoh, sebuah program pemicu otomatis dapat menghasilkan laporan pengecualian dalam bentuk HTML

Page 20: Tugas Data Warehousing Dan Data Mining

BERBASIS WEB INFORMASI PENGIRIMAN

387

mengajukan ketika beberapa nilai ambang batas yang telah ditetapkan terlampaui. Para pengguna kemudian dapat melihat lat-est terjadinya dengan memanggil halaman Web yang sesuai.

Sistem manajemen database menawarkan mempublikasikan-dan-berlangganan fungsi dalam mesin database mereka. Langganan A memungkinkan halaman HTML yang akan dibuat dari awal atau refresh setiap kali kebakaran pemicu dalam sumber data tertentu. Sebuah halaman HTML yang diterbitkan dapat meliputi data yang disaring langsung dari satu atau lebih tabel, hasil dari query diterjemahkan secara internal ke dalam laporan SQL, atau output dari prosedur yang tersimpan. Namun, langganan fa-cility terbatas pada data dalam database tertentu.

Pelaporan Sebagai Strategis Alat. Selanjutnya mari kita beralih ke pelaporan sebagai metode penyampaian informasi berbasis web. Di Web, Anda dapat mempublikasikan atau mendistribusikan file melalui e-mail. Fitur-fitur ini membuka kemungkinan besar untuk melaporkan sebagai alat strategis. Sekarang Anda dapat mengintegrasikan mitra bisnis ke dalam rantai pasokan. Manajer dan eksekutif dapat mengarahkan laporan diresepkan untuk dikirim secara otomatis kepada pelanggan tertentu dan pemasok. Mereka dapat mengatur batas atas tingkat persediaan dan memiliki laporan dikirim hanya bila kadarnya di luar batas.

Laporan manajemen dapat mencakup kedua jenis laporan. Laporan rutin dan pengecualian re-port dapat dijadwalkan untuk distribusi. Anda dapat membuat sejumlah parameter-driven ulang port yang dapat dibuat tersedia melalui Web. Anda bahkan mungkin label laporan dengan nama bisnis dan mengkategorikan mereka sesuai dengan kelas pengguna, tergantung pada pangkat atau otorisasi keamanan tingkat.

Beberapa teknik manajemen laporan yang mungkin: laporan parameter-driven, laporan cus-tomizable, laporan pengecualian, laporan yang telah ditetapkan, dan sebagainya. Salah satu teknik dapat menyediakan OLAP drill-down. Dalam teknik ini, pengguna meminta laporan pertama yang menunjukkan hasil pada tingkat ringkasan tinggi. Laporan ini dapat digunakan untuk melangkah lebih jauh dengan Analy-sis. Ketika laporan pertama datang kembali, laporan yang berfungsi sebagai landasan untuk analisis lebih lanjut. Pengguna mengubah parameter permintaan dan bor bawah pada data ringkasan untuk rincian tambahan tanpa

Page 21: Tugas Data Warehousing Dan Data Mining

harus membuat laporan baru. Lain teknik yang berguna re-lambatnya ke halaman on-demand. Ketika laporan dengan beberapa halaman kembali, pengguna dapat menavigasi ke halaman yang diinginkan melalui hyperlink bukan paging melalui, satu halaman pada satu waktu.

Teknologi Browser untuk Data Warehouse

Teknologi web dan teknologi browser yang hampir identik. Browser adalah perangkat lunak klien com-mon dalam lingkungan data warehouse Web-enabled. Pengguna Anda akan mengakses informasi dengan menggunakan browser standar. Mari kita membahas beberapa rincian sehingga Anda dapat menjadi akrab dengan teknologi browser. Sebuah aplikasi berbasis browser datang dengan banyak bene-cocok. Antarmuka pengguna-browser-praktis bebas. Anda tidak perlu mengkonfigurasi dan di-kios aplikasi berbasis browser pada klien; aplikasi berjalan pada server. Segera, Anda mengamati bahwa penyebaran aplikasi menjadi mudah bahkan ketika ada ratusan atau ribuan desktop.

Saat ini, empat teknologi yang biasa digunakan untuk membangun user interface Web-enabled. Ini adalah HTML, Java, ADO, dan plug-in. Lihatlah Gambar 16-4, yang membandingkan empat teknologi dalam hal kekuatan dan kelemahan.

Silakan mempelajari deskripsi singkat berikut empat teknologi:

HTML HTML., Yang paling sederhana dan paling mudah untuk mengelola teknologi, bekerja pada browser apapun terlepas dari platform. Pengguna dapat menavigasi dengan mengklik hyperlink. Mendukung HTML

Page 22: Tugas Data Warehousing Dan Data Mining

388   DATA PERGUDANGAN DAN WEB

grafis dan bentuk. Ini adalah "stateless," yang berarti bahwa konteks link jaringan antara browser dan aplikasi tidak dipertahankan antara aplikasi. Anda dapat mensimulasikan fitur OLAP seperti berputar dan drill-down dengan menghasilkan halaman HTML baru. Tapi Anda harus membayar harga menunggu halaman hasil yang akan dihasilkan dan di-download ke desktop. HTML adalah baik untuk laporan statis. Hal ini sangat cocok bila aplikasi Anda tidak tahu fitur dari platform target.

Java. Apakah Anda perlu canggih visualisasi 3-D, drill-melalui, drag dan drop, atau mirip fungsi high-end? Maka Java adalah teknologi untuk Anda. Java tersedia pada semua platform klien utama. Seperti applet Java tidak diperbolehkan untuk menulis ke hard drive atau mencetak ke printer lokal, untuk beberapa aplikasi ini bisa menimbulkan masalah. Karena Java adalah bahasa interpretatif, agak lambat dari bahasa dikompilasi. Desktop harus dilengkapi dengan browser Java. Seperti applet Java harus di-download dari server setiap kali, kadang-kadang waktu download yang lama tidak dapat diterima. Java cocok untuk klien interaktif, di mana beban kali panjang mungkin tidak menjadi faktor.

Page 23: Tugas Data Warehousing Dan Data Mining

ADO. Ini adalah solusi Microsoft untuk sistem berbasis Web didistribusikan. ADO, menerapkan-ed sebagai DLL Microsoft atau data link perpustakaan, dapat diinstal dengan men-download dari server menggunakan browser. Seperti yang diharapkan, ADO hanya berjalan pada platform Windows, sehingga tidak termasuk UNIX dan Mac konfigurasi. Menjadi antarmuka dikompilasi, ADO lebih cepat dari Jawa. ADO / MD, ekstensi Microsoft untuk ADO sebagai bagian dari Pivot Table-Services, dapat digunakan untuk membuat kontrol ActiveX di Visual Basic untuk memanipulasi data dalam layanan OLAP dari halaman Web. ADO dibatasi untuk platform Windows di mana Anda memiliki kontrol yang baik dari DLL.

Plug-in. Ini adalah program khusus browser yang mengeksekusi dalam browser itu sendiri. Plug-in dapat diinstal pada drive lokal. Karena masing-masing browser kebutuhan sendiri plug-in-nya,

Page 24: Tugas Data Warehousing Dan Data Mining

OLAP DAN WEB

389

Anda mungkin ingin standarisasi browser di lingkungan Anda jika Anda memilih ini ap-proach. OLAP klien pada berbagai platform, terutama yang menggunakan Java, mungkin memiliki masalah karena keterbatasan bandwidth.

Masalah keamanan

Tanpa ragu, ketika Anda membuka data warehouse Web-enabled untuk pengguna melalui-out perusahaan melalui intranet dan mitra bisnis di luar melalui extranet, Anda cenderung untuk memaksimalkan nilai. Tergantung pada organisasi Anda, Anda bahkan mungkin mendapatkan nilai lebih ketika Anda mengambil langkah berikutnya dan membuka gudang untuk umum di Internet. Tapi tindakan ini mengangkat isu-isu keamanan yang serius. Anda mungkin harus memberlakukan pembatasan keamanan pada tingkat yang berbeda.

Pada tingkat jaringan, Anda mungkin melihat ke dalam solusi yang mendukung enkripsi data dan mekanisme pengalihan kembali stricted. Keamanan di tingkat jaringan adalah salah satu bagian dalam skema proteksi-tion. Hati-hati melembagakan sistem keamanan di tingkat aplikasi. Pada tingkat ini, sistem keamanan harus mengelola otorisasi pada siapa yang diizinkan untuk masuk ke aplikasi dan apa setiap pengguna diperbolehkan untuk mengakses.

Pernahkah Anda mendengar dari Teroris Informasi? Ini mempekerjakan-ee loyal atau dipercaya yang memiliki otorisasi untuk mengakses informasi aman adalah ancaman besar bagi keamanan gudang. Memasukkan lubang ini sulit dan Anda perlu untuk mengatasi aspek keamanan.

OLAP DAN WEB

Sejumlah besar waktu dan uang yang diinvestasikan dalam membangun data warehouse dengan harapan bahwa perusahaan akan mendapatkan informasi yang dibutuhkan untuk membuat keputusan strategis nilai abadi. Untuk memaksimalkan potensi nilai, Anda perlu untuk memenuhi sebagai besar grup pengguna mungkin untuk memanfaatkan potensi gudang. Ini termasuk perpanjangan kemampuan OLAP untuk kelompok yang lebih besar dari analis.

Page 25: Tugas Data Warehousing Dan Data Mining

Perusahaan OLAP

Gudang awal dimulai sebagai sistem pendukung keputusan skala kecil untuk dipilih tangan ful analis tertarik. Mainframe awal sistem pendukung keputusan yang tersedia kemampuan analisis yang kuat meskipun cukup tak tertandingi untuk sistem OLAP hari ini. Karena sistem-sistem yang sulit untuk digunakan, mereka jarang mencapai luar sekelompok kecil analis yang bisa membajak melalui kesulitan.

Generasi berikutnya dari sistem pendukung keputusan diganti kompleks mainframe comput-ing dengan mudah digunakan GUI dan point-and-klik antarmuka. Ini generasi kedua sys tems-berjalan pada arsitektur client / server yang secara bertahap mampu mendukung OLAP di Addi-tion untuk query sederhana dan pelaporan. Namun, penyebaran dan biaya pemeliharaan dicegah perpanjangan dukungan keputusan untuk jumlah yang lebih besar dari pengguna. OLAP dan OLAP seperti capabili-hubungan masih terbatas pada sejumlah kecil pengguna.

Web telah menempatkan miring secara dramatis berbeda pada penyampaian informasi. Gudang data web-enabled dapat membuka pintu mereka kepada sekelompok besar pengguna baik di dalam maupun di luar perusahaan, dan jasa OLAP diperluas ke lebih dari kelompok memilih analis. Muncul pertanyaan: Dapatkah OLAP meningkatkan sistem untuk mendukung sejumlah besar bersamaan

Page 26: Tugas Data Warehousing Dan Data Mining

390   DATA PERGUDANGAN DAN WEB

pengguna melakukan query yang kompleks dan perhitungan intensif? Bagaimana bisa tim proyek Anda memastikan bahwa OLAP berhasil di data warehouse Web-enabled Anda?

Pendekatan web-OLAP

Kombinasi yang mendasari untuk keberhasilan pelaksanaan terdiri dari Web tech-nology, gudang data dengan sistem OLAP, serta arsitektur thin-client. Bagaimana Anda menerapkan OLAP di lingkungan seperti itu? Bagaimana OLAP sistem bekerja di gudang data Web-enabled Anda akan? Apa jenis arsitektur client dan Web akan menghasilkan hasil yang optimal? Anda mungkin mendekati pertanyaan-pertanyaan ini dalam tiga cara yang berbeda.

Browser Plug-ins. Dalam pendekatan pertama, Anda menggunakan plug-in atau ekstensi browser. Ini hanya sedikit versi modifikasi dari lemak-klien Windows pelaksanaan mantan kecuali bahwa konfigurasi klien lebih ke arah bahwa dari thin client. Dukungan-menggugat merayap di dan pendekatan ini memiliki masalah skalabilitas.

Dokumen HTML Precreated. Dalam pendekatan berikutnya, Anda memberikan precreated dokumen HTML bersama dengan alat-alat navigasi untuk menemukan ini. Dokumen-dokumen yang set hasil operasi analitis. Pendekatan ini mengambil keuntungan dari Web technolo-gy dan ekonomi thin-client, namun pengguna terbatas pada menggunakan laporan yang telah ditetapkan. Pendekatan ini tanpa analisis on-demand; pengguna tidak dapat melakukan khas pengolahan analisis online.

OLAP di Server. Pendekatan terbaik adalah dengan menggunakan server untuk melakukan semua secara online pengolahan analyti-kal dan menyajikan hasil pada antarmuka informasi thin-client yang benar. Pendekatan ini menyadari manfaat ekonomi dari Web dan thin-client Architec-mendatang. Pada saat yang sama, ia menyediakan lingkungan server terpadu terlepas dari mesin klien. Pemeliharaan diminimalkan karena aplikasi dan logika yang terpusat di server. Kontrol versi juga konsisten. Semua orang berbagi komponen yang sama: Server, metadata, dan laporan. Pendekatan ini bekerja dengan baik di lingkungan pro-duksi.

Page 27: Tugas Data Warehousing Dan Data Mining

OLAP Desain Mesin

Ketika data warehouse adalah Web-enabled dan tingkat operasi OLAP dinaikkan, de-tanda mesin OLAP menentukan kemungkinan scaling up. Dalam produk OLAP Anda pilih untuk data warehouse Web-enabled Anda, desain mesin OLAP peringkat tinggi di kritis-ity. Sebuah mesin yang dirancang dengan baik menghasilkan kurva kinerja yang tetap linear sebagai jumlah pengguna secara bersamaan meningkat. Mari kita mempertimbangkan beberapa pilihan:

Ketergantungan pada RDBMS. Mesin OLAP bergantung sepenuhnya pada RDBMS untuk melakukan pengolahan multidimensi, menghasilkan kompleks, SQL multipass untuk mengakses data ringkasan. Bergabung, agregasi, dan perhitungan semua dilakukan dalam database, pos-ing masalah serius bagi sistem Web-enabled. Sejumlah besar tabel sementara akan datang diperlukan. Overhead untuk menciptakan, memasukkan, menjatuhkan, mengalokasikan ruang disk, memeriksa perizinan, dan memodifikasi tabel sistem untuk setiap perhitungan sangat besar. Hanya lima pengguna bersamaan dapat membawa sistem OLAP bertekuk lutut.

Ketergantungan pada mesin tersebut. Berikut mesin menghasilkan SQL untuk mengakses ringkasan data dan melakukan semua pengolahan pada tingkat menengah. Anda akan melihat dua masalah daerah di

Page 28: Tugas Data Warehousing Dan Data Mining

MEMBANGUN WEB-ENABLED DATA WAREHOUSE

391

pendekatan ini. Lalu lintas jaringan berat dan persyaratan memori yang besar membuat pendekatan ini tidak diinginkan. Anda mungkin mendapatkan kurva kinerja linear, tapi kurva cenderung menjadi terlalu curam karena potensi DBMS tidak digunakan.

Cerdas OLAP mesin. Mesin ini memiliki kecerdasan untuk menentukan jenis permintaan dan di mana ia akan dilakukan secara optimal. Karena kecerdasan, mesin ini mampu mendistribusikan bergabung, agregasi, dan perhitungan antara komponen mesin dan RDBMS. Dalam model ini, Anda dapat memisahkan presentasi, logika, dan lapisan data baik secara logis dan fisik. Oleh karena itu, pengolahan sistem skor dan lalu lintas jaringan dioptimalkan. Saat ini, ini tampaknya menjadi pendekatan yang terbaik, mencapai kurva perfor-Mance yang tetap linear dengan kemiringan bertahap karena jumlah pengguna secara bersamaan meningkat.

MEMBANGUN WEB-ENABLED DATA WAREHOUSE

Mari kita meringkas apa yang telah kita pelajari sejauh ini. Kami dirasakan bagaimana Web telah mengubah segalanya termasuk desain dan penyebaran gudang data. Kami mengerti bagaimana teknologi Web dan data pergudangan telah berkumpul, membuka possibili-hubungan yang luar biasa. Tujuan utama dari data warehouse adalah untuk memberikan informasi, dan Web membuat menyediakan informasi yang mudah. Apa kombinasi yang bagus dari teknologi! Sekarang nilai data warehouse Anda dapat diperpanjang untuk array yang lebih luas dari pengguna.

Ketika kita cocok fitur dari gudang data dengan karakteristik dari Web, kita mengamati bahwa kita harus melakukan beberapa hal untuk desain dan penyebaran metode untuk beradaptasi gudang ke Web. Kami pergi melalui sebagian besar tugas. Web telah mengubah cara informasi disampaikan dari gudang data. Pengiriman infor-masi berbasis web lebih inklusif, lebih mudah digunakan, tetapi juga berbeda dari metode tradi-nasional. Kami telah menghabiskan beberapa waktu pengiriman informasi berbasis Web. Kami juga menyentuh pada OLAP dalam kaitannya dengan Web. Jadi, di mana kita sekarang? Kami sekarang siap untuk kembali tampilan pertimbangan untuk membangun data warehouse Web-enabled.

Page 29: Tugas Data Warehousing Dan Data Mining

Sifat Webhouse data

Pada pertengahan tahun 1999, Dr. Ralph Kimball dipopulerkan istilah baru, "Data Webhouse," yang includ-ed gagasan data warehouse Web-enabled. Dia menyatakan bahwa data warehouse mengambil panggung pusat dalam revolusi Web. Dia melanjutkan untuk menyatakan bahwa ini memerlukan ulangan dan menyesuaikan pemikiran data warehouse kami. Bagaimana benar!

Dalam usaha untuk merumuskan prinsip-prinsip untuk membangun data warehouse Web-enabled, mari kita meninjau sifat data Webhouse. Kami akan menggunakan pengetahuan ini untuk menentukan pelaksanaan pertimbangan. Sebelum pergi fitur utama, melihat Gambar 16-5, yang memberi Anda gambaran yang luas dari data yang Webhouse. Sekarang mari kita tinjau fea-tulisan. Berikut adalah daftar fitur utama dari Webhouse Data:

Ini adalah sebuah sistem sepenuhnya didistribusikan. Banyak node independen membuat keseluruhan. Seperti Dr. Kimball akan mengatakan, tidak ada pusat data Webhouse.

Ini adalah sebuah sistem Web-enabled; itu berada di luar sistem client / server. Pembagian tugas dan susunan komponen yang berbeda secara radikal.

Page 30: Tugas Data Warehousing Dan Data Mining

392   DATA PERGUDANGAN DAN WEB

Web browser adalah kunci untuk penyampaian informasi. Sistem ini memberikan hasil permintaan informasi melalui browser terpencil.

Karena keterbukaan, keamanan merupakan masalah serius. Web ini mendukung semua tipe data termasuk tekstual, numerik, grafis,

foto-ic, audio, video, dan banyak lagi. Oleh karena itu berikut bahwa data Webhouse mendukung berbagai bentuk data.

Sistem ini memberikan hasil permintaan informasi dalam waktu respon yang wajar.

Desain antarmuka pengguna adalah sangat penting untuk kemudahan penggunaan dan untuk publikasi yang efektif di Web. Berbeda dengan interface dalam konfigurasi lainnya, Web memiliki metode yang pasti untuk mengukur efektivitas dari user interface. Analisis data clickstream memberitahu Anda seberapa baik antarmuka.

Secara alami, data Webhouse memerlukan arsitektur compris-ing data mart skala kecil baik didistribusikan.

Karena susunan komponen didasarkan pada "bus" arsitektur data mart terkait, penting untuk memiliki dimensi sepenuhnya sesuai dan lengkap-ly sesuai atau fakta standar.

Page 31: Tugas Data Warehousing Dan Data Mining

Web tidak pernah tidur. Data Anda Webhouse diharapkan sepanjang waktu.

Akhirnya, ingat bahwa data Webhouse dimaksudkan untuk menjadi terbuka untuk semua kelompok pengguna, baik di dalam dan di luar perusahaan-karyawan, pelanggan, pemasok, dan lainnya mitra bisnis.

Page 32: Tugas Data Warehousing Dan Data Mining

MEMBANGUN WEB-ENABLED DATA WAREHOUSE

393

Pertimbangan Implementasi

Fitur utama yang dijelaskan di atas membawa kita ke faktor yang perlu Anda pertimbangkan untuk menerapkan-ing data warehouse Web-enabled. Setiap fitur yang tercantum di atas menuntut penyesuaian dari prinsip-prinsip pelaksanaan. Sebagian besar, dengan pergi melalui daftar fitur, Anda dapat memperoleh apa yang dibutuhkan. Kami ingin menyoroti hanya pertimbangan pelaksanaan beberapa yang penting.

Jika data Webhouse diharapkan akan didistribusikan secara luas, bagaimana Anda bisa mengelola itu? Bagaimana Anda bisa membuat semua komponen pekerjaan arsitektur bersama dan masuk akal? Apakah Anda tidak merasa bahwa tanpa sesuatu di tengah, tampaknya tidak mungkin untuk membuatnya bekerja? Dalam dunia nyata, banyak dari kelompok yang terhubung mungkin menggunakan berbagai technolo-gies dan platform yang berbeda. Bagaimana Anda bisa mengikat mereka semua bersama-sama? Dari mana?

Silakan mempelajari pengamatan berikut dengan seksama:

Untuk mencapai koherensi arsitektur dasar antara unit didistribusikan, fer-vently mengadopsi model dimensi sebagai teknik pemodelan dasar.

Menggunakan arsitektur bus data warehouse. Arsitektur ini, dengan dimensi sepenuhnya sesuai dan fakta-benar standar, yang kondusif untuk arus informasi yang benar.

Dalam lingkungan terdistribusi, yang sesuai dimensi dan fakta? Dalam bab-bab sebelumnya, kita telah membahas arti sesuai dimensi dan fakta. Pada dasarnya, implikasinya adalah untuk memiliki definisi yang sama di seluruh. Salah satu saran adalah untuk sentralisasi definisi dimensi sesuai dan fakta con-terbentuk. Kebutuhan ini tidak sentralisasi fisik; sentralisasi logis akan bekerja. Sentralisasi ini memberikan kemiripan pusat data Webhouse.

Masih pertanyaannya tetap: yang benar-benar sesuai dimensi dan fakta? An-swer tergantung pada apa yang akan bekerja untuk lingkungan Anda. Jika layak, menetapkan tugas sesuai dimensi dan fakta kepada kelompok-kelompok lokal peserta. Setiap kelompok mendapat tanggung jawab untuk datang dengan definisi untuk dimensi atau satu set fakta.

Page 33: Tugas Data Warehousing Dan Data Mining

Nah, bagaimana semua unit menjadi sadar set lengkap definisi untuk semua di-mensions dan fakta? Di sinilah Web berguna. Anda dapat memiliki Defin-itions diterbitkan di Web; mereka kemudian menjadi standar untuk sesuai Dimen-keputusan dan fakta.

Bagaimana Anda secara fisik melaksanakan tabel dimensi sesuai dan tabel fakta con-terbentuk? Tabel dimensi sering fisik digandakan. Sekali lagi, melihat apa yang layak di lingkungan Anda. Jumlah sentralisasi fisik semua tabel Dimen-sion mungkin tidak praktis, tetapi tabel fakta sesuai jarang diduplikasi. Umumnya, tabel fakta yang sangat besar dibandingkan dengan tabel dimensi.

Salah satu pertimbangan terakhir. Sekarang kita memahami data Webhouse sebagai satu set didistribusikan dimensi dan fakta berdasarkan teknologi database mungkin berbeda. Bagaimana Anda bisa membuat seperti sebuah karya koleksi didistribusikan sebagai suatu kesatuan yang utuh? Ini adalah apa alat query atau penulis laporan diperlukan untuk melakukan sedemikian Konfigurasi-tion didistribusikan. Mari kita mengatakan salah satu pengguna jauh mengeksekusi query tertentu. Alat query harus membangun koneksi ke masing-masing penyedia tabel fakta yang diperlukan dan mengambil set hasil yang dibatasi oleh dimensi sesuai. Kemudian alat ini harus menggabungkan semua hasil set yang diambil di server aplikasi menggunakan single-pass

Page 34: Tugas Data Warehousing Dan Data Mining

394   DATA PERGUDANGAN DAN WEB

sort-merge. Kombinasi tersebut akan menghasilkan hasil akhir yang benar diatur hanya akan menyebabkan-dimensi semua sesuai.

Menempatkan Potongan Bersama

Dalam ayat ini, mari kita pergi ke berbagai komponen yang perlu ditarik bersama-sama untuk membuat data warehouse Web-enabled. Simak daftar berikut:

Data konfigurasi Webhouse luar komputasi client / server. Dua tingkat atau tiga-tier biasa teknologi tidak memadai. Karena jumlah pengguna meningkat tajam, server baru harus ditambahkan tanpa kesulitan apapun. Oleh karena itu, mempertimbangkan komponen arsitektur terdistribusi.

Dengan node pengguna menyebar, Anda harus berusaha untuk administrasi minimum pada sisi klien. Teknologi thin-client sejati seperti Java cenderung memberikan setup klien nol-administrasi yang-trasi.

Teknologi client diharapkan menjadi kombinasi thin client dan klien penuh. Memastikan integrasi metadata lengkap. Kedua IT dan berbagai jenis pengguna akan mendapatkan keuntungan dari metadata terpadu.

Pilih database yang tepat untuk mendukung lingkungan terdistribusi. Seperti Anda mungkin menggunakan Java, sebuah RDBMS dengan mesin Java dalam database akan berguna.

Dalam banyak aplikasi Web, server HTTP menjadi titik kemacetan karena semua data dari sesi diumpankan ke browser melalui server ini. Anda akan menemukan scalabili-ty menjadi sulit kecuali Anda menerapkan model CORBA. CORBA menyediakan distrib-usikan komputasi objek dan skalabilitas karena server dan klien komunikasi-cate melalui CORBA.

Pastikan bahwa Anda membayar perhatian yang cukup untuk administrasi dan pemeliharaan. Ini harus mencakup identifikasi dimensi, hirarki dalam dimensi, fakta, dan ringkasan. Ringkasan manajemen bisa sulit.

Antarmuka Web terdiri dari browser, mesin pencari, groupware, mendorong technolo-gies, halaman rumah, link hypertext, dan di-download Java applet dan ActiveX.

Alat pendukung HTML dapat digunakan secara universal. Namun, untuk kompleks Analy-sis, HTML rumit. Gunakan HTML sebanyak mungkin dan cadangan Jawa atau plug-in untuk analisis ad hoc yang kompleks.

Page 35: Tugas Data Warehousing Dan Data Mining

Pengolahan Model web

Pertama mari kita lihat konfigurasi arsitektur Web. Lihat Gambar 16-6 menunjukkan susunan keseluruhan. Perhatikan bahwa arsitektur adalah lebih kompleks bahwa arsitektur client / server dua tingkat atau tiga-tier. Anda perlu tingkatan tambahan untuk mengakomodasi kebutuhan komputasi Web. Minimal, Anda harus memiliki server Web antara browser klien dan database. Juga, perhatikan firewall untuk melindungi aplikasi perusahaan Anda dari gangguan luar.

Ini mencakup keseluruhan arsitektur. Lihat Gambar 16-7 menunjukkan model untuk menyampaikan informasi. Model ini menggambarkan bagaimana halaman HTML dijabarkan ke dalam query SQL diteruskan ke DBMS menggunakan script CGI. Model ini menunjukkan komponen untuk pengiriman infor-masi melalui halaman HTML. Model ini dapat digeneralisasi untuk menggambarkan teknologi lainnya.

Page 36: Tugas Data Warehousing Dan Data Mining

MEMBANGUN WEB-ENABLED DATA WAREHOUSE

395

Page 37: Tugas Data Warehousing Dan Data Mining

396   DATA PERGUDANGAN DAN WEB

BAB RINGKASAN

Web adalah fenomena komputasi yang paling dominan dari tahun 1990-an dan yang technol-ogy dan data warehousing berkumpul untuk menghasilkan hasil yang dramatis.

Sebuah gudang data Web-enabled menyesuaikan Web untuk pengiriman informasi dan Collab-orasi di kalangan pengguna.

Mengadaptasi data warehouse ke Web berarti termasuk fitur seperti infor-masi "push" teknik, kemudahan penggunaan, respon cepat, tidak ada downtime, keluaran multimedia, dan skalabilitas.

Penyampaian informasi berbasis web memperluas penggunaan data warehouse dan membuka strategi informasi baru.

Kombinasi OLAP dan teknologi Web menghasilkan manfaat yang besar bagi pengguna.

Karena sifat terbuka dari Web, mengadaptasi data warehouse ke Web panggilan untuk pelaksanaan pertimbangan serius.

PERTANYAAN REVIEW

1. Jelaskan secara singkat dua fitur utama dari data warehouse Web-enabled.2. Bagaimana Internet, intranet, extranet dan berlaku untuk data warehouse? 3. Apa harapan pengguna dari sebuah gudang data Web-enabled? 4. Bagaimana Anda bisa menggunakan Web sebagai sumber data untuk data

warehouse Anda? Apa jenis informasi yang bisa Anda dapatkan dari Web? 5. Nama setiap empat pilihan standar pada halaman Web menyampaikan

informasi dari data warehouse. 6. Apakah empat teknologi umum untuk membangun user interface Web-

enabled untuk gudang data Anda? 7. Mengapa keamanan data menjadi perhatian utama untuk data warehouse

Web-enabled? 8. Daftar setiap empat fitur dari data Webhouse. 9. Nama dua pendekatan untuk sistem OLAP berfungsi dalam data

warehouse Web-enabled. 10. Apa arsitektur bus data warehouse? Bagaimana cara masuk dalam data

warehouse Web-enabled?

Page 38: Tugas Data Warehousing Dan Data Mining

LATIHAN

Menunjukkan jika benar atau salah:

Extranet yang tidak termasuk mitra bisnis di luar dari mengakses data warehouse perusahaan.

Teknologi web dalam data warehouse membuka berbagai format informasi kepada pengguna.

Penyampaian informasi yang lebih baik kepada pengguna adalah satu-satunya alasan untuk Web-memungkinkan gudang data Anda.

Page 39: Tugas Data Warehousing Dan Data Mining

LATIHAN   397

Supergrowth merupakan fenomena langka di Web-enabled data warehouse environ-ment.

Web ini mempromosikan "swalayan" akses.

Data Webhouse memerlukan arsitektur terdistribusi.

Teknologi web membuatnya lebih mudah untuk menambahkan lebih banyak pengguna untuk data warehouse.

Web dan fitur-fiturnya tidak kompatibel dengan data warehouse.

Untuk antarmuka informasinya, data warehouse Web-enabled tidak dapat menggunakan kedua "push" dan "menarik" teknik.

Dalam data warehouse Web-enabled, HTML atau XML standar file adalah prin-cipal berarti untuk komunikasi.

Informasi berbasis web dalam hasil data warehouse di "supergrowth." Diskusikan pertumbuhan yang fenomenal ini dan menjelaskan bagaimana Anda akan memberikan supergrowth.

Tim proyek Anda telah diarahkan untuk menyediakan semua pembuatan laporan dan pengiriman melalui Internet. Membuat rencana untuk mengadopsi teknologi Web untuk semua pelaporan dari gudang data Anda. Membahas semua implikasi.

Data warehouse Web-enabled tidak memiliki pusat. Ini adalah lingkungan terdistribusi. An-alyze implikasi dari pernyataan-pernyataan ini. Dari perspektif ini, apa con-siderations untuk menjaga tabel dimensi dan fakta?

Sebagai spesialis Web pada tim proyek, menyiapkan dokumen menyoroti pertimbangan ma-jor untuk Web-memungkinkan gudang data Anda. Hanya daftar-tions considera, bukan teknik pelaksanaan.

Page 40: Tugas Data Warehousing Dan Data Mining