Bahçeşehir Üniversitesi 1
İş Zekasına Giriş
Erdem Alparslan
2
İçerik
• Karar alma süreci– İş Zekası(BI) için motivasyon unsuru
• İş zekasına giriş– Tanımlar
• BI, DW, OLTP, OLAP– BI süreci– Karar destek sistemleri ve mimarileri– OLTP – OLAP kıyaslaması– BI’da veri madenciliğinin yeri
3
Karar alma süreci
• Farklı seviyelerde karar alma– Operasyonel
• Kısa vadeli geri dönüşler sağlayacak günlük kararlar• Genelde alt seviye yöneticilerin karar almaları
– Taktiksel• Orta seviye yöneticilerin aldığı stratejiye uygun orta vade hamleler
– Stratejik• Üst yönetim tarafından alınan, yapısal olmayan, soyut kararlar
4
Karar alma süreci
• Karar alma süreci– Problem tanımı– Alternatif çözümlerin araştırılması– Seçim yapılmasıAşamalarını içerir.
• Bilgi ve tecrübe karar almanın omurgasını oluşturur
5
Ham veri Bilgi
İşlenmiş Bilgi
Karar alma
Aksiyonlar
Var olan bilgi türleri
• Uzman bilgisi– Bir konunun uzmanı olan kişinin kişisel çalışma ve
tecrübeleri– Uzun yıllar iş tecrübesi, ilgi, konsantrasyon
• Örgütsel bilgi– Kurum bileşenleri arasındaki karmaşık ilişkiyi tanımlar– Kurum içinde gizli insan kaynağı bilgisini temsil eder
• Bilgi elde etme– Bilgi toplama (uzmanlardan)– Bilgi keşfetme (ham veriden)
7
Bilgi keşfetme avantaj ve dezavantajlar
• Avantajlar– Sadece bir ya da birkaç uzmana bağımlı değil– Anlık performansa dayalı– İnsanın tespit edemeyeceği ilişkili verilere ulaşma– Objektif– Teori ve pratik olarak tanınırlığı iyi düzeyde
• Dezavantajlar– Kullanılan veriye oldukça bağımlı (veri kirliliği)– Tarihsel veri gerektirir ve oldukça bağımlı (trend
değişiklikleri)
8
Motivasyon – Karar desteği niçin?
• Karar desteği: Bilgiye ihtiyaç duyan varlıklara (stratejik lider, yönetici ya da analist ) BT yardımıyla bilgi sağlama
• Ham verideki gizli ilişkilerin tespit edilmesi• Çok büyük veri yığınlarının kişisel çaba ile
incelenmesinin zorluğu• Daha tutarlı ve güvenilir sonuç isteği• Rekabette geri kalmama, hızlı aksiyon olma ve öncü
olma isteği
9
Temel kavramlar
• İş zekası• Veri ambarı• OLTP• OLAP• Data mart• Data küp• …..• ………
10
İş Zekası nedir
• Geçmişi anlamaya geleceği öngörmeye yarayan teknoloji
• Teknoloji– Veriyi yakalayan, saklayan, erişen ve analiz eden– İş performansını ölçülebilir veriler üzerinden belirleyen
• Uygulama– Karar destek sistemi– Sorgu ve raporlama– Anlık analitik süreç (OLAP)– İstatistiksel süreç, veri madenciliği ve öngörü
11
Veri ambarı
• Kurumun operasyonel veritabanından tamamiyle ayrılan karar destek veri tabanı
• Farklı kaynaklardaki bilgiyi tekilleştirerek ilişkilendiren bir bakış açısı
• Konsolide edilmiş ve tarihsel veriyi analiz amacıyla işleyen mimari
• Çok boyutlu veri modeli üzerinde veriye farklı bakış açılarından bakmaolanağı
13
Veri ambarı – İlişkisel veritabanı
• Online işlem işleyici (OLTP)– İlişkisel veritabanlarının birincil işi– Tüm gündelik operasyonel veriler– Veri tutarlılığı çok önemli, hızlı yanıt verebilme kabiliyeti
• Online analiz işleyici (OLAP)– Veri ambarlarının birincil işi– Ver analizi ve karar verme amaçlı– Büyük hacimli verilerin çok boyutlu incelenmesi amaçlanır
14
Veri ambarı – İlişkisel veritabanı
• Birbirinden ayrılan yönleri– Kullanıcı ya da sistem yönelimlilik– İçerdiği veri (anlık, tarihi, özet, detay)– Veritabanı tasarımı (ER, star, snowflake …)– Erişim şekilleri (sadece SELECT ya da SELECT-UPDATE-
INSERT)– Görünüm (anlık, geçmiş, evrimsel, bütünsel)
15
OLTP - OLAPKullanıcı İşlemci, BT çalışanı Bilgi işçisi
Fonksiyon Günlük operasyonlar Karar desteği
VT Tasarımı Uygulama yönelimli Amaç yönelimli
Veri Anlık, izole Tarihsel, bütünleşik
Görünüm Detaylı,düz ilişkisel Özet, çok boyutlu
Kullanım Yapısal, tekrarlı Ad hoc
İş Birimi Kısa ve basit işlem Karmaşık sorgu
Erişim Okuma / yazma Okuma
Operasyon İndeksler üzerinde Sıralı aramlarla
Erişilen kayıt sayısı Onlar Milyonlar
Boyut 100MB-GB 100GB-TB-PB
Kullanıcı sayısı Binler Yüzler
16
SQL – OLAP – Veri MadenciliğiSQL OLAP Veri Madenciliği
Görev Detaylı ve özet veri çıkarma
Özet, trend analizi ve öngörü Veri çıkarsama
Sonuç çeşidi Bilgi Analiz Öngörü
MetodSoru-cevap Çok boyutlu
modelleme, istatistikModel öğretme ve yeni veriye uygulama
Örnek soru Ortak fonları son 3
yılda kimler satın aldı?
Ortak fonları satın alanların bölge ve yıllara göre ortalama geliri ne kadardır?
Önümüzdeki 6 ayda ortak fonları hangi müşterilerimiz satın alacaklar? Neden?
17
Örnek
18
Örnek - inceleme• Yukarıdaki tabloyu DBMS mantığı ile sorgulayarak şu sorulara cevap bulabiliriz:
– Güneşli günlerdeki hava sıcaklığı ne?– Hangi günler nem oranı 65 in altında?– Hangi günler sıcaklı 70 in üzerinde iken nem 70 in altında?
• OLAP yardımı ile çok boyutlu model oluşturabiliriz (data küp)– Gün, durum ve piknik kullanılarak şu model oluşturulabilir:
• Veri madenciliği kullanılarak aşağıdaki karar ağacı elde edilebilir:– Durum = sunny
• Nem=yüksek piknik yok• Nem=Normal piknik var
– Durum=overcast piknik var– Durum=yağışlı
• Rüzgar var hayır• Rüzgar yok evet
19
İş Zekası Perspektifinden Karar Destek Sistemleri
20
Çok katmanlı karar destek sistemleri
• Veriambarı sunucusu– Genellikle ilişkisel veritabanı sistemleri, nadiren dosya sist.
• OLAP sunucular– İlişkisel OLAP (ROLAP): İlişkisel veritabanlarının operasyon
verilerini analiz için çok boyutlu mantığa uyarlanışı– Çok boyutlu OLAP (MOLAP): Çok boyutlu OLAP hesaplamaları
için tasarlanmış dedike sunucu• İstemciler– Sorgu ve raporlama araçları– Analiz araçları– Veri madenciliği araçları
21
Veri ambarı VS Datamartlar
• Kurumsal veriambarı: Tüm kurumu ilgilendiren varlıklar ile ilgili bilgiyi barındırır– Çok kapsamlı iş modellemesi gerektirir (yıllar alabilir)
• Datamartlar: Belirli bir iş için departman bünyesinde oluşturulmuş bakış açıları– Pazarlama datamartı: müşteri-ürün-satış– Hızlı oluşturma geç adaptasyon
• Sanal veriambarı: Diğer veritabanlarına görünümler– Efektif sorgular için diğer verikaynaklarına görünüm atma– Kullanımı kolay ancak operasyonel veritabanına yük bindirir
22
Metaveri havuzu
• Metaveri veri ambarı nesnelerini tanımlamak için kullanılır. Şu şekillerde olabilir:– Veriambarının yapısını belirtir– Operasyonel metaveri içerebilir– Özetleme için kullanılmış olan algoritmalar– Operasyonel veritabanından veriambarına nasıl aktarıldığı– Sistem performansı için gerekli veri– İş sahibi verisi (terimler, tanımlar, kısıtlamalar)
23
İş zekası – eski tanım
24
İş zekası – yeni tanım