15
Skladišta podataka Stjepan Brozović Doc.dr.sc. Marko Banek

SkladišTa Podataka

Embed Size (px)

DESCRIPTION

a

Citation preview

Page 1: SkladišTa Podataka

Skladišta podataka

Stjepan Brozović

Doc.dr.sc. Marko Banek

Page 2: SkladišTa Podataka
Page 3: SkladišTa Podataka

Ukratko:

Skladište podataka Povijest skladišta podataka Izgradnja skladišta podataka Metodologija izgradnje skladišta podataka Struktura sustava skladišta podataka Dimenzionalni model skladišta podataka Složene dimenzijske strukture Zaključak

Page 4: SkladišTa Podataka

Skladište podataka:

je baza podataka koja omogućuje brzo i jednostavno izvođenje pretraga i upita nad velikim količinama podataka

je skup podataka na kojem se temelji sustav potpore u odlučivanju

namjenjeno je menađerima, ali i svima koji u svom poslu obavljaju analitičke zadatke

sadrži ogromne količine podataka koji se koriste u svrhu poslovnih analiza i postizanja što boljih tržišnjih rezultata

Page 5: SkladišTa Podataka

Skladište podataka:

Definicija skladišta podataka:

“Skladište podataka je baza podataka koja sadrži povijesne, nepromijenjive podatke koji su logički i fizički izvućeni iz raznih izvora. Ti podaci se u skladu s definiranim modelom učitavaju u skladište i integriraju s postojecim podacima, a sve to u svrhu potpore poslovnom odlučivanju.”

R. Kimball, The Data Warehouse Toolkit

Page 6: SkladišTa Podataka

Povijest skladišta podataka:

70-tih Bill Inmon uvodi pojam: Skladište podataka 1983. Tvrtka Teradata predstavlja sustav upravljanja

bazama podataka stvoren za pomoć u odlučivanju 1988. IBM-ovi znanstvenici Barry Devlin i Paul Murphy

razvijaju tkz. poslovno skladište podataka 1991. Bill Inmon objavljuje knjigu: Building the Data

Warehouse 1991. Tvrtka Prim Solutions predtavlja softver

namjenjen za izgradnju i razvoj skladišta podataka 1995. Osniva se The Data Warehousing Institute

organizacija koja promiće skladišta podataka 1996. Ralph Kimball objavljuje knjigu: The Data

Warehouse Toolkit

Page 7: SkladišTa Podataka

Izgradnja skladišta podataka: (1)

Proces izgradnje započinje definiranjem korisničkih zahtjeva. Analiziraju se zahtjevi i postojeći podatci u operacijskoj bazi. Izgrađuje se logički model skladišta podataka. Podaci se logički transformiraju prilikom izvlačenja iz

transakcijske baze i učitavanja u skladište podataka. Podaci u skladištu podataka se modeliraju u dimenzijski model

podataka pogodan za izvođenje milijuna upita istovremeno. Podaci se zatim fizički dimenzijoniraju (pročišćavaju i

pojednostavljuju) što osigurava razumijevanje pojedinih podataka.

Page 8: SkladišTa Podataka

Izgradnja skladišta podataka: (2)

Osigurava se učitavanje novih podataka u nekim vremenskim intervalima.

Izgradnja skladišta je gotova, ali je skladiše potrebno nadgledati i upravljati njime, te ako se javi potreba i rekonstruirati.

Page 9: SkladišTa Podataka

Metodologija izgradnje skladišta podataka:

Tokom razvoja skladišta podataka pojavile su se mnogobrojne metodologija, ali sve su imale ishodište u dva najpoznatija pristupa: Odozgo-dolje – je stariji pristup kojeg je uveo B. Inmon. Brz,

ali ako skladiše podataka nije dovoljno temeljito definirano najvjerojatnije će rezlutirati pogrešnim rezultatom pretraživanja.

Odozdo-gore – Noviji pristup predložen od strane R. Kimbella. Jednostavniji i brži za izgradnju, ali sporiji u pretraživanju podataka no samim time i točniji sa krajnjim rezultatom.

Zato se danas primjenjuju različiti kombinirani pristupi, primjerice middle-out koji uvažava potrebe korisnika, ali i realnost raspoloživosti pojedinih podataka.

Page 10: SkladišTa Podataka

Struktura sustava skladišta podataka:

Izvorišni sustav/sustavi – je područije u kojem se vrši unos podataka koji nastaju kao rezultat poslovnog procesa.

Privremeno područje – je dio sustava u kojem se vrši obrada pristiglih podataka kako bi ih se pripremilo za njihov unos u bazu skladišta podataka.

Baza skladišta podataka – je odredišna točka prikupljenih izvorišnih podataka.

Korisnički pristup podatcima – je skup alata za pristup i analizu podataka. Očekuje se brzina i jednostavnost rada.

Page 11: SkladišTa Podataka

Dimenzionalni model podataka:

Nastanak dimenzionalnog modela uzrokovan je nedostatcima složenih relacijskih sruktura (suviše komplicirana struktura te spor odaziv pri postavljanju upita).

Dimenzionalni model zbog svoje jednostavnosti daje mogućnost brzog dobivanja informacije.

Page 12: SkladišTa Podataka

Složene dimenzijske strukture: (1)

Pahuljasta struktura: Nastaje kada se nad određenom dimenzijom

proizvoda izvrši postupak normalizacije. Npr. iz dimenzije proizvoda izdvoji se određena kategorija i stavi se u zasebnu dimenzijsku tablicu.

Stvaranje ovakve strukture nije preporučljivo, jer otežava korisniku razumjevanje te usporava upite.

Ovakvom strukturom ostvaruje se ušteda na fizičkom prostoru no ona je u nekim slučajevima zanemarivo mala.

Page 13: SkladišTa Podataka

Složene dimenzijske strukture: (2)

Mosna struktura:

Se pojavljuje u slučajevima kada jednom zapisu mora biti pridruženo više zapisa neke dimenzije. Npr. pregled pacijenta kojem se na jednom pregledu pruža dijagnoza ili bankovni račun koji ima više vlasnika.

Ovakvu dimenziju nazivamo dimenzijom više-prema-više

Page 14: SkladišTa Podataka

Zaključak:

Na globaliziranom tržištu sa oštrom konkurencijom i izbirljivim kupcima, proizvođaći traže idealnu poslovnu strategiju. Stratešku prednos daje im skladište podataka, odnosno analiza prikupljenih podataka o kupcima i proizvodima koje odabiru. To im omogućuje kreiranje profila kupca i usmjeravanje daljnih akcija prema kupcu u svrhu povećanja prodaje i zadovoljstva samog kupca.

Page 15: SkladišTa Podataka

The EndThe End

Zahvaljujem se na pažnji!Zahvaljujem se na pažnji!