84
DIMENZIJSKO MODELIRANJE PROF. DRAŽENA GAŠPAR 09.01.2014. Upravljanje poslovnim podacima

BDM_09012014_4

Embed Size (px)

DESCRIPTION

UPP slajdovi 3

Citation preview

  • DIMENZIJSKO MODELIRANJE

    PROF. DRAENA GAPAR 09.01.2014.Upravljanje poslovnim podacima

  • *TO JE DIMENZIJSKO MODELIRANJE (DM)?DM je tehnika logikog dizajna koja pokuava predstaviti podatke na standardan, intuitivan nain koji omoguava visoku razinu performansi pristupa. Moe se implementirati koristei relacijsku ili viedimenzijsku bazu podataka.Svaki dimenzijski model se sastoji od jedne tablice sa sloenim kljuem tablice injenica (vrijednosna tablica, injenina tablica, fakt tablica) i skupa manjih tablica dimenzijskih tablica. Svaka dimenzijska tablica ima jednostavni primarni klju koji odgovara tono jednom dijelu sloenog kljua iz fakt tablice. Grafiki prikaz ovog modela podsjea na zvijezdu, pa se ova struktura naziva zvijezda spajanje (zvijezda shema).

  • ZVIJEZDA SHEMA

  • FAKT TABLICAFakt tablica pohranjuje mjere vrijednosti poslovanja i pokazuje na vrijednost kljua na najnioj razini svake dimenzijske tablice Mjere su kvanitativni ili injenini podaci o predmetu. Mjere su openito numerike i odgovaraju na pitanje koliko?Primjeri mjera su: cijena, prodaja proizvoda, inventurna koliina, prihod i sl. Mjera se moe odnosti na stupac u tablici ili moe biti izraunata.

  • *FAKT TABLICANajkorisnije injenice u fakt tablici su numerike i po njima se moe zbrajati.

    Zbrajanje je bitno iz razloga to DW aplikacije skoro nikada ne rade s jednim retkom fakt tablice, ve obino rade sa stotinama, tisuama ili ak milijunima slogova (redaka) u jednom trenutku. Vrlo esto, najskorisnije to se moe uinit s tolikom brojem slogova je zbrojiti ih.

  • FAKT TABLICAPrije dizajna fakt tablice usitnjenost (granularnost) fakt tablice mora biti odreena.

    Usitnjenost odgovara definiciji pojedinanog sloga najnie razine u toj fakt tablici.

    Usitnjenost se moe odnositi na pojedinanu transakciju, dnevni snapshot ili mjeseni snapshot.

  • STRUKTURA FAKT TABLICE

  • LOA FAKT TABLICA Sadri ne-numerike vrijednosti to znai da nema agregiranja podataka

    Problem zbrajanja popust prikriven u cijeni

    Nema izravne relacije s postojeom strukturom kljueva (rezultat: problem zbrajanja)

  • PRIMJER DOBRE I LOE FAKT TABLICE

  • DIMENZIJSKA TABLICADimenzija predstavlja jedan skup objekata ili dogaaja u stvarnom svijetu.

    Svak adimenzija koju korisnik identificira za model podataka implemetira se kao dimenzijska tablica.

    Dimenzije su kvalifikatori koji daju znaenje mjerama iz fakt tablice, zato to daju odgovor na to, koji, kada, koliko i gdje aspekte pitanja. Na primjer:

    Koji kupci su ostvarili najvei promet prole godine?Koliki je bio na profit po dobavljaima?Koliko je prodano jedinica svakog proizvoda?

  • *DIMENZIJSKA TABLICADimenzijska tablica sadri informacije o tome kako organizacija eli analizirati injenice:Prikazati prodaju (injenica) za proli tjedan (vrijeme) za crvene alice (proizvod) u zapadnoj hercegovini (zemljopisni pojam)Dimenzijska tablica najee sadri opisne tekstualne informacije crvene alice, zapadna hercegovinaDimenzijski atributi se koriste kao izvor najzanimljivijih ogranienja u DW upitima, oni su uvijek zaglavlja redaka u SQL odgovoru na upit.

  • DIMENSIONS

  • DIMENZIJSKE TABLICEDimenzija moe definirati viestruke dimenzijske elemente za razliite razine zbrajanja. Na primjer, svi elementi koji se odnose na strukturu prodaje organizacije mogu initi jednu dimenziju.

  • DIMENZIJSKA TABLICADimenzije su napravljene od hijerarhija elemenata. Zbog hijerarhijskog aspekta dimenzija, korisnici mogu postaviti upite koji pristupaju podacima na vioj (roll up) ili nioj razini (drill down). Slika prikazuje hijerarhijsku vezu dimenzijskih elemenata: account se moe zbrajati (roll up) po teritoriji (territorie), a teritorije po regijama (regions). Korisnici mogu postavljati upite na razliitim razinama dimenzije. Na primjer: upit za sve regije i onda drill down prema teritoriji ili account razini za detaljne informacije.

  • DIMENZIJSKA TABLICAAtribut dimenzije je stupac u dimenzijskoj tablici. Svaki atribut opisuje razinu agregacije u okviru dimenzijske hijerarhije. Dimenzijski elementi definiraju hijerarhijske veze unutar dimenzijske tablice; atributi opisuju dimenzijske elemente na nain blizak korisnicima. Slika prikazuje dimenzijske elemente i odgovarajue atribute account dimenzije.

  • ZAKLJUAKDimenzijeVremenski neovisni, tekstualni i opisni atributi pomou kojih korisnici opisuju objekte. Kombiniranje svih atributa ukljuujui hijerarhije, svrdlanja i pod-referenciranja u jednu dimenziju je denormalizacija.esto po rije u upitima ili izvjeima Nisu vremenski ovisne

    FaktiPoslovna mjerenjeVeina injenica su numerikeZbrojivi, polu-zbrojivi, nezbrojiviIzgraeni od najnie razine detalja (usitnjenost)Vrlo efikasniVremenski ovisni

  • TIPINI OPERATORI Roll up (drill-up): zbrajanje (agregiranje) podatakaPo hijerarhiji prema gore ili po dimenzijiDrill down (roll down): suprotno od roll-up [svrdlanje]od vie razine agregiranja prema nioj tj. prema detaljnim podacima, ili uvoenje novih dimenzijaSlice and dice [raslojavanje i presijecanje]: Projekcija i selekcija Pivot (rotate) [rotiranje] : Zaokretanje kocke, vizualizacija, 3D prema seriji 2D.Drugi operatoridrill across [svrdlanje preko]: ukljuivanje (preko) vie od jedne fakt tablicedrill through [svrdlanje kroz]: kroz najniu razinu kocke do njenih relacijskih tablica u pozadini (koristei SQL)

  • DRILL DOWN I ROLL UP

  • ROLL DOWN / ROLL UPRoll-down i roll-up su OLAP operatori koji daju vii ili nii stupanj agregacije du cijele dimenzije za danu razinu hijerarhije.

  • DRILL DOWN / DRILL UP

  • SLICE AND DICE

    Slice [Raslojavanje]

    Definira lana ili grupu lanova koji su odvojeni (od svih derugih dimenzija) i onda se evaluiraju kroz sve dimenzije. lan dimenzije znai vrijednost unutar stupca.

    Primjer: 3 dimenzije: proizvod, trgovina i vrijeme

  • SLICE Slice odabir jednog ili vie lanova dimenzije (proizvod) i konsolidiranje (agregiranje) du svih ostalih dimenzija (trgovina i vrijeme)

  • DICEDice [Presijecanje] odabir jednog ili vie lanova iste dimenzije na jednoj osi, i lana/lanova druge dimenzije na drugoj osi.Svrha: analiza veza meu razliitim dimenzijama.

  • PIVOTING [ROTIRANJE]Pivoting zamjena stupaca i redaka

    Analiza istih podataka iz razliitih perspektiva

  • PIVOTING

  • PIVOTING

  • MODELIRANJE DIZAJN PROCES Identificirati poslovni proces Izvor mjerenjaIdentificirati usitnjenostto 1 redak u fakt tablici predstavlja ili znai?Identificiranje dimenzija Deskriptivni kontekst, odgovara usitnjenostiIdentificiranje injenica Numerike zbrojive mjere, odgovaraju usitnjenosti

  • KORAK 1 IDENTIFICIRANJE POSLOVNOG PROCESA Ova poslovna aktivnost se obino vee za izvorni sustav.Ne smije se pomijeati s poslovnim odjelom ili funkcijom. Dimenzijski model Naruivanja trebao bi podrati aktivnosti i Prodaje i Marketinga.Ako uspostavimo dimenzijski model koji predstavlja odjele, slijedi neosporno dupliciranje podataka s razliitim oznakama i terminologijom.

  • KORAK 2 IDENTIFICIRATI USITNJENOSTRazina detalja povezana s mjerama iz fakt tablice.

    Kritian korak neophodan prije koraka 3 i 4.

    To bi trebala biti najdetaljnija mogua razina.

    Kako opisujete pojedinani redak u fakt tablici?

  • KORAK 3 IDENTIFICIRANJE DIMENZIJA Lista svih diskretnih, tekstualnih atributa koji proizlaze iz fakt tablice.Najee se koristi po rije kako bi se opisali zahtjevi.Svaka dimenzija se moe promatrati kao ulazna toka za fakte (injenice).Kako poslovni ljudi opisuju podatke koji proizlaze iz poslovnog procesa?

  • KORAK 4 IDENTIFICIRANJE INJENICAMora odgovarati usitnjenosti definiranoj u koraku 2.Tipine injenice su numeriki zbrojive.injenice koje pripadaju razliitoj granularnosti pripadaju i odvojenim fakt tablicama.injenice su odreene odgovorom na pitanje: to mi mjerimo?Postotci i stope, kao to su postotak dobiti su nezbrojivi. Brojitelj i nazivnik bi trebali biti pohranjeni u fakt tablici.

  • PRIMJER

  • *DIMENZIJSKI MODEL VS ER MODELKlju za razumijevanje odnosa izmeu DM i ER modela je da se jedan ER dijagram rastavlja na vie DM dijagrama ili zvijezda. Promatrati veliki ER dijagram kao predstavljanje svakog mogueg poslovnog procesa u okviru aplikacije. ER dijagram moe imati Prodaju, Narudbe, Raune, Plaanja, Povrate, sve na istom dijagramu.

  • *DIMENZIJSKI MODEL VS ER MODELShipmentsReturnsSales ContactOrdersPayments

  • *DIMENZIJSKI MODEL VS ER MODELZa kreiranje pojedinane zvijezde koja postoji u aplikaciji :Traiti vie-prema-vie relacije u ER modelu koje sadre numerike i zbrojive vrijednosti i dizjnirati ih kao fakt tablice. Alternativno, traiti dogaaje ili transakcije oni takoer mogu biti vrijednosti (fakti) Denormalizirati sve preostale tablice u flat tablice s jednostavnim kljuevima koji ih povezuju izravno na fakt tablice. Ove tablice postaju dimenzijske tablice. U sluajevima gdje se dimenzijska tablica povezuje s vie od jedne fakt tablice, predstaviti istu dimenziju u obje sheme. Takva dimenzijska tablica se naziva konformna (conformed) tj. usuglaena izmeu dva dimenzijska modela.

  • *DM - PREDNOSTIPredvidiv, standardan okvir (OLAP, Alati za izvjeivanje i upite, korisnika sueljamogu imati ugraene vrste pretpostavke o DM i uiniti korisniko suelje razumljivijim, a obradu efikasnijom)

    Umjesto uporabe optimizatora, DBMS moe napraviti vrlo vrstu pretpostavku o tome da prvo ogranii dimenzijske tablice, a onda napadne fakt tablicu, sve odjednom s Kartezijevim proizvodom onih kljueva dimenzijskih tablica koji zadovoljavaju korisnika ogranienja.

  • *DM - PREDNOSTIPredvidljivi okvir zvijezda sheme podnosi nepredvidljive promjene u ponaanju korisnika. Svaka dimenzija je isto vrijedna. Sve dimenzije se mogu promatrati kao simetrino jednake ulazne toke u fakt tablicu. Logiki dizajn moe biti uraen neovisno o oekivanom uzorku upita. Korisnika suelja su simetrina, strategije upita su simetrine i SQL generiran nad dimenzijskim modelom je simetrian.

  • *DM - PREDNOSTIDM je elegantno proiriv u kako bi omoguio nove neoekivane podatkovne elemente i nove dizajn odluke. Elegantno proiriv:Sve postojee tablice (i fakt i dimenzijske) se mogu promjeniti jednostavnim dodavanjem novih redaka u tablicu, odnosno tablica moe biti promijenjena SQL Alter table naredbom. Podaci ne moraju biti ponovno uitani. Nijedan upitni ili izvjetajni alat ne treba reprogramirati da prihvati promjenu.Stare aplikacije nastavljaju s radom bez davanja razliitih rezultata. Mogue je dodavanje novih zbrojivih numerikih polja u fakt tablicu sve dok su konzistentni s temeljnom granulacijom fakt tablice.

  • *DM - PREDNOSTIPostoje standardni pristupi za rad sa slinim situacijama modeliranja u poslovnom svijetu:Sporo promjenjive (Slowly changing) dimenzije, gdje konstantna dimenzija kao to je Proizvod ili Kupac se stvarno mijenja sporije i asinkrono. Dogaajima upravljane (Event-handling) baze podataka gdje u je fakt tablica u pravilu bez veijdnosti tj. injenica (factless).

  • *DM - PREDNOSTIUpravljanje agregacijama:

    Agregacije su zbrojeni slogovi koji su u pravilu redudantni ali se koriste za poboljanje performansi upita. Potrebna je sveobuhvatna agregacijska strategija u svakoj implementaciji DW-a. Svi softverski paketi za upravljanje agregacijama ovise o specifinoj strukturi fakt i dimenzijskih tablica, odnosno o dimenzijskom modelu.

  • MODELIRANJE DIZAJN PROCES PRIMJER Identificirati poslovni proces Izvor mjerenjaIdentificirati usitnjenostto 1 redak u fakt tablici predstavlja ili znai?Identificiranje dimenzija Deskriptivni kontekst, odgovara usitnjenostiIdentificiranje injenica Numerike zbrojive mjere, odgovaraju usitnjenosti

  • KORAK 1 IDENTIFICIRANJE POSLOVNOG PROCESAAnaliza rezultata ispitnih rokova na Sveuilitu

    Osnovni cilj (svrha) analize???

    Koje vrste izvjea korisnici oekuju???

    Koji su podaci neophodni da bi se omoguila izvjea???

    Izvori podataka???

  • Analiza rezultata ispita na Sveuilitu

    Svrha:

    Dobiti informacije o (ne)uspjehu provjere znanja Dobiti informacije o stopi prolaznosti Dobiti informacije o najvioj, najnioj i prosjenoj ocjeni po ispitu, predmetu, studentu, profesoru, ispitnim rokovima, akademskim godinama, smjerovima, fakultetima .

    KORAK 1 IDENTIFICIRANJE POSLOVNOG PROCESA

  • Analiza rezultata ispita na Sveuilitu

    Izvori podataka: Sveuilini ISFakultetiSmjerovi/Studijske grupeIspitni rokoviNastavno osobljePredmetiStudentiOcjene (1-5)KORAK 1 IDENTIFICIRANJE POSLOVNOG PROCESA

  • KORAK 2 IDENTIFICIRANJE GRANULARNOSTI Razina detaljnosti povezana s vrijednostima u fakt tablici.Kritini korak neophodan prije koraka 3 i 4. Poeljno je da bude to je mogue vie atomizirana (detaljna) razina.Kako opisujete jedan redak u fakt tablici?

    USITNJENOST

  • Razina detaljnosti povezana s vrijednostima u fakt tablici.Kritini korak neophodan prije koraka 3 i 4. Poeljno je da bude to je mogue vie atomizirana (detaljna) razina.Kako opisujete jedan redak u fakt tablici?

    USITNJENOST (GRANULARNOST):

    Jedan redak za svaki ispit po predmetu i po studentu za ispitni rok !!KORAK 2 IDENTIFICIRANJE GRANULARNOSTI

  • KORAK 3 IDENTIFICIRANJE DIMENZIJAPopis svih diskretnih, tekstualnih atributa koji proizlaze iz fakt tablice.Koristi se rije po za opis zahtjeva.Svaka dimenzija se moe promatrati kao analitika ulazna toka za vrijednosti (injenice/fakte).Kako poslovni ljudi opisuju podatke koji rezultiraju iz poslovnih procesa?

  • Popis svih diskretnih, tekstualnih atributa koji proizlaze iz fakt tablice.Koristi se rije po za opis zahtjeva.Svaka dimenzija se moe promatrati kao analitika ulazna toka za vrijednosti (injenice/fakte).Kako poslovni ljudi opisuju podatke koji rezultiraju iz poslovnih procesa?Rezultati studentskih ispita - FaktGRAN.: svki predmet, ispit, rok po studentuStudentPredmetFakultetProfesorIspitna godinaOdabrani SmjerKORAK 3 IDENTIFICIRANJE DIMENZIJA

  • PREDMET dimenzija

    Predmet klju (PK)Predmet nazivECTSPredavanja satiVjebe satiSadrajKompetencijeROKOVI GODINE dimenzija

    Rok klju (PK)Rok opisAkademska godinaRok/SezonaRok tip ** R redoviti rok I izvanredni rokKORAK 3 IDENTIFICIRANJE DIMENZIJA

  • FAKULTET dimenzija

    Fakultet klju (PK)Facultet nazivFacultet adresa Facultet telefonFacultet e-mailFacultet web

    ODABRANI SMJER dimenzija

    Odabrani smjer klju (PK)Odabrani smjer opisKORAK 3 IDENTIFICIRANJE DIMENZIJA

  • STUDENT dimenzija

    Student klju (PK)Student imeStudent prezimeStudent indeks Student datum roenjaStudent status*Study ciklusStudent semestarStudent adresaStudent telefonStudent e-mail

    * R redoviti bez plaanja P redoviti uz plaanje I izvanredni uz plaanjePROFESOR dimenzija

    Profesor klju (PK)Profesor imeProfesor prezimeProfesor titulaZvanjeProfesor JMBGProfesor datum roenjaProfesor adresaProfesor telefonProfesor e-mailKORAK 3 IDENTIFICIRANJE DIMENZIJA

  • KORAK 4 IDENTIFICIRANJE VRIJEDNOSTI

    Mora odgovarati usitnjenosti definiranoj u koraku 2.Tipine injenice su numeriki zbrojive.injenice koje pripadaju razliitoj granularnosti pripadaju i odvojenim fakt tablicama.injenice su odreene odgovorom na pitanje: to mi mjerimo?Postotci i stope, kao to su postotak dobiti su nezbrojivi. Brojitelj i nazivnik bi trebali biti pohranjeni u fakt tablici.

  • REZULTATI STUDENTSKIH ISPITA FAKT

    Predmet klju (FK)Rok klju (FK)Fakultet klju (FK)Odabrani smjer klju (FK)Student klju (FK)Profesor klju (FK)Ocjena

    KORAK 4 IDENTIFICIRANJE VRIJEDNOSTI

  • NAPREDNI KONCEPTIDegenerativna dimenzijaPahuljasta shema (Snowflaking)Previe dimenzijaSurogatni kljueviPeriodini snapshotPoluzbrojive vrijednosti (fakti)Podudarne dimenzije/faktiSporo promjenjive dimenzijeDimenzije s viestrukim vrijednostima

  • DEGENERATIVNA DIMENZIJA Dimenzijska tablica bez atributa.

    Degenerativna dimenzija podaci koji su po prirodi dimenzijski ali su smjeteni u fakt tablici. Primjer: dimenzija koja samo ima Broj narudbe i Broj redaka narudbe 1:1 relacija s fakt tablicom

    POSLJEDICE ????

  • DEGENERATIVNA DIMENZIJAPosljedice: Dvije tablice s bilion redaka umjesto jedne tablice s bilion redaka.

    To je degenerativna dimenzija i Broj narudbe i Broj redaka narudbe trebali bi biti pohranjeni u fakt tablicu.

  • DEGENERATIVNA DIMENZIJADegenerativne dimenzije se obino pojavljuju kada je usitnjenost fakt tablice ustvari jedna transakcija (ili redak transakcije).Primjeri tipinih degenerativnih dimenzija: narudba, transakcija kreditne kartice, karta ili brojevi ekova. Ove degenerativne dimenzije su prirodni kljuevi roditelja itema redaka.

  • DEGENERATIVNE DIMENZIJE Example:

    ORDERS TRANSACTIONSorder#customer idcustomer lnamecustomer fnameshipto street addressshipto cityshipto stateshipto ziporder total amountdiscount amountnet order amountpayment amountorder date

    ORDERS FACTScustomer keyshipto address keyorder date keyorder total amountdiscount amountnet order amountpayment amountorder#

    DIM CUSTOMER Customer keycustomer idcustomer lnamecustomer fname

    DIM SHIPTO ADDRESS Shipto address keyshipto street addressshipto cityshipto stateshipto zip

    DIM Order DateOrder date keyCalendar dateCalendar month

  • PAHULJASTA SHEMA - SNOWFLAKINGNormalizirana zvijezda shema

  • SNOWFLAKINGProblemi:

    Poveava kompleksnost za korisnikeSmanjuje performanse (brojne tablice i spajanja)Usporava pretraivanje po dimenziji (npr. Sve grupe unutar jedne kategorije)

  • PREVIE DIMENZIJA

  • PREVIE DIMENZIJA Veliki broj dimenzija obino je znak da neke od dimenzija nisu potpuno neovisne i trebale bi se kombinirati u jednu dimenziju.

    Greka u dimenzijskom modeliranju je kada se elementi hijerarhije predstavljaju kao odvojene dimenzije.

  • SUROGATNI KLJUEVISurogatni (umjetni, neprirodni, sintetiki) kljuevi su cijeli brojevi (integers) koji se dodjeljuju sekvencijalno kako se dodaju retci.Surogatni klju je zamjena za prirodni primarni klju.Nema nikakvo znaenje.To je samo jedinstveni identifikator ili broj za svaki redak koji se moe koristiti kao primarni klju tablice. Surogatni kljuevi se uglavnom koriste za spajanje dimenziskih tablica s fakt tablicom.Koristan jer se prirodni primarni klju (npr. ifra kupca u tablici Kupci) moe promijeniti to onda ini auriranja sloenijim.

  • Prednosti uporabe surogatnih kljuevaPerformancsEfikasnija spajanja Manji indeksiVie redaka po blokuIntegritet podataka Kada se kljuevi u transakcijskim sustavima ponovno koristeDiskontinuitet proizvoda, izgubljeni kupci, itd.Mapiranje pri integriranju podataka iz razliitih izvoraKljuevi iz razliitih izvora mogu biti razliitiMapiranje tablice surogatnih kljueva i kljuevi iz razliitih izvoraSURROGATNI KLJUEVI

  • Prednosti uporabe surogatnih kljueva (Nastavak)Rad s nepoznatim ili N/A vrijednostimaJednostavno dodjeljivanje vrijednosti surogatnog kljua retcima s tim vrijednostimaPraenje promjena vrijednosti atributa u dimenzijamaKreiranje novih atributa i dodjela sljedeeg raspoloivog surogatnog kljua

    SUROGATNI KLJUEVI

  • Nedostaci uporabe surogatnih kljuevaDodjeljivanje i upravljanje surogatnim kljuevima i odgovarajua zamjena prirodnih kljueva sa surogatnim znai dodatno optereenje ETL sustava.

    Mnogi ETL alati imaju ugraene mogunosti potpore sprocesiranja surogatnih kljueva

    Jedanput kada se proces razvije, moe se jednostavno ponovno koristiti za druge dimenzijeSUROGATNI KLJUEVI

  • PERIODINI SNAPSHOT

    U predefiniranim intervalima snapshoti iste razine detaljnosti se izvravaju i primjenjuju na fakt tablicuPrimjer: veina financijskih izvjea, vrijpotpunjava detalje transakcije u tablici fakata ali ih ne zamjenjujeDijeli istu podudarnu dimenziju ali ima manje dimenzija

  • TIPOVI VRIJEDNOSTITri osnovna tipa:

    Zbrojivi: Mogu se zbrajati kroz sve dimenzije.Polu-zbrojivi: Mogu se zbrajati samo po nekim dimenzijama, ali ne svim.Nezbrojivi: Ne mogu se zbrajati ni po jednoj dimenziji.

  • ZBROJIVI TIPOVI

    Svrha: biljeenje iznosa prodaje za svaki proizvod u svakoj trgovini na dnevnoj bazi.Iznos_prodaje je vrijednost. U ovom sluaju, Iznos_prodajeje zbrojiva vrijednost jer se ova vrijednost moe zbrajati po sve tri dimenzije vrijeme, trgovina i proizvod. Na primjer, zbroj Iznos_prodaje za svih 7 dada u tjednu predstavlja ukupnu prodaju za taj tjedan.

    VrijemeTrgovinaProizvodIznos_prodaje

  • POLU-ZBROJIVE I NEZBROJIVE VRIJEDNOSTI

    Svrha: biljeenje trenutnog stanja po svim korisnikim raunima na kraju svakog dana, kao i profitne margine za svaki raun za svaki dan.Trenutno_stanjeiProfitna_marginasu vrijednosti. Trenutno_stanjeje polu-zbrojiva vrijednost, poto ima smisla zbrjati je po svim raunima korisnika (koliko je ukupno stanje po svim raunima u banci?), ali nema smisla zbrajati po dimenziji vremena (zbrajanje svih trenutnih stanja za svaki dan u mjesecu ne daje nikakvu korisnu informaciju). Profitna_marginaje nezbrojiva vrijednost jer nema smisla zbrajati je niti po jednoj dimenziji.

    VrijemeRaun korisnikaTrenutno_stanjeProfitna_margina

  • PODUDARNE (CONFORMED) DIMENZIJE/VRIJEDNOSTIGlavne ili zajednike referentne dimenzijeDjeljive u DW okruenju na nain da povezuju viestruke fakt tablice i predstavljaju razliite poslovne procese

    2 tipaIdentine dimenzijeJedna dimenzija je podskup detaljnije dimenzije

  • PODUDARNE (CONFORMED) DIMENZIJEIdentine dimenzijeIsti sadraj, interpretacija i prezentacije neovisno o poslovnom procesuIsti kljuevi, nazivi atributa, definicije atributa i domenske vrijednostiPrimjer: dimenzija proizvod je ista bez obzira poziva li se na nju narudba ili skladiteJedna dimenzia moe biti podskup detaljnije, usitnjene dimenzijske tabliceIsti nazivi atributa, definicije i domenske vrijednostiPrimjer: prodaja je povezana na dimenzijsku tablicu na pojedinanoj razini proizvoda, dok je predvianje prodaje povezano s razinom grupe proizvoda

  • PODUDARNE (CONFORMED) DIMENZIJESales Fact TableDate key FKProduct key FK other FKeysSales quantitySales amountProduct DimensionProduct key PKProduct descriptionSKU numberBrand descriptionSub class descriptionClass descriptionDepartment descriptionColorsizeDisplay type

    Sales Forecast Fact TableMonth key FKBrand key FK other FKeysForecast quantityForecast amount

    Brand DimensionBrand key PKBrand descriptionSub class descriptionClass descriptionDepartment descriptionDisplay type

  • PODUDARNE (CONFORMED) DIMENZIJEPrednostiKonzistentnostSvaka fakt tablica se filtrira konzistentno i na isti nain se oznaavaju rezultatiIntegracijaKorisnici mogu kreirati upite koi svrdlaju kroz fakt tablice i predstavljaju pojedinano razliite procese i zatim spojiti rezultate po zajednikim atributima dimenzijeSmanjuje vrijeme razvojaJedanput kreirane, podudarne dimenzije se mogu viestruko koristiti

  • PODUDARNE (CONFORMED) VRIJEDNOSTIAko vrijednosti postoje u vie od jedne fakt tablice, njihove definicije i izrauni moraju biti isti ako se eli rei da se odnose na istu stvar.Ako su vrijednosti oznaene identino, onda moraju biti definirane u istom kontekstu dimenzija i sa istim jedinicama mjere u svim data mart.Primjeri: prihod, profit, standardne cijene, standardni trokovi, mjerenje kvaliteta, mjerenje zadovoljstva kupaca i drugi KPI.

  • SPORO PROMJENJIVE DIMENZIJEAtributi dimenzijske tablice se ne mijenjaju estoMini-dimenzijeRazdvajanje atributa koji se ee mijenjaju u vlastite odvojene dimenzijske tablice

    3 naina rada sa sporo promjenjivim dimenzijama:Prepisati preko (overwrite) atributa dimenzijeDodati novi redak dimenzijiDodati novi atribut dimenziji

  • SPORO PROMJENJIVE DIMENZIJE OVERWRITE ATRIBUT DIMENZIJENova vrijednost se upisuje preko stareNe uva se povijest Javlja se problem ako su podaci ranije agregirani po starim vrijednostimaNee odgovarati ad-hoc agregacijama baziranim na novim vrijednostimaRanije agregacije se moraju aurirati kako bi podaci u zbrojevima bili sinkronizirani.

  • SPORO PROMJENJIVE DIMENZIJE DODAVANJE NOVOK RETKA DIMENZIJINajea tehnikaNovi redak s novim surogatnim PK se dodaje dimenzijskoj tablici za prikaz nove vrijednosti atributaI stara i nova vrijednost se pohranjuju zajedno s datumima aktivnosti i isteka, te indikatorom tekueg retka.Example:

  • SPORO PROMJENJIVE DIMENZIJE DODAVANJE NOVOG ATRIBUTA DIMENZIJIRijetko se koristiNovi stupac se dodaje dimenzijskoj tablici:Stara vrijednost se biljei u prethodnom stupcu atributaNova vrijednost se biljei u postojeem stupcuSve BI aplikacije transparentno koriste novi atributMogu se napraviti upiti za pristup vrijednostima pohranjenim u prethodnim stupcima

  • DIMENZIJSKO MODELIRANJE GREKE KOJE TREBA IZBJEISmjetanje tekstualnih atributa koji se koriste kao ogranienja ili za grupiranje u fakt tablicuOgraniiti prikaz opisnih atributa u dimenzija radi utede prostoraRazdvajanje hijerarhija i hijerarhijskih razina na vie dimenzijaIgnoriranje potrebe praenja promjena atributa dimenzijaRjeavanje svih problema performansi upita dodavanjem hardveraKoritenje transakcijskih ili pametnih kljueva za spajanje dimenizija s fakt tablicomZanemariti deklariranje i onda pokoravanje granularnosti fakt tabliceDizajniranje dimenzijskog modela za specifino izvjeeOekivati da e korisnici pretraivati podatke na najnioj razini u normaliziranom oblikuPropustiti napraviti podudarne dimenzije i vrijednosti kod odvojenih fakt tablica

  • Pitanja...

    ***************