16
12/16/2012 1 SKLADIŠTE PODATAKA 2.0 PROF. DR.SC. DRAŽENA GAŠPAR 11.12.2012. UPRAVLJANJE POSLOVNIM PODACIMA OCJENJIVANJE - izmjena Pronaći poduzeće za case study Analiza izvora podataka za donošenje odluka u odabranom poduzeću [Z1]– prezentiranje rezultata (max 10 bodova) Istražiti mogućnosti uporabe drugih izvora podataka prezentiranje rezultata [Z2] (max 10 bodova) Izrada dimenzijskog modela za data mart prezentiranje rezultata [Z3] (max 40 bodova) Definiranje izvora podataka za data mart prezentiranje rezultata [Z4] (max 10 bodova) Izrada Politike upravljanja podacima prezentiranje rezultata [Z5] (max 15 bodova) Preporuke za unapređenje upravljanja podacima u poduzeću [Z6] (max 15 bodova) Aktivnost na nastavi max 20 bodova 5 10 5

BDM_11122012_4

Embed Size (px)

DESCRIPTION

upravljanje poslovnim podacima slajdovi

Citation preview

  • 12/16/2012

    1

    SKLADITE PODATAKA 2.0

    PROF. DR.SC. DRAENA GAPAR

    11.12.2012.

    UPRAVLJANJE POSLOVNIM

    PODACIMA

    OCJENJIVANJE - izmjena

    Pronai poduzee za case study

    Analiza izvora podataka za donoenje odluka u odabranom poduzeu [Z1] prezentiranje rezultata (max 10 bodova)

    Istraiti mogunosti uporabe drugih izvora podataka prezentiranje rezultata [Z2] (max 10 bodova)

    Izrada dimenzijskog modela za data mart prezentiranje rezultata [Z3] (max 40 bodova)

    Definiranje izvora podataka za data mart prezentiranje rezultata [Z4] (max 10 bodova)

    Izrada Politike upravljanja podacima prezentiranje rezultata [Z5] (max 15 bodova)

    Preporuke za unapreenje upravljanja podacima u poduzeu [Z6] (max 15 bodova)

    Aktivnost na nastavi max 20 bodova

    5

    10

    5

  • 12/16/2012

    2

    TEST 15 MINUTA

    PITANJA ZA DISKUSIJU

    Prva generacija skladita podataka otvorena pitanja

    DW 2.0

    Osnovne znaajke DW 2.0

    DW 2.0 komponente

  • 12/16/2012

    3

    PRVA DW GENERACIJA OTVORENA PITANJA

    Naglasak na izgradnji DW i pohranjivanju

    podataka, danas na odravanju

    Integriranje podataka se dominatno odnosilo na

    numerike, transakcijske podatke

    Nije bilo razmiljanja o ivotnom ciklusu podataka

    Upravljanje meta i matinim podacima

    U poetku je DW bilo novitet, danas je osnovica za potporu odluivanju

    U poetku je DW vieno kao podatkovna osnovica za statistike analize, dans je to istraivako (exploration) DW

    DW 2.0. GENERACIJA

    Nova paradigma se fokusira na:

    Osnovne tipove podataka

    Podatkovne strukture

    Kako povezati podatke i formirati mono skladite podataka koje ispunjava potrebe organizacije za

    informacijama

  • 12/16/2012

    4

    DW 2.0. GENERACIJA

    Trokovi DW infrastrukture se ne poveavaju kontinuirano

    Infrastruktura se dri na okupu pomou meta podataka, meta podaci su kimeni stup DW 2.0

    Podaci su brzo dostupni. Podaci se smjetaju prema vjerojatnosti pristupa

    Prepoznata je potreba za arhiviranjem

    DW privlai ogromne koliine podataka. Ali, u DW 2.0 podaci su smjeteni po sektorima, tako da krajnji korisnik ima posla sa znaajno manje podataka

    Inmon, Strauss, Neushloss

    DW 2.0 The Architecture for the Next Generation of Data Warehousing.

    2008.

  • 12/16/2012

    5

    DW 2.0. OSNOVNE ZNAAJKE

    ivotni ciklus podataka

    Meta podaci

    Pristup podacima

    Strukturirani / nestrukturirani podaci

    Tekstualna analitika

    Tehnoloka osnovica

    Promjene poslovnih zahtjeva

    Tok podataka unutar DW 2.0

    Koliine podataka

    Korisne aplikacije

    DW 2.0. OSNOVNE ZNAAJKE

    IVOTNI CIKLUS PODATAKA

    DW 1.0 nije prepoznavalo potrebu za praenjem ivotnog ciklusa podataka

    DW 2.0 prepoznaje ivotni ciklus podataka ukljuuje razliite sektore:

    1. podaci brzo ulaze u Interaktivni (Interactive) sektor

    2. podaci se integriraju i prosljeuju u Integrirani (Integrated ) sektor i ostaju tu dok se ne smanji vjerojatnost pristupa (3-4

    godine)

    3. Iz Inegriranog sektora podaci se mogu prebaciti u jedan od

    dva sektora. Jedan je Blizu linije (Near line) sektor

    (opcionalan), kao proirenje Integriranog sektora u situaciji kada postoji iznimno velika koliina podataka i gdje se vjerojatnost pristupa znaajno razlikuje

    4. Posljednji sektor arhivski (archival) sektor

  • 12/16/2012

    6

    DW 2.0. OSNOVNE ZNAAJKE

    IVOTNI CIKLUS PODATAKA

    OnLine

    obrada

    Dozvoljeno

    auriranje

    DW 2.0. MAIN CHARACTERISTICS

    THE LIFE CYCLE OF DATA

    No update

    Podaci se

    agregiraju,

    zbrajaju,

    rekonstruiraju

    Nema auriranja Pohrana kao

    serija snapshota

  • 12/16/2012

    7

    DW 2.0. MAIN CHARACTERISTICS

    THE LIFE CYCLE OF DATA

    Meta

    podaci

    Kriteriji:

    -Starost -Vjerojatnost

    pristupa

    DW 2.0. MAIN CHARACTERISTICS

    THE LIFE CYCLE OF DATA

    Povezanost s

    vremenom,

    Rijetko kada

    pohrana na

    diskove,

    Matapodaci

  • 12/16/2012

    8

    DW 2.0. OSNOVNE ZNAAJKE

    META PODACI

    Tehniki i Poslovni

    DW 2.0. OSNOVNE ZNAAJKE

    META PODACI

  • 12/16/2012

    9

    DW 2.0. OSNOVNE ZNAAJKE

    META PODACI

    DW 2.0. OSNOVNE ZNAAJKE

    PRISTUP PODACIMA

  • 12/16/2012

    10

    DW 2.0. OSNOVNE ZNAAJKE

    STRUKTURIRANI / NESTRUKTURIRANI PODACI

    Strukturirani podaci dolaze ponavljajui se u istom formatu i alatu (DBMS)

    Nestrukturirani podaci dolaze u dva nazina oblika:

    - tekstualni (e-mailovi, telefonski razgovori, PPT

    prezentacije, ...)

    - ne-tekstualni grafike i slike (fotografije, diijagrani, ilustracije, X-zrake, MRIs, ...)

    Poboljanje rada s tekstualnim podacima

    Netekstualni podaci a jo uvijek veliko pitanje

    DW 2.0. OSNOVNE ZNAAJKE

    TEKSTUALNA ANALITIKA

  • 12/16/2012

    11

    DW 2.0. OSNOVNE ZNAAJKE

    TEKSTUALNA ANALITIKA

    Data that has no

    meaning to the business

    of the organization

    One of the challenges of managing unstructured

    data especially email is that of separating blather from meaningful communications. This is

    accomplished by matching external categories with

    unstructured communications. Any email that does

    not have a hit as it passes through external category qualification is considered to be blather.

    DW 2.0. OSNOVNE ZNAAJKE

    KOLIINE PODATAKA

  • 12/16/2012

    12

    DW 2.0. OSNOVNE ZNAAJKE

    KORISNE APLIKACIJE

    Integriranje stukturiranih i nestrukturiranih

    podataka u

    DW 2.0

    Rezultira novim aplikacijama

    Istinski 360 stupnjeva pogled na kupca

    (integriranje e-maila i demografskih podataka)

    Integriranje doktorskih biljeki s rezultatima laboratorijskih testova

    DW 2.0. KOMPONENTE

    4 razliita sektora:

    Interaktivni (Interactive) sektor

    Integrirani (Integrated) sektor

    Blizu linije (Near line) sektor

    Arhivski (Archival) sektor

  • 12/16/2012

    13

    Inmon, Strauss, Neushloss

    DW 2.0 The Architecture for the Next Generation of Data Warehousing.

    2008.

    DW 2.0. KOMPONENTE INTERACTIVE SEKTOR

  • 12/16/2012

    14

    DW 2.0. KOMPONENTE INTERACTIVE SEKTOR

    DW 2.0. KOMPONENTE INTERACTIVE SEKTOR

  • 12/16/2012

    15

    DW 2.0. KOMPONENTE INTEGRATED SEKTOR

    DW 2.0. KOMPONENTE INTEGRATED SEKTOR

    Captured text comes from the unstructured environment.

    Captured text may exist in the form of emails, documents,

    transcripts of telephone conversations, or other textual

    information. As a rule captured text is in the same unedited

    state in which it exists in the unstructured environment.

    However the unstructured text has been selected for

    relevancy to the business environment. It would make no

    sense to put massive amounts of unstructured text in the

    DW2.0 environment unless the unstructured text is

    important to the business represented by DW2.0.

    LINKAGE TEXT TO SUBJECT Fig DW2.0.5 shows the linkage to text data found in

    the DW2.0 environment.

    Fig DW2.0.5 shows that there is linkage data. When unstructured data is

    brought over to the data warehouse environment even when it has been edited and screened the textual data still can be more useful if it is linked to classical transaction and structured data found in DW2.0. Typical links can be

    formed across email address and telephone numbers. Still other links can be

    formed across names and mutations of names. This data is normally created

    after the textual data has been brought across to the data warehouse

    environment. Note that some textual data will have no linkage but will be

    relevant to the business of the corporation.

    TEXTUAL SUBJECTS

    Textual subjects are depicted by Fig DW2.0.8.

  • 12/16/2012

    16

    DW 2.0. KOMPONENTE INTEGRATED SEKTOR

    Questions..