52
Data Warehouse 28/09/15 TOPICOS ESPECIALES DE INGENIERIA 1

datawarehouse ppt 01

Embed Size (px)

Citation preview

Page 1: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 1/52

Data Warehouse

28/09/15

TOPICOS ESPECIALES DE INGENIERIA

1

Page 2: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 2/52

Definiciones de DataWarehouse

Un Data Warehouse es un conjunto integrado de bases dedatos, con orientación temática, que están diseñadospara el apoyo a la Toma de Decisiones, y donde cadaunidad de datos es relevante en algn momento deltiempo

!ill "# $nmon

%una copia de las transacciones de datos espec&ficamenteestructurada para la consulta y el análisis' o%la unión detodos los Data marts de una entidad'

(alph )imball

'*o considero al DW como algo que provee dos beneficiosempresariales reales+ $ntegración y cceso de datos# DWelimina una gran cantidad de datos intiles y nodeseados, como tambi-n el procesamiento desde elambiente operacional clásico.

/usan 0sterfeldt2

Page 3: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 3/52

0bjetivos

"acer la información de la organi1ación accesible

"acer a la información de la organi1ación consistente

2ontrolar el acceso efectivo a los datos 3enerar información de manera fle4ible

/ervir de ayuda a la toma de decisiones

3

Page 4: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 4/52

5n resumen

Un Data Warehouse tiene como objetivo almacenar yproveer a la 0rgani1ación de información relevante y atiempo

4

Page 5: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 5/52

$mportancia del Data

Warehouse Mejorar la Entrega de Información:#

Mejorar el Proceso de Toma de Decisiones

Impacto Positivo sobre los Procesos Empresariales

5

Page 6: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 6/52

pensar antes de implementar

un Data Warehouse 6a amplitud7 el nmero de diferentes temas y puntos de foco

8uentes que proveerán datos brutos#

6os medios por los cuales los datos se transportan de las

aplicaciones fuente y son cargados al Data Warehouse# 6as reglas de negocio que se aplican a la data en bruto para

producir activos de datos de alta calidad#

6as bases de datos receptoras, en la que estos activos de datosserán almacenados#

6os activos de datos7 los elementos, el nivel de detalle de cada

elemento, y cuánta historia se ha mantenido, por ejemplo# 6a $nteligencia de negocio

"erramientas de nivel usuario para acceder a los activos de datos#

6a arquitectura y complejidad en general del entorno#

6

Page 7: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 7/52

5mpresas que usan DT

W(5"0U/5 (oyal ban9 of canada

:aypal

;<

2oca=2ola 2ompany

>eri1on

8ord <otor 2ompany

"erramientas de nivel usuario para acceder a los activos de datos#

6a arquitectura y complejidad en general del entorno#

7

Page 8: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 8/52

8

Page 9: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 9/52

:roductos ?suites@ de DT

W(5"0U/5 y !$ $!< 2ognos

http+AABBB=C#ibm#comAsoftBareAdataAcognosA

Teradatahttp+AABBB#teradata#com

0racle "yperion

http+AABBB#oracle#comAhyperionAinde4#html

<icro/trategy

http+AABBB#strategy#com

//

http+AABBB#sas#com

9

Page 10: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 10/52

2aracter&sticas de un Data

Warehouse 0rientado a un tema

dministra grandes cantidades de información

3uarda información en diversos medios dealmacenamiento

2omprende mltiples versiones de uno ?o varios@esquema de base de datos

2ondensa y agrega información

$ntegra y asocia información de muchas fuentes

10

Page 11: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 11/52

Diferencias entre un sistema de

Data Warehouse y aplicacionestradicionalesSISTEMAS TRADICI!A"ES DATA#ARE$%SE

•:redomina la actuali1ación#•ctividad operativa ?d&a a d&a@#•:roceso puntual#

•5stabilidad#•Datos desagregados#•Dato actual#•(espuesta de la transaccióninmediata#•5structura relacional#

•Usuarios de perfiles bajos#•54plotación de la informaciónrelacionada con operatividad decada aplicación

•:redomina la consulta•nálisis y decisión estrat-gica#•:roceso masivo#

•Dinamismo#•Eiveles de detalleAagregación#•Dato histórico#•(espuesta masiva•5structura <ultidimensional•Usuarios de perfiles altos#

•54plotación de informacióninterna y e4terna relacionada conel negocio#

11

Page 12: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 12/52

<etodolog&as de Diseño de

Data Warehouse <etodolog&a de $nmon ?Top F !ottom@

12

Page 13: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 13/52

<etodolog&a de )imball?!ottom=up@

13

Page 14: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 14/52

<etodolog&a agil para laimplementación de un dB

14

Page 15: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 15/52

Page 15

rquitectura de un DataWarehouse

15

Page 16: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 16/52

Production

systems

Other sources

CR

!i""ing

Acti#ationsystems

Other D!s$

%i"es

ETL

Data&arehouse

OLAPcu'es

!usiness(sers

)uerying *Re+ortingtoo"s

Ac,uisition Storage -

Archi#ing

Restitution

Datamarts

8lujo de Datos de un DW

16

Page 17: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 17/52

Page 1.

• !ase de datos o+eraciona" - Ni#e" de 'ase de datose/terno0

• Ni#e" de acceso a "os datos• Ni#e" de organiaci2n de datos• Ni#e" de data 3arehouse• Ni#e" de acceso a "a in4ormaci2n• Ni#e" de gesti2n de +roceso

rquitectura de un DataWarehouse

17

Page 18: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 18/52

Page 1

!ase de datos o+eraciona" - Ni#e" de 'ase de datose/terno 6%uentes de datos7Los sistemas o+eraciona"es +rocesan datos +ara a+oyar"as necesidades o+eraciona"es cr8ticas9 ta"es como

ERPs9 SCs9 tam'i:n se +rocesa in4ormaci2n de 4uentesde datos e/ternas9 ta"es como de "a internet9 INEI9 !CRP0

Ni#e" de acceso a "os datos

Es res+onsa'"e de "a inter4aces entre "as herramientasde acceso a "a in4ormaci2n y "as 'ases de datoso+eraciona"es0 En a"gunos casos9 esto es todo "o ,ue unusuario 4ina" necesita +ara rea"iar estas inter4ases seuti"ia e" S)L 6Standar )uery Lengua;e7

5lementos de la rq# De un DW

18

Page 19: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 19/52

Ni#e" de organiaci2n de datosE" com+onente 4ina" de "a ar,uitectura data &arehouse

es "a organiaci2n de "os datos9 inc"uye todos "os+rocesos necesarios como se"eccionar9 editar9 resumir9com'inar y cargar datos en e" de+2sito y acceder a "ain4ormaci2n desde 'ases de datos o+eraciona"es y-oe/ternas

Ni#e" de data 3arehouse

En un data &arehouse 48sico9 e" a"macena;e de data+rocesada9 inc"uso en 4orma redundante

5lementos de la rq# De un DW

19

Page 20: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 20/52

Ni#e" de acceso a "a in4ormaci2nEste ni#e" se inc"uye e" hard3are y so4t3are

in#o"ucrados en re+resentar y +ro#eer de in4ormaci2n a"usuario 4ina" norma"mente usa d8a a d8a0 Por e;em+"o<

E/ce"9 Lotus 1=>=?9 %ocus9 Access9 SAS9 etc0

Ni#e" de gesti2n de +rocesoE" ni#e" de gesti2n de +rocesos tiene ,ue #er con "a

+rogramaci2n de di#ersas tareas ,ue de'en rea"iarse+ara construir y mantener actua"iado e" data 3arehousey "a in4ormaci2n de" directorio de datos0

5lementos de la rq# De un DW

20

Page 21: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 21/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

& 'ACTRES E! "A P"A!I'ICACI! DE %! DATA #ARE$%SE 

5stablecer una asociación de usuarios, gestión y grupos

2onstruir prototipos rápida y frecuentemente

$mplementación incremental

(eportar activamente y publicar los casos e4itosos

21

%ase 1< Organiaci2n

Page 22: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 22/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

( ESTRATE)IAS PARA E" DESARR"" DE %! DATA #ARE$%SE

22

@)ui:n es e" auditorio

@CuB" es e" a"cance

@)u: ti+o de data 3arehousede'er8a construirse

1ra0< Esta'"ecer un am'iente data 3arehouse #irtua"0

>da0< Construir una co+ia de "os datos o+eraciona"es desde un sistema

o+eraciona" nico y +osi'i"itar a" data 3arehouse de una serie deherramientas de acceso a "a in4ormaci2n0

?ra0< %ina"mente9 "a estrategia data 3arehousing 2+tima es se"eccionar e"nmero de usuarios 'asados en e" #a"or de "a em+resa y hacer un anB"isis desus +untos9 +reguntas y necesidades de acceso a datos0

Page 23: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 23/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

23

? ESTRATEGIAS PARA EL DISEFO DE (N DATA &AREO(SE

1ra0 < Los usuarios de "os data 3arehousesusua"mente no conocen mucho so're susre,uerimientos y necesidades como "osusuarios o+eraciona"es0

>da0< E" diseHo de un data 3arehouse9 con4recuencia in#o"ucra "o ,ue se +iensa ent:rminos mBs am+"ios y con conce+tos de"negocio mBs di48ci"es de de4inir ,ue en e"diseHo de un sistema o+eraciona"0 A" res+ecto9un data 3arehouse estB 'astante cerca aReingenier8a de "os Procesos de" Negocio6!usiness Process Reengineering70

?ra0< %ina"mente9 "a estrategia de diseHo idea"+ara un data 3arehousing es genera"mente dea4uera hacia adentro 6outside=in7 a di4erenciade arri'a hacia a'a;o 6to+=do3n70

Page 24: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 24/52

:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5

24

ESTRATEGIAS PARA LA GESTION DE (N DATA &AREO(SE

1ra0< (n data 3arehouse es una in#ersi2n 'uena s2"o si "osusuarios 4ina"es rea"mente +ueden conseguir in4ormaci2n #ita"mBs rB+ida y mBs 'arata de "o ,ue o'tienen con "a tecno"og8aactua"0

>da0< La administraci2n de'e reconocer ,ue e" mantenimientode "a estructura de" data 3arehouse es tan cr8tico como e"mantenimiento de cua",uier otra a+"icaci2n de misi2n=cr8tica0

?ra0< La gesti2n de'e com+render tam'i:n ,ue si se em'arcanso're un +rograma data 3arehousing9 se crearBn nue#asdemandas so're sus sistemas o+eraciona"es9 ,ue son<Demandas +ara me;orar datosDemandas +ara una data consistenteDemandas +ara di4erentes ti+os de datos9 etc0

Page 25: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 25/52

:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5

25

Se ha reconocido "os 'ene4icios de"+rocesamiento ana"8tico en "8nea 6On LineAna"ytica" Processing = OLAP79 mBs a""B de

"as Breas tradiciona"es de marJeting y4inanas0E" crecimiento de "a com+utaci2n

c"iente-ser#idor9 ha creado ser#idores dehard3are y so4t3are mBs +oderosos yso4isticados ,ue nunca0 Los ser#idores de

hoy com+iten con "as main4rames de ayer yo4recen ar,uitecturas de memoriatecno"2gicamente su+eriores9 +rocesadoresde a"ta #e"ocidad y ca+acidades dea"macenamiento masi#as0

%ase >< Desarro""o

10 @POR)(E CONSTR(IR !LO)(ES DE DATA &AREO(SE

Page 26: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 26/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

26

> CONSIDERACIONES PREKIAS AL DESARROLLO DE (N DATA &AREO(SE

ay muchas maneras +aradesarro""ar data 3arehousescomo tantas organiacionese/isten0 Sin em'argo9 hay unnmero de dimensiones

di4erentes ,ue necesitan serconsideradas<

A"cance de un data3arehouse

Redundancia de datos

Ti+o de usuario 4ina"

Page 27: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 27/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

27

? ELEENTOS CLAKES PARA EL DESARROLLO DE (N DATA &AREO(SE

Si se escoge incorrectamente9 e" data 3arehouse se con#ierte en unagran em+resa con +ro'"emas di48ci"es de tra'a;ar en su entorno9 costoso+ara arreg"ar y di48ci" de ;usti4icar0

Para conseguir ,ue "a im+"ementaci2n de" de+2sito tenga un inicioe/itoso9 se necesita en4ocar hacia tres '"o,ues c"a#es de construcci2n<

Ar,uitectura tota" de" de+2sito Ar,uitecturas de" ser#idor Sistemas de Gesti2n de !ase de Dato

ay muchas maneras +ara desarro""ar data 3arehouses como tantasorganiaciones e/isten0 Sin em'argo9 hay un nmero de dimensionesdi4erentes ,ue necesitan ser consideradas<

A"cance de un data 3arehouse Redundancia de datos

Ti+o de usuario 4ina"

Page 28: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 28/52

Page 29: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 29/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

29

5 %ACTORES DECISIKOS PARA DECIDIR EL DESARROLLO DE (N DATA &AREO(SE

La data sucia es un serio +e"igro +ara e" :/ito de un+royecto de data 3arehouse0 De+endiendo de"a"cance de" +ro'"ema9 sim+"emente +odr8a no ser+osi'"e dirigir"o rB+idamente y a'aratar"o0Los +rinci+a"es 4actores son<- E" tiem+o ,ue toma "a +rogramaci2n interna- E" costo de "as herramientas

Los gerentes de +royectos de Data &arehousenecesitan e#a"uar e" +ro'"ema con rea"ismo9 "osrecursos internos dis+oni'"es +ara distri'uir"os y

se"eccionar "a so"uci2n ,ue se ada+te a "a +"ani""a y+resu+uesto de" +royecto9 o modi4icar "a +"ani""a y e"+resu+uesto +ara so"ucionar e" +ro'"ema0

Page 30: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 30/52

Page 31: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 31/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

31

> ESTRATEGIAS PARA EL PROCESO DE IPLEENTACION

Identi4icar e" +ro'"ema en e" cua" e" usoestrat:gico de "a in4ormaci2n deta""ada9+ermita conseguir una so"uci2n +aragenerar una #enta;a com+etiti#a o unahorro de costos0

De4inir e" mode"o "2gico de datos aim+"ementar +ara reso"#er e" +ro'"ema+"anteado0

Page 32: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 32/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

32

? ESTRATEGIAS EN LA IPLEENTACION  De4inir e" me;or diseHo 48sico +ara e" mode"o de datos0 E" diseHo 48sico de'e estar

orientado a generar 'uen rendimiento en e" +rocesamiento de consu"tas9 a di4erencia de"mode"o "2gico ,ue estB orientado a" usuario y a "a 4aci"idad de consu"ta0

 De4inir "os +rocesos de e/tracci2n9 4i"tro9 trans4ormaci2n de in4ormaci2n y carga de datos,ue se de'en im+"ementar +ara +o'"ar ese mode"o de datos0

 De4inir "os +rocesos de administraci2n de "a in4ormaci2n ,ue +ermanece en e" data

3arehouse De4inir "as 4ormas de consu"tas a "a in4ormaci2n de" data 3arehouse ,ue se "e

+ro+orcionarB a" usuario0 Para :sto9 de'e considerarse "a necesidad de reso"#er un+ro'"ema y "a +otencia de consu"ta0

Com+"etar e" mode"o de consu"ta 'ase9 re"ati#o a" Brea se"eccionada0 Im+"ementar "os +rocesos estrat:gicos de" Brea de tra'a;o9 es decir9 im+"ementar

herramientas es+ecia"iadas de scoring9 herramientas es+ecia"iadas +ara inducci2n deconocimiento 6Data ining79 etc0 Com+"etar "as Breas de inter:s9 en 4orma simi"ar a "o descrito anteriormente0

Page 33: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 33/52

:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5

33

@)u: c"ases de costos e/cedieron e"+resu+uesto en mBs de" 1M en cada uno de"os 1> meses +asados

@Se aumentaron "os +resu+uestos en mBs de5M +ara cua",uier Brea dentro de "os "timos1 meses

@C2mo es+eci4icar "as c"ases de gasto entredi4erentes de+artamentos @Entre di#isiones@A tra#:s de "as regiones geogrB4icas

@C2mo tener mBrgenes de o+eraci2n so're"os dos "timos aHos en cada Brea denegocio Donde han disminuido "osmBrgenes9 @se han incrementado "os costos

%ASE < EKAL(ACION

1 EKAL(ACION DE RENDIIENTO DE LA INKERSION

Page 34: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 34/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

34

CASO PRACTICO

En un estudio encargado +or > #endedores y consu"tores9 se encontr2 unRetorno Promedio Tota" de "a in#ersi2n 6Return On In#estment=ROI7 de1M0Tam'i:n9 se e/c"uyeron "os +royectos 4racasados9 as8 como "ose;ecutados e/ce+ciona"mente9 tanto 'uenos como ma"os0

2.2 MillonesCosto promedio

>0? AHosPer8odo de reem'o"so +romedio

1MROI mediano

5??MROI +romedio de" mode"o com+"ementario de datos

?>>MROI +romedio de" +royecto mBs grande

1MROI +romedio tota"

CA!IOS DE KALOR

Page 35: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 35/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

35

101 COSTOS !ENE%ICIOS

Costos preliminares  P"ani4icaci2n DiseHo ode"amiento -Ingenier8a de

In4ormaci2n

Costos iniciales  P"ata4orma de hard3are So4t3are de 'ase de datos

Costos en procesamiento  antenimiento de datos Desarro""o de a+"icaciones Ca+acitaci2n y so+orte

Beneficios Tácticos  Im+resi2n y emisi2n de re+orte

reducido Demanda reducida +ara consu"tas de

c"ientes- Entrega mBs rB+ida de in4ormaci2n a "os

usuarios

Beneficios Estratégicos (Potencialidad)  A+"icaciones y herramientas de

acceso +ara "os usuarios 4ina"es

Decisiones con mayor in4ormaci2n Toma de decisiones mBs rB+ida Ca+acidad de so+orte a "a

in4ormaci2n organiaciona"

Page 36: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 36/52

:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5

36

> !ENE%ICIOS A O!TENER

Para "a Em+resaE" data 3arehouse hace "o +osi'"e +or a+ro#echar e" #a"or

+otencia" enorme de "os recursos de in4ormaci2n de "aem+resa y #o"#er ese #a"or +otencia" en #a"or #erdadero0

Para "os (suarios

E" data 3arehouse e/tiende e" a"cance de "a in4ormaci2n+ara ,ue +uedan accesar directamente en "8nea9 "o ,ue a "a#e contri'uye en su ca+acidad +ara o+erar con mayore4ecti#idad "as tareas rutinarias o no0

Para "a Organiaci2n en Tecno"og8as de In4ormaci2n

E" data 3arehouse enri,uece "as ca+acidades de" usuarioautosu4iciente y hace "o 4acti'"e +ara o4recer nue#osser#icios a "os usuarios9 sin inter4erir con "as a+"icacionescotidianas de +roducci2n

Page 37: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 37/52

$mportante+ 5l <odelo de Datos

Es e" mode"o +or e" cua" se diseHa e" es,uema de 4uncionamiento de "a!ase de Datos ,ue +ro#ee a" Data &arehouse0

E/isten #arios en4o,ues en este sentido<

%B'rica de in4ormaci2n cor+orati#a 6CI%7< inc"uyen ODS9 data 3arehouse y data

marts9 ;unto con otras #arias inter4aces de a+"icaciones y e" am'iente o+eraciona"94ue desarro""ada +or !i"" Inmon9 C"audia Imho449 y Ryan Sousa

Es,uema en estre""a< Este m:todo re+"ica "as estructuras mu"tidimensiona"es dehechos y dimensiones9 +ero usa ta'"as de RD!S9 es+ec84icamente ta'"as dehechos y ta'"as de dimensiones0 Se de;an de "ado "as reg"as de norma"iaci2n de'ase de datos y se +onen "os datos donde tienen mBs sentido

 Data #au"t 6Ar,uitectura de mode"ado 4undaciona" comn =C%IA7<Esta es una ar,uitectura de integraci2n de datos ,ue contiene una 'ase de datosorientada a" deta""e ,ue contiene un con;unto de ta'"as norma"iadas nicamenteen"aadas ,ue so+ortan una o mBs Breas 4unciona"es de "as ta'"as de negocio conta'"as sat:"ites +ara rastrear cam'ios hist2ricos0 Este en4o,ue h8'rido rene "o

me;or de" cruce entre "a tercera 4orma norma" 6?N%7

37

Page 38: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 38/52

Page ?

DATA #ARE$%SE *S +D

PERACI!A"(so de !ase de DatosO+eraciona"es

(so deData &arehouse

uchos usuarios concurrentes Pocos usuarios concurrentes

Consu"tas +rede4inidas y

actua"ia'"es

Consu"tas com+"e;as9

4recuentementeno antici+adas0

Cantidades +e,ueHas de datosresumidas0

Cantidades grandes de datosresumidas0

Re,uerimientos de res+uestainmediata

Re,uerimientos de res+uesta nocr8ticos

38

Page 39: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 39/52

<odelo de 5strella

39

Page 40: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 40/52

54tracción, Transformación y 2arga 54tracción

<ultiples 8uentes 0rientadas a trabajo !atch + cagas de estos sistemas son más fuertes cuando los sistemas de

producción tienen poca carga

2onectvidad a diferentes tecnolog&as, diferentes manejadores de !Ds

Transformación

<anipulación de data compleja

(eunión de diferentes fuentes $mplementación de reglas de negocio

6impiado, ordenado, eliminación de duplicidades

0ptimi1ado para el desempeño y para grandes volmenes

2arga

2argar la data en tablas de hechos y dimensiones :roduce un historial en archivos o en la !D para tra1abilidad

0tros

2ontrola los flujos de ejecución+ maneja las dependencias entre tareas, control deejecución, gestión de errores, registros históricos#

40

5jemplos de transformación

Page 41: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 41/52

5jemplos de transformación

Transformación de !squeda difusa

!usca valores en las tablas usando criterios difusos

5jemplo+ :ara un campo de te4to la data puede contener muchas variantes de la misma palabra?'friend., 'a friend., 'freind., etc@# 6a lógica difusa puede ayudar a reunir las variantes#

Transformación de dimensiones de cambio lento

yuda a manejar la actuali1ación de una dimensión de cambio lento

5jemplo + la información sobre los consumidores cambia constantemente, pero queremos una historia deestos

2ambio de dirección no queremos el valor anteiror ?reempla1o@

Un cambio en el valor >T  GduplicamosH la entrada del consumidor agregando los datos adicionales ?para propósitosfinancieros@

41

Clave s,stit,ta

Page 42: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 42/52

2ontrol de la 5jecución

6os datos son muy sensibles, la calidad de los reportesdepende la calidad de estos

2argar un Data Warehouse puede implicar reglas

complejas de e4tracción, transformación y carga 6os usuarios del negocio no confiarán en un DW si no

conf&an en su carga

42

Page 43: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 43/52

5jemplos de paquetes en 5T6 8lujo de control y flujo de datos

43

Page 44: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 44/52

<iddleBare

/on $nstancias intermedias a la carga y al acceso que sirvenpara verificar la calidad y fiabilidad de la data

5stación de transformación interina+ un área en la cual gruposde datos e4tra&dos de alguna de las fuentes pasan por unproceso de transformación antes de moverse hacia la base dedatos del almac-n#

5stación de aseguramiento de la calidad+ Un área en la cualgrupos de datos pasan por un conjunto de intensas revisionesde aseguramiento de la calidad antes de pasar hacia elalmac-n de datos#

44

Page 45: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 45/52

<iddleBare ?I@

45

Page 46: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 46/52

Sol,ción: crear almacenes de datos especiali-ados por .rea/ 0,e

reciben los datos desde el almac1n centrali-ado/ estos almacenes seconocen como Data Marts2

46

•Pro'"ema< a" crecer e" D&0 E" rendimiento de "as consu"tas decae y e" mode"ocentra"iado de;a de ser o+timo0

Page 47: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 47/52

Toma de decisiones

• (n Datamart es una 'ase dedatos de+artamenta"9es+ecia"iada en e"a"macenamiento de "os datos

de un Brea de negocio

es+ec84ica0

• Se caracteria +or dis+oner "aestructura 2+tima de datos +araana"iar "a in4ormaci2n a"deta""e desde todas "as

+ers+ecti#as ,ue a4ecten a "os+rocesos de dichode+artamento0

DATAART

47

Page 48: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 48/52

48

Data <art

:uede ser alimentado desde los datos de un

DW", o integrar por si mismo un compendio dedistintas fuentes de información#

Page 49: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 49/52

  Data Warehouses Vs. Data Marts

Data art

De+artamenta"

(n so"o tema

  Pocos

 

1 G!

eses

Data artData

&arehouse

Pro+iedad

A"cance

Tema

%uente de datos

TamaHo 6t8+ico7

Tiem+o de im+"ementaci2n

Data &arehouse

Em+resaria"

"ti+"es

uchas

1 G! to Q 1 T!

eses a aHos

49

Page 50: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 50/52

Su objetivo es agilizar la consulta e granes cantiaes e

atos! "aracteriza la #r$uitectura necesaria %ara lai&%le&entaci'n e un siste&a e a(ua en la to&a e

ecisiones! )a consultas son %ocas %ero son &u(

consu&ioras e tie&%o *%ueen correr +oras, las

actualizaciones son &enos .recuentes (/o la res%uesta a la

consulta no e%ene el +ec+o e tener actualizaa la basee atos!

  So+orte anB"isis mu"tidimensiona" y+rocesamiento ana"8tico en "8nea6OLAP7

50

Page 51: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 51/52

• Soporte an.lisis m,ltidimensional 3

procesamiento anal4tico en l4nea?"AP@

Los atos son clasi.icaos en i.erentes

i&ensiones ( %ueen ser vistas unas con otras en

i.erentes co&binaciones %ara obtener i.erentesanlisis e los atos $ue contienen!

)os suarios %ueen .or&ular consultas co&%lejas

arreglar atos en un re%orte ca&biar e atosresu&ios a atos etallados#

2(2T5($/T$2/

51

Page 52: datawarehouse ppt 01

7/23/2019 datawarehouse ppt 01

http://slidepdf.com/reader/full/datawarehouse-ppt-01 52/52

ROLAP (Relational OLAP) MOLAP (multidimensionalOLAP)

Almacena los datos en un motor

relacional

Almacena los datos en una base de

datos multidimensional

Muchas dimensiones Diez o menos dimensiones

Soportan analisis OLAP contragrandes volumenens de datos

Se comportan razonablemente envolumenes de datos mas reducidos

(menos de 5b)!erramienta "le#ible $ general Soluci%n particular con vol&menes

de in"ormaci%n $ numero dedimensiones mas modestos

C"asi4icaci2n segn e" ti+o de motor en e",ue est:n a"macenados "os datos<

52