Guía de DataStage (1)

Embed Size (px)

Citation preview

  • 7/25/2019 Gua de DataStage (1)

    1/31

    Contenido

    Stages de Secuencia

    Stages de Job Parallel

    Stages de Job Server

    Creacin de parmetros

    Paso de parmetros en Job Activity

    Ejecucin de los jobs

    Debug del ETL

  • 7/25/2019 Gua de DataStage (1)

    2/31

    1. Stages de Secuencia

    1.1 Job ActivityEs un stage ue invoca a un Job o a una Secuencia! En sus

    propiedades deben con"gurarse los siguientes puntos#

    General: Nombre:au$ se nombra el Job Activity! Puede colocarse cualuier

    nombre pero se recomienda colocarle a este stage el mismo nombre

    del Job o Secuencia al ue se est invocando! Descripcin:debe colocarse una breve descripcin de lo ue %ace

    el Job o la Secuencia a la ue invoca el stage!

    Trabajo: Nombre del trabajo:se debe seleccionar de la lista &%aciendo clic

    en ' el Job o Secuencia a la ue se uiere invocar con el stage! ar!metros:en esta seccin aparecer la lista de parmetros ue

    necesita el Job o Secuencia invocada para poder (uncionar! Nota:

    %ay ue considerar ue si los parmetros del Job Activity ya est

    con"gurados y si se desea invocar a otro Job o Secuencia) una ve*

    ue se realice el cambio en el campo +,ombre del Trabajo- los

    parmetros se borrarn! &.er Seccin de Parmetros' Desencadenantes:

    "#presin: normalmente se deja con la condicin por de(ecto!

    Nota:si el stage ya est con"gurado y se desea cambiar el Job o

    Secuencia al ue est invocando) %ay ue estar pendiente de

    sustituir el nombre del nuevo Job o Secuencia en la e/presin!

    1.$ Noti%cation Activity

    Es un stage ue permite enviar un correo de noti"cacin para

    alertar la ocurrencia de un determinado evento! En sus

    propiedades deben con"gurarse los siguientes puntos#

    Noti%cacin:au$ se con"gura todo lo relacionado con el correo ue

    se desea enviar &remitente) destinatario) asunto) contenido0'! Es

    recomendable ue tanto en el +,ombre del servidor de correo S1TP-

    como en la +Direccin de correo electrnico del destinatario- no se

    coloue la direccin de correo directamente sino ue 2sta se pase

    mediante un parmetro!

  • 7/25/2019 Gua de DataStage (1)

    3/31

    1.& Se'uencer

    Es un stage ue permite sincroni*ar dos ramas dentro de una

    Secuencia! En sus propiedades deben con"gurarse los siguientes

    puntos#

    Secuenciador: (odalidad:en este campo se indica el comportamiento ue va a

    tener el stage! Puede ser +Cualuiera- si se desea ue el proceso

    contin3e cuando cualuiera de las ramas ue llegan al Seuencer

    %aya terminado) o +Todos- si se uiere ue el proceso contin3e

    cuando todas las ramas del proceso %ayan terminado!

    1.) "#ecute *ommand

    Es un stage ue permite ejecutar un comando! ,ormalmente se

    utili*a para leer un arc%ivo !t/t! En sus propiedades debencon"gurarse los siguientes puntos#

    "#ec*ommand: (andato:en este campo se coloca la instruccin ue se desea ue

    ejecute el stage! Por lo general) se coloca primero el comando

    seguido de la ruta de donde se uiere leer el arc%ivo !t/t!

    1.+ ,ser -ariables Activity

    Este stage permite de"nir variables dentro de la secuencia ue

    pueden ser utili*adas posteriormente) por ejemplo) para de"nirparmetros! Los puntos ue se deben con"gurar en este stage

    son los siguientes#

    -ariables de usuario:4 Nombre:se debe colocar el nombre de la variable a crear!4 "#presin:&especi"car lo ue %ace la e/presin'

    1. /outine Activity

  • 7/25/2019 Gua de DataStage (1)

    4/31

    $. Stages de Job arallel

    $.1 D0$ *onnector

    Este stage permite reali*ar una cone/in a una D56 y e/traer o

    ingresar datos en la misma! La con"guracin de este stage ser

    di(erente dependiendo de cul de estos dos comportamientos se

    uiera establecer!

    "#traer datos

    ropiedades:

    *one#in:4 Database# se coloca el nombre del esuema al ue se desea

    conectar!4 ,sername:se coloca el nombre del usuario del esuema al ue

    se desea conectar!4 assord: se coloca el pass7ord del usuario del esuema al

    ue se desea conectar! ,so:

    4 Generate S23:en este campo se especi"ca si se uiere ue

    Datastage genere un uery para reali*ar la consulta o si se desea

    ingresar el uery manualmente! Si se elige la opcin +Si- se debe

    especi"car el nombre de la tabla en el campo +Table ,ame-! Si

    se elige la opcin +,o- se debe escribir el uery en el campo

    +Select Statement-!

    Nota: este stage brinda la posibilidad de reali*ar pruebas decone/in as$ como ver la data proveniente del origen! Para esto) en

    la seccin +Cone/in- se debe elegir la opcin +Probar- ue

    posteriormente arrojar un aviso indicando si la cone/in (ue

    satis(actoria o no! De igual manera) en la seccin +8so- se debe

    elegir la opcin +.er datos- ue posteriormente pedir la

    in(ormacin correspondiente a los parmetros ue se necesitan para

    poder e/traer la data del origen! Si la cone/in %a sido e/itosa y

    e/iste data en el origen) se podrn ver los registros

    correspondientes) en caso contrario) Datastage indicar ue %ay un

    error! *olumnas:en esta seccin se colocan el nombre y tipo de dato de las

    columnas ue se desean traer del origen! Es importante ue au$

    apare*can cada uno de los campos ue se indican en el uery &en caso

    de %aber ingresado un uery manual' y ue en ambos lugares tengan

    e/actamente el mismo nombre!

  • 7/25/2019 Gua de DataStage (1)

    5/31

    Nota: es recomendable) si es posible) ue el nombre del stage

    conector sea el mismo ue el de la entidad &tabla) vista) dimensin0' a

    la ue se est conectando!

    4ngresar datos

    ropiedades: *one#in:

    4 Database: se coloca el nombre del esuema en donde se

    encuentra la tabla en la ue se desean ingresar los datos!4 ,sername: se coloca el nombre del usuario del esuema en

    donde se encuentra la tabla en la ue se desean ingresar los

    datos!4 assord:se coloca el pass7ord del usuario del esuema en

    donde se encuentra la tabla en la ue se desean ingresar los

    datos! ,so:

    4 5rite (ode:normalmente se coloca 9nsert!4 Table Name:se coloca el nombre del esuema entre s$mbolos

    +:- seguido por un punto +!- y el nombre de la tabla en la ue se

    desean insertar los datos! Ejemplo#

    :;8S?TE>CASC>Dia>Anterior *olumnas:en esta seccin se colocan el nombre y tipo de dato de las

    columnas ue se desea ue contenga el Data Set!

    ,tili8acin de un Data Set ya creado

    ropiedades:

  • 7/25/2019 Gua de DataStage (1)

    6/31

    4 Source 6 7ile: se debe colocar la ruta donde se encuentra

    guardado el Data Set as$ como su nombre! Ejemplo#

    :;DataSet?ile:@DS>Consolidado>1TTA5>Activo! *olumnas:en esta seccin se colocan el nombre y tipo de dato de las

    columnas ue se desea ue contenga el Data Set!

    Nota:es posible visuali*ar la data ue contiene el Data Set %aciendo uso

    de la opcin +.er Datos-) en donde se desplegar una ventana para

    ingresar los parmetros correspondientes al job! En caso de ue el Data

    Set contenga registros y se %aya reali*ado la cone/in al mismo de

    manera satis(actoria) los registros sern mostrados! En caso contrario) se

    visuali*ar una alerta indicando la naturale*a del error o indicando ue el

    Data Set no contiene "las!

    $.& Trans9ormer1

    Este stage permite reali*ar trans(ormaciones &conversin de tipo de

    datos) operaciones) inclusin de variables0' a una data de entrada! 8na

    ve* ue se coloca en el job el stage de Trans(ormer) este toma las columnas

    del lin de entrada! Cuando se abren las propiedades del Trans(ormer) se

    puede ver del lado i*uierdo una seccin ue contiene las columnas

    correspondientes al lin de entrada) del lado derec%o in(erior estar la

    seccin correspondiente a las columnas del lin de salida y del lado

    derec%o superior la seccin de +.ariables de la etapa-!

    Para crear una variable#

    4 Entrar en +Propiedades-!4 Seleccionar la pestaBa +Etapa .ariables-!4 Asignar el nombre y el tipo de dato de la variable!

    8na ve* creada la variable) 2sta aparecer en la seccin +.ariables de la

    etapa-! Es posible editar la derivacin de cada variable de etapa) %aciendo

    clic derec%o sobre la derivacin y seleccionando la opcin +Editar

    derivacin-! Con esto se tiene la opcin de utili*ar una determinada (uncin

    para reali*ar un tratamiento determinado a un campo!

    Adems) en la parte in(erior de la ventana de +Propiedades- se encuentra la

    lista de campos correspondientes al lin de entrada y lin de salida con sus

    respectivos tipos de dato! Nota: se puede reali*ar de (orma impl$cita la

    conversin de tipo de dato de un campo) sin embargo) es mejor reali*ar las

    conversiones de tipo de dato con un stage 1odi(y!

  • 7/25/2019 Gua de DataStage (1)

    7/31

    1 NTA 4(/TANT":reducir el uso de este stage en lo posible dado ue

    est obsoleto y es posible ue en (uturas versiones de DataStage 2ste sea

    eliminado!

    $.) (odi9y

    Este stage permite modi"car el tipo de dato de un campo! El

    campo ue %ay ue con"gurar en este stage es el de

    +Speci"cation- dentro de la pestaBa +Propiedades-! Au$ lo ue

    %ay ue colocar es la instruccin ue permita reali*ar la conversin &revisar

    la Ayuda de DataStage para mayor detalle de las (unciones ue permiten

    reali*ar la conversin'!

    $.+ Sort

    Este stage permite ordenar datos! Se utili*a sobre todo antes del

    stage Aggregator) ya ue 2ste reuiere ue la data de entrada est2

    ordenada! Los puntos ue se deben con"gurar para este stage son los

    siguientes#

    ropiedades:4 Sorting ;eys 6 ;ey# au$ se coloca la o las claves del stage

    &especi"car como se eligen estas claves'! Para cada una de las

    claves debe elegirse el +Sort ey 1ode- ue es la modalidad de

    ordenamiento y por lo general se selecciona el tipo +Sort-! Tambi2ndebe especi"carse el +Sort rder- ue puede ser +Ascending- si se

    uiere ordenar los registros de menor o mayor o +Descending- si se

    uiere ordenar los registros de mayor a menor! Nota:para agregar

    una clave adicional %acer clic en +Sorting eys- y luego) en la parte

    in(erior derec%a de la ventana) %acer clic en +ey-!

    Salida:4 *orrelacin:en esta seccin es donde se reali*a el mapeo de las

    columnas desde el lin de entrada %acia el lin de salida!4 *olumnas: en esta seccin debe aparecer la metadata de la

    in(ormacin ue se desea ordenar!

    $. Aggregator

    Este stage permite agregar data! Es indispensable ue la data de

    entrada est2 ordenada! El stage Aggregator puede con"gurarse de dos

  • 7/25/2019 Gua de DataStage (1)

    8/31

    maneras) como +Count

  • 7/25/2019 Gua de DataStage (1)

    9/31

    4 ptions 6 Duplicate to retain:au$ se especi"ca cual duplicado

    se conservar en caso de ue se encuentren registros duplicados!

    Puede elegirse +?irst- si se uiere conservar el primer duplicado o

    +Last- si se uiere conservar el 3ltimo duplicado!

    Nota:este stage es especialmente 3til cuando se presenta un error en laejecucin del ETL relacionado con la e/istencia de duplicados al momento

    de cargar datos!

    $.? *opy

    Este stage permite copiar la data de entrada en la salida! Se usa para

    dividir la data y reali*ar procesado por separado! 8na ve* ue este stage se

    agrega dentro del Fujo de un job) 2l toma la metadata del lin de entrada y

    automticamente se mapea al lin de salida!

    $.@ Join$

    Este stage permite combinar data! Tiene la misma (uncionalidad ue

    un Join dentro de una sentencia SGL! Los puntos ue deben con"gurarse

    para este stage son los siguientes#

    ropiedades:4 ;ey:au$ se debe colocar el campo ue se desea designar como

    clave) es decir) auel por el cual se uiere %acer el Join! Nota:si se

    desea agregar una clave adicional) en la parte in(erior derec%a de la

    ventana de propiedades se debe %acer clic en +ey-!4 Join Type:en este punto se debe elegir el comportamiento ue se

    uiere ue el stage tenga! E/isten cuatro opciones# 4nner:deja pasar a la salida del stage auellas columnas ue

    %agan matc%! 3e9t uter: deja pasar a la salida del stage todas las

    columnas del lin i*uierdo) %agan o no matc% con las

    columnas del lin derec%o! Para las columnas ue no %acen

    matc% se establecen valores por de(ecto para rellenar los

    campos ue ueden vac$os! /ig=t uter: deja pasar a la salida del stage todas las

    columnas del lin derec%o) %agan o no matc% con las

    columnas del lin i*uierdo! Para las columnas ue no %acen

  • 7/25/2019 Gua de DataStage (1)

    10/31

    matc% se establecen valores por de(ecto para rellenar los

    campos ue ueden vac$os! 7ull uter: deja pasar a la salida del stage todas las

    columnas del lin i*uierdo y derec%o) %agan o no matc%!

    Para las columnas ue no %acen matc% se establecen valores

    por de(ecto para rellenar los campos ue ueden vac$os! Especi"car en donde se coloca el valor por de(ecto con ue se

    rellenan los registros! rdenacin de los enlaces:en esta seccin se debe establecer cul

    de los lins de entrada del Join va a ser el Le(t Lin y cul el

  • 7/25/2019 Gua de DataStage (1)

    11/31

    Silva M6HM ?ernnd

    e*

    6N

    Tabla $. /egistros de la 9uente de datos 0

    El resultado de la salida del Join variar seg3n el +Join Type- ue se elija! El

    comportamiento del Join para cada caso ser$a el siguiente#

    4nnerSlo deja pasar a la salida auellas columnas ue %agan matc%! En este

    caso) el resultado ser$a el siguiente#

    4D Nombre Apellido "dad Jos2 =on*le* 6H

    Tabla &. Data resultante con un Join tipo 4nner

    3e9t uterEn este caso) pasan a la salida todas las columnas del lin i*uierdo)

    %agan o no matc% con las del lin derec%o! La data resultante de aplicar

    este Join es la siguiente#

    4D Apellid

    o

    "dad Nombre

    =on*le

    *

    6H =on*le*

    Silva M6 &valor por

    de(ecto'HM ?ernnd

    e*

    6N &valor por

    de(ecto'Tabla ). Data resultante con un Join tipo 3e9t uter

    /ig=t uterEn este caso) pasan a la salida todas las columnas del lin derec%o)

    %agan o no matc% con las del lin i*uierdo! La data resultante de

    aplicar este Join es la siguiente#

    4D Nombre Apellido "dad6H Ana

  • 7/25/2019 Gua de DataStage (1)

    12/31

    En este caso) pasan a la salida todas las columnas de ambos lins! La

    data resultante de aplicar este Join es la siguiente#

    4D Apellid

    o

    "dad Nombre

    =on*le

    *

    6H =on*le*

    Silva M6 &valor por

    de(ecto'HM ?ernnd

    e*

    6N &valor por

    de(ecto'6H

  • 7/25/2019 Gua de DataStage (1)

    13/31

    4D Apellid

    o

    "dad

    =on*le

    *

    6H

    Silva M6

    6H

  • 7/25/2019 Gua de DataStage (1)

    14/31

    ropiedades:4 rdenacin de los enlaces:en esta seccin se debe especi"car

    cul de los lins de entrada ser el principal &+Primary-' y cul ser

    el de re(erencia &+Looup I-'!/estricciones:

    < *ondicin no se cumple *ondition Not (etE: *ontinuar *ontinueE:si la condicin se cumple! 7inali8acin anmala 7ailE:si la condicin no se cumple Descartar DropE:si la condicin no se cumple porue el

    registro %a sido previamente borrado! /ec=a8ar /ejectE:

    4 AnomalFa en la bs'ueda 3ooCup 7ailureE: establece la accin

    a tomar cuando sucede lo especi"cado en +Condicin no se

    cumple-! *ontinuar *ontinueE: el job continua sin (allar y los

    valores de re(erencia con los ue sern poblados los campos

    de los registros ue no %acen matc% sern ,8LL en caso deue el campo sea nullableo con un string vac$o en caso de

    ue el campo sea no-nullable! 7inali8acin anmala 7ailE:el job (alla! Descartar DropE:los registros se borran! /ec=a8ar /ejectE:los registros se env$an %acia un lin de

    reject &%ay ue colocar el lin de reject'!

    En la ventana de con"guracin del Looup aparecen en la parte i*uierda

    las tablas correspondientes a los campos del lin mster y de los lins de

    re(erencia! Del lado derec%o se encuentra una seccin en donde se deben

    mapear auellos campos ue se deseen pasar a la salida! En la partein(erior) aparece la lista de cada uno de los campos correspondientes a

    cada lin con sus nombres y respectivos tipos de dato!

    "jemplo:Supngase ue se tiene el diagrama siguiente) en donde se tiene

    una (uente de datos A en el lin principal y una (uente de datos 5 en el lin

    secundario! Los datos correspondientes a la (uente A y a la (uente 5 son los

    ue se muestran en las tablas a continuacin!

  • 7/25/2019 Gua de DataStage (1)

    15/31

    4lustracin &. "jemplo de diagrama con 3ooCup

    4D Nombre Apellido6H Ana

  • 7/25/2019 Gua de DataStage (1)

    16/31

    4D Nombre Apellido "dad6H Ana

  • 7/25/2019 Gua de DataStage (1)

    17/31

    En este caso) si se encuentran registros ue no %acen matc% &?ail' 2stos

    se borran de la memoria &Drop') por lo ue la data de salida ser$a la

    siguiente#

    4D Nombre Apellido "dad Jos2 =on*le* 6H

    Tabla 1>. Data de salida con 3ooCup 7ail H Drop

    Nota: si se elige esta opcin es recomendable ue antes de

    implementarla se pruebe con la opcin ?ail Q

  • 7/25/2019 Gua de DataStage (1)

    18/31

    $.11 (erge$

    Es un stage ue permite combinar data! Puede tener varios lins de

    entrada donde uno de ellos debe ser designado como lin mster y el resto

    como lins de re(erencia! En la salida tiene el lin principal y de manera

    opcional se puede agregar un lin de reject &pueden agregarse tantos lins

    de reject como lins de re(erencia tenga en su entrada'! Como reuisito) la

    data de entrada debe estar libre de duplicados y debe estar ordenada! Los

    puntos ue deben con"gurarse en este stage son los siguientes#

    ropiedades:4 (erge ;eys 6 ;ey:au$ se coloca el campo ue se desea designar

    como clave) es decir) auel por el cual se desea reali*ar el 1erge!

    Adicionalmente) a cada clave se le debe especi"car el tipo deordenacin en +Sort rder- ue puede ser +Ascending- si la data

    est ordenada de manera ascendente o +Descending- si est

    ordenada de manera descendente! Nota:si se desea agregar una

    clave adicional) en la parte in(erior derec%a de la ventana de

    propiedades se debe %acer clic en +ey-!4 pciones 6 ,nmatc=ed (asters (ode: au$ se especi"ca el

    comportamiento ue se uiere establecer cuando las columnas no

    %agan matc%! Se debe elegir la opcin +eep- si se uieren

    conservar las columnas ue no %agan matc% o +Drop- si se uieren

    borrar las columnas ue no %agan matc%!

    4 pciones 6 5arn n /eject ,pdates:au$ se especi"ca si seuiere ue DataStage emita un 7arning cuando alg3n registro de los

    lins de re(erencia sea rec%a*ado! Si se uiere ue se emita el

    7arning este campo debe colocarse en +True-) de lo contrario en

    +?alse-! =eneralmente se deja en +?alse-!4 pciones 6 5arn n ,nmatc=ed (asters:au$ se especi"ca si

    se uiere ue Datastage emita un 7arning cuando alg3n registro del

    lin mster sea rec%a*ado! Si se uiere ue se emita el 7arning este

    campo debe colocarse en +True-) de lo contrario en +?alse-!

    =eneralmente se deja en +?alse-! rdenacin de los enlaces:en esta seccin se debe especi"car cul

    ser el lin principal &+1ster-' y el lin de re(erencia &+8pdateI-' en la

    entrada y cul ser el lin principal &+1ster-' y el lin de reject

    &+

  • 7/25/2019 Gua de DataStage (1)

    19/31

  • 7/25/2019 Gua de DataStage (1)

    20/31

    IK 1aracay 6MH6Tabla $. /egistros de la 9uente de datos *

    Dependiendo de la opcin ue se elija en +8nmatc%ed 1asters 1ode- el

    comportamiento del 1erge ser di(erente! El resultado de este ejemplo se

    detalla a continuacin para cada una de las opciones!

    ;eepEsta opcin permite pasar a la salida todos los registros ue se

    encuentren en el lin mster) %agan o no matc% con los registros de los

    lins de re(erencia! En las siguientes tablas se muestra el resultado

    para esta opcin!

    4D Nomb

    re

    Apellido "dad *iudad %cina

    6H Ana

  • 7/25/2019 Gua de DataStage (1)

    21/31

    Join 3ooCup (erge,so de

    memoria

    Ligero Pesado Ligero

    Nmero de

    entradas

    6 o ms# le(t o

    rig%t

    6 o ms# uno

    principal y uno o

    ms de re(erencia

    6 o ms# uno

    principal y uno o

    ms de re(erenciaData de

    entrada

    ordenada

    Todas las

    entradas

    ,o necesario Todas las entradas

    Duplicados en

    el linC m!ster

    arning

    Duplicados en

    los linCs de

    re9erencia

    arning cuando slo

    %ay un lin de

    re(erenciapciones

    cuando no =ay

    matc= en ellinC m!ster

    eep &Le(t

    uter' Drop

    &9nner'

    ?ail Continue

    Drop

  • 7/25/2019 Gua de DataStage (1)

    22/31

    ordenados y +Seuence- deja pasar los registros del primer lin de

    entrada) luego los del segundo y as$ sucesivamente! Salida:

    4 *orrelacin:en esta seccin es donde se reali*a el mapeo de las

    columnas desde el lin de entrada %acia el lin de salida!

    4*olumnas:

    en esta seccin debe aparecer la metadata de lain(ormacin!

    $.1& 7ilter

    Este stage permite "ltrar data de acuerdo a una condicin!

    Puede tener ms de dos lins de salida) donde uno de ellos se

    puede con"gurar como lin de reject! Los puntos ue se deben

    con"gurar para este stage son los siguientes#

    ropiedades:

    4 redicates 6 5=ere *lause:au$ se debe colocar la condicincon la cual se desea "ltrar) por ejemplo) EDAD U I! Si se desea

    agregar condicin adicional) en la parte in(erior derec%a de la

    ventana de propiedades se debe %acer clic en +%ere Clause-!

    Nota:cuando %ay ms de una condicin) es necesario especi"car

    por cul lin van a salir los datos resultantes de cada una de las

    condiciones! Esto se especi"ca en el campo utput 3inC!4 pciones 6 utput /ejects:se debe colocar en True cuando se

    uiera ue los registros ue no cumplen la condicin se pasen al lin

    de reject!< pciones 6 uput /o nly nce: esta opcin se debe colocar

    en True si se uiere pasar a la salida auellos registros ue cumplanslo con la primera condicin &en caso de e/istir ms de una

    condicin'! Si se coloca en ?alse) a la salida pasarn auellos

    registros ue cumplan con todas las condiciones establecidas! rdenacin de los enlaces:en esta seccin se debe especi"car cul

    ser el lin principal &+Primary-') los lins de re(erencia &N) I) 60' y el

    lin de reject &+Primary reject-' si lo %ubiera!

    Salida:4 *orrelacin:en esta seccin es donde se reali*a el mapeo de las

    columnas desde el lin de entrada %acia el lin de salida!4 *olumnas: en esta seccin debe aparecer la metadata de la

    in(ormacin!

    "jemplo:Supngase ue se tiene el diagrama siguiente) en donde se tiene

    una (uente de datos A como entrada! La data de entrada es como la ue se

    muestra en la siguiente tabla y se desea separar la in(ormacin en base a

    las personas ue sean mayores y menores a 6 aBos!

  • 7/25/2019 Gua de DataStage (1)

    23/31

    4lustracin ?. "jemplo de diagrama con 7ilter

    4D Nombr

    e

    Apellid

    o

    "dad

    Jos2 =on*le

    *

    6H

    Jes3s Silva M66H Ana

  • 7/25/2019 Gua de DataStage (1)

    24/31

    6H Ana

  • 7/25/2019 Gua de DataStage (1)

    25/31

    ). aso de par!metros en Job Activity

    Para poder ejecutar una secuencia correctamente) es necesario ue cada JobActivity tenga asignados los parmetros dentro de sus Propiedades! Antes ue

    nada) se debe vincular el Job Activity a un job o secuencia &ver la Seccin I!I'

    para ue apare*ca la lista de parmetros ue necesita el job o secuencia a la

    ue se est invocando) como se muestra a continuacin!

    En algunos casos se reuerir ue el valor del parmetro sea un parmetro de

    la secuencia en donde nos encontramos! En este caso) se debe %acer clic en

    +9nsertar parmetro- y seleccionarlo en la lista ue aparecer! En otros casos

    se necesitar asignar alg3n otro valor) por ejemplo) una variable creada en un

    .ariable Activity) un string) una (uncin) un condicional) etc!) como se muestra

    a continuacin!

  • 7/25/2019 Gua de DataStage (1)

    26/31

    +. "jecucin del "T3

    Para ejecutar el ETL es necesario ue todos los jobs y secuencias est2n

    compilados! Si se uiere compilar varios jobs al mismo tiempo) se debe %acer

    clic en erramientas 6 *ompilacin de varios trabajos y se desplegar

    una ventana en donde aparecern los *riterios de Seleccin ue por lo

    general se dejan tal y como estn! Al seleccionar +Siguiente- se contin3a con el

    pr/imo paso en donde se debe elegir cuales jobs se desean compilar) como se

    muestra a continuacin!

  • 7/25/2019 Gua de DataStage (1)

    27/31

    8na ve* seleccionados los jobs ue se van a compilar) en el siguiente paso se

    deja la opcin por de(ecto y en el siguiente paso a ese se debe presionar

    +9niciar compilacin-! Si se marca la opcin +1ostrar reporte de compilacin al

    "nali*ar- se generar un arc%ivo t/t con el listado de los jobs compilados

    satis(actoriamente y los ue %an (allado por alguna ra*n!

    8na ve* ue todos los jobs %an compilado) se puede ejecutar el ETL %aciendo

    clic en ! Al %acer esto) se despliega la ventana ue contiene los parmetros

    de la secuencia) ue pueden tener o no valores por de(ecto como se muestra a

    continuacin!

  • 7/25/2019 Gua de DataStage (1)

    28/31

    8na ve* ue todos los parmetros tienen asignado su valor) se presiona

    +Ejecutar-! En el Log &parte in(erior de DataStage') se mostrar el progreso de

    la ejecucin) cules jobs se %an ejecutado satis(actoriamente) cules con7arnings y si %ay un error en la ejecucin! La primera l$nea ue aparece en el

    Log luego de iniciar la ejecucin &Starting Job K' es importante porue all$ se

    puede revisar el valor de los parmetros con los ue se est ejecutando ese job

    o secuencia) %aciendo doble clic sobre esa l$nea!

    tra de las l$neas ue aparecen en el Log ue es importante para veri"car) en

    especial cuando la secuencia %a (allado es la de Summary o9 se'uence run)

    porue permite determinar e/actamente en cul job o secuencia se %a

    producido el error!

  • 7/25/2019 Gua de DataStage (1)

    29/31

    . 0uenas pr!cticas en el desarrollo de "T3Ls

    1. Nombre del Job o Secuencia:a cada job y secuencia se le debe colocarun nombre ue %aga re(erencia a la tarea ue reali*a! Adems de esto) es

    recomendable ue el nombre empiece con el nombre del proyecto!"jemplo:si el proyecto en DataStage se llama =estionPromotores y se

    tiene un job ue permite conocer cul es el primer d$a %bil del mes) un

    nombre apropiado para este job ser$a

    +=estPromotores>8bicarPrimerDiaabil-!

    $. Documentacin del Job o Secuencia:en cada job y secuencia deben

    aparecer ciertos elementos ue lo identi"can y (acilitan la comprensin del

    mismo! Es importante ue el estilo de la documentacin se mantenga igual

    en todos los jobs y secuencias del proyecto! Entre los elementos uecon(orman la documentacin del job estn#a Q 9denti"cador de la gerencia o rea encargada del seguimiento del

    desarrollo del ETL por parte del cliente!b Q 9denti"cador de los encargados del desarrollo del ETL por parte de TCS)

    as$ como el nombre del proyecto) (ec%a de creacin y actuali*acin del job

    o secuencia!c Q Datos del job o secuencia) tales como nombre del job o secuencia y la

    descripcin de la tarea ue reali*a!d Q

  • 7/25/2019 Gua de DataStage (1)

    30/31

    4lustracin @. "jemplo de documentacin del job

    &. Jobs o secuencias de respaldo: los jobs o secuencias ue por alg3n

    motivo ya no se usen dentro del Fujo del ETL no se deben dejar en las

    carpetas del proyecto donde (ueron creados inicialmente! Durante el

    desarrollo de un ETL ser necesario crear dentro del proyecto una carpeta

    llamada +

  • 7/25/2019 Gua de DataStage (1)

    31/31

    4lustracin 1. "jemplo de cmo deben nombrarse los linCs