16
Web Project server Repositorio de datos Establecer la conexión con las herramientas de Integración de datos de Pentaho. OBJETIVO Establecer un flujo de datos entre dos bases de datos. QUE SE REALIZARÁ EN ESTA ETAPA. La comunicación requiere un emisor, un receptor, un canal y un mensaje, basado en eso, estableceremos una comunicación entre 2 bases de datos usando una herramienta de Acceso Manejo de ETL llamada Spoon de la suite de pentaho, y enviaremos como mensaje el contenido de una tabla.

Como Construir La Conexion ETL Pentaho

Embed Size (px)

Citation preview

Establecer la conexin con las herramientas de Integracin de datos de Pentaho.OBJETIVOEstablecer un flujo de datos entre dos bases de datos.QUE SE REALIZAR EN ESTA ETAPA.La comunicacin requiere un emisor, un receptor, un canal y un mensaje, basado en eso, estableceremos una comunicacin entre 2 bases de datos usando una herramienta de Acceso Manejo de ETL llamada Spoon de la suite de pentaho, y enviaremos como mensaje el contenido de una tabla. Web Project serverRepositorio de datos

INSTALACIN. La versin comunity edition pentaho no requiere instalacin, simplemente se descomprime, el archivo que actualmente corresponde a la ltima versin es:pdi-ce-4.4.0-stable.zipSe puede descargar desde:http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.4.0-stable/Es posible que el driver que permite la conexin de Pentaho a Mysql no est y sea necesario adicionarlo, se soluciona ubicando el archivo mysql-connector-java-5.1.23-bin.jar en la carpeta data-integration\libext\JDBC.(el archivo mysql-connector-java-5.1.23-bin.jar est junto a este documento en el mismo zip ).

Es necesario verificar que tengan una versin de java instalado en su computador, pueden descargarlo de:http://www.oracle.com/technetwork/java/javase/downloads/jre-6u25-download-346243.html

EJECUCIN.

Lo primero que realizamos es componer un flujo de datos, esto se hace por medio de la herramienta Spoon.Se ejecuta por medio de Spoon.bat

Si solicita Acceso a usuario y contrasea a un repositorio, no es necesario. Oprimir cancelar

INICIO DE LA HERRAMINETA.La ventana inicial nos presenta un men de opcines, por ahora ver en File > New -> transformacinEsto nos lleva a una ventana donde podemos inicial un proceso ETL.

En el costado izquierdo estn las herramientas.Al lado derecho estas se arrastran, colocan de acuerdo a su utilidad.

UBICAR COMPONENTES DE LA ETLPara obtener informacin de nuestro origen de datos, iniciamos con la opcin Table Input y lo ponemos arrastramos al rea de trabajo.

Con doble click abrimos el men que dispone de varias opciones1. Nombre del paso.2. Conexin a usar 3. Consulta que se requiere realizar.4. Opciones de desempeo como limitar nmero de columnas, entre otras.

DEFINIR LA CONEXIN A LA BASE DE DATOS ORIGEN

click en New.. y llegamos a la siguiente ventana que se llena como se v a continuacin.

Se llenan los campos con esta informacin:

Connection Name: poliConnection Type: MySQLAccess: Native(JDBC)Host Name: polienero2014.cuit8lfnw4w1.us-east-1.rds.amazonaws.comDatabase Name: sakilaPort Number: 3306UserName: poliEnero2014Password: poliEnero2014

Si est bien al hacer click en Test aparece algo parecido a:

Aceptamos el ok del test de la conexin Ok en la conexin.Regresamos a la ventana Donde definimos las caractersticas de la consulta de cual deseamos extraer informacin.

DEFINICIN DE LA CONSULTA AL SISTEMA ORIGEN

Ahora podemos visualizar el contenido de la base de datos haciendo click en Get SQL select StatmentY luego de cargar podemos navegar en la estructura de tablas de la base de datos. Si seleccionamos la tabla contactos, y luego click en OK. El sistema automticamente construye una consulta con todos los campos de la tabla.

Podemos limitar o editar la consulta que realiza el sistema desde esa caja de dialogo.

Damos OKDEFINICIN DEL DESTINO DE LA INFORMACIN

Adicionamos una conexin Output lugar donde dejaremos los datos de las tablas:

En Access Previamente creamos una base de datos con una tabla

.. se hace doble click en el icono de conexin de Microsoft Access Output.Y despliega una ventana donde se puede realizar la conexin. Click en OK

EJECUCIN DEL PROCESO ETLEn la parte superior hay una barra de herramientas que nos permiten hacer la ejecucin del ETL ahora construido.

CLick en el botn verde Play : Emerge una ventana de parmetros de la configuracin(en casos particulares se adicionan parmetros, en este caso no)

Se ejecuta la transformacin por medio del botn Launch y luego se acepta la ejecucin.

El resultado de la operacin es exitoso.(ntese que en la parte superior de cada conexin hay un signo que indica correcto)

(En caso de error aparecen lneas rojas indicando en donde falla el proceso.)

VER EL RESULTADO

Se actualiza la tabla en Access y como resultado obtenemos la migracin de la informacin.

Se ha cumplido el objetivo. Se ha llevado informacin de un sistema a otro.En este ejemplo la transformacin es pequea, y se entiende como un filtro de registros (ya que no se estn realizando operaciones complejas sobre estos).

Entrega del trabajo1. Documento de office con la captura de las pantallas de los procesos que realizaron, incluyendo el de ejecucin exitosa del proceso2. Adjunto archivo con extencin .ktr que contiene el ejercicio realizado.