20
Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible) 1 INTRODUCCIÓN A PENTAHO BI SUITE 3.5 P P e e n n t t a a h h o o ( ( B B I I O O p p e e n n S S o o u u r r c c e e ) ) OSBI – Concepto (extraído de http://www.corebi.com) En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementación de herramientas Open Source. La cantidad de proyectos libres de licencias en este segmento y el número de personas implicadas demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez. ¿Por qué OSBI? Adaptabilidad a todos los entornos. Sin costos de licencias. Independencia del proveedor. Seguridad. Garantías de permanencia. Upgrades y mejoras frecuentes. Tendencia a la calidad y utilización de estándares Dedicación full a los servicios y a la solución de negocios. Gran aprovechamiento de Web Services y tecnología SOA. (Arquitectura Orientada a Servicios) La comunidad del Software Libre. Los proyectos BI deberían ser proyectos a largo plazo, porque de ellos depende no sólo el presente de nuestras decisiones, sino el futuro. OSBI existentes (extraído de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009) Hoy por hoy, Pentaho es la suite más completa y fuerte del mercado OSBI. Pero han surgido otras interesantes, aunque les falta para llegar a competir con Pentaho, por ejemplo, algunas son: SapgoBI Vanilla OpenI Todas parten de mondrian (motor OLAP) + jpivot (interfase para OLAP) + kettle (ETL), por lo que siempre nos conviene partir de Pentaho. Aún teniendo en cuenta los cambios frecuentes de Licencias de Pentaho. (extraído de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html) Una funcionalidad muy interesante es que admite el uso de diferentes motores OLAP que dan respuesta a la necesidad sin diferenciar si en dicho ámbito usamos una solución open source o propietaria. Por ejemplo, podemos usar Mondrian que es ROLAP y PALO que es MOLAP. De manera que ambos motores se complementan. OLAP: soporta los motores Mondrian, PALO y Microsoft Analysis Services. Informes: soporta los motores de JasperReports, BIRT y Cristal Reports. ETL: soporta los motores de Talend, Oracle Warehouse Builder y Data Stage. Dashboard: soporta los motores de Lazlo y Tibco. Análisis geográfico: soporta mapserver y sbigeo. Data Mining: soporta weka,

Pentaho (OSBI)

Embed Size (px)

DESCRIPTION

ESpago Bi

Citation preview

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

1

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

PPPeeennntttaaahhhooo (((BBBIII OOOpppeeennn SSSooouuurrrccceee)))

OSBI – Concepto (extraído de http://www.corebi.com)

En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementación de herramientas Open Source.

La cantidad de proyectos libres de licencias en este segmento y el número de personas implicadas demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez.

¿Por qué OSBI?

� Adaptabilidad a todos los entornos. � Sin costos de licencias. � Independencia del proveedor. � Seguridad. � Garantías de permanencia. Upgrades y mejoras frecuentes. � Tendencia a la calidad y utilización de estándares � Dedicación full a los servicios y a la solución de negocios. � Gran aprovechamiento de Web Services y tecnología SOA. (Arquitectura Orientada a Servicios) � La comunidad del Software Libre.

Los proyectos BI deberían ser proyectos a largo plazo, porque de ellos depende no sólo el presente de nuestras decisiones, sino el futuro.

OSBI existentes (extraído de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009)

Hoy por hoy, Pentaho es la suite más completa y fuerte del mercado OSBI. Pero han surgido otras

interesantes, aunque les falta para llegar a competir con Pentaho, por ejemplo, algunas son:

� SapgoBI � Vanilla � OpenI

Todas parten de mondrian (motor OLAP) + jpivot (interfase para OLAP) + kettle (ETL), por lo que siempre nos conviene partir de Pentaho. Aún teniendo en cuenta los cambios frecuentes de Licencias de Pentaho.

(extraído de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)

Una funcionalidad muy interesante es que admite el uso de diferentes motores OLAP que dan respuesta a la necesidad sin diferenciar si en dicho ámbito usamos una solución open source o propietaria. Por ejemplo, podemos usar Mondrian que es ROLAP y PALO que es MOLAP. De manera que ambos motores se complementan.

� OLAP: soporta los motores Mondrian, PALO y Microsoft Analysis Services. � Informes: soporta los motores de JasperReports, BIRT y Cristal Reports. � ETL: soporta los motores de Talend, Oracle Warehouse Builder y Data Stage. � Dashboard: soporta los motores de Lazlo y Tibco. � Análisis geográfico: soporta mapserver y sbigeo. � Data Mining: soporta weka,

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

2

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

A parte de soporta KPI’s, charts (uso de jfreechart), integración con office, dashboards interactivos y QbE (Query By Example). Módulos de la suite:

� SpagoBI Server: nucleo central de SpagoBI que integra la funcionalidad de los diferentes motores, gestión de usuarios, etc.

� SpagoBI Studio: entorno de desarrollo único e integrado. � SpagoBI Meta: entorno enfocado a la capa de metadatos. � SpagoBI SDK: un nuevo nivel de integración para utilizar SpagoBI con aplicaciones externas � SpagoBI Applications: para mantener los modelos verticales de análisis desarrollados con SpagoBI.

Esta es una solución enteramente Open Source. En la página oficial puede verse una demo en línea de la suite (http://spagobi.ow2.org)

Basado en Java EE con la aplicación por defecto para correr en tomcat, OpenI es una solución para la construcción y publicación de informes de XMLA compatible con fuentes de datos OLAP, como Microsoft Analysis Services o Mondrian. Su objetivo es proporcionar análisis consolidado de los principales componentes de datos de una aplicación inteligente, incluyendo:

• Fuentes de datos OLAP • Bases de datos relacionales • Los datos estadísticos modelos • Los modelos de minería de datos

Página:http://openi.org/. Demo en línea : http://demo.openi.org/openi/ (usuario/pass= openi2/openi2)

Cuenta con:

� reports (Ireport & BIRT engines)

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

3

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

� Web reports (Web interface for creation and data exploration) � Olap views (FreeAnalysis engine) � Dashboard (FreeDashboard engine) � Key Performance Indicateors (FreeMetrics engine) � Maps (Googlemap integration & Map engines)

Obtener demo de: http://forge.bpm-conseil.com/ Documento de presentación de la versión 2.2: http://www.bpm-conseil.org/vanilla22/documentation/BPM_Vanilla_Presentation_200_FR.pdf Rápida adopción del mercado de BI open source (Chile) (extraído de http://www.cognus.cl/content/view/598217)

“El software open source representa la tendencia más significativa, global y de más largo plazo que la industria del software ha visto desde los comienzos de los 80’s.”

“El software de BI open source estará probablemente en tu futuro: el tema real no es si estará, si no cuando”

“El BI open source está aquí para quedarse.” “El interés en la tecnología de BI open source es tan alto como la búsqueda de las compañías por alternativas de productos comerciales disponibles de menor precio.”

La plataforma Pentaho Open Source Business Intelligence (extraído de Todo BI - http://www.gravitar.biz - http://www.cognus.cl)

(extraído de: MySQL V5 – Ready for Prime Time Business Intelligence - Seth Grimes)

La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Análisis de los Datos y de Informes empresariales. Cuenta con:

� Administración y distribución de reportes, análisis y dashboards � Fácil integración de fuentes de datos, portales y aplicaciones usando estándares abiertos � Programación de tareas y autentificación integradas � Funcionalidades de customización a través de APIs, Web Services o modificación a plantillas,

reglas de negocio o incluso el código fuente � Registro de auditoría integrado para seguimiento de actividades de usuarios, performance y

acceso a contenido � Procesos basados en workflow que permiten implementar lógica de negocios única

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

4

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Estado actual en que se encuentra la solución y con que componentes cuenta.

� Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad. � Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat,

WebLogic y Oracle AS. � Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR

Teradata, Firebird. � Sistema operativo: no hay dependencia. Lenguaje interpretado. � Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO). � Interfaz de desarrollo: Java SWT, Eclipse, Web-based. � Repositorio de datos basado en XML. � Todos los componentes están expuestos vía Web Services para facilitar la integración con

Arquitecturas Orientadas a Servicios (SOA).

(extraído de Todo BI)

Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” y “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos.

Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrado con un motor de workflow de procesos de negocio, una de las capacidades BI claves de la plataforma. Es decir, la plataforma será capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la información adecuada en el momento adecuado.

Informe técnico

Pentaho está construído en torno al servidor de aplicaciones J2EE JBoss y Jboss Portal (la versión 3.5 de la community edition viene con Tomcat), habilitando que toda la información sea accesible mediante un browser en la intranet de la empresa.

Pentaho presenta informes en los formatos habituales (html, excel, pdf...) mediante JfreeReport, u otras plataformas como BIRT o JasperReports. Para la generación de PDFs utilizan, como podría ser previsible, el conocidísimo Apache FOP.

Asimismo incorpora la librería JPivot, gracias a la cual podemos ver tablas OLAP a través de un browser y realizar las aplicaciones típicas de análisis OLAP (drill down, slice and dice...). Existe una alternativa para reemplazar jpivot que es PAT (Pentaho Analysis Tools (http://code.google.com/p/pentahoanalysistool/)

También Pentaho Report Design Wizard, una herramienta de diseño de informes, que facilita el trabajo con JfreeReport y supera sus limitaciones.

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

5

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Los dashboards son un desarrollo propio de Pentaho. Recogen información de todos los componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y páginas web. Incluyen gestión y filtrado del contenido, seguridad basada en roles y drill down. Pueden ser integrados en terceras aplicaciones, en portales o dentro de la plataforma Pentaho.

Para generar gráficos se apoyan en JFreeChart, una librería para generar los gráficos más comunes (2D, 3D, barras, líneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos, exportación a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes.

Los WebServices son una característica fundamental de Pentaho. Las acciones, que son las tareas más sencillas que constituyen una solución de Pentaho, pueden publicarse como WebServices. Pentaho utiliza como motor de WebServices Apache Axis, quedando los servicios descritos en el lenguaje de definición de servicios web WSDL.

Para entregar la información Pentaho se apoya en una infraestructura JMS para enviar correos electrónicos y Quartz, un scheduler opensource integrable en aplicaciones J2EE.

La corporacion Pentaho es el patrocinador primario y propietario del projecto Pentaho BI. El Pentaho BI

es una iniciativa en curso por la comunidad de Open Source.

El proyecto Pentaho BI abarca los siguientes componentes:

Componentes de la plataforma Pentaho BI son: (extraído de Todo Bi - http://www.cognus.cl - http://www.gravitar.biz)

La siguiente imagen muestra como interactuan los diferentes componentes de pentaho:

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

6

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

http://kettle.pentaho.org � Integración de Datos:

Se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite implementar

los procesos de limpieza, transformación y población del DW. La versión - PDI 3.0 – marcó un gran paso adelante en OSBI ETL y hizo de Pentaho Data Integration una alternativa interesante para las herramientas comerciales. (SUM es aliado de negocios de Pentaho http://www.sun.com/third-party/global/pentaho/) o Se compone de 4 herramientas:

- SPOON: permite diseñar de forma gráfica la transformación ETL. - PAN ejecuta la transformaciones diseñadas con SPOON. - CHEF permite, mediante una interfaz gráfica, diseñar la carga de datos incluyendo un control de estado de los trabajos. - KITCHEN permite ejecutar los trabajos batch diseñados con Chef.

o Amplio soporte a fuentes de datos, más de 30 bases de datos (open source y propietarias),

archivos planos, Excel, y más. o Arquitectura extensible permite desarrollar conectores y plug ins fácilmente. o Basado en repositorio facilita re uso de componentes de transformación, colaboración y

administración de modelos, conexiones, logs, etc. o Performance y escalabilidad de clase Enterprise con soporte a procesamiento masivo paralelo

(MPP) a través de ejecución en cluster o Debugger integrado o Población de Data warehouses con soporte built-in para dimensiones que cambian lentamente y

dimensiones basura

� Pentaho Análisis: Suministra a los usuarios un sistema avanzado de análisis de información. Con uso de las

tablas dinámicas (pivot tables, crosstabs), generadas por Mondrian y JPivot, el usuario puede navegar por los datos, ajustando la visión de los datos, los filtros de visualización, añadiendo o quitando los campos de agregación. Los datos pueden ser representados en una forma de SVG o Flash, los dashboard widgets, o también integrados con los sistemas de mineria de datos y los portales web (portlets). Además, con el Microsoft Excel Analysis Services, se puede analizar los datos dinámicos en Microsoft Excel (usando la conexión a OLAP server Mondrian).

Cuenta con: ⇒ Despliegue gráfico interactivo, con grillas de datos ⇒ Resultados explorables y navegables incluso en los gráficos ⇒ Sofisticadas capacidades OLAP, arquitectura ROLAP ⇒ Técnicas de optimización para mejoras de tiempos de respuesta

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

7

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

http://mondrian.pentaho.org o El servidor OLAP : Para obtener la funcionalidad de procesamiento analítico en línea (OLAP)

se utilizan dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot, permiten realizar querys a Datamarts, y que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones típicas. Algunas cuestiones interesantes sobre Mondrian:

- Mondrian utiliza MDX como lenguaje de consulta, que no tendría nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft.

- En noviembre de 2005 Mondrian se incorporó al proyecto Pentaho. - Mondrian funciona sobre las bases de datos estándar del mercado: Oracle, DB2,

SQL-Server, MySQL,PostgreSQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho.

- JPivot está considerado con un “proyecto hermano” de Mondrian. Al incorporarse Mondrian también lo ha hecho JPivot

� Pentaho Dashboards: Todos los componentes del modulo Pentaho Reporting y Pentaho Análisis pueden

formar parte de un Dashboard. En Pentaho Dashboards es muy fácil incorporar una gran variedad en tipos de gráficos, tablas y velocímetros (dashboard widgets) e integrarlos con los Portlets JSP, en donde podrá visualizar informes, gráficos y análisis OLAP.

� Identificación de Indicadores (KPI’s, Key Performance Indicators) o Monitoreo/Métricas

� Investigar detalles subyacentes o Drill a reportes de soporte

� Seguimiento de excepciones o Alertas basadas en reglas del negocio

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

8

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

� Pentaho Datamining: (http://www.sourceforge.net/projects/weka) Para tal fin, Pentaho está incorporando la tecnología WeKa. Decimos está incorporando, porque al

día de hoy el roadmap de Pentaho indica que están en ello. o Poderoso motor de minería de datos provee de un set de algoritmos de aprendizaje del proyecto

Weka incluyendo clustering, segmentación, árboles de decisión, random forests, redes neuronales y análisis de componentes principales, entre otros.

o Integración de Pentaho Data Integration, automatización de procesos de transformación de datos al formato que requiere el motor de data mining.

o Los algoritmos pueden ser aplicados directamente a un set de datos o invocados desde código Java.

o Provee filtros para discretización, normalización, re-muestreo, selección de atributos, transformación y combinación de atributos.

o Modelos para predicción de variables nominales o numéricas. o Herramientas gráficas de diseño para preprocesamiento de datos, regresión, clustering, reglas de

asociación.

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

9

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

http://reporting.pentaho.org

� Reporting: Pentaho Reporting es una solución basada en el proyecto JFreeReport (hay quienes usan BIRT)

y permite generar informes ágil y de gran capacidad. Permite la distribución de los resultados del análisis en múltiples formatos - todos los informes incluyen la opción de imprimir o exportar a formato PDF, XLS, HTML y texto- y permiten también la programación de tareas y ejecución automática de informes con una determinada periodicidad.

Cuenta con: ⇒ Implementación flexible, desde solución standalone de escritorio, a reportes interactivos

basados en Inteligencia de Negocios ⇒ Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o basados en

XML ⇒ Solución proporcionada por pentaho e integrada en su suite para el desarrollo de

informes

Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios.

Pentaho Report Designer: Editor basado en eclipse con prestaciones profesionales y de calidad y con capacidad de personalización de informes a las necesidades de negocio destinado a desarrolladores. Incluye Asistentes para facilitar la configuración de propiedades. Está estructurado de forma que los desarrolladores pueden acceder a sus prestaciones de forma rápida: Incluye un editor de consultas para facilitar la confección de los datos que serán utilizados en un informe.

Pentaho Report Design Wizard: Herramienta de diseño de informes, que facilita el trabajo y permite a los usuarios obtener resultados de forma inmediata. Está destinada a usuarios con menos conocimientos técnicos. A través de pasos sencillos permite:

• Conectarse a todo tipo de bases relacionales • Integrar el resultado dentro del portal pentaho

Web ad-hoc reporting: Es el similar a la herramienta anterior pero via web. Extiende la capacidad de los usuarios finales para la creación de informes a partir de plantillas preconfiguradas y siguiendo un asistente de creación.

Las características generales son: • Proporciona funcionalidad crítica para usuarios finales como:

o Acceso vía web o Informes parametrizados o Scheduling o Suscripciones o Distribucíon (bursting)

• Proporciona claras ventajas a especialistas en informes: o Acceso a fuentes de datos heterogeneos: relacional (vía jdbc), OLAP, XML, transformaciones

de pentaho data integration. o Capacidad de integración en aplicaciones o portales: jsp, portlet, web service. o Definición modular de informes (distinción entre presentación y consulta)

• Diseño de informes flexible o Entorno de diseño gráfico o Capacidad de uso de templates o Acceso a datos relacionales, OLAP y XML

• Desarrollado para: o Ser embebible o Ser fácil de extender o No consumir muchos recursos o 100% Java: portabilidad, escalabilidad e integración

• Multiplataforma (tanto a nivel de cliente como servidor): mac, linux/unix y Windows

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

10

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

� El workflow de procesos de negocio: Dos son los fundamentos del workflow de procesos de

negocio: el motor de workflow Enhydra Shark y el estándar WPDL, auspiciado por la WorkFlow Management Coalition (WFMC), organismo que declara tener más de 300 empresas asociadas, incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de ellas.

COMMUNITY ó ENTERPRISE? En el contexto Open Source, nos encontramos que la gran mayoría de proveedores tienen una

versión para la comunidad y otra profesional (por ejemplo Pentaho, JasperSoft,Talend, MySQL). ¿En qué consiste? Existe una versión open source comunitaria con un conjunto de funcionalidades bien definidas, acotadas y plenamente operativas. Y una versión profesional que presenta o bien más funcionalidades que la otra versión o bien una versión mejorada de las mismas funcionalidades.

Pentaho soporta la creación de Dashboards, pero sólo la versión profesional presenta un Dashboard Designer Ad-hoc. Dichas funcional sólo pueden ser accedida mediante la adquisición de una subscripción o de soporte.

Versiones disponibles de Pentaho: 1. Pentaho Community Edition: Versión comunitaria, sin costos de licencia, sin

servicios de soporte asociados. Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de Business Intelligence. Aunque Pentaho soló la recomienda para:

� Aficionados al BI � Académicos � Programadores de Software Abierto

Pentaho recomienda la versión EE para entornos empresariales, especialmente cuando el tiempo de inactividad dedicado averiguar cómo instalar, configurar y mantener una solución de inteligencia de negocios son prohibitivamente caro.

Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU General Public License versión 2, con partes bajo el LGPLv2, la Common Public License, y la Licencia Pública de Mozilla.

2. Pentaho Enterprise Edition: Versión empresarial, sin costos de licencia, tiene

asociados servicios de soporte y mantenimiento que se pagan a través de una suscripción anual. Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control.

Comparativa: (extraído de Pentaho BI Suite Enterprise Edition)

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

11

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

12

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Dónde conseguir ayuda?

Community Wiki Home

http://wiki.pentaho.com/display/COM/Community+Wiki+Home

Este wiki contiene la documentación y la información para el Open Source de Pentaho BI Suite Community Edition (CE). La suite incluye ETL, análisis OLAP, los metadatos, la minería de datos, informes, cuadros de mando y una plataforma que le permite crear soluciones complejas a problemas de negocios.

La comunidad Pentaho es un grupo extraordinario de personas con muchos talentos diferentes que se dedica a ofrecer una completa y bien integrada, de alta calidad y una suite de software de Business Intelligence.

Pentaho Community Forums http://forums.pentaho.org/

¿Por qué Pentaho? (extraído de Todo Bi - http://www.cognus.cl) Mejores productos

• Cobertura completa de punta a punta de las necesidades de BI • Calidad sin igual, comunidad extensa y adopción empresarial • Arquitectura moderna, construida sobre estándares y en base a componentes • Servicios de administración

Mejor servicio • Soporte a producción disponible 24x7x365 • Atención a soporte por los verdaderos expertos Pentaho desde la primera llamada • Capacitación y consultoría profesional

Mejor valor • Licencia open source sin costo • Servicio de subscripción y soporte a una fracción de proveedores propietarios

Mejor relación • Completa transparencia • Relación basada 100% en la calidad del soporte al cliente

Herramientas Cliente (extraído de: Introducing the Pentaho BI Suite 3.5 Community Edition) Las herramientas de cliente de Pentaho son:

� Report Designer: una herramienta avanzada de creación de informes. Ofrece mucho más flexibilidad y funcionalidad que las capacidades de informes ad hoc de la consola de usuario Pentaho. (http://reporting.pentaho.org)

� Designer Studio: Una herramienta basada en Eclipse que le permite editar a mano un informe o una view de análisis xaction file. En general, la gente lo utiliza para hacer modificaciones a un informe existente que no se puede añadir con el Diseñador de informes.

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

13

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

� Aggregation Designer: una herramienta gráfica que ayuda a mejorar la eficiencia del cubo Mondrian.

� Metadata Editor: Le permite agregar un capa de metadatos a una fuente de datos existentes.

Normalmente se podría hacer esto de una fuente de datos que desea utilizar para el análisis o la presentación de informes. No es necesario, pero hace más fácil para los usuarios construir consultas para analizar la base de datos.

� Pentaho Data Integration: Herramientas de extracción, transformación y carga (ETL), que

permite a acceder a fuentes de datos y prepararlas para el análisis, la minería de datos, o la presentación de informes.

� Schema Workbench: una herramienta gráfica que le ayuda a crear esquemas ROLAP para el

análisis.

INSTALACION Qué necesitamos descargar? (http://sourceforge.net/projects/pentaho/files/)

� Lo primero que debemos obtener es el BI-Server de Pentaho, su distribución CE (Community Edition).

Si buscamos en www.google.com.ar “sourceforge pentaho” el primer link devuelto no dá la página de dónde bajar el Server. Desde la carpeta “Business Intelligence Server”, bajaremos biserver-ce-3.5.2.stable.zip . Descomprimimos sobre un directorio PENTAHO y tendremos las siguiente estructura de directorio: Pentaho/

administrationconsole/ biserver-ce/

El primero es la consola de administración y el segundo es el servidor BI de Pentaho y contiene la consola de usuario.

� Crear un directorio /pentaho/design-tools � Descargaremos también la última versión estable de las herramientas cliente, no vamos a utilizar

todas pero igual las bajaremos: o Schema Workbench (http://sourceforge.net/projects/mondrian/files/) o Report Designer (http://sourceforge.net/projects/pentaho/files/) o Report Wizard (http://sourceforge.net/projects/pentaho/files/) o Pentaho Design Studio (http://sourceforge.net/projects/pentaho/files/) o Pentaho Metadata (http://sourceforge.net/projects/pentaho/files/) o Data Integration (http://sourceforge.net/projects/pentaho/files/) Tendremos entonces la siguiente estructura de directories:

Pentaho/ administrationconsole/ biserver-ce/

design-tools/ schema-workbench/ report-design/ report-wizard/ design-studio/ pentaho-metada/ data-integration/

� Descargaremos el motor Postgresql 8.4 que usaremos como repositorio de datos. o PostreSQL 8.4.3-1 for windows incluye PGADMIN III

(http://www.enterprisedb.com/products/pgdownload.do) o JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgresql-8.4-701.jdbc3.jar)

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

14

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Para mayor información de download ver: http://wiki.pentaho.com/display/COM/Community+Edition+Downloads Repositorio de la solución Viene por default en un RDBMS, HyperSQL. Para este curso introductorio no lo cambiaremos, pero puede migrase a:

� MySQL 5.x � PostgreSQL 8.x.x � Oracle 10g & 11g

Prashant Raju nos dá un buen aporte con esto: http://www.prashantraju.com/projects/pentaho/

En está página encontramos cómo migrar el repositorio a con los correspondientes script de migración.

Qué deberíamos conocer? (por Prashant Raju) Ésto son algunos paquetes que son útiles en Pentaho BI Server:

� Apache Tomcat (el server que bajamos ahora viene con un tomcat incorporado, pero puede compilarse para JBoss)

o Descripción: El servidor web que provee la plataforma para ser la parte front end de Pentaho BI Server.

o Puerto: 8080 (predeterminado) o URL de acceso: http://localhost:8080/ o Sitio Web: http://www.apache-tomcat.com/

� Hibernate o Descripción: Un paquete Java que ayuda a la base de datos relacional trabajar con

Pentaho. o Sitio Web: http://www.hibernate.org/

� Jetty o Descripción: El servidor web que provee una plataforma para la Consola del

Administrador o Puerto: 8099 (predeterminado) o URL de accesos: http://localhost:8099/ o Sitio Web : http://www.jetty-server.com/

� PostgreSQL o Descripción: El servidor de base de datos que usaremos para trabajar con Pentaho o Puerto: 5432 (predeterminado) o URL de acceso Java: jdbc:postgresql://localhost:5432/pentaho

� Quartz o Descripción: El sistema de calendario de reportes que Pentaho usa. o Sitio Web: http://www.opensymphony.com/quartz/

� Hypersonic: o Descripción: o Sitio Web:

Ver terminología usada en el proyecto Pentaho en http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project

Configuración

• Correo: La plataforma envía mensajes a través del correo usando el SMTP Server. En la mayoría de los casos requiere el “ID” del usuario, contraseña y una dirección de correo válida. Para modificar estas configuraciones la ruta de omisión es:

/pentaho/biserver-ce/pentaho-solutions/system/smtp-email/email_config.xml � Puertos: El servidor tratará de usar el puerto 8080. En la siguiente ruta se ubica el archivo de

configuración de puerto: /pentaho/biserverp-ce/tomcatt/conf/server.xml

� Publicaciones: Herramientas del Cliente Pentaho publicadas en el servidor. Para disponer de las herramientas del cliente (“Report Design Wizard, Cube Design Wizard, etc”) y publicarlas al servidor se requiere de una contraseña.

Para configurar la contraseña edite el siguiente archivo: /pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml

� Despliegue: La instalación de PENTAHO está diseñada para trabajar localmente en http://localhost:8080/pentaho como la URL de base.

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

15

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Para accederlo a través de otra terminal, se requiere configurar el web.xml, ubicado en: /pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF <context-param>

<param-name>base-url</param-name> <param-value>http://myserver.pentaho.org:8080/pentaho</param-value>

</context-param> � JAVA_HOME : con esta distribución de Pentaho viene una JRE. Setear la variable de entorno:

SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre

Start el Business Intelligence Server

Debemos correr el archivo startup.bat localizado en el directorio pentaho/biserver-ce, sinembargo si

se quiere correr cómo un servicio de Windows: � Primero hay que registrar el Tomcat como un servicio.

/pentaho/biserver-ce/tomcat/bin> service.bat install tomcat5 Verá la siguiente salida:

Installing the service 'tomcat5' ... Using CATALINA_HOME: D:\pentaho352\biserver-ce\tomcat Using CATALINA_BASE: D:\pentaho352\biserver-ce\tomcat Using JAVA_HOME: Using JVM: auto The service 'tomcat5' has been installed

. � El servicio sera instalado pero no ha sido iniciado, por lo que debemos iniciar el servicio, desde la

consola de servicios de windows.

En este curso, estamos usando como repositorio de la solución la base por defecto en HyperSonic, por lo que antes de levantar el servicio debemos poner disponible la base corriendo /pentaho/biserver-ce/data/Stara_hypersonic.bat (este se para con stop-hypersonic.bat en el mismo directorio); o bien ponerla también como un servicio.

� Ahora tenemos podemos entrar a la Consola de Usuario ya que tenemos el servidor BI corriendo.

http://localhost:8080/pentaho o si lo configuró para el acceso desde la red http://[nombre o ip del servidor BI]:8080/

� Podremos ver la siguiente pantalla de Bienvenida:

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

16

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Podemos ingresar seleccionar el usuario “joe” del combo con los usuarios para demo, que es el usuario con rol de administrador. La password es “password”. Veremos:

Si elegimos la vista ventana haciendo clic en el ícono indicado, tendremos acceso a los dos directorios de soluciones ejemplos que vienen con Pentaho:

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

17

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Podemos darle un vistazo a los ejemplos y ver que se puede hacer con el producto…

� En este curso iniciaremos el servidor con /pentaho/biserver-ce/start-pentaho.bat y lo pararemos con stop-pentaho.bat

Start de la Consola de Administración

� Tener en cuenta que siempre debe estar corriendo primero el servidor BI. � Ejecutar /pentaho/administration-console/start-pac.bat. Se abrirá una ventana de commandos con la

siguiente salida: � Puede ingresar a la interfase en http://localhost:8099/ o la dirección que especifique en la ventana

anterior. Verá una ventana de login que pedirá usuario y clave; estas son "admin" y "password". Si ingresa verá la siguiente páginaI siguiente:

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

18

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Tomará unos segundos que identifique que el Server está disponible. Podremos ver entonces

haciendo click en Administration, distintas solapas que nos permitirán definir Usuario y Roles, Datasource, ejecutar algunos servicios de mantenimiento y programar estas tarea:

⇒⇒⇒⇒ Creamos un nuevo Datasource para la soluciones que vamos a implementar

1. Agregar JDBC para PostgreSQL a /pentaho/administration-console/jdbc/, ya que nuestro repositorio de datos está en la base “pentaho”, en el servidor de PostgreSQL.

2. En la solapa Database Connections agregamos otro DataSource: Name: SIU Driver Class: elegimos en el combo, org.postgresql.Driver Usuario: dba Password: dba URL: jdbc:postgresql://localhost:5432/pentaho

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

19

INTRODUCCIÓN A PENTAHO BI SUITE 3.5

Antes de hacer el Test de la conección, completar la solapa “Advanced”:

3. La solapa de “Services”, nos servirá para refrescar el repositorio (la cache) y la configuración del sistema.

Lic. Ana Smail - (esta documentación no es de producción propia sino recopilación de la información disponible)

20

INTRODUCCIÓN A PENTAHO BI SUITE 3.5