Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” y “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basadas en procesos y ha sido concebida desde el principio para estar basada en procesos.
Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrado con un motor de workflow de procesos de negocio. La plataforma será capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades así mismo de presentar y entregar la información adecuada en el momento adecuado.
Su modelo de ingresos parece estar orientado a los servicios (soporte, formación, consultoría y soporte a ISVs y distribuciones OEM) aunque en alguno de los documentos y páginas que hemos examinado aparece mencionado algunas funcionalidades “Premium” que hacen pensar en ingresos por futuras versiones o funcionalidades de pago.
En su web presenta una organización por productos:
Reporting,
Análisis,
Dahsboards y
Data Mining, acompañado por dos introducciones:
a la plataforma y
a los productos. En dichas introducciones se hace mención específica al workflow como una de las capacidades BI claves de la plataforma.
Presentando y entregando la información.
Pentaho está construído en torno al
servidor de aplicaciones J2EE JBoss y
Jboss Portal (
en quien parece que estaban interesados BEA y Oracle), antes de ser
adquirida por Red Hat, habilitando que toda la información sea accesible mediante un browser en la intranet de la empresa.
Pentaho presenta informes en los formatos habituales (html, excel, pdf...) mediante
JfreeReport,
proyecto incorporado recientemente a Pentaho junto con su responsable Thomas Morgner, u otras plataformas como BIRT o
JasperReports. Para la generación de PDFs utilizan, como podría ser previsible, el muy conocido
Apache FOP. Asi mismo incorpora la librería
JPivot, gracias a la cual podemos ver tablas OLAP a través de un browser y realizar las aplicaciones típicas de análisis OLAP (drill down, slice and dice...).
Recientemente se anunció Pentaho Report Design Wizard, una herramienta de diseño de informes, que facilita el trabajo con JfreeReport y supera sus limitaciones. Suponemos que algo tiene que ver JFreeDesigner, el diseñador de informes para JFreeReport de jfree.org, ya que Thomas Morgner es también el responsable de
JFreeDesigner.
Los dashboards son un desarrollo propio de Pentaho. Recogen información de todos los componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y páginas web. Incluyen gestión y filtrado del contenido, seguridad basada en roles y drill down. Pueden ser integrados en terceras aplicaciones, en portales o dentro de la plataforma Pentaho.
Para generar gráficos se apoyan en
JFreeChart, una librería para generar los gráficos más comunes (2D, 3D, barras, líneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos, exportación a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes.
Los
WebServices son una característica fundamental de Pentaho. Las acciones, que son las tareas más sencillas que constituyen una solución de Pentaho, pueden publicarse como WebServices. Pentaho utiliza como motor de WebServices
Apache Axis, quedando los servicios descritos en el lenguaje de definición de servicios web
WSDL.
Para entregar la información Pentaho se apoya en una infraestructura
JMS para enviar correos electrónicos y
Quartz, un scheduler opensource integrable en aplicaciones J2EE (de hecho necesita ser instanciado). También está anunciado un feed RSS propio, para posicionarse en el desktop.
La solución BI
El workflow de procesos de negocio.
Dos son los fundamentos del workflow de procesos de negocio:
el motor de workflow Enhydra Shark y el estándar
WPDL, auspiciado por la
WorkFlow Management Coalition (WFMC), organismo que declara tener más de 300 empresas asociadas, incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de ellas. Dentro del proyecto Enhydra podemos encontrar también
Enhydra JaWE, un editor de workflow XPDL, según las especificaciones de WfMC.
El servidor OLAP.
Para obtener la funcionalidad de procesamiento analítico en línea (OLAP) se utilizan otras dos aplicaciones: el
servidor OLAP Mondrian, que combinado con
Jpivot, permiten realizar querys a Datamarts, que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones típicas.
Algunas cuestiones interesantes sobre Mondrian:
- Mondrian utiliza MDX como lenguaje de consulta, que no tendría nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft.
-
En noviembre de 2005 Mondrian se incorporó al proyecto Pentaho, incluyendo a su fundador Julian Hyde.
- Mondrian funciona sobre las bases de datos estándar del mercado: Oracle, DB2, SQL-Server, MySQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho.
- JPivot está considerado con un “proyecto hermano” de Mondrian. Al incorporarse Mondrian también lo ha hecho JPivot.
Data Mining.
Por supuesto, qué sería de una aplicación de BI sin Data Mining?. Para tal fin, Pentaho está incorporando la tecnología
WeKa. Decimos está incorporando, porque en la actualidad
el roadmap de Pentaho indica que están en ello. Weka es una herramienta extensible e integrable que incluye herramientas para realizar transformaciones sobre los datos, tareas de clasificación, regresión, clustering, asociación y visualización.
Aquí, puede encontrarse un manual en español.
ETL
Se trata de la más reciente adquisición, como
indicábamos hace unos días.
Kettle es un proyecto belga que incluye un conjunto de herramientas para realizar ETL. Uno de sus objetivos es que el proyecto ETL sea fácil de generar, mantener y desplegar.