PENTAHO
Pentaho es una plataforma de Business
Intelligence (BI) orientada a la solución y
centrada en procesos que incluye los
componentes requeridos para implementar
soluciones basadas en procesos
como minería de datos, ETL, generación de
informes…
Actualmente, muchas empresas utilizan
Pentaho como herramienta BI para la mejora de la capacidad de análisis y de toma de
decisiones, puesto que ofrece soluciones que se componen fundamentalmente de una
infraestructura de herramientas de análisis e informes integrado con un motor
de workflow de procesos de negocio.
Pentaho BI es una herramienta imprescindible para la toma de decisiones empresariales
gracias a su poderoso motor de análisis. Con la suite de Pentaho BI podremos generar
multitud de informes en cualquier formato: dinámicos, adhoc, guiados, predefinidos
etc.…
Estos informes pueden ser de gran ayuda, por ejemplo, a la hora presentar reportes
mensuales de ventas, lo que sería un informe estático al uso. Un escalón más allá
tendríamos los informes dinámicos que nos permitirán interactuar con dicha
información y analizar dicha información en detalle.
Básicamente, si te planteas porque tu organización debería utilizar un software como
Pentaho BI, aquí te damos unas buenas razones:
Mayor accesibilidad a la información corporativa: Gracias a Pentaho Data
Integration (PDI ó Kettle) tendremos contenidos más accesibles, comprensibles
y navegables. Lo que mejorará la productividad de la empresa.
Aporta una seguridad extra a la información de la empresa: Con Pentaho BI
podremos controlar el acceso a la información mediante la asignación de roles y
además, podremos saber quién hace uso de los datos y de qué datos
exactamente.
Es la base para la toma de decisiones: La ordenación de toda la información y
los datos recogidos, además de la correcta presentación de los mismos para su
posterior análisis, nos permitirá, como ya hemos indicado, tomar las decisiones
de manera más acertada
Qué productos dispone Pentaho
Pentaho cuenta con diferentes productos, que podemos encontrar en el Pentaho
marketplace, de los cuales destacamos los siguientes:
Pentaho Reporting: Se trata de una herramienta que genera informes de forma
programática usando archivos XML.
Pentaho Dashboard: Esta plataforma será donde podremos ver todos los datos
en forma de informe, gráficos, etc.
Pentaho Data Mining: Esta suite aplica el machine learning y el data mining
para apoyar las tareas de análisis descriptivo.
Pentaho para Apache Hadoop: Se trata de un conector para facilitar el acceso
a los grandes volúmenes que maneja el proyecto Apache Hadoop.
Pentaho Analysis Services: Se utiliza para realizar análisis y especificaciones
de la interfaz. Compatible con MDX y el lenguaje de conducta XML.
Qué componentes tiene Pentaho
Pentaho cuenta con diferentes componentes o módulos con distintas funcionalidades.
Dentro de los componentes más importantes, caben destacar los siguientes:
Pentaho Business Analytics Platform (BA): Se considera el núcleo de
Pentaho, esto es la plataforma web que aloja tanto contenido generado en la
propia web como ficheros publicados al servidor desde aplicaciones de
escritorio.
Pentaho Data Integration (PDI): También conocido como Kettle, es la
herramienta ETL de Pentaho. Como su propio nombre indica (Extract,
Transform, Load), nos permitirá la extracción de datos de diferentes fuentes,
transformar dichos datos y cargarlos en diferentes destinos. Pentaho data
integration (PDI) tiene un papel fundamental a la hora de desarrollar el proyecto
ya que podemos, instalando un plug-in, extraer datos de diferentes fuentes, como
MongoDB y procesarlos con Hadoop y MapReduce.
Pentaho Report Designer: Es la herramienta que nos ayuda a configurar de
forma rápida una fuente de datos y genera informes.
Pentaho ofrece una edición empresarial y comunitaria del software, pero en general, las
características de ambas opciones son las siguientes:
Plataforma 100% J2EE: Que asegura las escalabilidad, integración y
portabilidad.
Servidor: Puede correr en servidores compatibles con J2EE como JBOSS AS,
WebSphere, WebLogic, etc.
Base de datos: vía JDBC, IBM DB2, Microsoft SQL server MySQL, Oracle, etc.
Sistema operativo: No hay dependencia. Lenguaje interpretado.
Lenguaje de programación: Java, JavaScript , JSP, XSL.
Interfaz de desarrollo: Java SWT, Eclipse, Web-base.
Repositorio de datos: Basado en XML.
Todos los componentes están expuestos vía web services para facilitar la
integración con Arquitecturas orientadas a servicios (SOA).
Ventajas y Desventajas de utilizar Pentaho
Como cualquier otro software, Pentaho tiene grandes ventajas y algunas desventajas.
Deberemos poner ambas sobre la balanza a la hora de implementar, o no, dicha
herramienta.
Comencemos por las ventajas:
o Open Source: No habrá que comprar ninguna licencia para empezar a
utilizarlo.
o Multiplataforma: Se puede usar en cualquier plataforma, ya sea
Microsoft, Mac, Linux...
o Tecnología estándar: Usa java, XML o Javascript.
o Los entornos de desarrollo son básicos, en todas las herramientas de la
aplicación.
o Instalación y configuración muy sencilla.
o Al ser open source, se trata de una solución flexible con la que podremos
crear nuevas funcionalidades o módulos, para adaptar al máximo la
herramienta a las necesidades de la empresa.
o Su motor de Data mining y el servidor OLAP son muy poderosos.
o Gran comunidad de Pentaho: De manera altruista, la comunidad de
Pentaho realizará pruebas de tu proyecto en busca de posibles fallos y
errores, antes de lanzar la aplicación.
¿Y las desventajas?
Las desventajas de Pentaho BI son más a nivel desarrollo que a nivel de
usuario/consumidor del software. La documentación oficial es limitada, por lo que esto
puede llegar a dificultar en algún punto el despliegue de la solución. Pero, como hemos
comentado, la comunidad de Pentaho es muy grande y podrás encontrar información no
oficial fácilmente, o pedir apoyo a otros desarrolladores de la herramienta.
Uno de los principales inconvenientes de Pentaho es que las herramientas que forman
parte de la suite fueron desarrolladas por separado lo que quiere decir que los
desarrolladores usan diferentes metodologías para poder hacer las mismas acciones pero
con distintas herramientas.
Por otra parte, no hay demasiada documentación fiable; solo dispone de un manual de
usuario básico en el que no se detallan muchos conceptos, lo que dificulta el desarrollo
y despliegue de la solución.