sábado, octubre 15, 2011

Pentaho- Herramienta ETL - Kettle - Spoon)

Tomado de: Carga de Datos con Kettle

Transformación grafica ETL con Spoon – un componente de Pentaho Data Integration (Kettle)


En la primera lección del Kettle ETL tutorial vamos a usar la aplicación Spoon (un componente de Pentaho Data Integration) para crear unas transformaciones simples de ejemplo y mostrar que fácil es usar y diseñar los módulos de Kettle.
La transformación de este ejemplo leerá datos de una tabla Oracle, filtrara los datos y creara dos ficheros de texto donde los datos estarán escritos según los criterios introducidos.

En cuanto el Spoon este instalado correctamente, después de ejecutarlo aparece una ventana donde hay que elegir un repositorio. Un Repositorio es un sitio donde todos los objetos de Kettle están guardados, en nuestro caso los objetos están en una base de datos Oracle.
Si no tenemos ningún repositorio disponible, desde aquí se puede crear uno nuevo y así haremos en esta guía.

Para crear un nuevo repositorio haga clic en ‘New’ y rellena los parámetros de conexión (ventana ‘Connection information’).
En esta pantalla hay algunas opciones muy útiles, cómo ‘Test’ que permite comprobar si la conexión funciona correctamente y ‘Explore’ que da posibilidad ver y explorar los objetos y el esquema de la base de datos.
Al pulsar el boton ‘Create or Upgrade’ un nuevo repositorio esta creado en la ubicación indicada con un usuario administrador con el login admin y la contraseña admin. Se recomienda cambiar la contraseña después de logear por la primera vez.


Conexión entre Spoon y Oracle:
Conexión entre Spoon y Oracle


Si la conexión con un repositorio esta establecida, debemos ver el menú principal de la aplicación Spoon.
Para diseñar una nueva transformación que realizara el flujo de datos descrito antes, hay que seguir estos pasos:

No hay comentarios: