Creando un DW
A través de TodoBI he encontrado un artículo muy interesante de Ralph Kimball (¿Algún despistado que no lo conoce?) donde detalla los 12 errores más comunes en la construcción de un datawarehouse.
Se trata de un artículo excelente. Cada vez que he cometido alguno de estos errores, he tenido que rectificar al poco tiempo. No valen los atajos, hay que hacer las cosas bien desde el principio.
Los doce errores más comunes en la construcción de un datawarehouse son:
- Error 12: Incluir atributos de texto en una tabla de hechos, si se hace con la intención de filtrar o agrupar.
- Error 11: Abreviar las descripciones en las tablas de dimensión con la intención de reducir el espacio requerido.
- Error 10: Dividir las jerarquías y los niveles de las jerarquías en múltiples dimensiones.
- Error 9: No afrontar el tratamiento de las dimensiones lentamente cambiantes.
- Error 8: Crear “smart keys” para relacionar una tabla de dimension con una tabla de hechos.
- Error 7: Añadir dimensiones en una tabla de hechos antes de definir su granularidad.
- Error 6: Crear un modelo dimensional para resolver un informe en particular.
- Error 5: Mezclar hechos de diferente granularidad en una misma tabla de hechos.
- Error 4: Olvidarse del máximo nivel de detalle en el modelo entidad-relación.
- Error 3: Omitir las tablas agregadas y comprimir las tablas de dimension para afrontar los problemas de rendimiento.
- Error 2: No unificar los hechos entre distintas tablas de hechos
- Error 1: No compartir dimensiones entre diferentes tablas de hechos.
A mis lectores menos "tekies", os pido perdón porque los próximos mensajes no los escribo pensando en vosotros. Van dirigidos al lado oscuro... :-)
Serie sobre cómo construir un datawarehouse
Finalmente, he terminado de recorrer la lista de Ralph Kimball sobre cómo no construir un datawarehouse. A lo largo de estos artículos he intentado introducir los conceptos más importantes relativos a la modelización de un datawarehouse (base de cualquier entorno Business Intelligence).
Para finalizar esta serie, incluyo el índice de todas las entradas:
Para finalizar esta serie, incluyo el índice de todas las entradas:
- Introducción: Cómo no construir un datawarehouse
- Artículo 1: Datawarehouse
- Artículo 2: Dimensiones
- Artículo 3: Jerarquías
- Artículo 4: Dimensiones lentamente cambiantes
- Artículo 5: Claves subrogadas
- Artículo 6: Tablas de hecho
- Artículo 7: DWH organizado por temas
- Artículo 8: Tablas agregadas
- Artículo 9: Máximo nivel de detalle
- Artículo 10: Rendimiento
- Artículo 11: Unificar los hechos
- Artículo 12: Unificar las dimensiones
- Mistake 12: Place text attributes in a fact table if you mean to use them as the basis of constraining and grouping.
- Mistake 11: Limit the use of verbose descriptive attributes in dimensions to save space.
- Mistake 10: Split hierarchies and hierarchy levels into multiple dimensions.
- Mistake 9: Delay dealing with a slowly changing dimension (SCD).
- Mistake 8: Use smart keys to join a dimension table to a fact table.
- Mistake 7: Add dimensions to a fact table before declaring its grain.
- Mistake 6: Declare that a dimensional model is "based on a specific report."
- Mistake 5: Mix facts of differing grain in the same fact table.
- Mistake 4: Leave lowest-level atomic data in E/R format.
- Mistake 3: Eschew aggregate fact tables and shrunken dimension tables when faced with query performance concerns
- Mistake 2: Fail to conform facts across separate fact tables.
- Mistake 1: Fail to conform dimensions across separate fact tables.
- Error 12: Incluir atributos de texto en una tabla de hechos, si se hace con la intención de filtrar o agrupar.
- Error 11: Abreviar las descripciones en las tablas de dimensión con la intención de reducir el espacio requerido.
- Error 10: Dividir las jerarquías y los niveles de las jerarquías en múltiples dimensiones.
- Error 9: No afrontar el tratamiento de las dimensiones lentamente cambiantes.
- Error 8: Crear "smart keys" para relacionar una tabla de dimension con una tabla de hechos.
- Error 7: Añadir dimensiones en una tabla de hechos antes de definir su granularidad.
- Error 6: Crear un modelo dimensional para resolver un informe en particular.
- Error 5: Mezclar hechos de diferente granularidad en una misma tabla de hechos.
- Error 4: Olvidarse del máximo nivel de detalle en el modelo entidad-relación.
- Error 3: Omitir las tablas agregadas y comprimir las tablas de dimension para afrontar los problemas de rendimiento.
- Error 2: No unificar los hechos entre distintas tablas de hechos
- Error 1: No compartir dimensiones entre diferentes tablas de hechos.
1 comentario:
Did you know you can create short links with OUO and get $$$$ from every click on your shortened urls.
Publicar un comentario