miércoles, julio 01, 2009

La verdad sobre la minería de datos - 1

Tomado de:
http://www.technologyevaluation.com/es/Research/ResearchHighlights/BusinessIntelligence/2009/06/research_notes/es/TU_BI_AM_06_15_09_1.asp

La verdad sobre la minería de datos
Anna Mallikarjunan

Página 1 de 5


La implementación de un sistema de inteligencia empresarial (BI, Business Intelligence) se puede ver desde la perspectiva de dos capas. La primera comprende los reportes estándares, reportes especiales, análisis multidimensionales, tablero de mandos, scorecards y alertas. La segunda capa se encuentra más comúnmente en aquellas organizaciones que han construido y madurado la primera capa. El análisis avanzado de datos por medio de modelos predictivos y pronósticos define esta capa; en otras palabras, la minería de datos.

La minería de datos tiene un alcance y aplicaciones muy amplias. Puede ser utilizada en cualquier situación donde se requiere encontrar conocimiento en vastas cantidades de datos. A través de este articulo, la palabra conocimiento es usada para referirse a patrones significativos derivados de técnicas de minería de datos que pueden estimular los objetivos de una organización, como los ingresos, tráfico del sitio Web, cultivo de campos de información y mejorar los estándares de salud. Los espacios de minería de datos reúnen técnicas estadísticas, el aprendizaje automático o intuitivo de las máquinas (el diseño y desarrollo de algoritmos que permiten a los sistemas aprender y mejorar su propio rendimiento basados en sus propias experiencias); redes de trabajo neutrales (modelos computacionales o matemáticos basados en un sistema nervioso); tecnología de base de datos; tecnología de alto rendimiento (el uso de supercomputadoras o clústeres); análisis de datos espaciales (técnica para estudiar entidades usando su espacio topológico, geométrico o características geométricas), por nombrar algunas. La minería de datos en un área de estudio compleja aún considerada esotérica y difícil de implementar en algunos ambientes BI.

La razón de ser

La minería de datos se refiere al proceso de extracción de patrones escondidos en grandes cantidades de datos. El término minería es con frecuencia utilizado como analogía como en el caso de la minería de oro o de carbón; sin embargo, el producto final de la minería de datos no son los datos, es el conocimiento. La minería de datos se aplica en una gran variedad de situaciones, pero presentamos aquí los escenarios empresariales más comunes en los cuales se presenta como una solución:

* Explotación de datos: Cuando la cantidad de información crece significativamente, solo los modelos estadísticos especializados, pueden ayudar a desenmascarar patrones importantes; en esta situación, los análisis simples y multidimensionales no serán suficientes.

* Comportamiento predictivo: Estas son situaciones donde las organizaciones necesitan predecir el comportamiento de los clientes. Este tipo de análisis permite identificar a los clientes en riesgo de cambiar hacia la competencia. Dentro de una población de animales se puede llevar a cabo modelado de enfermedades basado en información relevante sobre la especie, realizando predicciones y estimando el riesgo de enfermedad.

* Ventas cruzadas: Comúnmente conocido como análisis de la cesta de mercado, la minería de datos puede dar información sobre los patrones de ventas cruzadas. Las tiendas en línea de libros como Amazon.com, usan esta técnica para sugerir libros relacionados con el que se está buscando o comprando.

* Formaciones taxonómicas: La minería de datos puede ser aplicada en situaciones donde los datos de entrenamiento (los datos usados para entrenar el modelo de minería) están perdiendo algún tipo de etiqueta. Las etiquetas se usan para conceptualizar datos. Por ejemplo, en el análisis que examina las relaciones entre las ventas y las temporadas, estas últimas pueden ser categorizadas como primavera, verano, etc. El clustering o la segmentación es el proceso de particionamiento de datos en clases o incluso en jerarquías de clases, para los cuales los miembros de un grupo tienen características similares.

* Pronósticos: Para estimar valores futuros de entidades, se debe aplicar técnicas de pronósticos. Por ejemplo, pronosticando la demanda futura de sus productos, un fabricante puede planear su producción.


No hay comentarios: