MANAGEMENT
El Impacto de la Inteligencia de Negocios...
MANAGEMENT
OLAP: Información Multidimensional del Negocio...
MANAGEMENT
KPI: Midiendo el Desempeño del Negocio ...
MANAGEMENT
El Valor Estratégico de la Calidad de los Datos...
MANAGEMENT
BRMS: Reglas Más Sintonizadas con el Negocio...
MANAGEMENT
CDI: Resolviendo la Integración de Datos del Cliente...
MANAGEMENT
La mejor decisión se llama DSS...
MANAGEMENT
La Era de la “Empresa Predictiva”...
MANAGEMENT
EDM: Automatizando las Decisiones de Negocios...
MANAGEMENT
DASHBOARDS: Vigilando la Marcha del Negocio ...
MANAGEMENT
BPEL: Integrando procesos de negocios sin límites ...
MANAGEMENT
BAM: Una Mirada al Negocio en Tiempo Real...
Ver Todas  


DATA MINING:
BUSCANDO UN TESORO OCULTO ENTRE SUS DATOS

Con amplias aplicaciones en todo tipo de empresas, la minería de datos contribuye a capitalizar el inmenso volumen de datos que acumulan día a día las organizaciones, convirtiéndolo en una fuente para descubrir información no evidente u oculta y potencialmente útil para la toma de decisiones.

La disminución de los costos y el aumento de las capacidades de los sistemas de almacenamiento, brindan a las organizaciones la oportunidad de contar con un completo registro de sus transacciones con clientes y partners y aumentar día a día sus repositorios de datos.

Sin embargo, si no se utilizan las herramientas adecuadas, los análisis serán conducidos y arribarán sólo a conclusiones generadas por presunciones y relaciones pre-establecidas, es decir, no se logrará obtener información oculta y desconocida previamente. Esa es precisamente la promesa del Data Mining o minería de datos, una tecnología orientada a descubrir información nueva desde los inmensos almacenes de datos de las organizaciones.

Definiendo la Minería de Datos

El Data Mining es una técnica para obtener información desde grandes volúmenes de datos, proceso que se conoce como KDD (Knowledge Discovery in Databases o Descubrimiento de Conocimiento en las Bases de Datos) y que parte con la preparación de los datos, sigue con la extracción de información y concluye con la interpretación de los resultados obtenidos.

Las herramientas de minería de datos empleadas en el proceso de KDD se pueden clasificar en dos grandes grupos: técnicas de verificación (en las que se prueban hipótesis del usuario) y métodos de descubrimiento (búsqueda de patrones, incluyendo las técnicas de predicción).

Considerando lo anterior, en términos más específicos, Data Mining es "la extracción de información a partir de los datos de una organización, desconocida y potencialmente útil para la gestión del negocio". Esto significa que no es una simple herramienta para establecer asociaciones estadísticas, sino una tecnología que -basada en datos del pasado y el presente- es fundamentalmente prospectiva, es decir, descubre factores y asociaciones antes desconocidas, llegando incluso a ser predictiva.

Del Dato a la Información Para explotar los datos en una organización se requiere previamente estructurarlos en forma coherente. Un primer paso es contar con un Data Warehouse o Almacén de Datos. Se trata de una técnica para consolidar y gestionar los datos provenientes desde distintas fuentes con la finalidad de proveer información oportuna a quienes corresponda, siendo uno de los sistemas de apoyo a la decisión (DSS - Decision Support Systems) más conocidos.

Al mismo tiempo, a veces se requiere desarrollar también varios Data Marts, es decir, almacenes o "cubos" de datos más pequeños respecto del Data Warehouse y que responden a las necesidades específicas de un área de la organización.

Asimismo, junto al almacén de datos, las herramientas de análisis multidimensional conocidas como OLAP (On-Line Analytical Processing) constituyen un segundo elemento importante en los sistemas DSS. Con ellas se facilita el manejo del Data Warehouse y se puede correlacionar los datos.

Sin embargo, el análisis OLAP aunque permite responder consultas complejas, sigue dependiendo del usuario para definir las relaciones, es decir, puede ratificar información, pero no descubrir información oculta o desconocida.

Tras las Huellas del Cliente

El Data Mining representa un nuevo paso en los sistemas DSS, en tanto lleva más allá el análisis, aunque sin llegar a reemplazar a los sistemas OLAP, puesto que deben entenderse como un complemento. De esta forma, pueden descubrir relaciones desconocidas e hipótesis novedosas para optimizar la gestión del negocio ya que, a diferencia de dichos sistemas -que usan lógica de razonamiento deductiva-, el Data Mining es esencialmente inductivo.

Por otra parte, y ya pensando en las transacciones de los clientes por Internet, existe el Web Mining que consiste en la aplicación de técnicas de Data Mining en la Web con la finalidad de descubrir información potencialmente útil. La minería de la Web se clasifica, en términos amplios, en Web Content Mining, Web Structure Mining y Web Usage Mining. En este último caso, que es el más importante, se descubren y analizan los modelos de acceso de usuarios en Internet, a través de la extracción de patrones e información implícita en sus comportamientos al navegar.

También existe el "Text Mining", que apunta a examinar los documentos de la organización, los cuales, en su mayoría están en formato de texto.

El Proceso de Data Mining

Un proceso de Data Mining requiere como primera fase el filtrado de los datos con la finalidad de depurarlos, eliminar valores incorrectos y no válidos, obtener muestras, o bien, reducir el número de valores posibles.

Posteriormente, se efectúa una selección de variables. Esto consiste en seleccionar ciertas características (atributos) o las variables más significativas.

Enseguida viene la fase de extracción del conocimiento a través de un modelo que representa patrones o relaciones de asociación. Una vez que se extrae el conocimiento, se procede a validarlas y establecer las conclusiones respectivas. En esta fase se verifica si los resultados obtenidos son coherentes y se comparan con los análisis estadísticos y de visualización gráfica.

Algunas de las técnicas más conocidas y utilizadas en la minería de datos son las siguientes:

Redes Neuronales Artificiales:

Modelos predecibles, no lineales, que aprenden a través del entrenamiento.

Árboles de Decisión:

Estructuras de forma de árbol que representan conjuntos de decisiones. Dichas decisiones generan reglas para la clasificación de un conjunto de datos.

Redes Bayesianas:

Se usan fundamentalmente para realizar predicciones y se orientan a determinar relaciones causales que expliquen un fenómeno según los datos presentes en una base de datos. Se trata de un método usado generalmente en sistemas de diagnóstico.

Algoritmos Genéticos:

Se trata de técnicas de optimización que utilizan procesos como combinaciones genéticas y de selección natural en un diseño basado en los conceptos de evolución.

Aplicaciones de Data Mining

El Data Mining se utiliza actualmente tanto en empresas, con finalidades relacionadas con la gestión de negocios, como en organizaciones públicas, con objetivos que vayan en beneficio de la sociedad.

Entre otras aplicaciones, la minería de datos destaca por su uso en marketing e iniciativas de CRM (Customer Relationship Management), como, por ejemplo, en la identificación de clientes que eventualmente pudieran interesarse en una oferta específica. También se utiliza en técnicas de venta para realizar "cross selling"o para determinar el mejor mix de productos y su óptima distribución espacial en los locales de venta de las grandes tiendas.

En ese sentido, esta tecnología permite establecer perfiles muy bien definidos de los clientes así como registrar las tendencias en sus deserciones con la finalidad de prevenirlas y buscar su fidelización, a partir del conocimiento profundo de sus inclinaciones y necesidades.

El Data Mining se conoce por su uso para el análisis de riesgo en operaciones financieras e inversiones, lo cual también puede hacerse con los clientes de un banco para decidir la aprobación o negación de un crédito o para determinar el monto apropiado para cada uno de ellos.

Esta aplicación es utilizada también en investigaciones científicas, por ejemplo, en la medicina, para analizar un tratamiento en el tiempo, o bien en meteorología, para predecir el estado del tiempo o los niveles de polución en ciudades o zonas geográficas.

Sin embargo, uno de las aplicaciones más reconocidas es la detección de fraudes. Gracias a esta tecnología analítica es posible detectar patrones de comportamientos anómalos de clientes de bancos, acciones inusuales en el pago de impuestos u otras operaciones similares, lo cual permite detectar a tiempo acciones fraudulentas.

Por último, en el ámbito de la manufactura y la industria, la minería de datos permite diagnosticar eventuales fallas.

En todos los casos mencionados, se trata de analizar un alto volumen de datos y obtener información que de cualquier otra manera sería imposible lograr debido al tiempo que tomaría su revisión completa.

El Data Mining posee un gran ROI (Retorno sobre la Inversión) ya que ahorra mucho dinero a las empresas y les ayuda a descubrir nuevas oportunidades de negocios, mientras contribuye a que la alta dirección pueda tomar mejores decisiones, a partir de modelos descriptivos y predictivos que establecen relaciones no conocidas previamente y que ofrecen una visión global de la gestión de la organización, teniendo un impacto muy positivo en los resultados finales.