MINERÍA DE DATOS O DATA MINING

25.08.2019 11:20

Por: Lucy Medina Velandia.    La minería de datos se define tradicionalmente como “un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (Fayyad y otros, 1996). Empresarialmente, la minería de datos la precisa Molina y otros (2001), como “La integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisión”.

Debido a que las bases de datos en las empresas ha crecido exponencialmente y solo se tiene información simple que por lo general no aporta valor agregado a la toma de decisiones, se ha tenido la oportunidad de utilizar esa información valiosa que se encuentra escondida en esos volúmenes de información almacenada en bases de datos, proceso que se realiza a través del Data Mining o minería de datos y es precisamente esa su importancia: la extracción de los datos de forma adecuada, por cuanto se pueden realizar predicciones de tendencias o de comportamientos de productos o servicios. Aplicaciones prácticas de estas predicciones, son, por ejemplo, dar un pronóstico sobre qué segmentos de personas pueden responder a un evento dado, o qué población puede ser el objetivo para vender un producto, o qué producto se consume en una franja de tiempo del día, etc.

Las empresas han almacenado datos por años, sin tener presente que de esta mole puede extraerse una gran cantidad de información oculta y de gran interés estratégico, que servirá a las empresas para que tomen mejores decisiones. Todos estos datos son imperceptibles, es decir, no se extraen con los métodos tradicionales, sino que deben aplicarse técnicas sofisticadas como la Inteligencia artificial, con el objeto de encontrar relaciones, patrones, perfiles y tendencias a través del análisis de los datos, utilizando tecnologías de reconocimiento de patrones, redes neuronales, clustring, clasificación, predicción y otras técnicas avanzadas de análisis de datos de esos volúmenes de información.

Al encontrar patrones en la información oculta, se pueden crear modelos de la realidad; y a través de descubrir el Conocimiento en bases de datos – Knowledge Discovery in Databases - (KDD), que utiliza técnicas comunes de búsqueda de información sobre una base de datos con recursos de la inteligencia artificial a través del procesamiento automático de grandes volúmenes de datos con el objeto de encontrar conocimiento útil en ellos, para permitir a los usuarios aprovechar la información encontrada eficientemente, bien sea preparando los datos hallados para interpretar los resultados o para permitir el uso de forma eficiente al tomar decisiones.

Lo anterior indica que el poder y valor de los datos se encuentra en la informción extraída de los grandes volumenes de información almacenados en bases de datos, que permite a las empresas tomar decisiones a tiempo, mejorar la comprensión de hechos que rodean a una empresa, incrementar ganancias, maximizar la eficiencia operativa, reducir costos y, por supuesto, mejorar la satisfacción de los clientes.

Pero, ¿cómo funciona este proceso? Básicamente, el Data Mining es una tecnología en la cual se toman los volúmenes de información almacenada en bases de datos y por medio de las herramientas de Data Mining en un solo paso barren esas bases de datos y se identifican modelos escondidos, a través de los cuales una empresa puede tomar decisiones, establecer estrategias de crecimiento, elaborar planes de acción que den ventajas competitivas al negocio, entre otros usos. El Data Mining trabaja unido con áreas como la Estadística, la Inteligencia Artificial, la computación gráfica, el procesamiento masivo, claro está, utilizando las bases de datos.

El Data Mining sigue un proceso que consta de tres etapas [2]:

  1. Integración, limpieza y exploración de los datos
  2. Definición de patrones o construcción de modelos
  3. Validación y verificación de los modelos

Cuando se ha terminado el proceso, los modelos pueden detectar fraude en transacciones de tarjetas  de crédito, por ejemplo, y errores al digitar datos, entre otros problemas.

Para terminar este pequeño escrito, se afirma que la Minería de Datos, o Data Mining, es un proceso en el cual se exploran grandes volúmenes de información para descubrir patrones y modelos de comportamiento o relaciones entre diferentes variables, con el objeto de generar conocimiento para tomar decisiones en una empresa o negocio.

Las empresas que practican este tipo de proceso pueden obtener un mayor valor de la información almacenada, lo que les permitirá dirigir todos sus esfuerzos a mejorar cada día más en servicio, respaldados sin duda en los datos almacenados.

En varias empresas se utilizan este tipo de proceso así:

  1. Para detectar fraudes. Empresas de telecomunicaciones, tarjetas de crédito, compañías de seguros.
  2. Para optimizar campañas de marketing, describir y segmentar clientes, predecir la fidelidad de los clientes con cierto producto o empresa.
  3. En la industria del comercio utilizan la Minería de Datos para diseñar y evaluar campañas de Marketing, recomendar o definir las ofertas más apropiadas a cierto tipo de clientes, para predecir riesgos en la asignación de créditos a ciertas personas.
  4. En la medicina, se utiliza la minería de datos para pronosticar cuán efectivos son los procedimientos quirúrgicos, los exámenes médicos o los medicamentos, por ejemplo.

Data Mining permite tomar decisiones y transformar las bases de datos simples de la compañía en la inteligencia de negocios que se puede ejecutar, es decir, ayuda a lograr los objetivos específicos de una compañía.

 Referencias:

[1] Vallejos, S. J. (2006) Minería de Datos. Universidad Nacional del Nordeste, Argentina.

[2] Hernández, O. J. (2010)  Análisis y Extracción de Conocimiento en Sistemas de Información: Datawarehouse y Datamining

[3] Royo J.A. (2009). Data Warehouse and Data Mining. 

https://delfos.bligoo.com/content/view/195902/Data-Warehouse-Data-mart-y-Data-Mining.html. Consultado en marzo de 2011.

[4] Frawley, W. J., Piatetsky-Shapiro, G. y Matheus, C. J. (2008). Knowledge Discovery in Databases: An Overview. https://www.aaai.org/Library/Magazine/vol13.php. Consultado en febrero de 2011.

[5]Pérez, C., Santín D. (2008). Data Mining. Editorial AlfaOmega.

Contacto

Escritos sobre Diversos Temas lunome07@hotmail.com