¿Qué es y cómo funciona el datamining? DicZionario

ok1

El pasado sábado 21 de marzo Twitter cumplía 9 años y a la vez saltaba la noticia: Twitter planea poner a disposición los tuits de los usuarios a los denominados “data miners”, o al datamining en general. Y de ahí surge nuestra pregunta: ¿qué es eso del datamining? A grandes rasgos viene a ser “minería de datos” en español.

Ya sabemos que, sobre todo con la explosión de las redes sociales, cada día generamos, como usuarios, una gran cantidad de información, algunas veces conscientes de que lo hacemos y otras veces inconscientes de ello porque lo desconocemos. Y el datamining está detrás para saber más del usuario. ¿En qué consiste? ¿Qué ejemplos hay? De todo ello hablamos una semana más en una nueva entrega del DicZionario.

Definición del concepto de datamining

Ya sabemos que en el mundo del marketing las bases de datos son muy importantes, ya que permiten ejecutar estrategias para lograr que los clientes sean fieles, e incluso usen, consuman o soliciten más productos de una marca. El problema con el que nos encontramos es con el de la infoxicación, es decir, disponemos de mucha información pero se requiere de efectividad para organizarla. Y con las bases de datos pasa algo parecido.

Por ello, una base de datos efectiva requiere a su vez un gran esfuerzo de organización, y la clave está en tratar de descubrir patrones en grandes volúmenes de conjuntos de datos. Ahí es donde entra en juego el datamining, o “minería de datos”: es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

La idea de datamining no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como data fishing, data mining o data archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido. A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar el concepto. Ahora adquiere especial relieve por la tecnología, pero ya vemos que el concepto como tal tiene varias décadas.

En otras palabras, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

¿Pero cómo se pasa de datos en general a información valiosa? Hay que partir que, grosso modo, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Y en todo ese proceso, desde el dato en bruto hasta las conclusiones de la unión de esos datos está el datamining. ¿Vemos ejemplos en concreto?

Algunos ejemplos

Empecemos por un ejemplo muy sencillo, uno relacionado con la administración empresarial basada en la relación con el cliente. En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas o enviando e-mails, sólo se contacta con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una determinada oferta o promoción.

Otro ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.

Ahora con aplicaciones informáticas todo es relativamente “más sencillo” de controlar. Así, por ejemplo, investigadores de la Universidad de Cambridge han creado una aplicación web que permite identificar la personalidad de los internautas a partir de su comportamiento online. El software, llamado Apply Magic Sauce, elabora un informe psicológico de los usuarios y está destinado tanto a empresas que quieran analizar a sus clientes como a cualquier persona interesada en saber cómo le “ve” internet.

En este sentido, cualquier visita que hagas (y aceptes las cookies), cualquier tweet que compartas, o cualquier “like” que hagas en Facebook puede parecer inocente pero no lo es. Son datos que los usuarios facilitan y, que a su vez, pueden ser utilizados por terceros, tanto en beneficio del propio usuario como en su propio perjuicio, claro está. Por ello, por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. por tanto, la clave esta en la ayuda de “toma de decisiones”, ¿no creéis?

Imagen | Charis Tsevis
En BlogginZenith | COS o contenido personalizado: ¿dónde queda la privacidad del usuario?

En campaña con Zenith
   

Deja un comentario

Tu correo electrónico no se verá en el comentario publicado.

Política de comentarios

Escribe tu comentario para que la comunidad pueda aprovecharlo. Los comentarios que no sean adecuados o se salgan de la temática del blog serán descartados, así como los promocionales, susceptibles de afectar a derechos de terceros, con insultos o de vulnerar las leyes.

Cuando se detecta una infracción de estas normas se podrá editar el comentario o simplemente eliminarlo, pero si la infracción es continuada, se podrá llegar a un bloqueo de la cuenta.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>