¿Qué es y cómo funciona el “Dark Data”? DicZionario

El big data ha revolucionado la manera en que las empresas se acercan a sus clientes. El conocimiento e información que generan todos esos datos resulta primordial para ejecutar las diferentes estrategias.

Pero, ¿se están analizando todos los datos? El dark data es un interesante concepto que nos habla de la importancia de la información que no se está tratando. Y de cómo ésta podría aportar interesantes soluciones que no se contemplan. Hoy, en nuestro DicZionario, hablamos del dark data.

Definición de dark data

La consultora Gartner fue de las primeras en aportar luz sobre una realidad que, para muchos, estaba pasando desapercibida. Se trata del dark data, al que define así: “aquellos activos de información que una organización recoge, procesa y almacena durante sus actividades de negocio, pero que no llega a poner en valor ni explotar“.

Sabemos qué es el big data y su importancia. Por ello, también cobra gran repercusión el dark data. Nos estamos refiriendo a todos los datos e informaciones que aportan los consumidores y/o usuarios a través de sus experiencias con la marca, con un producto, en su relaciones personales, laborales… La información que, en definitiva, es plasmada y captada por las herramientas digitales y tecnológicas, pero que  es pasada por algo y nunca llega a analizarse.

Un estudio de IBM revela que el 80% de los datos que se almacenan a través de las herramientas de big data no se utilizan. Ése es el dark data, una acumulación de información que no consigue ser rentabilizada. A pesar de que su captación se presume como una actividad fundamental en el marketing de hoy en dia.

Si lo pensamos, cualquier movimiento que hacemos en Internet genera información. Aunque parezca insignificante, cada vez hay más empresas que se están dando cuenta de que son datos sobre las personas y sus actividades. Si fuéramos capaces de combinarlos con otros, de procesarlos y analizarlos, seguramente se podría encontrar un gran fuente de valor que ahora mismo está siendo desaprovechada.

El dark data está condicionado por sus peculiares características. Por un lado, tenemos su rápido crecimiento. Los datos y la información se generan en cada interacción del individuo. Por ejemplo, se prevé que, en 2019, la información que generen los dispositivos del Internet de las Cosas llegue a ser 269 veces mayor que la que se da entre centros de datos. Así pues, también hay cierta dificultad en almacenar todos y cada uno de esos registros, pues requiere de una inversión económica que quizá después no se vea devuelta.

Además, hemos de contar con las dificultades para clasificarlos. Cualquier información que se genera, si después no es procesada, corre el riesgo de convertirse en dark data. Y con cualquier información nos referimos a un amplio margen que incluye vídeo, audio, imágenes, textos, animaciones, documentos… Diferentes naturalezas que nos llegan de diferentes fuentes, las más diversas. O, mejor dicho, todas las que existen en el mundo de Internet. Desde un comentario en redes sociales a la descarga de una app. Desde un click a un vídeo a una publicación en un blog.

Isaac Sacolick, de la empresa Star CIO, realiza una clasificación del dark data en tres tipos:

  • Datos que tiene la empresa y que están en un formato accesible que no han sido usados.
  • Información que tiene la empresa, pero que se encuentran en formatos difíciles de procesar.
  • Datos que no son capturados por la empresa o están fuera de su poder de maniobra.

En torno al dark data existen multitud de opiniones diversas, no todos los expertos están de acuerdo en su posible utilidad y aprovechamiento. De hecho, uno de los grandes retos del dark data está en determinar cuál es el valor real de los datos que se están almacenando. Al desconocer ese valor, las empresas no los analizan, pues hacerlo supone una inversión económica de la que no saben qué resultado pueden obtener. Pero, por otro lado, tampoco los descartan, pues saben que pueden estar perdiendo datos importantes. Al final, resulta una realidad complicada de manejar pues lo que impera es la necesidad de saber con qué tipo de información se está tratando. Y ello mismo es difícil de clarificar. Se hacen necesarias herramientas específicas que clasifiquen y analicen esta información.

Por otro lado, no podemos dejar de mencionar los peligros que muchos relacionan con el uso del dark data. Muchos de esos datos son de perfil privado, por lo que existe una legislación que protege a los usuarios e impide que la empresa pueda usarlos. Además, si hubiera una fuga de información y esos datos salieran a la luz, la imagen de la empresa se vería muy perjudicada. Garantizar la seguridad es vital. Ello nos lleva al tercer inconveniente y gran problema. Se trata de la necesidad de invertir una suma de dinero en ese almacenamiento y esa seguridad. Pero, si después, no somos capaces de analizar esos datos, ¿qué sucede con la inversión realizada?

Algunos ejemplos

Como hemos venido explicando, el dark data puede generarse en cada uno de nuestros pasos por la red. Archivos de registro de un servidor, datos de geolocalización, registros de sensores, correos electrónicos, información de antiguos empleados, datos de encuestas sin procesar… Todo ello son ejemplos de dark data que podría resultar muy útil para las empresas.

Y no sólo hablamos de la información que se genera de manera online. Las actividades offline también son fundamentales. Así, las llamadas telefónicas que realiza un cliente o las grabaciones de una cámara dentro de un comercio o un establecimiento, también podrían ser analizadas y escrutadas para conseguir información sobre el comportamiento de esos usuarios.

IBM es una de las empresas que está trabajando firmemente para exprimir aquellos datos que estamos obviando del big data. En abril del año pasado, presentaba una herramienta para desentrañar la compleja realidad del dark data. Se llama Watson y es un instrumento de inteligencia artificial que trabaja en la IBM Cloud.

Abast es otra compañía que está dando especial relevancia al análisis y estudio del dark data. La empresa explica cómo trabaja con esos datos para convertirlos en información útil y rentable para las marcas. En primer lugar, se requiere un tratamiento previo que identifique y filtre la información valiosa. En segundo lugar, aplica soluciones de Bussinnes Intelligence para analizar correctamente esos datos.

Otro de los nombres que está tratando de aportar soluciones para el entendimiento del dark data es Datumize. Sus responsables explican que la tecnología que emplean es única en el mundo de las empresas. Recuperar datos en todo tipo de situaciones y circunstancias, para lo que estarían empleando técnicas como las usadas en servicios de inteligencia. Todo con la idea de que las empresas para las que trabajan puedan después usar esos datos, es decir, monetizarlos. En particular, están en contacto con compañías de turismo, automoción, logística o comercio electrónico.

El uso del big data ha representado un salto cualitativo para conocer mejor al consumidor y llegar hasta él a través de sus deseos y necesidades. Ahora, el dark data puede convertirse también en un instrumento muy importante. Y lleno de posibilidades, no sólo empresariales, sino también políticas. Así nos lo enseña el caso de Cambridge Analytica. La empresa dice contar con los perfiles psicológicos de más de 200 millones de votantes norteamericanos. Unos datos que habría utilizado Trump en la campaña electoral que le convirtió en presidente de los Estados Unidos.

El dark data es toda esa información que no se procesa ni analiza. Su amplitud de formatos, su ubicuidad y un volumen que crece día a día puede hacer difícil su análisis. Pero, por otro lado, se trata de datos útiles que las empresas pueden estar perdiendo para conocer mejor a quienes han de dirigirse.

Imagen | Pixabay

En BlogginZenith | ¿Qué es y cómo funciona el “consumidor healthcare”? DicZionario

En campaña con Zenith

Un comentario

  1. Estas medidas ofrecen un buen paso en un desafío que muchas organizaciones enfrentan hoy en sus esfuerzos analíticos: descubrimiento, aprovechamiento y uso positivo de “datos oscuros”, es decir, datos que residen en la organización, pero que no se utilizan con eficacia o, en algunos casos en lo absoluto.

    Ejemplos de dark data pueden incluir archivos de audio de conversaciones con clientes, correos electrónicos de reclamaciones, mensajes de chat, datos capturados en transacciones bancarias, información de campañas de marketing digital, datos de clics de correo electrónico, etc. La aplicación de un buen manejo de dato, le daré a su empresa mejores posibilidades de crecimiento.

    “Las pulseras para eventos son una manera de llegar a más usuarios”.

   

Deja un comentario

Tu correo electrónico no se verá en el comentario publicado.

Política de comentarios

Escribe tu comentario para que la comunidad pueda aprovecharlo. Los comentarios que no sean adecuados o se salgan de la temática del blog serán descartados, así como los promocionales, susceptibles de afectar a derechos de terceros, con insultos o de vulnerar las leyes.

Cuando se detecta una infracción de estas normas se podrá editar el comentario o simplemente eliminarlo, pero si la infracción es continuada, se podrá llegar a un bloqueo de la cuenta.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>