El dark data todavía es un desconocido para el gran público. ¿Qué son estos datos oscuros? “Aquellos que existen en las empresas, pero que no se están utilizando por razones de coste, complejidad o riesgo en la adquisición”, explica Nacho Lafuente, consejero delegado de Datumize. Especificando un poco más, Jorge Fernández, mánager de Thinkalia –división de la empresa G2–, aclara que se trata de “datos volátiles o perecederos que no han sido explícitamente recolectados por la organización ni procesados adecuadamente por su difícil acceso en el tiempo, por el coste o por no tener el formato adecuado”. Por ejemplo, los cambios registrados en la negociación de un pedido desde la oferta inicial hasta que se concreta la compra, variaciones en el funcionamiento de máquinas, movimientos de mercancía en el almacén, productos no encontrados en búsquedas en e-commerce o servicios web…
“Cuando ese dato oscuro se ilumina, deja de ser dark data y pasa a ser parte del proceso de negocio, por lo que debemos tener un proceso continuo de búsqueda de información hasta debajo de las piedras”, declara Fernández. Quizá la mejor forma de entender en qué consiste el dark data es su contraposición frente al big data.
‘Dark data’ frente a ‘big data’
“El problema inherente al big data radica en las llamadas tres V: volumen, velocidad y variedad. Es decir, el gran volumen de datos que nos llega, la velocidad y frecuencia constante a la que lo hace, y la variedad en el formato y contenido de estos datos.
En cambio, el problema inherente al dark data es la inaccesibilidad de los datos y la dificultad para registrarlos y tratarlos”, comenta el mánager de Thinkalia. “El dark data es un estado donde la organización sabe que una transacción pasó, pero no sabe qué sucedió a su alrededor”, matiza.
A su vez, Lafuente explica que “la dificultad principal del big data es el análisis de un volumen grande de datos, la rapidez en el análisis y la selección de los datos, mientras que en el dark data la complejidad radica en la identificación y recolección de esos datos”. Para Fernández, “el big data aporta esencialmente información de clientes, proveedores, competencia actual y futura, y productos sustitutivos. Su análisis permite identificar cómo nuestra organización se relaciona con la cadena de valor externa. Sin embargo, en dark data los objetos de análisis son los procesos de negocio de la empresa. Se trata de hacer accesible y analizable la información que generamos en los procesos de la cadena de valor interna”.
Otra diferencia sustancial es la envergadura de los proyectos y los costes de implementación de una u otra tecnología. “El coste de abordar un proyecto de big data es elevado. Es como intentar construir una nave espacial. Te enfrentas a problemas desconocidos con tecnología insuficiente. Y la identificación y generación de dicha información puede tener un coste considerable. En cambio, el coste de un proyecto dark data es relativamente bajo, pues la dificultad radica en encontrar los datos. Equivale a cavar un gran hoyo con un pico y una pala. Va a costar, pero sabemos que el dato está allí. Sólo hay que encontrarlo”, afirma el responsable de Thinkalia.
Dos maneras de aproximarse
Hay dos formas de acercarse a los datos oscuros. Por un lado, la empresa puede explotar aquellos que ya están registrados en sus sistemas. “Puede que el 60%-70% de los datos que se pueden utilizar en dark data ya estén recolectados de una u otra manera y se estén desperdiciando. Se trata de cambiar los procedimientos en los sistemas de información para activar esos datos, capturarlos y darlos a conocer dentro de la compañía”, indica Fernández. En este caso, puede que la compañía únicamente necesite un servicio de consultoría para identificar los datos susceptibles de ser rescatados y utilizados para mejorar su eficiencia. Yendo un paso más allá, quizá sea preciso instalar algún software adicional, esencialmente para traducir los datos a un formato adecuado para su visualización.
La otra manera de acceder al dark data es mediante la instalación de unhardwareespecífico que recopile esos datos de difícil recolección, como un dispositivo para monitorizar contadores de electricidad, lectores de códigos de barras, etc. Y después habrá que tratar y analizar esos datos. Como es lógico, los servicios contratados –consultoría, software, hardware...– determinarán el coste de un proyecto de dark data.
¿Qué utilidades reales puede sacar una empresa de una adecuada explotación de su dark data? Estas son las siete posibles:
1) Asesoramiento e individualización de la oferta
Datumize ha instalado unos dispositivos para extraer dark data de los contadores eléctricos industriales de los clientes de Gas Natural en España. “Son unas máquinas con muchos años de antigüedad, así que no son inteligentes. Pero son muy caros, por lo que renovarlos costaría mucho dinero”, explica Lafuente.
“Los datos oscuros que recopilamosson todas las métricas que tiene dentro el contador, como consumo, curvas de potencia… a los que no se puede acceder remotamente. Hemos puesto un pequeño computador que ‘hace una foto’ completa del estado del contador cada segundo o cuando quiera el cliente. Después traducimos esa ‘foto’ a un formato de datos moderno, ya que el contador ‘habla’ en un protocolo muy antiguo. Y esos datos los subimos a una plataforma online de Gas Natural”, señala. Es decir, traduce datos muy primitivos, en un lenguaje binario (0/1) a datos más complejos y analizables. “Los contadores, que eran totalmente opacos, han dejado de serlo. Ahora, Gas Natural tiene todos los datos cada segundo, pudiendo contactar con sus clientes para explicarles por qué consumen y de qué manera, ofrecer un servicio de valor añadido de eficiencia para las industrias, etc.”, apunta el consejero delegado de Datumize.
2) Optimización de consumo y detección de fallos
La utilización de los datos oscuros permite reunir información acerca del funcionamiento de los equipos con el fin de reducir consumos innecesarios o detectar fallos. “Si tenemos 60.000 ordenadores en stand by, encendidos 12 horas al día, consumen muchísimo. Y también supone un coste muy alto tener un técnico que vaya visitando todas las oficinas para revisar de forma preventiva las máquinas para que no se rompan. Somos capaces de hacer ‘fotos’ del estado de funcionamiento y detectar anomalías si las máquinas trabajan de forma diferente, así como consolidar las ‘fotos’ en una plataforma central para hacer modelos elaborados sobre su desempeño. Si somos capaces de sacar datos de todas esas máquinas de forma periódica para adelantarnos, aunque sea sólo en un 15% o 20% de las situaciones, y actuar antes de que se rompan, supone un ahorro directo. Además, podemos ajustar las horas de trabajo del técnico, optimizar el consumo eléctrico de las máquinas teniendo encendidas solamente las que se necesiten, etc.”, indica Lafuente.
3) Mejora de la venta online
Todos los procesos que se realizan a través de Internet dejan un rastro de datos. Sin embargo, dicha información no siempre se utiliza adecuadamente. Las compañías analizan cuáles son los productos más buscados, los más vendidos, etc., pero hay mucha información que se pierde sin ser usada, ya que no es registrada. Por ejemplo, las búsquedas que no tienen una respuesta satisfactoria. “Las capacidades de búsqueda dentro de los comercios electrónicos no funcionan bien. Están perdiendo oportunidades. Podemos capturar todas las búsquedas de los clientes y qué se les ha respondido. Así es posible conocer las consultas que no han devuelto resultados de búsqueda. Los motivos pueden ser absurdos, como que se pregunte en otro idioma, se escriba mal el nombre del producto o se pida un color no disponible, pero también se puede detectar que se pregunta muchas veces por una categoría de producto que la empresa no tiene y que nunca se ha planteado ofrecer. Capturamos esos datos y se los enseñamos al cliente para pueda tomar la decisión de incorporar dicho producto a su catálogo y así vender más”, añade Lafuente.
Sin olvidar que se pueden aprovechar otros datos. Así, es posible crear una visión integral de los clientes mediante sus interacciones en la web, los productos más visitados, tiempo de consulta de cada referencia, navegación entre artículos, descarga de manuales, diferencias de comportamiento entre usuarios registrados y anónimos, quejas por tipo de producto o de cliente, coste de las incidencias según el producto o cliente, etc.
4) Optimización de compras y stocks
Datumize cuenta entre sus clientes conla red de concesionarios Quadis, que obtienen buena parte de sus ingresos de la venta de recambios. “Tiene un sistema ERP y somos capaces de proporcionar todas las comunicaciones que ha habido relacionadas con venta perdida. Es decir, todo el producto que se ha solicitado por parte de los clientes pero que no se ha llegado a vender porque no estaba en stock. Revisando esos datos, sus analistas son capaces de establecer una política de compras que les va a reportar mucho más beneficio, porque van a vender más o con mejor margen”, especifica Lafuente. Adicionalmente, el aprovechamiento de estos datos puede ayudar a mejorar la rotación de almacén, evitar roturas de stock o la acumulación de producto no vendido. El CEO de Datumize pone otro ejemplo. “Los hospitales se gestionan de forma centralizada, con sistemas que permiten conocer la disponibilidad de un quirófano o de un determinado material quirúrgico. Se pueden producir casos en los quese pregunte por la disponibilidad de un material 200 veces a lo largo del día y que el sistema responda en otras tantas ocasiones que no está disponible. La entidad gestora no se entera de esto porque el sistema sencillamente responde que no hay y no se puede reservar, pero dicha falta no es reconocida por el sistema”, comenta Lafuente.
5) Registro del funcionamiento de plataformas
El touroperador Grupo Piñero es uno de los clientes a los que Datumize presta sus servicios dedark datacon el fin de garantizar la continuidad de operaciones de su plataforma telemática. “En temporadas altas, Grupo Piñero tiene una infraestructura que debe funcionar las 24 horas del día a pleno rendimiento, ya que cuenta con clientes en todo el mundo. Una de las complejidades es que cuando uno de sus clientes pide algo, implica muchísimos sistemas dentro de su centro de datos. En cada petición se están tocando 4, 5 o 6 sistemas diferentes. Eso genera una gran complejidad y la compañía necesita entender mejor qué está pasando. Y en caso de tener problemas, necesita un registro completo de todo lo que ha sucedido para poder solucionarlo”, explica Lafuente. Datumize instala sus dispositivos y no interfiere en la actividad de la empresa. “Si no lo dices al responsable de esos sistemas que estamos ahí, ni siquiera se entera. Capturamos todos los datos, los consolidamos en una plataforma big data y ellos pueden hacer un seguimiento de todo lo que está sucediendo. Así se pueden centrar en su negocio, sin modificar sus aplicaciones para tener un registro de todo, sin preocuparse de aumentar la capacidad de sus máquinas, etc.”.
6) Estudios de mercado
Uno de los grandes problemas de los fabricantes es que no pueden controlar cómo, cuándo y dónde se venden sus productos. “Hay muchas empresas de productos de consumo que fabrican sus artículos, reciben los pedidos, salen de fábrica y se distribuyen a un mayorista, dejando de tener control sobre sus productos en ese punto. Pueden saber lo que ha salido de fábrica, pero no conocen cómo se han vendido sus referencias ni cuándo, porque son incapaces de tener visibilidad del stock de la tienda final. Como mucho, pueden saber lo que se distribuye a través de grandes superficies, pero no tienen idea de lo que se comercializa a través de pequeñas tiendas. Se tienen que fiar de lo que les dicen las empresas de investigación de mercado”, señala Lafuente.
“La clave es que empiecen a aparecer operadores capaces de poner máquinas en el punto final de venta. Nosotros estamos ofreciendo tecnología a los grandes fabricantes, que tienen capacidad de inversión para comprar 3.000 máquinas, por ejemplo, y ponerlas en otras tantas tiendas estratégicas en todo el territorio nacional para tener una muestra representativa de cómo se venden sus productos. Recuperamos las transacciones de venta de producto a partir de lecturas de códigos de barras, de forma que sabemos exactamente cuándo se ha vendido un determinado producto”, puntualiza.
De esta manera, el fabricante puede saber en qué tiendas se vende cada uno desus artículos, qué días y a qué horas se registra mayor venta, si estas referencias se venden solas o junto a otros productos propios o de la competencia… Y esto también permite conocer mejor el efecto real de las campañas de marketing.
7) Mejora del proceso comercial
Los datos oscuros permiten conocer mejor el proceso de negociación de un proveedor con las compañías que adquieren sus bienes y servicios. “Normalmente, el sistema de información de una empresas sólo registra el estado final de los pedidos, pero no los estados intermedios, como variaciones en los precios o en el volumen, la interacción con el cliente… Y el business intelligence visualiza la información en ‘fotos’ –ventas de un mes, evolución del total de ventas en el último año…–, pero no ofrece una visión de la evolución de la relación con el cliente desde el inicio hasta la fecha”, indica el mánager de Thinkalia. Este proceso incluye dark data, que se puede emplear para mejorar el proceso comercial desarrollando el registro de todo aquello que envuelve al proceso de creación de la oferta, como cambios de productos, modificaciones de precio, incrementos de descuentos, entre otros.
Y muchas más aplicaciones
Medición de tráfico en tienda. Con la ayuda de un pequeño dispositivo, se puede hacer un seguimiento del flujo de clientes, midiendo cuántas personas entran o salen, cuánto tiempo pasan en la tienda, con qué frecuencia vuelven, etc. Esos datos se pueden extraer sirviéndose de diferentes tecnologías. Por ejemplo, es posible obtener información de la conexión de los smartphones de los clientes a la red wifi del establecimiento y por los paquetes de datos dentro de las red local de la tienda. Para ello, es esencial la ‘anonimización’ de los datos capturados. “Podemos capturar la dirección MAC de un dispositivo móvil pero la anonimizamos de tal manera que sea imposible revertirla”, explica Lafuente.
Seguimiento de empleados. El aprovechamiento de los datos oscuros permite hacer tracking de los empleados sólo con analizar qué máquinas están encendidas o apagadas, permitiendo conocer cuándo vienen y se van, si están presentes o no, tiempo de permanencia, etc.
Carreras profesionales. Cada empleado tiene un currículum cuando llega a la empresa, pero éste puede modificarse durante su trayectoria profesional mediante la realización de cursos de formación. “Generalmente, los cursos que se hacen no son visualizados por el gerente o jefe directo. Mediante procesos de dark data se puede capturar la información de la formación que se va recibiendo para conocer qué motivaciones tiene cada empleado. Quizá una persona que trabaja en logística esté realizando cursos orientados al marketing, por lo que tal vez sería preciso que dicho departamento evaluara una trayectoria profesional horizontal de este empleado”, indica el mánager de Thinkalia.
Almacenamiento y logística. “Hay muchísima información de almacén que no se está tratando y que pueden tener muchísimo valor, como los cambios de localización. Normalmente, sólo se guarda el último punto donde se ha puesto la mercancía. Si se cambia de A a B, el sistema registra que el material está en B, pero no se puede ver que ha cambiado varias veces de sitio. Así no es posible mejorar el trabajo en el almacén porque no se está registrando esa información o se está obviando. Utilizando estos datos oscuros se pueden optimizar las rutas”, afirma Fernández.
SEGURO QUE TE INTERESA…
Por qué el Big Data es un aliado de tu empresa