Seleccionar página

Uno de los resultados más positivos del advenimiento del Big Data es como ha capturado la atención de los manager seniors, los cuales comienzan a hablar de proyectos relacionados usando la frase “datos como un activo”.

No obstante, en la mayoría de las grandes empresas existe una estrategia de coexistencia que combina lo mejor de los datawarehouse tradicionales, los ambientes de análisis ya existentes, y el nuevo poder del Big Data. Es decir, en las grandes empresas el Big Data no es algo que se trate separadamente de otros tipos de datos y analíticas.

De hecho, estas están más concentradas en la variedad de los datos, y no en el volumen de los mismos, como el nombre “Big Data” podría hacer presuponer. Los nuevos tipos de datos como voz, texto, ficheros de logs, imágenes, o videos, son los que tienen más potencial para ser analizados bajo iniciativas de Big Data.

La estrategia para su implementación pasa invariablemente por el Cloud, pero también por la concentración y consolidación, en el caso de grandes empresas con muchas sedes.
Por ejemplo, el GroupM, una subsidiaria del conglomerado publicitario WPP, ha evitado los sobrecostes que podría haber causado la fragmentación de tecnologías de Big Data (si se hubieran contratado e implantado en algunas de sus 120 oficinas repartidas por el mundo), centralizando todo en una oficina en New York. Su estimación fue de un ahorro de 120 millones de dólares al haber dado este paso.

Big Data and Data Warehouse Coexistence

Big data puede significar secuenciación del genoma humano, sensores en pozos de petróleo, comportamientos de células cancerosas, localización de productos en pallets, interacciones en social media, y mucho más. Pero la plataforma de facto usado para todo ello es el proyecto Open Source Hadoop.
Es tanto el éxito de esta plataforma que algunas empresas se plantean reemplazar sus sistemas datawarehouse tradicionales por ella, asociándola luego con extensiones para trabajar con sql.

Algunas empresas que usan Big Data creen que los costes de los MIPS y los terabytes de almacenamiento para los datos estructurados son ahora más baratos si se entregan mediante clusters realizados con Hadoop. En una comparación realizada por una empresa estimaron que el coste de almacenar 1 terabyte durante un año era de 37000 dólares para una base de datos relacional tradicional, 5000 dólares para una base de datos como appliance, y solo 2000 dólares en el caso de un cluster Hadoop.

Big Data es ideal cuando se emplea para tomar decisiones basadas en fuentes de datos menos estructurados, como los generados por la interacción de los clientes.
Pero también puede usarse en otras áreas de análisis más tradicionales como cadenas de suministro, gestión del riesgo, o precios. El factor que hace que esto sea cuestión de Big Data es el hecho de usar datos externos para mejorar el análisis.

La reducción de tiempo es otra de sus grandes ventajas, y así Macy’s ha sido capaz de reducir el tiempo de optimización de cambio de precios de sus 73 millones de items, pasando de emplear 27 horas a solo 1. Y esta capacidad hace que ellos sean mucho más adaptables a los cambios del mercado de retail.

Otros ejemplos de éxito son:

  • GE, que estima que una mejora de eficiencia del 1% en sus plantas de generación de energía mediante turbinas de gas, gracias al Big Data, podrían suponer un ahorro de 66000 millones de dólares de combustible.
  • Linkedin, que usa Big Data y científicos de datos para desarrollar un amplio espectro de productos y características, como “Gente que podrías conocer”, “Grupos que te podrían gustar”, “Trabajos que te podrían interesar”, “¿Quién ha visto tu perfil?”, y otros. Lo que le ha hecho ganar millones de usuarios.

Uno de los desarrollos más profundos en el mundo del Big Data es la visualización de los datos, lo que permite que la información sea presentada de una manera gráfica e intuitiva.

Las empresas grandes en general no han establecido organizaciones separadas para trabajar con Big Data. En vez de esto, a los grupos de análisis y tecnologías ya existentes se les ha añadido funciones de Big Data en su misión. Otras simplemente han sumado capacidades de ciencia de datos a sus portfolios.

Todo esto y más es un resumen del informe “Big Data en Big Companies“,  realizado por Tom Davenport and Jill Dyché.

Share This