¿Qué es Big Data? ¿será literalmente cómo su nombre en inglés Grandes Datos? Pues algo de eso hay, es lógico pensar que existen muchos datos de distintas fuentes que se generan segundo a segundo y que crece exponencialmente.
También puedes pensar que eso no es verdad para todas las empresas, claro eso puede ser verdad dependiendo de qué datos quieras almacenar. Por un lado, tendrás los datos de tu sistema de transacciones, CRM, ERP o los sistemas que utilices para tu negocio. También puedes generar cientos de planillas de algunos procesos manuales, puedes tener llamadas telefónicas de tus clientes o por whatsapp, o en otras redes sociales. Puedes almacenar fotografías de confirmaciones de entrega o para procesar fallas de productos y un sinfín de datos que que se pueden clasificar de tres formas:
Estructurados: los que se encuentran tabulados en filas y columnas, tienen un orden y estructura. Por ejemplo, una planilla o los registros de una base de datos de tu ERP.
Semi estructurados: Están algo estructurados, pero en otros formatos. Como HTML, XML, JSON. Por ejemplo, los que puedes recolectar de una Cookie en tu web.
No estructurados: Todo lo demás por ejemplo las fotografías, video, audio, texto sin estructura, etc.
Si piensas en todos estos datos te darás cuenta que pueden ser muchos, incluso en una pequeña empresa. Entonces acá llegamos al problema de dónde los almacenamos, cómo los utilizamos y le sacamos provecho. Y para solucionar esto se empezó a trabajar en las tecnologías que podían ayudar y se les llamó “Big Data”, pero debe cumplir con ciertas características; debe manejar grandes Volúmenes de datos, Variedad de Datos y Velocidad de generación.
Estas fueron las tres primeras V, actualmente son siete, pero en la práctica cumpliendo dos de estas tres ya estamos hablando de Big Data.
Y esta tecnología ha estado creciendo de forma vertiginosa para satisfacer esta gran demanda que es cómo manejo mis datos, este nuevo petróleo. Y desde las distintas fases del dato, pasando por la captura, su almacenamiento, análisis (sino hiciéramos esto no tendría sentido almacenar los datos, no crees), Visualización (es importante comunicar los resultados, de una forma en que todos puedan entender) y publicación (la información debe estar disponible para quien lo requiera). Se necesitan diversas herramientas la mayoría de tipo open source, libre de pago. Pero otras que arman estos paquetes de herramientas e implementaciones robustas son de pago.
Algunas de estas tecnologías:
Como podrán ver hay muchísimas tecnologías, lo cual puede ser muy abrumador, pero tranquilos depende de tus necesidades y presupuesto cuál de ellas debes implementar.
Ahora qué sabes qué es Big Data, ¿tu empresa qué está haciendo para manejar sus datos?