El Big DATA es un término que, aunque no es nuevo, seguramente genere cierta controversia sobre qué es exactamente y para qué sirve.
En este POST trataremos de dar la visión más actual de este concepto, ya que desde su nacimiento, en cierto modo, ha evolucionado.
Comenzaremos indicando que el nacimiento y evolución del Big DATA está intrínsecamente ligado a la naturaleza y el uso del dato que hacemos hoy en día.
Actualmente, recibimos ingentes cantidades de información desde diferentes fuentes. Estos datos deben ser tratados de manera inmediata para que nuestro negocio se beneficie completamente de ello.
Por poner un ejemplo relativamente reciente, podemos decir que el Big DATA ha sido empleado para recopilar y tratar datos sobre el contagio, avance y predicción de la COVID-19 alrededor del mundo. Además, ha sido una de las herramientas que han demostrado ser más eficientes contra esta lucha.
Para definirlo, inicialmente se hablaba del concepto de las 3 V’s que ha ido evolucionando hasta llegar a ser 5.
Big DATA, qué es y para qué sirve:
Volumen
En su concepción, el Big DATA, tenía como casi única característica principal la gran cantidad de información que proviene de las múltiples fuentes de datos que existen hoy en día.
Aunque a día de hoy sigue siendo una de las características principales, ya no es la única. Esta información puede provenir de ciudades inteligentes, RRSS, IoTs, análisis de mercados, etc. Por lo tanto, genera una cantidad enorme de información.
Dicha información puede ser útil o necesaria en el largo plazo o tener un ciclo de vida corto, y requiere ser tratada y a continuación liberarla. Para gestionar estos volúmenes, en ocasiones se debe emplear tecnologías de base de datos orientadas a esta naturaleza.
Velocidad
Hoy por hoy el flujo de información con el que se alimentan los sistemas de BigDATA es enorme y muy alto.
Es por ello que se necesitan nuevas estrategias y tecnologías para hacer frente a este nuevo reto. En este ámbito, no solo se ha trabajado en las propias bases de datos, si no en sistemas de integración, streaming de datos, etc, para alcanzar el mayor rendimiento posible sin olvidar la calidad.
Variedad
Debido a la naturaleza tan diversa de la que procede la información y de cómo debe ser explotada, comienzan a nacer nuevos modelos de almacenar y tratar la información.
De ahí salen tipos de datos y nuevas bases de datos con cada una de las diferentes orientaciones que cada aplicación puede requerir.
Veracidad
La veracidad tiene que ver con la calidad del dato.
Con las nuevas necesidades llega la entropía sobre la información. Por ello, es importante que durante los procesos de recolección y tratamiento de los datos nos aseguremos de estar en disposición de datos fiables o, al menos, altamente fiables.
Valor
Finalmente, se podría considerar que el valor está en lo más alto de la pirámide si cada uno de estos pasos formaran parte de ella.
El volumen sería la base en esta hipotética pirámide, mientras que el valor sería el resultado y el uso que le damos como conclusión de todo el proceso de Big DATA.
Una correcta recolección y tratamiento de los mismos da como resultado unas tomas de decisión eficientes y efectivas para un negocio que aplique adecuadamente este procedimiento. Por lo tanto, mejora sus beneficios de forma tangible y evidente.
Conclusión
La adopción del Big DATA ya está muy inmersa en nuestra sociedad profesional, pero dependiendo de cómo se aplique podemos conseguir maximizar sus beneficios minimizando su impacto y sus costes.