Investigación médica, lucha contra la delincuencia… para todo esto, y mucho más, necesitamos Big Data

Pero, ¿Que es el Big Data? Big Data es un término que engloba las tecnologías digitales que permiten la recopilación y análisis de grandes cantidades de datos complejos y sin estructurar.

Que es el Big Data

Big Data describe cantidades grandes, no estructuradas y complejas de datos. La creciente digitalización, el uso masivo de Internet, en combinación con el número cada vez mayor de diferentes servicios, provoca una cantidad inimaginable de datos, que ya no se pueden procesar manualmente.

Existe un enorme potencial latente en estas cantidades de datos. Para los negocios (Business Analytics), pero también para la educación, la investigación y la ciencia. Sin embargo, estos datos son inútiles en su forma sin procesar. Big Data es un término que engloba las tecnologías digitales que permiten la recopilación y análisis de dichos datos.

El estadounidense Doug Laney acuño la definición actual de Big Data en su modelo de las 3 V. Describe tres dimensiones:

  • Volumen. Los datos provienen de una variedad de fuentes, incluidas las transacciones comerciales, dispositivos inteligentes (IoT) y redes sociales.
  • Velocidad. Los flujos de datos deben procesarse rápidamente. Aplicaciones como la lectura de tarjetas de identificación, solo funcionan si se procesan grandes cantidades de datos casi en tiempo real.
  • Variedad. Los datos están disponibles en una amplia variedad de formatos. Esto incluye datos numéricos estructurados de bases de datos, pero también textos no estructurados, correos electrónicos y tickers bursátiles.

Recientemente, la definición se ha ampliado, y se habla de las 5 V, para incluir:

  • Valor. Los datos aportan valor añadido.
  • Validez. Los datos tienen una calidad utilizable.

Para qué sirven tantos datos

Industria 4.0, lucha contra la delincuencia, medicina… El Big Data se puede utilizar de muchas formas.

Para cada vez más empresas, el Big Data es lo más importante, cuando se trata de tecnologías orientadas al futuro. Eso deja claro el potencial del Big Data.

Big Data se puede aplicar en muchas áreas diferentes. Las grandes cantidades de datos son un requisito previo para la Industria 4.0 y, a menudo, se asocia con la computación en la nube. Pero los datos masivos no solo son necesarios en la Industria 4.0.

Los gobiernos pueden utilizar el Big Data, entre otras cosas, en la lucha contra el crimen. Se puede intentar predecir dónde tendrá lugar el próximo robo utilizando datos existentes de patrones de delitos pasados.

Los análisis de macrodatos (Big Data Analytics) también pueden ayudar en la investigación médica. En segundos, se puede determinar si la quimioterapia está curando a una persona enferma, o si simplemente está causando un sufrimiento innecesario. Además, se pueden identificar conexiones en datos anónimos de pacientes sobre nuevos enfoques de tratamiento.

Desafíos y riesgos de los macrodatos

Los principales desafíos en el área del Big Data son el almacenamiento, transmisión, distribución y provisión de grandes cantidades de datos. El análisis de datos requiere algoritmos adecuados, que puedan hacer frente a volúmenes de datos grandes, y en constante cambio o aumento.

El análisis del Big Data también conlleva algunos riesgos. No siempre está claro de qué fuentes diferentes, y posiblemente inciertas, se originan los datos, ni qué calidad tienen. La consecuencia puede ser que su análisis dé lugar a resultados incorrectos. Por tanto, los análisis siempre deben cuestionarse críticamente.

Las redes sociales, los teléfonos inteligentes (smartphones), los hogares inteligentes, y muchos otros dispositivos y plataformas en red, también son fuentes de Big Data. Mapean el comportamiento de comunicación, consumo o navegación de los usuarios.

Por lo tanto, cuando se trata de Big Data, a menudo existen conflictos entre el deseo de utilizar los datos, y los derechos personales de los usuarios. El conflicto se puede resolver anonimizando los datos. Así, es imperativo tomar precauciones contra el robo de datos.

Sin embargo, el problema más común es que, a pesar de los datos disponibles, las técnicas de evaluación sofisticadas y, por lo tanto, las posibles respuestas, faltan las preguntas correctas. Las relaciones entre los datos y los problemas que podrían resolverse con ellos, a menudo, están más allá de la imaginación humana.