Datos: probablemente, la materia prima más importante del siglo XXI

“Los datos son el nuevo oro del siglo XXI. Se pueden tener datos sin información, pero no se puede tener información sin datos”. ¿Qué son los datos?

Nuestra sociedad debate todos aspectos de la protección de datos y la privacidad y, como siempre, apunta a las grandes empresas de Internet, que son vistas con gran escepticismo, especialmente en Europa. Y, sin embargo, casi todos usamos los servicios de estas compañías a diario.

¿Qué son los datos?

Datos = Plural de dato. En su mayoría, valores numéricos obtenidos a través de observaciones o mediciones de eventos reales.

La semiótica (del griego antiguo = señal), es decir, el estudio de los signos, describe los datos como información potencial. La base de datos está formada por caracteres. Según el triángulo semiótico, existe una relación fija entre el signo o símbolo, el objeto real y el concepto. El símbolo representa una cosa u objeto. Los símbolos despiertan en las personas un concepto que se relaciona con la cosa.

“Las palabras habladas son los signos de las ideas en el alma y las palabras escritas son los signos de las palabras habladas. Así como los caracteres no son los mismos para todas las personas, las palabras no son las mismas para todas las personas; pero las representaciones del habla, cuyos signos inmediatos son las palabras, son las mismas para todas las personas, y por lo tanto los objetos son los mismos en todas partes, de los cuales estas representaciones son las imágenes”.

Aristóteles, Peri hermeneias, primer capítulo

Medición de tiempo y lugar

¿Te has estado preguntando durante mucho tiempo por qué tu identificación muestra tu lugar de nacimiento y fecha? El tiempo y el lugar casi siempre determinan un resultado que realmente tuvo lugar. Esto significa que también puede identificarte claramente como una persona además de tu nombre y género. Cada evento real, ya sea una visita a un sitio web o la entrega del último pedido de comercio electrónico. Por regla general, cada punto de medición siempre tiene al menos dos dimensiones, a saber, tiempo y lugar. Estos determinan un evento más o menos exactamente.

El origen de los datos

Si los datos siempre tienen un punto en el tiempo y un lugar como característica, también se puede suponer que debe haber datos desde la medición del tiempo. La historia de los dispositivos de cronometraje se remonta a los sumerios y al antiguo Egipto. Ya 3.000 años antes de Cristo, había relojes de sol que mostraban la hora actual del día. También se dice que el tiempo es relativo, por lo que la medición en sí también es relativamente precisa.

Se distingue entre los siguientes tipos de datos:

  • Datos estructurados que tienen una estructura similar. Por ejemplo, formulados en un modelo de datos.
  • Datos semiestructurados. Por ejemplo, Extensible Markup Language (XML).
  • Datos no estructurados. Por ejemplo, textos, gráficos, otros documentos.

Como todo lo demás, los datos están sujetos a un ciclo de vida. Esto también corresponde a las operaciones que se pueden utilizar sobre los datos, también denominadas “CRUD”.

  • C significa “create” (crear): los datos son creados.
  • R significa “read/retrieve” (leer/recuperar): los datos son leídos u obtenidos.
  • U significa “update” (actualizar): los datos se modifican o mejoran.
  • D significa “delete” (eliminar): los datos serán eliminados.

La era de Big Data

El “cámbrico” de los datos

Big Data es sinónimo de una gran colección de datos con diferentes características. También se habla de las llamadas 4 V:

  • Volumen
  • Velocidad (los intervalos de tiempo en los que se generan los datos)
  • Variedad (variedad de diferentes fuentes de datos)
  • Veracidad (el contenido de verdad que está presente en los datos)

Según la consultora IDC, la cantidad anual de datos generados en todo el mundo se multiplicará por diez en los próximos años, principalmente debido a los datos de los sensores. Las empresas de hoy ya tienen problemas para manejar correctamente sus volúmenes de datos existentes. ¿Cómo debería ser eso en el futuro?

Los datos inteligentes (Smart Data) deberían controlar el caos de datos

¿Cómo se pasa de Big Data a Smart Data? Se puede extraer información valiosa de diferentes cantidades de datos utilizando algoritmos o análisis manuales. La información resultante de un análisis se denomina Smart Data. Un ejemplo de datos inteligentes es, por ejemplo, “Google Trends”. De muchas consultas de búsqueda que se generan en todo el mundo, podemos determinar rápidamente cómo se han desarrollado utilizando Google Trends. Con Google Trends, no solo obtenemos los datos sin procesar, sino que obtenemos la información directamente.

Las iniciativas de Smart Data están en pleno apogeo. Los datos inteligentes son de gran importancia, ya que allanan el camino para la Inteligencia Artificial (IA).

¿Qué son los datos realmente?