Big Data simplemente explicado: ¿por qué los volúmenes de datos son tan relevantes para el futuro?

Big Data es fácil de explicar. Es la base, la “alimentación” para los análisis que utilizan ordenadores, es decir, para la ciencia de datos, la IA, el aprendizaje automático, la visión por ordenador y mucho más.

Big Data es fácil de explicar

Estas grandes cantidades de datos son creadas, entre otras cosas, por teléfonos inteligentes que recopilan datos de movimiento y uso de los usuarios, y los ponen a disposición para su análisis. Sin Big Data no habría IA. Y sin IA no habría sistemas de asistencia a las personas, por ejemplo.

Sin embargo, el RGPD, es decir, el reglamento de protección de datos en Europa, restringe la posibilidad de analizar estos datos, más que, por ejemplo, los reglamentos de datos de EE.UU. o China. En pocas palabras, el RGPD solo permite el análisis de datos personales si la persona ha dado su consentimiento de forma activa.

Esto evita en gran medida el análisis vinculado de datos en Europa, como la combinación de datos en el teléfono inteligente con, por ejemplo, datos de Google o Facebook sobre esta persona. Es diferente en China, por ejemplo. Big Data también es la base de la IA en Europa, pero no se puede analizar tan extensamente aquí como en otros países.

Cómo funciona Big Data

Big Data es fácil de explicar. Big Data simplemente significa la recopilación de datos estructurados o no estructurados como base para análisis, por ejemplo, en el campo de la ciencia de datos o mediante inteligencia artificial. A medida que mejora nuestra capacidad tecnológica para recopilar y almacenar datos, la base para los métodos de análisis mencionados se vuelve cada vez mejor.

En la actualidad, los datos de los teléfonos inteligentes e Internet se utilizan y analizan principalmente. Según Kai-Fu Lee (Libro: Superpotencias de la inteligencia artificial. China, Silicon Valley y el nuevo orden mundial), esta es solo la primera ola de IA y compañía. Él llama a esta ola la “IA de Internet”: los usuarios se mueven online, una IA es capaz de recopilar e interpretar datos. Las orientaciones de “salida” necesarias para un sistema de aprendizaje son, por ejemplo, “hizo clic” versus “no hizo clic”, “compró” vesus “no compró”. Los productos finales son, por ejemplo, marketing de recomendación: “los usuarios que vieron este artículo también estaban interesados en este otro artículo”. La IA aprende las preferencias personales del usuario, al que puede rastrear online. Esto da como resultado un mejor marketing de recomendación durante el tiempo de retención, un desarrollo que los usuarios pueden reconocer como una “mejora de Internet”. Sin embargo, aún no se produce una combinación de comportamiento online y offline.

Ejemplos de Big Data

Dondequiera que se recopilen datos, se acumula “Big Data”:

  • Cámaras en la estación de tren.
  • Datos de movimiento y uso del Smartphone.
  • Datos del tiempo.
  • Recibos de supermercado.
  • Tarjetas de crédito.

Big Data en el futuro

Big Data es bueno, Smart Data es mejor. En la siguiente fase, según Kai-Fu Lee, una IA no utiliza los datos que se generan online, sino los datos disponibles de las empresas comerciales con el objetivo de desarrollar aún más la empresa respectiva.

Aquí, también, un análisis significativo y el aprendizaje de la IA solo es posible si los datos están disponibles en forma estructurada, son numerosos y se puede etiquetar el resultado deseado. No todas las empresas y no todas las industrias tienen esta calidad de datos, por lo que se puede suponer que solo ciertas empresas pueden usar la IA de manera sensata aquí.

Ejemplo

Un ejemplo de esto es el sector financiero. Y aquí se trata principalmente de empresas prestamistas, porque para ellas el riesgo de incumplimiento y, por lo tanto, una pérdida del dinero del préstamo es muy alto. Si solicitamos un préstamo, debemos proporcionar mucha información sobre nosotros, nuestra familia y nuestra situación financiera. Por lo tanto, las empresas prestamistas tienen datos de clientes estructurados. Y tienen la importante variable de salida, que es el incumplimiento del préstamo frente al reembolso del préstamo. Una IA puede usarlo para aprender y calcular la probabilidad de que un solicitante de préstamos incumpla, ANTES de que se concluya el contrato de préstamo. Las compañías de crédito pueden entonces decidir si, por ejemplo, aumentan la tasa de interés para cubrir mejor el riesgo, o si rechazan a los solicitantes desde el principio.

Big Data y la IA seguirán encontrando su camino hacia nuevas áreas de nuestras vidas.

Fuente:

KI Revolution