Los conjuntos de datos son el centro de la inteligencia artificial y el aprendizaje automático

Los conjuntos de datos son el centro de la inteligencia artificial y el aprendizaje automático. Sin embargo, los resultados de alta calidad solo pueden provenir de datos cualitativos bien mantenidos. Internet of Things, Machine Learning e Inteligencia Artificial necesitan datos de alta calidad, pues los datos son el centro de IoT, ML e IA.

50.000 millones de dispositivos IoT en 2022

Internet de las Cosas es un horno digital de enormes dimensiones. Probablemente, más de 50.000 millones de dispositivos estarán conectados al IoT para 2022. Según los analistas de Juniper Research, la fase de escalado debería llegar gradualmente. En un estudio de 2018, se afirma que la cantidad total de sensores y dispositivos conectados al IoT aumentará a más de 50.000 millones para 2022, en comparación con una estimación de 21.000 millones en 2018. En otras palabras, un ecosistema en el que se crean cantidades de datos puramente concentrados, especialmente para la inteligencia artificial y el aprendizaje automático, siempre que los datos subyacentes, y en particular los datos de los socios comerciales, estén bien mantenidos y sean de alta calidad.

Cualquiera que piense que la Inteligencia Artificial (IA) y el aprendizaje automático (ML, Machine Learning) están todavía muy lejos, se equivoca.

Los asistentes de voz y los chatbots son un escenario de aplicación transversal para los sistemas inteligentes. Aquí, se evalúan grandes cantidades de datos estructurados y no estructurados de documentos, así como archivos de audio y vídeo para implementar, por ejemplo, consultas virtuales o información personalizada y ofertas educativas.

El hecho es que la gama de campos de aplicación de IA concebibles es casi ilimitada y abarca desde hogares inteligentes y software basado en IA en diagnósticos médicos hasta optimización con apoyo de ML para el suministro de materias primas y la planificación del despliegue del personal. Además, los investigadores de mercado del Information Service Group (ISG) predicen que la inteligencia artificial y el aprendizaje automático se volverán notablemente más baratos. Paralelamente a este desarrollo, predicen en su comparación anual de proveedores “que el mercado está ganando madurez a un ritmo rápido”.

La IA como fuerza impulsora de la Internet de las Cosas

En este contexto, es cada vez más claro cuán estrechamente están interconectado el Internet de las Cosas (IoT), y con él el mayor desarrollo de la Industria 4.0, con el avance de la difusión de la inteligencia artificial y el aprendizaje automático. La enorme cantidad de datos que surgen del control y la interacción de miles de millones de enrutadores, puertas de enlace, sensores, contadores, dispositivos de salida, elementos de fabricación y otros módulos deben seguir siendo manejables. Para ello, se requieren procesos cada vez más automatizados e inteligentes, aquí es exactamente donde entran en juego la inteligencia artificial y el aprendizaje automático.

Por lo tanto, las tecnologías inteligentes como el aprendizaje automático y el aprendizaje profundo (Deep Learning) serán la clave a la hora de filtrar el volumen de Big Data del IoT, reconocer patrones y evaluar rápidamente los datos relevantes. Los análisis resultantes ayudarán a comprender mejor los productos de IoT y a optimizar su control en consecuencia.

Esto no solo hace que el control de elementos de IoT sea mucho más eficiente. Aún más: a través del acoplamiento inteligente de IA, ML e IoT, las empresas se convierten en organizaciones impulsadas por datos y orientadas a procesos que están idealmente equipadas para los requisitos de digitalización. En este contexto, el pronóstico de que el uso de la IA ayudará a la red de cosas de manera exponencial parece extremadamente realista.

En inteligencia artificial, la alta calidad de los datos es la mejor protección contra los malos usos de la IA

A pesar de toda la euforia que rodea al potencial de los algoritmos inteligentes, bajo ninguna circunstancia debemos perder de vista los riesgos. Cuanto más inteligente se vuelva una IA, menos podremos comprender sus decisiones. Ya en la actualidad, hay tantas cifras clave, puntos de datos y variables involucradas en cada cálculo, que un cerebro humano ya no puede comprenderlos, al menos rápidamente.

Entonces, ¿qué nos queda? Tenemos que confiar en las recomendaciones y decisiones de las inteligencias artificiales. Una afirmación que de ningún modo debe interpretarse de forma fatalista. Más bien, tenemos que asegurarnos de antemano que los resultados de los análisis de IA y ML sean exactos y significativos.

Lo más importante, por supuesto, es la programación cuidadosa y precisa de los algoritmos. Una vez que el software están en funcionamiento, entra en juego otro factor decisivo para los procesos de IA y ML sin errores: buenos datos de entrenamiento. Por ejemplo, es esencial que las empresas mantengan concienzudamente los datos de sus socios comerciales que se incorporarán a la programación de la IA. De lo contrario, corren el riesgo de que los sistemas inteligentes aprendan incorrectamente y, por lo tanto, produzcan resultados incomprensibles o incluso discriminatorios.

Industrial Internet of Things (IIoT)

Los datos de socios comerciales, en particular los datos de clientes y prospectos, representan una categoría de datos que a menudo se descuida, si no se olvida por completo, en el entorno de IoT industrial (IIoT). Esta es una categoría al menos tan importante como los datos de sensor o de máquina. Esto se vuelve particularmente claro cuando pasamos al tema de la personalización masiva hasta “tamaño de lote igual a uno”: no hay dos productos iguales y ya están vinculados al futuro comprador durante la producción, por ejemplo, en la industria automotriz.

La personalización en masa o la producción en masa específica del cliente en la industria automotiriz conduce a un gran número de variantes posibles para vehículos individuales. La complejidad resultante en el desarrollo, pero también en la planificación y el control de la producción y de toda la empresa, es un desafío particular para la gestión y el control de la empresa. Y muy vinculado a los datos de los socios comerciales.

Pero es casi irrelevante de qué industria se está hablando, independientemente de su naturaleza, sus fuentes y sus áreas de aplicación, una cosa es común a todas las categorías y, en particular, a los datos de los socios comerciales: su calidad es esencial. Son el eje dentro de la red de relaciones de una empresa, especialmente en el contexto de la IA y el ML: la inteligencia artificial, cuyos análisis tienen un impacto en el mantenimiento y la comunicación con los socios comerciales, necesita datos de la calidad adecuada.

Consolidar los datos distribuidos para el entrenamiento de IA en la verdad del terreno

No se puede enfatizar lo suficiente que la IA en la fabricación no solo aprende de los datos de las máquinas, sino también de y con los datos de los socios comerciales. Esta es la única forma de adaptar los elementos y dispositivos de IoT a las necesidades del usuario.

Es posible que todo el proceso de producción no se detenga si los datos son incorrectos. Sin embargo, las interrupciones del proceso debido a la mala calidad de los datos, y en particular de los datos de los socios comerciales, no son convenientes para lograr los objetivos generales de producción y negocios. Por eso, el principio GOGO también se aplica aquí.

Lo que los informáticos una vez llamaron en broma Garbage In / Garbage Out, refleja una verdad cautivadora y simple: si se coloca material inferior en un sistema en un extremo, no se deben esperar joyas en el otro extremo.

Datos de alta calidad

Para la inteligencia artificial en el entorno de IoT, esto significa que las empresas primero deben limpiar, enriquecer y consolidar sus datos en toda la empresa para una formación adecuada de IA. Un desafío particular, porque los datos de los socios comerciales a menudo se encuentran dispersos y distribuidos en la empresa. Los sistemas en los que se pueden encontrar datos relevantes van desde herramientas de CRM hasta soluciones de ticketing y ERP hasta aplicaciones de call center.

Cada vez más empresas utilizan varias soluciones departamentales para administrar los datos de sus clientes. Esto significa que les resulta difícil fusionar los datos gestionados en los diferentes sistemas y ponerlos a disposición del sistema de IA o ML.

Las empresas pueden contrarrestar el dilema de las bases de datos distribuidas y no armonizarlas fusionando realmente toda la información disponible sobre un socio comercial, es decir, datos maestros y datos de movimiento (datos de transacciones e interacciones). Para ello, las empresas necesitan la llamada “verdad fundamental”, una solución y una metodología de proceso que ofrezca una imagen global fiable de todos los datos y, por tanto, de la realidad.

Con esta “verdad de datos fundamental” como una base de datos de alta calidad, AI y ML solo pueden aprender realmente, desarrollar todos sus beneficios y, por lo tanto, ganarse la confianza de sus usuarios.

La inteligencia artificial necesita datos de alta calidad