Las tecnologías de ciencia de datos y aprendizaje automático tienen una gran demanda a medida que las empresas buscan forman de analizar Big Data y automatizar procesos centrados en datos. Veamos startups de ciencia de datos de vanguardia y de tecnología de aprendizaje automático que han llamado nuestra atención.

Curva de aprendizaje

A medida que las empresas luchan con volúmenes de datos cada vez mayores, tanto generados dentro de sus organizaciones como recopilados de fuentes externas, encontrar formas eficientes de analizar y “operacionalizar” todos esos datos para obtener una ventaja competitiva es cada vez más desafiante.

Esto está impulsando la demanda de nuevas herramientas y tecnologías en los ámbitos de la ciencia de datos y el aprendizaje automático. Solo el mercado global de aprendizaje automático alcanzó $ 15.440 millones en 2021, se espera que crezca hasta $ 209.910 millones en 2029.

A su vez, el mercado mundial de plataformas de ciencia de datos se valoró en $ 4.700 millones en 2020, y se prevé que alcance los $ 79.700 millones en 2030.

Ciencia de datos y aprendizaje automático

“Ciencia de datos” y “aprendizaje automático” a veces se confunden e, incluso, se usan indistintamente. Son dos cosas diferentes, pero están relacionadas en el sentido de que las prácticas de ciencia de datos son clave para los proyectos de aprendizaje automático.

La ciencia de datos es un campo de estudio que utiliza un enfoque científico para extraer significado e información de los datos. Incluye el desarrollo de estrategias de análisis de datos, la preparación de datos para el análisis, el desarrollo de visualizaciones de datos y la creación de modelos de datos.

El aprendizaje automático (Machine Learning), un subsegmento del universo más amplio de la Inteligencia Artificial (IA), utiliza el análisis de datos para enseñar a los ordenadores cómo aprender, imitando la forma en que aprenden las personas, utilizando modelos basados en algoritmo y datos.

La demanda de herramientas de ciencia de datos y aprendizaje automático ha generado una ola de startups de ciencia de datos y aprendizaje automático que desarrollan tecnología punta en el campo de la ciencia de datos / aprendizaje automático.

Startups de ciencia de datos

PolyAI [ @poly_ai ] desarrolla una plataforma de aprendizaje automático (Machine Learning) para inteligencia artificial conversacional.

Cribl [ @cribl_io ] ayuda a las empresas a crear y escalar soluciones de análisis de Big Data y herramientas de flujo de trabajo.

Imply [ @implydata ] ofrece ingesta y visualizaciones en tiempo real para flujos de datos de transmisión y basados en eventos.

Stord [ @GetSTORD ] proporciona servicios de cadena de suministro en la nube a marcas que buscan visibilidad y control sobre su inventario.

HEX [ @_hex_tech ] crea espacio de trabajo para análisis colaborativo y ciencia de datos; convirtiendo los datos en conocimiento.

dbt Labs [ @getdbt ] desarrolla una herramienta de ingeniería analítica que prepara datos sin procesar en el almacén para su análisis.

Starburst Data [ @starburstdata ] es una empresa de análisis y acceso a datos que desarrolla un motor de consultas SQL.

Firebolt [ @FireboltHQ ] es una plataforma de almacenamiento de datos en la nube para optimizar el análisis y el acceso a la información.

Airbyte [ @AirbyteHQ ] es la plataforma de integración de datos de código abierto llave en mano que otorga a su infraestructura superpoderes para mover datos sin problemas.

QuestDB [ @QuestDb ] es la base de datos de código abierto más rápida para series temporales y análisis

Osaro [ @OsaroAI ] es una empresa de IA que desarrolla productos basados en tecnología patentada de aprendizaje por refuerzo profundo.

Facilio [ @FacilioInc ] es un software de gestión que emplea IoT y aprendizaje automático para ayudar a gestionar edificios.

Zenysis [ @Zenysis ] crea el software que los gobiernos y las organizaciones internacionales necesitan para enfrentar los mayores desafíos que enfrenta la humanidad.

Doxel [ @doxel_ai ] ofrece una plataforma de control de proyectos impulsada por IA que predice retrasos costosos y sobrecostos en proyectos de construcción.

Centaur Labs [ @CentaurLabs ]: etiquetado de imágenes médicas a escala.

Playment [ @TELUSint ]: somos una solución totalmente administrada que ofrece datos de capacitación para visión por computadora, aprendizaje automático y humanos en el circuito para IA a escala.

Phiar Technologies [ @PhiarUp ]: el motor de IA espacial ultraligero de Phiar permite que los vehículos perciban su entorno y potencia nuestro primer caso de uso en AR Navigation.

CrowdAI [ @CrowdAIinc ] permite a las organizaciones crear e implementar modelos personalizados para IA visual, en una plataforma simple y sin código.

Tala [ @talamobile ] es una empresa de tecnología móvil y ciencia de datos enfocada en servicios financieros en mercados emergentes.

Coiled [ @CoiledHQ ]: gestión de la ciencia de datos a escala, ayudándole a funcionar a la máxima velocidad y al mínimo coste.

Prefect [ @PrefectIO ] es un sistema de gestión de flujo de trabajo que ayuda a eliminar los problemas de flujo de datos para los equipos de datos de las empresas.

Incorta [ @incorta ] desarrolla una plataforma de análisis diseñada para acelerar la ingesta de datos comerciales.

AEye [ @AEye ] desarrolla hardware, software y algoritmos de visión avanzados que actúan como los ojos y la corteza visual de los vehículos autónomos.

Databricks [ @databricks ] es una empresa de datos e inteligencia artificial que interactúa con la información corporativa almacenada en la nube pública.

Abacus.AI [ @abacusai ] es una empresa de investigación de inteligencia artificial y servicios en la nube de IA.

Druva [ @druvainc ] ofrece una plataforma basada en SaaS para proteger y administrar los datos empresariales en las cargas de trabajo de punto final, centro de datos y nube.

Domino Data Lab [ @DominoDataLab ] utiliza la ciencia de datos y la IA para la colaboración, la implementación de modelos y la centralización de la infraestructura.

Bigeye [ @Bigeyedata ]: monitoreo automático de la calidad de los datos para equipos de análisis e ingeniería de datos.

Streamsets [ @streamsets ] es una plataforma DataOps para la integración moderna de datos.

Nova Credit [ @nova_credit ] es una oficina de crédito para el consumidor que permite el acceso financiero a los inmigrantes

Narrador [ @narratorai ] – Todos sus datos, una tabla. El nuevo estándar para el modelado y análisis de datos.

Okera [ @okerainc ] brinda acceso seguro a los datos a escala para que los equipos de datos tengan la confianza para desbloquear el poder de sus datos.

Stuff That Works [ @StuffThatWorks1 ] desarrolla un motor de estadísticas que analiza datos y los convierte en información general y personalizada.

Pachyderm [ @pachyderminc ] es una plataforma de ciencia de datos de nivel empresarial que hace realidad la IA/ML explicable, repetible y escalable.

Farmers Business Network [ @FBNFFarmersAUS ] conecta su granja con información valiosa de miles de millones de puntos de datos de agricultores reales.

Element Analytics [ @elementanalytic ] – Análisis predictivo para la industria.

Confluent [ @confluentinc ] ofrece una plataforma de transmisión basada en Apache Kafka que permite a las empresas acceder fácilmente a los datos como transmisiones en tiempo real.

Swayable [ @Swayable ] es una plataforma de ciencia de datos y análisis de medios que mide cómo el contenido de marca y promoción cambia la opinión pública.

Tachyus [ @TachyusCorp ]: creamos tecnología para optimizar la producción de energía para la industria del petróleo y el gas.

Acalvio [ @AcalvioTech ] proporciona soluciones de Advanced Threat Defense para detectar, atacar y responder a actividades maliciosas dentro del perímetro.