¿Cuáles son las habilidades clave que debe tener un buen científico de datos?

La ciencia de datos es la aplicación de técnicas avanzadas de minería de datos, estadísticas, métodos y algoritmos de la ciencia y otros campos al big data. Desarrolla tu carrera en ciencia de datos.

El objetivo es obtener valor comercial de los datos: marketing más específico, mejor toma de decisiones, mejor comprensión de las tendencias comerciales, identificación más rápida de nuevas oportunidades comerciales, respuesta oportuna a las necesidades del cliente, etc.

Desarrolla tu carrera en ciencia de datos

¿Cuáles son las habilidades clave que debe tener un buen científico de datos?

Los científicos de datos suelen tener un doctorado en ciencias, p.e. Física, matemáticas aplicadas, bioinformática y química/biología computacional. Algunos tienen una maestría complementada con experiencia adicional en algoritmos avanzados y métodos de análisis de datos. Algunos estudiaron informática y se especializaron en trabajar con grandes conjuntos de datos, aprendizaje automático o algoritmos analíticos.

El aspecto clave es la aplicación de aprendizaje automático y métodos estadísticos, así como la experiencia en el manejo de conjuntos de datos muy grandes, heterogéneos y «desordenados» (big data). Entonces, los científicos de datos deben tener estas habilidades, incluidos los paquetes de análisis estadístico y los lenguajes como SAS, R, MATLAB, etc.

También deben tener habilidades de programación: esto a menudo incluye Java, Python y otros lenguajes de secuencias de comandos, así como experiencia con varias herramientas de gestión de datos. Según el entorno, estos pueden ser almacenes de datos tradicionales (bases de datos relacionales como Oracle, Sybase, SQL Server, consultas SQL, etc.) o las plataformas de datos distribuidos más nuevas (Hadoop, Cassandra, Map Reduce, etc.).

Un buen científico de datos tiene la habilidad de obtener valor de los datos: detectar tendencias y señales y relacionarlas con el negocio. También necesita sólidas habilidades de comunicación y trabajo en equipo: solo ser técnicamente bueno con los datos no es suficiente. Debe poder comunicar conocimientos e ideas a partir de los datos con miembros del equipo no técnicos, como especialistas en marketing, gerentes de productos y altos ejecutivos. Incluso las habilidades lingüísticas no deberían ser un obstáculo.

Finalmente, la capacidad de ser creativo con los datos es fundamental: se requiere encontrar nuevas formas de analizar los datos y desarrollar productos de datos innovadores y soluciones basadas en datos para las necesidades comerciales.

Trabajando en ciencia de datos

Los científicos de datos a menudo trabajan en equipos pequeños con otros científicos de datos, ingenieros de datos (personas que conocen los aspectos de «plomería» de los datos, la infraestructura de bajo nivel necesaria), así como gerentes de productos, gerentes de marketing u otras personas de negocios.

Al igual que la ciencia, la minería de datos es exploratoria y está orientada a las ideas al mismo tiempo. Al igual que en la ciencia experimental y observacional, los científicos de datos examinan los datos para encontrar señales y tendencias a partir de las cuales sacar conclusiones comerciales. Pero también como en la ciencia teórica, desarrollan ideas (teorías) e hipótesis y las prueban usando los datos. Al igual que la ciencia, la buena ciencia de datos sigue el método científico de aprendizaje, pruebas y demostraciones incrementales para, en última instancia, generar valor empresarial (ideas de nuevos productos, conocimientos de los clientes, decisiones basadas en datos, etc.).

Este tipo de análisis de datos no es informática, pero implica mucho procesamiento de datos. Los científicos de datos programan y usan software estadístico para analizar y trabajar con conjuntos de datos grandes y complejos a diario.