La ciencia de datos es el proceso de recopilar, organizar y analizar datos para obtener conocimiento y comprensión.

¿Cuántos datos generan las personas? Forbes estima que los humanos crean 2,5 quintillones de bytes de datos nuevos cada día. Eso es suficiente para llenar unos 3.700 millones de CD. Apila esos discos uno encima del otro, y la pila se extendería casi la distancia desde la ciudad de Nueva York hasta Los Angeles. Según esas estadísticas, no sorprende que la Oficina de Estadísticas Laborales de EE.UU. prediga que las carreras en ciencia de datos crecerán hasta un 36% durante la próxima década. Pero, ¿qué es la ciencia de datos?

¿Qué es la ciencia de datos?

En pocas palabras, la ciencia de datos es el proceso de recopilar, organizar y analizar datos para obtener conocimiento y comprensión, dice Kevin Desai, profesor asistente de ciencias de la computación de UTSA y miembro principal de la facultad de SDS.

La idea es usar datos y tratar de extraer significado de ellos usando algoritmos y técnicas que pueden involucrar inteligencia artificial, aprendizaje automático, aprendizaje profundo, etc.”, dijo Desai.

“La ciencia de datos toca todo, por lo que es fácil para los estudiantes continuar con lo que están haciendo mientras agregan un nuevo conjunto de habilidades en ciencia de datos”.

Un ejemplo familiar de la ciencia de datos en el trabajo es la publicidad y las compras online, dice Rocky Slavin, también profesor asistente de informática y miembro principal de la facultad de SDS.

A medida que navegamos y compramos artículos online, o incluso en las tiendas, gracias a servicios como Apple Pay y Google Pay, esos datos se pueden usar para entrenar modelos de aprendizaje automático para predecir qué le puede interesar a una persona arbitraria para que pueda hacer sugerencias”, Slavin continuó.

Habilidades

Básicamente, la ciencia de datos incorpora habilidades de estadística, informática y otras disciplinas para extraer conocimiento de conjuntos de datos que luego las personas pueden usar para tomar decisiones más informadas, explica Rebecca Schroeder, profesora asociada de instrucción de UTSA, decana asistente de University College y cuerpo docente principal de SDS.

La ciencia de datos es el campo general que combina estas diferentes técnicas”, dijo. “Estás usando estadísticas, estás usando programación, estás usando conocimiento de dominio, y todo eso te está ayudando a dar sentido a la gran cantidad de números que hay”.

En el ejemplo de las compras online, Slavin dice que las compras recomendadas podrían haber sido alguna vez algo que un programador de software hubiera tenido que configurar manualmente.

La diferencia es que ahora todo esto se puede hacer automáticamente mediante modelos de aprendizaje automático”, dijo. “Aún mejor, los modelos continúan aprendiendo a medida que reciben nuevos datos. Entonces, a medida que cambian las tendencias, los modelos pueden mantenerse al día automáticamente”.

Pero la ciencia de datos no solo permite que Amazon le recomiende nuevos productos, que Tesla encuentre las ubicaciones óptimas para sus estaciones de carga o que los médicos diagnostiquen a los pacientes con mayor precisión gracias a las imágenes médicas mejoradas. Los profesores reconocen que se ha convertido en un componente vital en campos que van desde la investigación científica hasta la medicina, el marketing, la agricultura, las finanzas y la planificación cívica. Incluso la construcción está incorporando la ciencia de datos.

Comúnmente se piensa que la creación de grandes estructuras es simplemente una cuestión de diseño, adquisición de materiales y construcción”, dijo Slavin. “Pero al incorporar datos sobre construcciones anteriores, materiales, clima, tráfico, cadenas de suministro y logística diversa, la ciencia de datos puede ayudarnos a planificar prácticamente todos los aspectos de los proyectos a gran escala. Como resultado, el tiempo y el coste se pueden minimizar mientras se maximiza la seguridad”.

Oportunidad educativa

La rápida difusión de la ciencia de datos también es una oportunidad educativa significativa para los estudiantes que están interesados en el campo, pero que tienen la intención de seguir otras carreras. Por ejemplo, Ashwin Malshe, profesor asociado de marketing, enseña a sus alumnos a utilizar el análisis de sentimientos (usando herramientas como la inteligencia artificial para analizar el contenido emocional de la información subjetiva como las publicaciones de Twitter) para explorar cómo las empresas pueden mejorar su servicio al cliente.

Eso es lo que quiero que los estudiantes realmente entiendan”, dijo Schroeder. “Tratar de encontrar una manera de incorporar la capacitación en ciencia de datos en su especialización para aumentar sus habilidades comercializables es realmente importante, porque habrá una gran demanda de personas que tengan un conocimiento básico en ciencia de datos”.

Incluso los profesionales altamente capacitados en otros campos pueden beneficiarse de una formación en ciencia de datos. Por ejemplo, con el aumento de la inteligencia artificial y el análisis de datos, UTSA ahora ofrece un programa en múltiples departamentos, a saber, Ciencias de la Computación, Matemáticas y Análisis de Datos, donde los estudiantes con diferentes antecedentes, incluida la medicina, pueden obtener una maestría en inteligencia artificial (MS in AI) y aplicar ese conocimiento a sus campos correspondientes. Desai dice que esto es ventajoso, porque la experiencia en otros campos a menudo proporciona a los científicos de datos información sobre los desafíos que deben resolverse y cómo encontrar soluciones.

El profesor de UTSA aconseja a los estudiantes interesados en obtener un título en ciencia de datos que lleven consigo sus otras pasiones e intereses.

Pueden trabajar en su propio campo”, dijo. “La ciencia de datos toca todo, por lo que es fácil para los estudiantes continuar con lo que están haciendo mientras agregan un nuevo conjunto de habilidades en ciencia de datos”.

Leído en:

UTSA