Desarrollar métodos para analizar datos complejos de rendimiento de los estudiantes

Yinqiu He sintió atracción por la estadística por el equilibrio de la disciplina entre las matemáticas teóricas y el trabajo aplicado. Datos de alta dimensión.

Los estadísticos ayudan a los científicos a analizar, comprender y obtener información útil de sus datos”, señala Yinqiu. “Disfruto creando herramientas que pueden ayudar a otros científicos y profesionales a resolver sus problemas… lo mejor de ser estadístico es que puedes jugar en el patio trasero de todos”.

Con datos de alta dimensión, cada sujeto tiene múltiples características o variables asociadas, según He. “La pregunta es: ‘¿cómo podemos dar sentido a la gran dimensionalidad de los datos para obtener información que sea útil? ¿Cómo sacas de todas estas funciones y características para obtener ideas y conocimientos?’

Eligió pasar un año en DSI para expandir su perfil de investigación y hacer nuevas conexiones. “Tuve la oportunidad de abrir mi mente y ampliar mis horizontes para ver cuán ampliamente la ciencia de datos está desempeñando un papel en diferentes áreas fuera de la estadística”, dijo. “He aprendido sobre muchos problemas interesantes diferentes en áreas nuevas e interesantes, y aprecio la exposición a la diversidad de aplicaciones de ciencia de datos y a muchas personas diferentes”.

Métodos para analizar datos complejos

Por ejemplo, el profesor de estadística de Columbia, Zhiliang Ying, y He colaboran para desarrollar métodos para analizar datos complejos de rendimiento de los estudiantes, incluidos los datos del Centro Nacional de Estadísticas Educativas, y evaluar la imparcialidad de las preguntas de la prueba buscando evidencia del funcionamiento diferencial de los elementos (DIF). Una pregunta de prueba se etiqueta como DIF cuando las personas con la misma capacidad latente que pertenecen a diferentes grupos tienen una probabilidad desigual de dar una respuesta correcta.

Cuando se diseñan las pruebas, esperamos que, dadas las habilidades de un estudiante, la probabilidad de que responda correctamente la pregunta sea la misma. No queremos que otros factores como el género, la raza o la edad influyan en esa probabilidad”, explicó. “Los datos de las evaluaciones educativas modernas son de gran dimensión porque cada estudiante responde un gran conjunto de preguntas de prueba. Esto requiere un análisis de datos de alta dimensión para obtener información sobre los niveles de habilidad de un estudiante y la dificultad de las preguntas. Ahí es donde quiero poner en práctica mi conocimiento”.

Su interés en redes grandes y dinámicas también la llevó a analizar datos de Citi Bike, incluidos grupos de usuarios en diferentes ubicaciones de la ciudad y qué tan activos son los usuarios en diferentes momentos y días. “Nuestro objetivo para el proyecto es extraer tanto la estructura geográfica subyacente como el efecto de evolución temporal de la red dinámica simultáneamente. Esto podría ayudarnos a comprender el comportamiento de los usuarios y guiar la asignación futura de estaciones de bicicletas”.

Después de Columbia y DSI, se unirá a la facultad de la Universidad de Wisconsin en Madison como profesor asistente de estadística.

La vida es complicada, pero las matemáticas son simples”, dijo. “Cuando me concentro en las matemáticas, mi espíritu se eleva más allá de este mundo complicado y me siento feliz. Tengo suerte de poder concentrarme en un trabajo que es puro y no complicado de esa manera”.

Fuente:

The Data Science Institute at Columbia University