Agrupación de datos heterogéneos de trastornos del espectro autista

El trastorno del espectro autista (TEA) es un trastorno del desarrollo que afecta la comunicación y el comportamiento. Se han realizado varios estudios en los últimos años para desarrollar una mejor comprensión de la enfermedad y, por lo tanto, un mejor diagnóstico y un mejor tratamiento mediante el análisis de diversos conjuntos de datos que consisten en encuestas y pruebas de comportamiento, descripción del fenotipo e imágenes cerebrales. Sin embargo, el análisis de datos se ve desafiado por la diversidad, complejidad y heterogeneidad de los casos de pacientes y por la necesidad de integrar diversos conjuntos de datos para alcanzar una mejor comprensión de los TEA. El objetivo del estudio es extraer grupos homogéneos de pacientes a partir de un conjunto heterogéneo de datos que consta de conjuntos de datos ADOS y de comportamiento, e interpretar los grupos descubiertos dentro del contexto médico de las áreas cerebrales afectadas utilizando datos de aprendizaje automático no supervisado para extraer un conjunto de datos heterogéneos que consta de las puntuaciones del Standardized Autism Diagnostic Observation Schedule (ADOS), que son métricas que se utilizan para medir la gravedad del autismo, datos fenotípicos y de comportamiento, que se utilizan para identificar problemas de comportamiento para los pacientes autistas, y la resonancia magnética funcional (fMRI), que es una técnica para medir y mapear la actividad cerebral. La canalización de Big Data utiliza diferentes algoritmos de agrupación para dividir a los pacientes en grupos homogéneos: agrupación jerárquica, agrupación espectral y agrupación conjunta espectral. Además, diseñamos un marco general que agrega explicabilidad a los algoritmos de agrupación de una manera que ayuda al usuario final a dar sentido a los resultados de la agrupación mediante la respuesta a sus preguntas sobre los resultados en relación con los datos de entrada en sí, así como la evidencia externa disponible. Los algoritmos de agrupación pudieron descubrir grupos homogéneos de pacientes que comparten características fenotípicas y de comportamiento similares. Además, se generó una interpretación accesible de los resultados de la agrupación mediante el mapeo de las agrupaciones descubiertas en la estructura del cerebro. A través de nuestros módulos de agrupación y explicación, nuestra metodología de aprendizaje automático sin supervisión permite a los expertos en el dominio realizar un análisis poderoso en casos homogéneos, como descubrir asociaciones ocultas entre los datos genéticos de pacientes que pertenecen al mismo grupo para tener una mejor comprensión del trastorno del espectro del autismo (TEA) y allanar el camino hacia la medicina personalizada basada en datos.

Boujelbene, Mariem, «Clustering heterogeneous autism spectrum disorder data.» (2019). Electronic Theses and Dissertations. Paper 3163. https://doi.org/10.18297/etd/3163