Ús de l’aprenentatge automàtic amb dades del món real per identificar el risc d’autisme en nens.
El diagnòstic endarrerit i la subidentificació del trastorn de l’espectre de l’autisme (TEA) tenen impactes personals, de salut pública i econòmics significatius; i les nenes i els nens llatins es veuen afectats de manera desproporcionada per aquest problema, en part perquè els metges tenen menys probabilitats de reconèixer els factors de risc de TEA i de derivar-los per a una avaluació de TEA. En aquesta proposta d’investigació, utilitzarem dades del món real per (1) desenvolupar un fenotip computable per al TEA utilitzant dades de registre de salut electrònic (EHR) estructurades (és a dir, codis de diagnòstic) i no estructurades (és a dir, notes del metge) de dues ubicacions diverses (Children’s Hospital Los Angeles i OneFlorida Data Trust) i (2) desenvolupen un model de predicció del risc d’aprenentatge automàtic per al TEA. Això establirà les bases d’una eina de suport a la presa de decisions clíniques, que s’integrarà als EHR per notificar a un metge quan un nen justifiqui una avaluació del TEA, que s’ampliarà fàcilment en un estudi a gran escala, a passos següents, al PCORnet global, que proporciona assistència sanitària a més de 24 milions de nens. Aprenentatge automàtic per identificar el risc d’autisme en nens fent servir dades del món real.
Resum – Aprenentatge automàtic per identificar el risc d’autisme en nens
La identificació precoç i precisa del trastorn de l’espectre de l’autisme (TEA) és important perquè les intervencions de TEA poden donar suport a resultats positius de desenvolupament a llarg termini, però hi ha un retard de més de 2 anys entre l’edat en què els nens poden ser diagnosticats de manera fiable i l’edat mitjana de diagnòstic; i 1 de cada 4 nens nord-americanes de 8 anys amb TEA no han estat diagnosticats. Les nenes i els nens llatins es veuen afectats de manera desproporcionada pel problema del diagnòstic retardat i la subidentificació del TEA, en part perquè els metges tenen menys probabilitats de reconèixer els factors de risc de TEA i els remetin a una avaluació del TEA. Per tant, es necessita predir el risc de TEA a nivell de població per millorar la detecció precoç i precisa, especialment en aquestes poblacions desateses. Els investigadors estan començant a aprofitar mètodes d’informàtica clínica per identificar el TEA a partir de dades del món real en els registres sanitaris electrònics (EHR), utilitzant tant dades estructurades (per exemple, codis de diagnòstic) com dades no estructurades (per exemple, notes del metge). Tanmateix, els algorismes existents pateixen múltiples defectes importants, com ara la no representativitat de les mostres d’entrenament, els codis de diagnòstic obsolets i els mètodes de processament del llenguatge natural (NLP) i la manca de diagnòstic de TEA “verificat” en els seus conjunts de dades estàndard d’or.
Aquesta investigació proposada aborda aquestes llacunes desenvolupant un model de risc de TEA contemporani que utilitza mètodes d’aprenentatge automàtic i NLP d’última generació. Utilitzant dades d’EHR del Children’s Hospital Los Angeles (incloent un conjunt de dades estàndard d’or amb diagnòstics de TEA “verificats” de la Boone Fetter Clinic) i OneFlorida Data Trust (una base de dades d’EHR a tot l’estat de Florida), desenvoluparem un fenotip computable per TEA utilitzant dades EHR estructurades i no estructurades (inclosos discriminadors de TEA informats pels pares i característiques associades amb TEA que sovint es troben en text lliure en els registres dels nens) i (2) desenvolupar un model de predicció de riscos d’aprenentatge automàtic per TEA. Això establirà les bases d’una eina de suport a la decisió clínica, que s’integrarà als EHR per notificar a un metge quan un nen justifiqui una avaluació del TEA.
Això té potencial per millorar la identificació del TEA en tots els nens, però pot beneficiar especialment les nenes i els nens llatins, reduint les disparitats ètniques i sexuals. A més, s’ampliarà fàcilment en un estudi de “següents passos” al PCORnet global, que porporciona assistència sanitària a més de 24 milions de nens. Mitjançant l’ús d’EHR, aquesta proposta és prometedora per a futures intervencions rendibles dels sistemes de salut que poden ajudar a corregir un “desequilibri” sociodemogràfic en la investigació de TEA arribant a nenes i nens llatins amb risc de patir TEA.
Leído en:
USC Chan Division of Occupational Science and Occupational Therapy