L'intelligenza artificiale generativa sta dimostrando capacità straordinarie nell'accelerare l'analisi di enormi dataset biomedici, aprendo prospettive inedite per la ricerca scientifica. Un esperimento condotto congiuntamente dall'Università della California a San Francisco (UCSF) e dalla Wayne State University ha messo alla prova otto sistemi di AI nel compito di sviluppare algoritmi predittivi per il parto pretermine, una delle principali cause di mortalità neonatale e di disabilità cognitive e motorie nei bambini. I risultati, pubblicati sulla rivista Cell Reports Medicine il 17 febbraio, rivelano che quattro di questi sistemi hanno eguagliato o persino superato le performance di team umani composti da esperti di data science, riducendo drasticamente i tempi di elaborazione da anni a pochi mesi.
Il contesto della ricerca riguarda una delle sfide più complesse della medicina perinatale: comprendere i fattori di rischio del parto prematuro. Negli Stati Uniti nascono ogni giorno circa mille bambini pretermine, eppure le cause scatenanti rimangono in gran parte sconosciute. Per indagare questo fenomeno, il gruppo guidato da Marina Sirota, professoressa di Pediatria e direttrice ad interim del Bakar Computational Health Sciences Institute presso UCSF, ha aggregato dati sul microbioma di circa 1.200 donne in gravidanza provenienti da nove studi separati. L'elaborazione di simili quantità di informazioni richiede normalmente mesi di lavoro da parte di programmatori specializzati e l'impiego di sofisticate pipeline analitiche.
Per verificare se l'intelligenza artificiale potesse accorciare questi tempi, i ricercatori hanno fatto ricorso ai dataset utilizzati in precedenza nelle sfide internazionali DREAM (Dialogue on Reverse Engineering Assessment and Methods), competizioni di crowdsourcing scientifico che coinvolgono centinaia di team nel mondo. Sirota aveva co-coordinato una di queste sfide, focalizzata specificamente sull'analisi del microbioma vaginale per prevedere il parto pretermine, mentre Adi L. Tarca, professore presso il Center for Molecular Medicine and Genetics della Wayne State University e co-autore senior dello studio, aveva guidato altre due competizioni dedicate alla stima dell'età gestazionale attraverso campioni di sangue e placenta. Nella competizione originale, oltre cento team avevano impiegato tre mesi per sviluppare i propri modelli di machine learning, ma erano serviti quasi due anni per consolidare e pubblicare i risultati.
La metodologia dell'esperimento attuale è stata rigorosa: gli otto chatbot di intelligenza artificiale hanno ricevuto istruzioni identiche, formulate in linguaggio naturale ma altamente specifiche, analoghe a quelle utilizzate con ChatGPT. Senza intervento diretto di programmatori umani, i sistemi dovevano generare autonomamente codice analitico capace di identificare pattern associati al rischio di parto prematuro o di stimare con precisione l'età gestazionale. Quest'ultima rappresenta un parametro cruciale: la datazione della gravidanza determina infatti il tipo di assistenza medica fornita e, quando risulta imprecisa, complica significativamente la preparazione al travaglio.
L'aspetto più sorprendente riguarda la velocità di esecuzione. Il codice generato dai sistemi AI richiedeva pochi minuti per essere prodotto, un compito che normalmente impegna programmatori esperti per diverse ore o addirittura giorni. Questa capacità ha permesso persino a una coppia di giovani ricercatori inesperti – Reuben Sarwal, studente magistrale alla UCSF, e Victor Tarca, studente di scuola superiore – di sviluppare modelli predittivi funzionanti con il supporto dell'intelligenza artificiale. Il duo ha potuto completare gli esperimenti, verificare i risultati e sottomettere il lavoro a una rivista scientifica nell'arco di pochi mesi, un risultato impensabile con i metodi tradizionali.
L'efficacia dell'AI deriva dalla sua capacità di tradurre prompt testuali concisi ma altamente dettagliati in pipeline di codice operativo. Tuttavia, come sottolineano gli autori dello studio, la supervisione umana rimane indispensabile: questi sistemi possono generare risultati fuorvianti e l'expertise scientifica continua a essere essenziale per interpretare correttamente i dati. La vera innovazione consiste nel liberare i ricercatori dal peso tecnico della programmazione, consentendo loro di concentrarsi sulla formulazione di domande scientifiche significative e sull'interpretazione critica dei risultati.
"Questi strumenti di intelligenza artificiale potrebbero alleviare uno dei maggiori colli di bottiglia nella data science: la costruzione delle nostre pipeline analitiche", ha dichiarato Marina Sirota. "Questa accelerazione non potrebbe arrivare in un momento più opportuno per i pazienti che necessitano di aiuto immediato." Tomiko T. Oskotsky, co-direttrice del March of Dimes Preterm Birth Data Repository e professoressa associata presso il BCHSI di UCSF, ha inoltre evidenziato come questo tipo di lavoro sia possibile solo grazie alla condivisione aperta dei dati, che aggrega le esperienze di molte donne e l'expertise di numerosi ricercatori.
Le implicazioni pratiche di questa ricerca si estendono ben oltre la predizione del parto pretermine. Accelerare l'analisi di dataset biomedici complessi potrebbe migliorare significativamente lo sviluppo di strumenti diagnostici in molteplici ambiti della medicina. Secondo Adi Tarca, "grazie all'intelligenza artificiale generativa, i ricercatori con un background limitato in data science non dovranno sempre formare ampie collaborazioni o passare ore a correggere errori nel codice. Potranno concentrarsi sulle giuste domande biomediche." Il lavoro è stato finanziato dal March of Dimes Prematurity Research Center presso UCSF e da ImmPort, con dati generati in parte grazie al supporto del Pregnancy Research Branch del National Institute of Child Health and Human Development (NICHD).