Un gruppo di ricerca del MIT in collaborazione con Empirical Health ha sviluppato un modello di intelligenza artificiale capace di analizzare dati incompleti provenienti da dispositivi indossabili per prevedere condizioni mediche con un'accuratezza sorprendente. Il sistema, chiamato JETS (Joint Embedding Time Series), è stato addestrato su un dataset di oltre 3 milioni di giorni-persona raccolti da Apple Watch, dimostrando come anche dati frammentari e irregolari possano essere trasformati in strumenti diagnostici efficaci. La ricerca, recentemente accettata a un workshop della conferenza NeurIPS, rappresenta un passo significativo nell'applicazione dei modelli fondazionali al settore della salute digitale, un ambito in cui la qualità e la continuità dei dati rappresentano tradizionalmente ostacoli critici.
L'architettura alla base di JETS affonda le radici nel Joint-Embedding Predictive Architecture (JEPA), un approccio proposto da Yann LeCun quando era ancora Chief AI Scientist di Meta. A differenza dei tradizionali Large Language Model che si concentrano sulla previsione di token, JEPA addestra i modelli a inferire il significato dei dati mancanti piuttosto che ricostruirne i valori esatti. In pratica, quando il sistema si trova di fronte a lacune nelle serie temporali, apprende a comprendere cosa rappresentano le porzioni assenti basandosi sul contesto disponibile, una strategia che si è rivelata particolarmente efficace per i dati biomedici raccolti in modo non continuativo.
Il dataset utilizzato nello studio comprende informazioni provenienti da 16.522 individui, con 63 metriche distinte registrate a risoluzione giornaliera o inferiore. Queste metriche coprono cinque domini principali: salute cardiovascolare, salute respiratoria, sonno, attività fisica e statistiche generali. Un aspetto cruciale è che solo il 15% dei partecipanti disponeva di storie cliniche etichettate utilizzabili per la valutazione, mentre il restante 85% sarebbe stato inutilizzabile con approcci di apprendimento supervisionato tradizionali. JETS ha invece sfruttato l'intero dataset attraverso un pre-addestramento auto-supervisionato, per poi essere perfezionato sul sottoinsieme etichettato.
La soluzione tecnica adottata dai ricercatori prevede la conversione di ogni osservazione in una tripletta composta da giorno, valore e tipo di metrica. Questo approccio trasforma le osservazioni in token che vengono sottoposti a un processo di mascheramento, codifica e infine alimentano un predittore che stima l'embedding delle porzioni mancanti. La tecnica consente al modello di gestire efficacemente serie temporali multivariate irregolari, una caratteristica distintiva dei dati raccolti da wearable nella vita reale, dove le misurazioni possono apparire in modo discontinuo o con ampi intervalli temporali.
I risultati ottenuti sono particolarmente impressionanti se si considera la natura frammentaria dei dati di partenza. Il modello ha registrato un AUROC del 86,8% nella previsione dell'ipertensione, 70,5% per la fibrillazione atriale, 81% per la sindrome da stanchezza cronica e nuovamente 86,8% per la sindrome del nodo del seno malato. È importante sottolineare che AUROC e AUPRC non misurano strettamente l'accuratezza delle previsioni, ma piuttosto la capacità del modello di classificare e dare priorità ai casi probabili, un indicatore fondamentale per applicazioni cliniche dove l'identificazione precoce dei pazienti a rischio è cruciale.
Nel confronto con i modelli baseline, inclusa una versione precedente di JETS basata sull'architettura Transformer, il nuovo sistema ha dimostrato vantaggi consistenti, pur non risultando superiore in tutti gli scenari testati. La vera forza di JETS emerge nella gestione di metriche registrate con frequenze estremamente variabili: alcuni parametri di salute erano presenti solo nello 0,4% delle rilevazioni giornaliere, mentre altri raggiungevano il 99% di copertura. Questa capacità di estrarre valore predittivo anche da dati altamente irregolari rappresenta un breakthrough significativo per l'analisi di dati wearable nel mondo reale.
L'approccio JEPA, che sta guadagnando crescente attenzione nella comunità scientifica, si contrappone alla logica di previsione token-by-token tipica dei sistemi GPT e degli LLM, proponendo invece la costruzione di "modelli del mondo" capaci di comprendere rappresentazioni astratte dei fenomeni osservati. Non a caso, LeCun ha recentemente lasciato Meta per fondare una startup dedicata esclusivamente ai world model, che secondo la sua visione rappresentano la vera strada verso l'AGI. L'applicazione di questi principi ai dati sanitari dimostra come l'architettura possa adattarsi a domini diversi dalle immagini o dal linguaggio naturale.
Le implicazioni pratiche di questa ricerca sono rilevanti sia per gli utenti che per il settore sanitario europeo. Milioni di persone indossano dispositivi come Apple Watch in modo discontinuo, rimuovendoli durante il sonno, la ricarica o attività specifiche. Tradizionalmente, questa discontinuità limitava il valore clinico dei dati raccolti, mentre JETS dimostra che anche pattern di utilizzo irregolari possono fornire insight predittivi significativi.