L'analisi microscopica delle cellule ematiche rappresenta da oltre un secolo un pilastro della diagnostica medica, ma richiede anni di formazione specialistica e rimane soggetta a variabilità interpretativa anche tra esperti. Un nuovo sistema basato sull'intelligenza artificiale generativa, sviluppato da un consorzio di ricerca britannico che coinvolge l'Università di Cambridge, l'University College London e la Queen Mary University of London, promette di superare questi limiti storici, applicando alla medicina di laboratorio la stessa tecnologia che alimenta i generatori di immagini come DALL-E. Il sistema, denominato CytoDiffusion, non si limita a classificare le cellule in categorie predefinite, ma modella l'intero spettro di variabilità morfologica delle cellule sanguigne normali, consentendo di identificare con maggiore precisione e coerenza le anomalie associate a patologie gravi come le leucemie.
La particolarità metodologica di questo approccio risiede nell'utilizzo di modelli generativi addestrati su un dataset eccezionale: oltre mezzo milione di immagini di strisci ematici raccolti presso l'Addenbrooke's Hospital di Cambridge, descritto dagli autori come il più vasto mai assemblato in questo campo. A differenza degli algoritmi convenzionali di riconoscimento di pattern, che apprendono a separare le immagini in classi discrete, CytoDiffusion impara la distribuzione probabilistica delle caratteristiche cellulari normali, acquisendo così la capacità di rilevare deviazioni sottili che potrebbero sfuggire anche a osservatori esperti. Questa strategia conferisce al sistema una resilienza superiore rispetto alle variazioni tecniche tra diversi ospedali, microscopi e protocolli di colorazione, un problema che affligge cronicamente i sistemi di intelligenza artificiale medica quando vengono trasferiti da un contesto clinico all'altro.
Simon Deltadahl, primo autore dello studio pubblicato su Nature Machine Intelligence e ricercatore presso il Dipartimento di Matematica Applicata e Fisica Teorica di Cambridge, sottolinea la rilevanza clinica del problema: "Tutti abbiamo numerosi tipi di cellule ematiche con proprietà e ruoli diversi nel nostro organismo. I globuli bianchi si specializzano nel combattere le infezioni, ma riconoscere come appare una cellula ematica anomala o patologica al microscopio è parte fondamentale della diagnosi di molte malattie". Il riconoscimento di piccole differenze nelle dimensioni, nella forma e nella struttura cellulare costituisce infatti il fondamento diagnostico per numerosi disturbi ematologici, ma padroneggiare questa abilità richiede anni di esperienza, e persino specialisti altamente qualificati possono giungere a valutazioni discordanti nei casi complessi.
La dimensione del problema è anche quantitativa: un singolo striscio ematico standard può contenere migliaia di cellule individuali, un numero che eccede largamente le capacità di analisi esaustiva di un operatore umano. "Gli esseri umani non possono osservare tutte le cellule di uno striscio: è semplicemente impossibile", afferma Deltadahl. "Il nostro modello può automatizzare questo processo, gestire i casi di routine e segnalare per la revisione umana qualsiasi elemento insolito". Questa esigenza è particolarmente sentita dai clinici: il dottor Suthesh Sivapalaratnam, coautore senior della ricerca presso la Queen Mary University di Londra, racconta che "la sfida clinica che affrontavo come giovane ematologo era che, dopo una giornata di lavoro, mi trovavo di fronte molti vetrini ematici da analizzare. Mentre li esaminavo nelle ore tarde, mi sono convinto che l'intelligenza artificiale avrebbe fatto un lavoro migliore del mio".
Nei test di validazione, CytoDiffusion ha identificato cellule anomale associate alla leucemia con una sensibilità molto superiore rispetto ai sistemi esistenti, eguagliando o superando le prestazioni dei modelli leader attuali pur essendo stato addestrato con un numero significativamente inferiore di esempi. Ma l'aspetto forse più notevole del sistema, secondo i ricercatori, non risiede tanto nell'accuratezza assoluta quanto nella sua capacità di quantificare l'incertezza delle proprie previsioni. "Dove il sistema si è davvero distinto è stato nel sapere quando era incerto", spiega Deltadahl. "Il nostro modello non affermerebbe mai di essere certo per poi rivelarsi in errore, ma questo è qualcosa che gli esseri umani talvolta fanno". Questa consapevolezza metacognitiva – la capacità di riconoscere i limiti della propria conoscenza – rappresenta un elemento critico nel processo decisionale clinico.
Il professor Michael Roberts, coautore senior del Dipartimento di Matematica Applicata e Fisica Teorica di Cambridge, evidenzia che il sistema è stato valutato proprio rispetto alle sfide reali che l'intelligenza artificiale medica incontra nella pratica quotidiana: "Abbiamo valutato il nostro metodo contro molte delle difficoltà riscontrate nell'IA del mondo reale, come immagini mai viste prima, immagini catturate da macchine diverse e il grado di incertezza nelle etichette diagnostiche. Questo framework offre una visione multifaccettata delle prestazioni del modello che riteniamo sarà vantaggiosa per i ricercatori". Un elemento particolarmente significativo della validazione è stato un esperimento in stile test di Turing: quando dieci ematologi esperti sono stati chiamati a distinguere immagini reali di cellule ematiche da quelle sintetiche generate dall'intelligenza artificiale, le loro prestazioni non sono risultate superiori al caso casuale. "Questo mi ha davvero sorpreso", ammette Deltadahl. "Si tratta di persone che osservano cellule ematiche tutto il giorno, eppure nemmeno loro riuscivano a distinguerle".
Nell'ambito del progetto, il team di ricerca sta rendendo disponibile quella che viene descritta come la più vasta collezione pubblicamente accessibile di immagini di strisci ematici periferici al mondo, con oltre mezzo milione di campioni. "Rendendo questa risorsa aperta, speriamo di dare ai ricercatori di tutto il mondo la possibilità di costruire e testare nuovi modelli di intelligenza artificiale, democratizzare l'accesso a dati medici di alta qualità e contribuire in definitiva a una migliore assistenza ai pazienti", afferma Deltadahl. Questa scelta di apertura dei dati riflette un crescente riconoscimento nella comunità scientifica dell'importanza della condivisione delle risorse per accelerare l'innovazione nella ricerca medica basata sull'intelligenza artificiale.
Nonostante i risultati promettenti, i ricercatori sottolineano con chiarezza che CytoDiffusion non è concepito per sostituire i medici specializzati, ma per assisterli, segnalando rapidamente i casi preoccupanti ed elaborando automaticamente i campioni di routine. Il professor Parashkev Nachev dell'UCL articola una visione più ampia del ruolo dell'intelligenza artificiale in medicina: "Il vero valore dell'IA sanitaria non risiede nell'approssimare l'expertise umana a costo inferiore, ma nel consentire un potere diagnostico, prognostico e prescrittivo maggiore di quanto possano raggiungere sia gli esperti sia i semplici modelli statistici. Il nostro lavoro suggerisce che l'IA generativa sarà centrale in questa missione, trasformando non solo la fedeltà dei sistemi di supporto clinico ma la loro comprensione dei limiti della propria conoscenza".
Il team riconosce che ulteriori ricerche sono necessarie per aumentare la velocità computazionale del sistema e per validarne le prestazioni su popolazioni di pazienti più diverse, garantendo accuratezza ed equità diagnostica attraverso differenti contesti demografici e geografici. Il progetto ha ricevuto finanziamenti dalla Trinity Challenge, Wellcome, dalla British Heart Foundation, dal Cambridge University Hospitals NHS Trust, dal Barts Health NHS Trust, dal NIHR Cambridge Biomedical Research Centre, dal NIHR UCLH Biomedical Research Centre e da NHS Blood and Transplant. Il lavoro è stato condotto dal gruppo di lavoro sull'imaging all'interno del consorzio BloodCounts!, un'iniziativa internazionale che mira a migliorare la diagnostica ematologica in tutto il mondo mediante l'applicazione dell'intelligenza artificiale, segnalando come la collaborazione tra istituzioni accademiche e strutture sanitarie nazionali possa generare progressi significativi nella medicina di precisione.