Il mondo della ricerca scientifica si trova di fronte a un paradosso preoccupante: la stragrande maggioranza dei dati prodotti nei laboratori di tutto il pianeta non viene mai riutilizzata, vanificando così investimenti miliardari e rallentando sensibilmente il progresso in ambiti cruciali come la lotta contro il cancro, lo sviluppo di modelli climatici accurati e la riproducibilità degli studi. Su cento set di dati generati, circa ottanta rimangono confinati all'interno dei singoli laboratori, venti vengono condivisi ma raramente riutilizzati, meno di due rispettano gli standard FAIR e solo uno, tipicamente, porta a nuove scoperte. Per affrontare questa emergenza silenziosa, Frontiers, editore specializzato in scienza aperta, ha lanciato una soluzione innovativa che promette di rivoluzionare la gestione dei dati di ricerca.
Il sistema Frontiers FAIR² Data Management rappresenta il primo servizio completo al mondo per la gestione dei dati di ricerca potenziato dall'intelligenza artificiale. L'obiettivo è trasformare radicalmente l'approccio alla condivisione scientifica, garantendo che ogni dataset sia non solo riutilizzabile ma anche adeguatamente riconosciuto ai suoi autori. La piattaforma integra in un unico flusso di lavoro tutti i passaggi essenziali: dalla curazione alla verifica della conformità, dalla formattazione compatibile con l'AI alla revisione tra pari, fino alla certificazione e all'hosting permanente attraverso un portale interattivo.
Il cuore tecnologico del sistema risiede nell'AI Data Steward, alimentato da Senscience, la divisione AI di Frontiers che ha sviluppato FAIR². Operazioni che tradizionalmente richiedevano mesi di lavoro manuale – organizzazione, verifica, generazione di metadati e produzione di output pubblicabili – vengono ora completate in pochi minuti. I ricercatori che caricano i propri dati ricevono quattro prodotti integrati: un Data Package certificato, un Data Article sottoposto a peer review e citabile, un Interactive Data Portal con visualizzazioni e chat AI, e un certificato FAIR². Ogni elemento include controlli di qualità e riassunti chiari che rendono i dati comprensibili anche ai non specialisti e compatibili tra diverse discipline scientifiche.
L'acronimo FAIR² espande i principi FAIR tradizionali – che rendono i dati individuabili, accessibili, interoperabili e riutilizzabili – attraverso un framework aperto che garantisce la compatibilità con l'intelligenza artificiale e il riutilizzo etico sia da parte di umani che di macchine. Come ha spiegato la dottoressa Kamila Markram, cofondatrice e CEO di Frontiers: "Il 90% della scienza scompare nel vuoto. Con Frontiers FAIR² Data Management, nessun dataset e nessuna scoperta devono più andare perduti – ogni contributo può ora alimentare il progresso, ottenere il riconoscimento che merita e liberare la scienza".
Per dimostrare le potenzialità del sistema, Frontiers ha lanciato quattro dataset pilota che coprono ambiti diversi della ricerca. Il primo raccoglie informazioni su 3.800 varianti della proteina spike del SARS-CoV-2, collegando previsioni strutturali di AlphaFold2 ed ESMFold con dati sul legame ACE2 e sull'espressione, offrendo una risorsa fondamentale per la preparazione pandemica. Il secondo armonizza 343 scansioni MRI di diffusione relative a lesioni cerebrali precliniche provenienti da quattro centri di ricerca, standardizzate per protocolli e allineate per la comparabilità, supportando la scoperta di biomarcatori riproducibili.
Gli altri due dataset pilota riguardano rispettivamente gli indicatori di pressione ambientale che combinano dati osservati e previsioni modellizzate attraverso 43 paesi per sei decenni, tracciando emissioni, rifiuti, popolazione e PIL per supportare la pianificazione delle politiche climatiche basate su evidenze, e la biodiversità degli atolli dell'Indo-Pacifico, che abbraccia 280 atolli attraverso cinque regioni integrando registri di biodiversità, habitat delle barriere coralline, indicatori climatici e storie di utilizzo umano. Quest'ultimo fornisce una base senza precedenti per la modellazione ecologica e la definizione delle priorità di conservazione degli ecosistemi insulari vulnerabili.
La risposta della comunità scientifica è stata entusiasta. Il dottor Sean Hill, cofondatore e CEO di Senscience, ha sottolineato come "la scienza investa miliardi nella generazione di dati, ma la maggior parte va perduta – e i ricercatori raramente ottengono riconoscimento. Con Frontiers FAIR², ogni dataset viene citato, ogni scienziato riconosciuto – finalmente premiando il lavoro essenziale della creazione di dati". Ogni riutilizzo moltiplica il valore del dataset originale, assicurando che nessuna scoperta venga sprecata e che ogni contributo possa innescare la prossima svolta, mentre i ricercatori ottengono il merito per il loro lavoro.
I ricercatori che hanno testato i progetti pilota hanno evidenziato come Frontiers FAIR² non si limiti a preservare e condividere dati, ma costruisca fiducia nel loro riutilizzo attraverso verifiche di qualità, riassunti chiari per non specialisti e l'affidabilità necessaria per combinare dataset tra discipline, garantendo al contempo il giusto riconoscimento agli scienziati. Il dottor Ángel Borja, ricercatore principale presso AZTI, ha raccomandato questo tipo di curazione e pubblicazione dei dati perché permette di "generare informazioni molto rapidamente in un formato utile per qualsiasi utente finale".
Particolarmente significativa è stata l'osservazione del professor Neil Harris dell'UCLA, secondo cui "l'implementazione di FAIR² può fornire un controllo obiettivo sui dati sia per le mancanze che per la qualità, utile su molti livelli. Questi tipi di valutazioni imparziali e riassunti dei dati possono aiutare la comprensione da parte di esperti non di settore per migliorare in definitiva la condivisione dei dati". Maryann Martone, redattrice capo di Open Data Commons, ha definito FAIR² uno dei modi più semplici ed efficaci per rendere i dati FAIR, abbassando drasticamente la barriera che ha sempre rappresentato il vero collo di bottiglia: il tempo e lo sforzo richiesti.
La piattaforma risponde anche a esigenze specifiche di ricercatori in contesti diversi. Femke Heddema di PharmAccess ha evidenziato come Frontiers FAIR² renda più fluida l'esecuzione dei principi FAIR per ricercatori e implementatori di salute digitale, dimostrando che rendere riutilizzabili dataset come MomCare non deve essere complesso. Il dottor Vincent Woon Kok Sin dell'Università di Hong Kong ha apprezzato come la piattaforma renda il suo dataset globale sui rifiuti più visibile e accessibile, aiutando ricercatori in tutto il mondo che spesso lottano con dati scarsi e frammentati.
La visione che emerge dalle testimonianze dei ricercatori è chiara: la vera accessibilità dei dati va oltre il semplice caricamento di fogli di calcolo in un repository. Come ha osservato il dottor Sebastian Steibl del Naturalis Biodiversity Center, significa rendere i dati facili da visualizzare, esplorare e comprendere senza necessariamente richiedere anni di formazione. La piattaforma FAIR², con il suo chatbot AI e gli strumenti interattivi di esplorazione visiva e sintesi dei dati, rende le informazioni su biodiversità e ambiente ampiamente accessibili non solo agli studiosi, ma anche ai professionisti, ai responsabili politici e alle iniziative delle comunità locali.