Nel complesso labirinto molecolare che regola la vita delle cellule umane, esistono reti di comunicazione genetica così intricate da rappresentare ancora oggi una sfida formidabile per la ricerca oncologica. Quando questi sistemi di regolazione genica si alterano, possono innescare processi tumorali difficili da decifrare con gli strumenti analitici tradizionali. Per affrontare questa complessità, un gruppo di ricercatori spagnoli ha sviluppato una piattaforma computazionale capace di mappare le interazioni tra molecole regolatrici e geni messaggeri, fornendo previsioni prognostiche accurate e soprattutto interpretabili dal punto di vista biologico. Si tratta di un contributo significativo in un'epoca in cui i modelli di intelligenza artificiale applicati alla genomica tendono a produrre risultati precisi ma spesso privi di spiegazioni comprensibili agli scienziati.
RNACOREX, questo il nome della piattaforma open-source, nasce dalla collaborazione tra l'Institute of Data Science and Artificial Intelligence (DATAI) e il Cancer Center della Clínica Universidad de Navarra. Il software, pubblicato sulla rivista PLOS Computational Biology, è stato validato utilizzando dati provenienti da tredici diversi tipi di tumore raccolti dal consorzio internazionale The Cancer Genome Atlas (TCGA), che rappresenta uno dei più vasti archivi di informazioni genomiche oncologiche disponibili alla comunità scientifica.
La peculiarità di RNACOREX risiede nella sua capacità di analizzare simultaneamente migliaia di molecole biologiche, identificando le interazioni più rilevanti tra microRNA (miRNA) e RNA messaggero (mRNA). I microRNA sono brevi sequenze di RNA non codificante che regolano l'espressione genica legandosi agli mRNA e modulandone la traduzione in proteine. Quando questa regolazione fine viene compromessa, possono emergere fenotipi patologici, inclusi quelli tumorali. Tuttavia, distinguere le interazioni biologicamente significative dal rumore di fondo rappresenta una sfida computazionale considerevole, data l'enorme quantità di dati disponibili e la presenza di segnali spurii.
Rubén Armañanzas, responsabile del Digital Medicine Laboratory presso DATAI e coordinatore dello studio, spiega che comprendere l'architettura di queste reti è fondamentale per rilevare, studiare e classificare i diversi tipi tumorali. Il problema principale, sottolinea, risiede nell'assenza di strumenti accessibili e precisi capaci di distinguere quali interazioni molecolari siano effettivamente associate a ciascuna patologia, considerando la vastità dei dati e l'abbondanza di falsi positivi.
La metodologia implementata in RNACOREX integra informazioni validate provenienti da database biologici internazionali con dati reali di espressione genica, assegnando priorità alle interazioni miRNA-mRNA più significative dal punto di vista biologico. A partire da questa base, il sistema costruisce progressivamente reti regolatorie di crescente complessità che possono funzionare anche come modelli probabilistici per lo studio del comportamento delle malattie. Questa architettura permette non solo di predire esiti clinici come la sopravvivenza dei pazienti, ma anche di identificare pattern molecolari condivisi tra diversi tipi tumorali e di evidenziare singole molecole con forte rilevanza biomedica.
Aitor Oviedo-Madrid, primo autore della pubblicazione e ricercatore presso DATAI, evidenzia come la piattaforma abbia raggiunto prestazioni predittive comparabili a quelle di sistemi di intelligenza artificiale avanzati, distinguendosi però per un elemento cruciale: la capacità di fornire spiegazioni interpretabili delle interazioni molecolari che sottendono i risultati ottenuti. Questa caratteristica contrasta con l'approccio "black-box" di molti algoritmi di machine learning, che pur essendo precisi risultano opachi nei meccanismi decisionali, limitando la loro utilità nella pratica biomedica dove la comprensione dei processi biologici è essenziale.
I test condotti hanno coinvolto tumori della mammella, del colon, del polmone, dello stomaco, melanomi e neoplasie della testa e del collo. In ciascun caso, RNACOREX ha generato una "mappa molecolare" che aiuta a prioritizzare nuovi bersagli biologici, accelerando potenzialmente il processo di ricerca oncologica. Le reti regolatorie identificate possono infatti suggerire nuove ipotesi sui meccanismi di crescita e progressione tumorale, indicando al contempo promettenti marcatori diagnostici o target terapeutici da esplorare in studi futuri.
La piattaforma è stata rilasciata come software open-source su GitHub e Python Package Index (PyPI), includendo strumenti automatizzati per il download dei database necessari. Questa scelta facilita l'integrazione del software nei flussi di lavoro di laboratori e istituti di ricerca, democratizzando l'accesso a tecnologie computazionali avanzate. Il progetto ha ricevuto finanziamenti parziali dal Governo della Navarra attraverso il programma ANDIA 2021 e dall'iniziativa europea ERA PerMed JTC2022 PORTRAIT, sottolineando il supporto istituzionale a questo tipo di ricerca interdisciplinare.
Armañanzas sottolinea come, in un contesto in cui l'intelligenza artificiale applicata alla genomica sta accelerando rapidamente, RNACOREX si posizioni come una soluzione esplicabile e facilmente interpretabile, rappresentando un'alternativa ai modelli opachi e contribuendo a tradurre i dati omici nella pratica biomedica quotidiana. Questa caratteristica diventa particolarmente rilevante nell'ottica della medicina di precisione, dove le decisioni cliniche devono basarsi su evidenze biologiche comprensibili e verificabili.
Il team dell'Università di Navarra sta già lavorando all'espansione delle capacità del software. Tra le implementazioni pianificate figurano l'analisi delle vie metaboliche e l'integrazione di nuovi livelli di dati sulle interazioni molecolari, con l'obiettivo di sviluppare modelli che spieghino più compiutamente i meccanismi biologici alla base della crescita e progressione tumorale. Questi sviluppi si inseriscono nell'impegno più ampio dell'istituzione verso una ricerca interdisciplinare che combina biomedicina, intelligenza artificiale e scienza dei dati per far progredire la medicina oncologica personalizzata.