Le regioni genomiche che segnano l'inizio dei geni umani si sono rivelate punti caldi di mutazione, dove le alterazioni del DNA si verificano con una frequenza superiore del 35% rispetto a quanto previsto dai modelli statistici. Questa scoperta, frutto dell'analisi di oltre 225.000 genomi umani, rivoluziona la comprensione dei meccanismi di insorgenza delle mutazioni ereditarie e impone una revisione degli strumenti diagnostici utilizzati nella genetica clinica. La ricerca, coordinata dalla dottoressa Donate Weghorn del Centre for Genomic Regulation di Barcellona e pubblicata il 26 novembre sulla rivista Nature Communications, identifica i siti di inizio della trascrizione come zone di vulnerabilità genetica particolarmente attive nelle primissime fasi dello sviluppo embrionale.
I ricercatori hanno concentrato la loro attenzione sui transcription start sites, le sequenze di DNA dove la macchineria cellulare avvia il processo di copiatura del materiale genetico da DNA a RNA. Analizzando 150.000 genomi della UK Biobank e 75.000 sequenze del Genome Aggregation Database, il team ha scoperto che i primi 100 paia di basi dopo questi punti di partenza accumulano mutazioni a un ritmo significativamente più elevato rispetto al resto del genoma. Queste regioni, spiega Weghorn, rappresentano "sequenze estremamente soggette a mutazioni e figurano tra le aree funzionalmente più importanti dell'intero genoma umano, insieme alle sequenze codificanti per proteine".
La vulnerabilità particolare di questi siti genomici trova spiegazione nella natura caotica del processo di trascrizione. Durante questa fase, la macchina molecolare cellulare si arresta e riprende frequentemente l'attività nelle vicinanze del punto di inizio, talvolta avviando la copiatura in entrambe le direzioni. Contemporaneamente si formano strutture temporanee che lasciano segmenti di DNA esposti a potenziali danni. Questi momenti di instabilità diventano particolarmente critici durante le rapide divisioni cellulari che caratterizzano le prime fasi post-concepimento, quando la pressione selettiva per una crescita veloce può impedire ai sistemi di riparazione del DNA di correggere tutti gli errori, lasciando "piccole cicatrici sul genoma".
Un elemento cruciale emerso dallo studio riguarda il momento in cui queste mutazioni si manifestano. Molte delle alterazioni in eccesso rilevate nei siti di inizio trascrizione insorgono subito dopo il concepimento, durante i primissimi cicli di divisione dell'embrione. Si tratta di mutazioni a mosaico, presenti solo in alcune cellule e non nell'intero organismo. Questa distribuzione disomogenea ha rappresentato per lungo tempo un ostacolo alla loro identificazione. Un genitore può essere portatore di mutazioni a mosaico che contribuiscono a malattie senza manifestare sintomi, poiché solo una porzione dei suoi tessuti contiene l'alterazione. Nonostante l'assenza di manifestazioni cliniche, queste mutazioni possono essere trasmesse attraverso ovuli o spermatozoi. Un figlio che eredita una di queste mutazioni a mosaico la presenterà in ogni cellula del proprio corpo, con possibili conseguenze patologiche.
L'analisi dettagliata ha rivelato che l'accumulo anomalo di mutazioni interessa specificamente i siti di inizio dei geni coinvolti in funzioni critiche: sviluppo tumorale, attività cerebrale e formazione degli arti. La concentrazione più elevata di queste mutazioni in eccesso si osserva quando si esaminano varianti estremamente rare, che tendono a rappresentare cambiamenti recenti nel patrimonio genetico. Questo eccesso si riduce nelle varianti più antiche e comuni, indicando che la selezione naturale rimuove progressivamente queste mutazioni nel corso delle generazioni. Le famiglie portatrici di tali alterazioni, specialmente nei geni legati a funzioni cerebrali o oncologiche, hanno minori probabilità di trasmetterle alla discendenza.
Le implicazioni pratiche di questa scoperta investono direttamente la genetica clinica. I modelli mutazionali attualmente in uso stimano quante mutazioni dovrebbero comparire in una determinata porzione del genoma in condizioni normali, fornendo una linea di base rispetto alla quale i genetisti identificano le alterazioni meritevoli di approfondimento diagnostico. Poiché i siti di inizio trascrizione accumulano naturalmente più mutazioni di quanto precedentemente riconosciuto, il livello base atteso per queste regioni risulta più elevato di quanto assumano i modelli attuali. Questo scarto metodologico può portare a interpretazioni errate: un modello che non riconosce la natura naturalmente ricca di mutazioni di una regione potrebbe classificare erroneamente come anomala una situazione in realtà normale, o viceversa ignorare l'importanza di un gene dove la selezione sta attivamente eliminando varianti dannose.
Gli studi genetici che ricercano esclusivamente mutazioni presenti nel figlio ma assenti in entrambi i genitori risultano particolarmente vulnerabili a questo punto cieco metodologico. Mentre questo approccio funziona per mutazioni presenti in ogni cellula, fallisce nel catturare le mutazioni a mosaico, che compaiono in un mix di tessuti. Di conseguenza, alcuni importanti fattori contributivi alle malattie possono sfuggire all'analisi. Weghorn suggerisce strategie correttive: "Per superare questo limite, si potrebbero analizzare i pattern di co-occorrenza delle mutazioni per aiutare a rilevare la presenza di mutazioni a mosaico, oppure riesaminare i dati scartando le mutazioni che si verificano vicino ai siti di inizio trascrizione dei geni più fortemente colpiti da questo hotspot".