MP3 e altri file all'interno del DNA sintetico: si può fare!

I ricercatori dell'EMBL-EBI hanno reso l'archiviazione sfruttando il DNA una realtà più concreta, superando alcuni dei problemi noti finora. Siamo ancora lontani dall'uso del DNA per salvare file, ma si tratta di un buon passo avanti.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

I ricercatori dell'EMBL-European Bioinformatics Institute (EMBL-EBI) hanno sviluppato un modo per archiviare dati nel DNA sintetico (non biologico) - un materiale che, come noto, dura decine di migliaia di anni. Questo studio, pubblicato su Nature, ce ne ricorda uno analogo realizzato dai ricercatori del Wyss Institute dell'Università di Harvard e apre alla possibilità d'immagazzinare almeno 100 milioni di ore di filmati in HD all'interno di una "tazza" di DNA.

Nel mondo ci sono molte informazioni digitali, circa 3 zettabyte (3000 miliardi di miliardi di byte) e quello dell'archiviazione è un problema crescente, specie in ambito scientifico, dove la mole di dati trattata è enorme. Per questo tipo d'impiego gli hard disk sono comunque troppo costosi e richiedono energia mentre i nastri magnetici si degradano rapidamente.

Il DNA invece dura nel tempo, è incredibilmente piccolo, denso e non ha bisogno di energia per archiviare i dati. La lettura del DNA inoltre è abbastanza semplice, ma scrivervi all'interno è stato finora un ostacolo importante per rendere il DNA un mezzo di archiviazione con cui lavorare. Due le sfide: la prima è che usando i metodi attuali è possibile produrre solo brevi filamenti di DNA, e questo limita lo spazio complessivo con cui lavorare. La seconda è che lettura e scrittura del DNA sono soggette a errori, causati da lettere ripetute codificate all'interno dei filamenti del DNA.

Per evitare tutto questo il dato in bit si converte in trit,  che secondo i colleghi di Wired è "l'unità di base di un sistema numerico che usa tre cifre (generalmente 0, 1 e 2) al posto di due (0 e 1); dopodiché a ogni trit si abbina un nucleotide (le unità che compongono una molecola di DNA, NdR). In questo modo è possibile assemblare lunghi filamenti di DNA in cui, grazie alle molteplici combinazioni numeriche possibili con un codice a tre cifre, è quasi impossibile avere vicino due nucleotidi dello stesso tipo (la maggior fonte di errore in questo tipo di tecnologie). Successivo il filamento si può quindi spezzare in piccole porzioni (più facilmente manipolabili) a cui si legano sequenze indice che ne indicano la posizione all'interno del filamento originale".

Per testare la nuova tecnica la californiana Agilent Technologies si è offerta di immagazzinare dati nelle stringhe di DNA. I ricercatori hanno inviato all'azienda vari file, codificati nel metodo appena citato. Tra questi troviamo - per un totale di 739 kilobyte - una versione codificata di un MP3 del noto discorso "I Have a Dream" di Martin Luther King, una foto in formato JPG dell'EMBL-EBI; un PDF, file TXT e un file che descrive il processo di codifica usato.

Agilent ha scaricato quei file e trasferito le informazioni in centinaia di migliaia di stringhe di DNA, grandi quanto un granello di polvere. L'azienda ha poi inviato le stringhe codificate nuovamente a BI, dove gli scienziati sono riusciti a ricostruire la sequenza ed i file senza errori"Abbiamo creato un codice che è tollerante all'errore usando una forma molecolare che sappiamo durerà, nelle giuste condizioni, per 10.000 anni o forse anche più a lungo", ha dichiarato il ricercatore Nick Goldman. "Fino a quando qualcuno sa che cos'è il codice, sarete in grado di leggerlo se possedete un macchinario che può leggere il DNA".

Anche se ci sono molti aspetti pratici da risolvere, la densità e la longevità del DNA lo rendono una soluzione di archiviazione che potrebbe davvero rappresentare il futuro. Il prossimo passo dei ricercatori è perfezionare lo schema di codifica ed esplorare gli aspetti pratici, gettando le basi per un modello di archiviazione basato sul DNA su scala commerciale.