Storage

Archiviare nel DNA un Buono regalo Amazon è possibile

Ricercatori della Columbia University e del New York Genome Center (NYGC) hanno dimostrato che un algoritmo pensato per lo streaming di video su smartphone può sbloccare quasi tutto il potenziale di archiviazione del DNA, inserendo più informazioni nelle quattro basi dei nucleotidi.

L'uso del DNA come supporto di archiviazione è qualcosa di cui si parla da tempo. Anche Microsoft è al lavoro. Il DNA è ideale per assolvere a questo compito, perché è ultra-compatto e può durare centinaia di migliaia di anni, se conservato in un luogo fresco e asciutto. "Il DNA non si degrada nel tempo come le cassette e CD, e non diventerà obsoleto – se lo diventerà, avremo problemi più grandi", ha affermato il coautore dello studio Yaniv Erlich, professore d'informatica presso la Columbia Engineering.

dna 02

Erlich e la collega Dina Zielinski del NYGC hanno scelto sei file da codificare, o scrivere, nel DNA. Tra questi un sistema operativo completo per computer, un film, un virus per computer e una carta regalo Amazon da 50 dollari. I due hanno compresso i file in un file "master" e poi hanno suddiviso i dati all'interno di brevi stringhe di codice binario fatte di uno e zero.

Tramite un algoritmo (fountain code), hanno inserito in modo casuale le stringhe in quelle che hanno definito "gocce", e hanno mappato uno e zero in ognuna di esse all'interno delle quattro basi dei nucleotidi del DNA: A, G, C e T. L'algoritmo ha cancellato le combinazioni di lettere note per creare errori e aggiunto un codice a barre a ogni goccia per semplificare il successivo riassemblaggio dei file.

Complessivamente hanno generato una lista digitale di 72.000 filamenti di DNA, ognuno con una base lunga 200 e l'hanno inviata in un file di testo a Twist Bioscience, startup di San Francisco che è specializzata nel trasformare dati digitali in biologici. Due settimane dopo hanno ricevuto una fiala con le molecole di DNA.

Per recuperare i loro file e leggere i filamenti di DNA hanno usato una tecnologia di sequenziamento moderna. Dopodiché hanno tradotto il codice genetico nuovamente in binario, riuscendo a recuperare i file con zero errori. La loro tecnica di codifica permette di creare un numero virtualmente illimitato di copie dei file. Moltiplicando il loro campione di DNA tramite Reazione a catena della polimerasi (PCR) hanno visto che possono recuperare senza errori delle copie e anche "copie delle copie".

dna 01

La loro soluzione di codifica ha permesso di salvare 215 petabyte di dati in un singolo grammo di DNA, una densità eccezionale. La capacità di memorizzazione di dati DNA è teoricamente limitata a due cifre binarie per ogni nucleotide, ma i vincoli biologici del DNA stesso e la necessità d'includere informazioni ridondanti per riassemblare e leggere successivamente i frammenti ne riduce la capacità a 1,8 cifre binarie per nucleotide. Con la loro tecnica Erlich e Zielinski sono riusciti a inserire una media di 1,6 bit in ogni base. Si tratta almeno del 60% di dati in più dati rispetto ai metodi precedentemente provati.

Il costo di salvare e recuperare informazioni nel DNA, per quanto in discesa, è comunque alto. I ricercatori hanno speso 7 mila dollari per sintetizzare il DNA usato per archiviare 2 megabyte di dati e altri 2000 per leggerli. Il prezzo della sintesi del DNA può essere sensibilmente ridotto se si producono molecole di qualità inferiore, e si usano strategie di codifica per correggere gli errori molecolari come quella usata dal team di Erlich.

Seagate ST10000VN004 Seagate ST10000VN004
  
Seagate ST10000VX0004 Seagate ST10000VX0004