Microsoft salva 200 megabyte di dati nel DNA sintetico

Un video degli OK Go!, la Dichiarazione Universale dei Diritti dell'Uomo in oltre 100 lingue e molto altro nei 200 MB di dati che Microsoft ha salvato con successo in un filamento di DNA sintetico.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

L'interesse di Microsoft per l'archiviazione di informazioni digitali nel DNA sintetico è concreta. L'azienda è passata dalle intenzioni ai fatti: insieme all'Università di Washington è riuscita ad archiviare 200 MB di dati su filamenti molecolari di DNA.

A colpire non è solo la quantità di dati codificati e decodificati nel DNA sintetico, ma è anche lo spazio in cui sono stati in grado di conservare il tutto. Una volta codificati i dati hanno occupato un'area in una provetta "molto più piccola della punta di una matita", ha spiegato Douglas Carmean, partner architect di Microsoft. Pensate quindi a un futuro, per ora molto lontano, in cui datacenter di grandi dimensioni saranno simili a pochi cubetti di zucchero. 

ceze lab

Il team congiunto di Microsoft e dell'Università di Washington, per questo esperimento, ha scelto di archiviare le versioni digitali di alcuni lavori artistici - come un video HD della band OK Go! -, la Dichiarazione Universale dei Diritti dell'Uomo in oltre 100 lingue, i primi 100 libri del Progetto Gutenberg e il database dei semi di Crop Trust su filamenti di DNA.

Il DNA sembra la soluzione di archiviazione ideale. È compatto, dura a lungo - sino a 2000 anni senza che i dati si deteriorino (almeno secondo l'American Chemical Society) - e sarà sempre attuale (ossia non sarà soppiantato facilmente da nuove soluzioni di archiviazione come i DVD con i Blu-Ray).

"Fintanto che c'è vita basata sul DNA sul pianeta, saremo interessati a leggerlo", ha spiegato Karin Strauss, ricercatore principale di Microsoft per questo progetto. "Quindi rimarrà rilevante in eterno".

pencil low res
I dati in una punta di matita

Secondo il professor Luis Henrique Ceze l'industria biotecnologica ha fatto grandi passi avanti nel sintetizzare (codificare) e sequenziare (decodificare) dati. La strada è lunga ma i ricercatori sono ottimisti, dato che nell'ultimo anno la capacità di archiviazione nei filamenti sintetici di DNA è stata aumentata di mille volte. E credono di poter fare grandi progressi in termini di velocità con l'applicazione di principi scientifici come la correzione degli errori.

L'archiviazione dati nel DNA funziona più o meno così: prima il dato viene tradotto da 1 e 0 in lettere delle quattro basi nucleotidiche - (A)denina, (C)itosina, (G)uanina e (T)imina. Poi grazie alla collaborazione di Twist Bioscience "si traducono quelle lettere, che sono ancora in forma elettronica, all'interno delle molecole stesse e poi sono rinviate indietro", ha spiegato Karin Strauss. "È essenzialmente una provetta e si può a malapena a vedere cosa c'è dentro. Sembra un po' di sale essiccato".

Per leggere i dati si usa un'altra soluzione mutuata dall'informatica per l'accesso alla RAM. Il team usa la reazione a catena della polimerasi, una tecnica che i biologi molecolari usano di routine per manipolare il DNA, per moltiplicare o amplificare i filamenti che vogliono recuperare. Una volta che hanno drasticamente aumentato la concentrazione dei frammenti desiderati, prendono un campione, sequenziano o decodificano il DNA e quindi eseguono calcoli per la correzione degli errori.