DNA e Data Storage

Sapevi che 1 grammo di DNA può memorizzare un miliardo di Terabyte di dati per oltre 1000 anni?

Da oltre un anno Microsoft sta collaborando con l’Università di Washington per raggiungere dei risultati nella memorizzazione dei dati nei 10 milioni di filamenti di DNA sintetico acquistati dalla Twist Bioscience di San Francisco.
Tuttavia i risultati migliori sono stati raggiunti da una coppia di ricercatori della Columbia University che, insieme alla New York Genome Center (NYGC), hanno messo a punto una nuova tecnica per memorizzare grandi quantità di dati sul DNA, ed i risultati sono meravigliosi.

I ricercatori hanno immagazzinato con successo in tutto 6 files per 2MB di dati, tra cui:

  • Un sistema operativo completo
  • Un film Francese del 1895 “arrivo di un treno a La Ciotat”
  • Buono Amazon di $ 50
  • Un virus informatico
  • Una targa Pioneer
  • Uno studio condotto nel 1948 da Claude Shannon

Come è stato possibile?

Il processo è stato denominato “DNA Fountain“. I ricercatori hanno da prima compresso tutti i file in un unico archivio, successivamente lo hanno diviso in piccole stringhe di codice binario ( fatto di zero e uno ).
Successivamente è stato usato una algoritmo di cancellazione chiamato fountain codes per “pacchettizzare” le piccole stringe con un identificativo sequenziale in grado di guidare la ricostruzione del file per intero.
Dopo aver mappato gli zero e gli uno di ogni pacchetto tramite i nucleotidi ( ATGC ) hanno ottenuto una lista di 72mila coppie di DNA contenenti i dati.
I ricercatori hanno inviato il file di testo generato in questo modo a Twist Biosciences, ricevendo delle molecole contenenti il DNA da loro scritto. Una volta sequenziato il DNA e ri-mappato da nucleotidi a bit, hanno ottenuto di nuovo i file immagazzinati con ZERO errori.

Questo è in assoluto il dispositivo a più alta densità di memorizzazione mai creato.
Se si pensa che nel 2020 è stimato che il numero di bit memorizzati sarà pari al numero complessivo di tutte le stelle dell’universo, ci si rende immediatamente conto di  quando sia importante questo passo. I costi sono ancora elevati ( tra scrivere e leggere si è speso 9000 $ per 2 Mb), ma sicuramente questo è il futuro.

Alessandro Giacani

Alessandro Giacani

CEO @ Nukecommerce ltd, Full Stack Developer.
Scovo problemi complicati – fornisco soluzioni semplici.
Chatta con me question_answer