Biologie

DNA als robuster Datenspeicher

Biomoleküle speichern digitale Informationen zuverlässig

Der Basencode der DNA eignet sich bestens als Datenspeicher © iStock.com

Statt Festplatte: Forscher haben große Mengen digitaler Daten in DNA gespeichert. Zwei Megabyte an komprimierten Informationen kodierten sie dabei in Form der Biomoleküle – und lasen sie anschließend fehlerfrei wieder aus. Das Besondere: Das von dem Team verwendete Verfahren ist nicht nur effizient, sondern auch äußerst robust. Denn selbst aus mehrfach kopierter DNA ließen sich die ursprünglichen Daten noch einwandfrei wiedergewinnen.

Die Menschheit produziert immer mehr Daten. Gleichzeitig aber droht das digitale Vergessen, weil die heutigen Speichermedien eher kurzlebig sind. Durch den steten Wandel der Technologien und die mangelnde Haltbarkeit der Datenträger müssen Archive digitaler Daten heute regelmäßig umkopiert werden. Was auf einer normalen Festplatte liegt, könnte sonst in wenigen Jahrzehnten unlesbar sein.

Langlebig und niemals veraltet

Um diese Problematik künftig zu vermeiden, wenden sich Wissenschaftler inzwischen einem uralten Speichermedium der Natur zu: der DNA. Ihr Basencode speichert nicht nur die Erbinformation von Lebewesen hervorragend. Er taugt auch als Speicher für digitale Daten. Denn die Codesprache der Natur ist der binären Sprache von Computern sehr ähnlich. Der einzige Unterschied: Auf der Festplatte repräsentieren Nullen und Einsen die Daten, in der DNA sind es die Basen A, C, T und G.

Im Vergleich zum Festspeicher hat das Biomolekül jedoch einen entscheidenden Vorteil: Es kann tausende von Jahren unbeschadet überdauern, wenn es unter den richtigen Bedingungen gelagert wird. „Anders als Kassetten und CDs wird dieses Speichermedium außerdem niemals veraltet sein – und falls doch, haben wir dann ganz andere Probleme“, sagt Yaniv Erlich vom New York Genome Center.

Zwei Megabyte als Buchstabencode

Wie sich die enormen Datenmengen unserer heutigen Gesellschaft verlässlich in DNA speichern lassen, haben Erlich und seine Kollegin Dina Zielinski nun eindrucksvoll bewiesen. Dafür kodierten sie sechs Dateien als DNA – unter anderem einen Text des Informationstheoretikers Claude Shannon, einen französischen Film, einen Computer-Virus und ein vollständiges Computer-Betriebssystem.

Um diese in komprimierter Form insgesamt zwei Megabyte große Datenmenge umzuwandeln, nutzten die Forscher einen speziellen Algorithmus – genannt Fountain Code – der Informationen nach dem Zufallsprinzip in kleine Pakete schnürt und anschließend in der richtigen Reihenfolge wieder zusammensetzen kann. Das System kodiert die Informationen dabei mehrfach. Auf diese Weise gehen keine Daten verloren, auch wenn einige DNA-Nukleotide des späteren Speichers beschädigt sein sollten. Das Besondere: Trotz des Einfügens redundanter Informationen ist das Kodierverfahren sehr effizient.

Fehlerfrei – trotz mehrfachen Kopierens

Insgesamt generierten Erlich und Zielinski auf diese Weise einen 72.000 DNA-Stränge langen Code, bei dem jeder Strang aus 200 Basen besteht. Diese Buchstabenfolge schickten sie an ein Labor, das anhand dieser Vorlage DNA-Moleküle synthetisierte. Dann folgte der spannende Moment: Würde sich aus diesen Molekülen die originale Information wiedergewinnen lassen?

Tatsächlich konnten die Forscher ihre Daten mithilfe einer Software fehlerfrei dekodieren. Viel Erstaunlicher aber: Der gleiche Erfolg ließ sich mit Kopien der DNA erzielen. Die Wissenschaftler vervielfältigten die Biomoleküle mithilfe der Polymerase-Kettenreaktion wieder und wieder. Diese Kopien und auch Kopien dieser Kopien und so weiter konnten fehlerfrei dekodiert werden. Das zeige, dass das Kodierverfahren mittels Fountain-Code äußerst robust sei, so das Team.

Teures Verfahren

Die Forscher zeigten zudem, dass sie mit ihre Methode Informationen nicht nur sicher, sondern auch effizient in großen Mengen speichern können. Demnach reicht ein einziges Gramm DNA aus, um 215 Petabyte an Daten aufzubewahren. Der einzige Haken an dem Speicherverfahren: die Kosten. 7.000 US-Dollar kostete allein das Synthetisieren der Biomoleküle. Noch einmal 2.000 Dollar gaben die Forscher aus, um ihre Daten anschließend auszulesen. (Science, 2017; doi: 10.1126/science.aaj2038)

(Columbia University School of Engineering and Applied Science, 06.03.2017 – DAL)

Keine Meldungen mehr verpassen – mit unserem wöchentlichen Newsletter.
Teilen:

In den Schlagzeilen

News des Tages

Diaschauen zum Thema

Dossiers zum Thema

Bücher zum Thema

Die berechnete Welt - Leben unter dem Einfluss von Algorithmen Von Nora S. Stampfl

50 Schlüsselideen Digitale Kultur - Tom Chatfield und Carl Freytag

Die Wunder maschine - Die unendliche Geschichte der Daten- verarbeitung von Herbert Matis

Top-Clicks der Woche