Erbmolekül als Verschlüsselungshelfer: Die meisten echten Zufallszahlen werden heute mithilfe physikalischer Prozesse generiert. Doch auch die DNA-Synthese eignet sich als Zufallszahlengenerator, wie nun ein Experiment belegt. Dabei erzeugt die zufällige Abfolge der Basen in kurzer Zeit Millionen Gigabyte an Zufallszahlen. Dies ist das erste Mal, dass echte Zufallszahlen dieser Größenordnung auf chemischer Basis erzeugt wurden, wie Forscher im Fachmagazin „Nature Communications“ berichten.
Zufallszahlen werden für die Verschlüsselung von Daten benötigt, aber auch in der Statistik und Simulation. Diese Zahlen in der nötigen Länge und Geschwindigkeit zu produzieren, ist jedoch aufwändig. Zwar gibt es Zufallszahlengeneratoren, die mithilfe spezieller Algorithmen solche Zahlenfolgen generieren. Weil sie aber einem festen, reproduzierbaren Verfahren folgen, sind ihre Zahlen nicht komplett unberechenbar und daher für die Kryptografie nicht geeignet.
Um wirklich zufällige Zahlenfolgen zu erzeugen, nimmt man daher meist physikalische Prozesse zu Hilfe. Das können radioaktive Zerfallsprozesse sein, aber auch das atmosphärische Rauschen, Fluktuationen in einem Laser, winzige Spannungsschwankungen in einem Stromleiter oder auch der Zustand verschränkter Photonen in einem Quantensystem.
Abfolge der vier DNA-Basen als Grundlage
Auf Chemie statt auf Physik setzen dagegen Linda Meiser von der ETH Zürich und ihre Kollegen. Denn ihr Zufallsgenerator basiert auf einem der Grundprozesse allen Lebens: der Synthese des Erbmoleküls DNA. Als Basis für den Zahlencode dient dabei die Abfolge der vier DNA-Basen. Wird das Erbmolekül im Labor in einer Lösung aus allen vier Bausteinen synthetisiert, entsteht kein geplanter Code, sondern eine zufällige Abfolge der Basen.
„Die synthetische Produktion der DNA ist ein stochastischer, chemischer Prozess“, erklären die Forscher. „In unserer Studie haben wir daher die gängigen Technologien zur Synthese und Sequenzierung der DNA so kombiniert, dass wir daraus Zufallszahlen erzeugen können.“ Als Grundeinheiten für diese Zahlen dienten 64 Basen lange DNA-Abschnitte. Mit drei verschiedenen Syntheseverfahren haben die Forscher in kurzer Zeit mehr als drei Billiarden solcher Stränge erzeugt.
Filter beseitigt Ungleichgewicht
Im nächsten Schritt galt es herauszufinden, wie zufällig diese Abfolgen tatsächlich sind. Dafür sequenzierten die Wissenschaftler diese DNA-Stücke und wandelten ihre Basenabfolge dann in digitale Zahlenfolgen um. Dafür ordneten sie den Basen Werte von Null oder Eins zu: Adenosin und Cytosin entsprachen einer Null, Guanin und Thymin dagegen einer Eins. Dadurch ergab sich eine lange Abfolge von Nullen und Einsen.
Mithilfe etablierter Tests prüften Meiser und ihre Team dann, ob diese Abfolge die Kriterien einer echten Zufälligkeit erfüllte. Es zeigte sich: Weil die Basen G und T von Natur aus etwas häufiger eingebaut werden, gab es noch leichte Abweichungen vom echten Zufall. Dies jedoch gab sich, als die Forscher eine Korrekturmethode einsetzten. Dieser sogenannte Von-Neumann-Algorithmus filtert die Bits, indem er Paare gleicher Werte – 00 und 11 – löscht und nur Paare mit ungleichen Werten behält.
Alle Zufallstests bestanden
Das Ergebnis nach diesen sogenanntem De-Biasing waren nahezu perfekte Zufallszahlen: Sie absolvierten alle Standardtests mit Höchstwerten. „Im Vergleich zu anderen Methoden der Zufallszahlengenerierung zeigt die DNA-Synthese sogar eine höhere Zufallsproduktion“, konstatieren die Forscher.
„Gegenüber anderen Methoden hat unsere zudem den Vorteil, dass man mittels DNA-Synthese eine große Menge an Zufälligkeit generieren und auf einem extrem kleinen Raum, in einem kleinen Reagenzglas, aufbewahren kann“, erklärt Seniorautor Robert Grass von der ETH Zürich. Denn in einem Syntheseschritt lassen sich bis zu sieben Millionen Gigabyte an Zufallszahlen erzeugen. Das Auslesen der DNA-Stränge ist mit rund 300 Kilobyte pro Sekunde allerdings etwas langsamer.
Nach Ansicht der Wissenschaftler eröffnet die chemische Synthese von DNA damit eine echte Alternative zu physikalischen Zufallsgeneratoren. „Schon jetzt könnte die Nutzung von DNA als kommerziellem Zufallsgenerator interessant sein und in Zukunft werden sich die Kosten für das Schreiben und Lesen von DNMA noch weiter reduzieren“, schließen Meiser und ihre Kollegen. (Nature Communications, 2020; doi: 10.1038/s41467-020-19757-y)
Quelle: Eidgenössische Technische Hochschule Zürich (ETH Zürich)