Datenexplosion: Die Genforschung könnte bald der größte Mitspieler im Big Data-Ozean werden. Denn DNA-Sequenzierungen von Pflanzen, Tieren und Menschen nehmen rapide zu und mit ihnen die anfallende Datenmenge. Schon in zehn Jahren könnten sie mehrere Exabyte jährlich umfassen – und Youtube und andere Datenriesen weit hinter sich lassen, wie die Forscher im Fachmagazin „PloS Biology“ berichten. Es sei daher dringend nötig, sich auf diese Herausforderung technisch vorzubereiten.
Wenn es um die schiere Menge an anfallenden Daten geht, dann liegen heute Youtube, Twitter und in der Forschung Astronomie und Teilchenphysik weit vorne. Allein auf Youtube werden jede Minute 300 Stunden Film hochgeladen, im Jahr müssen bis zu einem Exabyte an neuen Daten gespeichert werden – das entspricht einer Trillion Bytes oder einer Million Terabytes.
Explosion von DNA-Sequenzierungen
Doch bereits in zehn Jahren könnte ein neuer Mitspieler im Big Data-Bereich alle bisherigen überflügeln: die Genforschung. „Weil die Sequenzier-Technologie immer besser wird und die Kosten sinken, erwarten wir eine Explosion von DNA-Sequenzierungen, die eine gewaltige Flut von Daten erzeugen werden“, sagt Studienleiter Gene Robinson von der University of Illinois in Urbana-Champaign.
Schon jetzt verdoppelt sich die Menge der genetischen Daten alle sieben Monate, wie die Forscher berichten. Und dieser Trend wird sich fortsetzen. Denn allein in der Biologie haben mehrere Projekte das Ziel, das Erbgut möglichst aller bekannten Tier- und Pflanzenarten zu entschlüsseln. „Bis 2025 wird es nach unseren Schätzungen mindestens 2,5 Millionen komplett sequenzierte Genome von tierischen und pflanzlichen Organismen geben“, so die Wissenschaftler. Mehrere Millionen Genome von Mikroben kommen da noch dazu.