Ursprung des Gencodes: Die Basenabfolge unserer DNA kodiert die Bauanleitungen für Proteine über die Abfolge ihrer Grundbausteine, der Aminosäuren. Doch der genetische Code für diese Proteinbausteine könnte zu Beginn des Lebens anders ausgesehen haben als heute, wie neue Analysen nahelegen. Der heutige DNA-Code war demnach nicht der erste Code des Lebens. Zudem fanden einige Aminosäuren früher als gedacht Einzug in den Gencode, andere später.
Von der Bakterie bis zum Blauwal nutzen nahezu alle Lebewesen der Erde denselben genetischen Code. Sie alle speichern die genetischen Informationen, die ihr individuelles Aussehen und ihre Lebensweise bestimmen, in ihrer DNA oder RNA – über die Abfolge der vier Basen Adenin, Cytosin, Guanin und Thymin beziehungsweise Uracil bei der RNA. Diese Basenfolge wird dann in den Zellen in Kombinationen von 20 verschiedenen Aminosäuren übersetzt, durch die Proteine mit verschiedenster Funktion entstehen. Diesen universellen Ablauf gab es schon in dem frühsten gemeinsamen Vorfahren allen Lebens (LUCA), der vor rund vier Milliarden Jahren auf der Erde lebte.
Wie entwickelte sich unser Gencode?
„Es ist ein verblüffend komplizierter Prozess, und dennoch ist unser Code überraschend gut. Er ist nahezu optimal für eine ganze Reihe von Dingen“, sagt Seniorautorin Joanna Masel von der University of Arizona. Bisher gehen Forschende davon aus, dass sich dieser Gencode in Etappen entwickelt hat. Doch wie sahen diese Etappen aus und wie lange gibt es diesen genetischen Basen-Code in seiner jetzigen Form schon? Die Antwort auf diese Frage ist unter Experten umstritten und bislang nicht abschließend geklärt.
Bisherige Studien wie das berühmte Urey-Miller-Experiment 1952 simulierten die Entwicklung des genetischen Codes, indem sie die Lebensbedingungen auf der Ur-Erde im Labor nachbauten. Diese Versuche konnten zwar beweisen, dass mehrere Aminosäuren und andere Lebensbausteine aus nicht-lebender Materie durch spontane chemische Reaktionen in der Ursuppe entstehen können, aber nicht, wann und wie es dazu kam, dass sich diese Bausteine jeweils im genetischen Code verankerten.
Aminosäurenvergleich erlaubt Blick zurück
Ein Forschungsteam um Sawsan Wehbi von der University of Arizona ist dem Ursprung des genetischen Codes nun anhand einer neuen statistischen Methode nachgegangen. Damit analysierten Webhi und ihre Kollegen die Aminosäureabfolgen der Proteine von Lebewesen, die zu unterschiedlichen Zeitpunkten in der Erdgeschichte lebten. Dies erlaubte Rückschlüsse auf die Aminosäuren und den Gencode des frühsten gemeinsamen Vorfahrens LUCA sowie davor und danach lebenden Organismen. Die Forschenden untersuchten tausende Proteingruppen aus einer Datenbank, davon rund 400 aus Organismen aus der Zeit von LUCA.
Wehbi und ihre Kollegen verglichen dabei vor allem die Kernabschnitte der Proteine, die deren Funktion bestimmen. „Angenommen das Protein ist ein Auto, dann ist eine Domäne wie ein Rad“, erklärt Wehbi. „Es ist ein Teil, das in vielen verschiedenen Autos verwendet werden kann, und Räder gibt es schon viel länger als Autos.“ Dieser Ansatz gibt Aufschluss darüber, welche Aminosäuren wann entstanden sind – und wann diese wahrscheinlich im Gencode verankert wurden.
Codes für kleine Aminosäuren sind älter als für große
Dabei zeigte sich, dass die Proteine der ersten Lebensformen wie LUCA überwiegend aus kleineren Aminosäuremolekülen bestanden. Die Aminosäuren Cystein und Histidin, die katalytisch aktive Metalle wie Eisen, Zink oder Kupfer binden können, kamen bei LUCA ebenfalls bereits in großen Mengen vor – und damit deutlich früher als bisher angenommen. Gleiches zeigte sich für schwefelhaltige Aminosäuren wie Methionin. Diese Protein-Bausteine könnten die Lebewesen schon damals vor reaktiven Schwefel- oder Sauerstoffmolekülen geschützt haben, vermutet das Team.
Große Aminosäuren mit komplexeren Seitengruppen kamen dagegen anfangs nur selten vor und wurden erst später häufiger. Auch hydrophobe Aminosäuren kamen bereits bei LUCA und seinen Zeitgenossen vor, fanden sich jedoch in später lebenden Organismen in größeren Anteilen, berichtet das Team. Die großen und hydrophoben Aminosäuren entwickelten sich demnach zwar früh, verankerten sich aber erst in der späteren Evolution des Lebens im Gencode.
Dies deckt sich mit früheren Annahmen, wonach aufwändig herzustellende Aminosäuren sich tendenziell später entwickelten als kleinere, die auch spontan entstehen können. Doch einzelne Aminosäuren wie Glutamin kamen sogar noch später als bislang gedacht in unseren genetischen Code.
Unser DNA-Code hat andere Codes überlebt
Webhi und ihre Kollegen verglichen auch die Proteine, die es schon in der Zeit vor dem letzten gemeinsamen Vorfahren allen Lebens gegeben hat. Diese enthielten weniger Valin und Glutaminsäure als bei LUCA sowie überraschend viele Aminosäuren mit einer aromatischen Ringstruktur: Tryptophan, Tyrosin, Phenylalanin und Histidin. Diese Aminosäuren sind allerdings groß und sperrig und wurden erst weit später auch durch DNA-Basen im genetischen Code des Lebens repräsentiert gefunden.
Dass sich solche aromatischen Aminosäuren dennoch schon zu Prä-LUCA-Zeiten vor mehr als vier Milliarden Jahren in lebenden Organismen befunden haben, legt nahe, dass es vor unserem heutigen DNA-Code noch andere genetische Codes gegeben haben muss. „Dies liefert Hinweise auf andere genetische Codes, die vor unserem existierten und die seitdem in den Abgründen der geologischen Zeit verschwunden sind“, sagt Masel. Dieses Urzeit-Erbgut könnte auch Codes für weitere Aminosäuren wie Norvalin und Norleucin enthalten haben, die heute nicht mehr Teil der Standardpalette für Protein-Bausteine von Lebewesen sind.
Entstehungsgeschichte neu geschrieben
Insgesamt muss die bislang vermutete Reihenfolge revidiert werden, in der die einzelnen Aminosäuren in den heute gültigen genetischen Code der Organismen aufgenommen wurden, so Wehbi und seine Kollegen. Sie schlagen stattdessen diese evolutionäre Reihenfolge vor: Valin (V)-Glycin(G)-Isoleucin(I)-Methionen(M)-Alanin(A)-Threonin(T)-Histidin(H)-Glutamat(E)-Cystein(C)-Prolin(P)-Lysin(K)-Serin(S)-Aspartat(D)-Leucin(L)-Asparagin(N)-Arginin(R)-Phenylalanin(F)-Tyrosin(Y)-Glutamin(Q)-Tryptophan(W).
Folgestudien sollen nun überprüfen, ob diese Zuordnung zutrifft. (Proceedings of the National Academy of Sciences, 2024; doi: 10.1073/pnas.2410311121)
Quelle: University of Arizona