Kleine Änderungen, große Wirkung: Bisher war für 98 Prozent aller Punktmutationen in unserer DNA unbekannt, ob sie schaden, nutzen oder wirkungslos sind. Jetzt liefert eine künstliche Intelligenz diese Informationen. Das von der Google-Tochter DeepMind entwickelte KI-System „AlphaMissense“ erkennt die im Gencode ausgetauschten DNA-Buchstaben und prognostiziert ihre Wirkung auf die Proteinfunktion. Von den 216 Millionen möglichen Punktmutationen sind demnach 32 Prozent potenziell krankmachend, 57 Prozent wahrscheinlich harmlos, so das Team in „Science“.
Durch Kopierfehler bei der Zellteilung oder äußere Einflüsse entstehen immer wieder Mutationen in unserer DNA. In vielen Fällen wird dabei irrtümlich eine Base im DNA-Code durch eine andere ersetzt. Liegt diese Mutation in einem proteinkodierenden Gen, kann die geänderte „Buchstabenfolge“ der DNA zum Einbau einer falschen Aminosäure in das resultierende Protein führen. Im schlimmsten Fall blockiert eine solche Missense-Mutation die Proteinfunktion und macht krank. Bekannte Beispiele dafür sind die Sichelzellen-Anämie, einige Krebsarten und eine Variante der Amyotrophen Lateralsklerose (ALS).
Doch nicht jede Missense-Mutation macht krank: Von den rund 9.000 dieser DNA-Veränderungen, die jeder von uns in sich trägt, bleiben die meisten folgenlos. Um potenzielle Auswirkungen vorherzusagen, muss man wissen, wie sich der Austausch der Aminosäure auf die dreidimensionale Faltung des Proteins auswirkt – denn sie ist oft eng mit der Funktionsfähigkeit gekoppelt. Genau dieses Wissen fehlt jedoch bisher weitgehend. Von den rund vier Millionen bisher bekannten Missense-Mutationen sind deshalb nur rund zwei Prozent klassifiziert.
Drei KI-Systeme arbeiten zusammen
Jetzt könnte ein neues KI-System Abhilfe schaffen: Ein Team um Jun Cheng von Google DeepMind in London hat eine künstliche Intelligenz entwickelt, die allein auf Basis des Gencodes vorhersagen kann, ob eine Missense-Mutation krankmacht oder harmlos ist. Möglich wird dies, weil das AlphaMissense getaufte System auf der 2020 von DeepMind vorgestellten KI AlphaFold aufbaut. Diese ist darauf trainiert, die Faltung eines Proteins auf Basis der Aminosäureabfolge vorherzusagen.
Konkret kombiniert AlphaMissense drei verschiedene lernfähige Untersysteme miteinander. Das erste wurde anhand bestehender Gendatenbanken darauf trainiert, häufige und weniger häufige Missense-Mutationen zu erkennen. Weil harmlose Veränderungen oft erhalten bleiben, sind sie potenziell häufiger als krankmachende, wie das Team erklärt. Das zweite Untersystem von AlphaMissense ist ein Großes Sprachmodell, das gelernt hat, welcher DNA-Basen-Code welche Aminosäure kodiert. Die dritte Komponente des KI-Systems ist eine Variante von AlphaFold. Dieses kennt die Effekte verschiedener Aminosäureabfolgen auf die Proteinfaltung.
AlphaMissense im Test
Die Kombination dieser drei Teilsysteme ermöglicht es AlphaMissense, auf Basis des DNA-Codes vorherzusagen, ob eine Punktmutation die Proteinfaltung und -funktion stört und dadurch krankmacht oder nicht. „Dabei sagt AlphaMissense nicht voraus, wie sich die Proteinstruktur durch die Mutation konkret verändert, aber es prognostiziert, wie wahrscheinlich eine pathogene Wirkung ist“, betonen Cheng und sein Team. Für ihre Studie testeten sie AlphaMissense zunächst mit Mutationen, deren Folgen schon bekannt sind oder zumindest vermutet werden. Dabei schnitt die neue KI genauso gut oder besser ab als alle zuvor existierenden Modelle, wie die Forschenden berichten.
Im nächsten Schritt folgte die eigentliche Aufgabe: Theoretisch sind in den 19.223 proteinkodierenden Genen des Menschen insgesamt 216 Millionen verschiedene Punktmutationen möglich. AlphaMissense sollte nun daraus die Mutationen identifizieren, die die Aminosäureabfolge des Proteins ändern und dann vorhersagen, ob diese Missense-Mutation schädlich oder harmlos ist.
32 Prozent der Mutationen könnten krankmachen
Das Ergebnis: Die künstliche Intelligenz hat 71 Millionen Veränderungen des Gencodes als Missense-Mutation identifiziert. Von diesen sind ihrer Prognose nach 32 Prozent potenziell krankmachend und 57 Prozent wahrscheinlich harmlos. „Damit liefern wir erstmals eine relativ zuverlässige Prognose für die meisten beim Menschen vorkommenden Missense-Varianten“, konstatieren die Forschenden. Zusätzlich haben sie auch Vorhersagen für die gesammelten Effekte der Missense-Mutationen in den einzelnen Genen erstellt.
Zusammen genommen erweitern die neuen Erkenntnisse das Wissen über menschliche Genvarianten beträchtlich. Gleichzeitig könnten sie dabei helfen, potenziell krankmachende Mutationen in Zukunft besser zu erkennen, wie Cheng und seine Kollegen erklären. „Zusammengenommen haben die Prognosen von AlphaMissense das Potenzial, unser Verständnis der molekularen Effekte von DNA-Varianten auf die Proteinfunktion zu erweitern. Sie könnten zur Entdeckung neuer Krankheitsgene führen und die Diagnose seltener genetisch bedingter Krankheiten verbessern“, so das Team.
Weitere Forschung nötig
In einem begleitenden Kommentar geben Joseph Marsh von der University of Edinburgh und Sarah Teichmann von der University of Cambridge allerdings zu bedenken, dass es sich hier nur um strukturbasierte Prognosen handelt. „Es ist daher wichtig, die Einstufung als potenziell pathogen nicht mit den sehr spezifischen klinischen Definitionen dieses Begriffs zu verwechseln“, erklären sie. Ob eine als potenziell pathogen eingestufte Mutation in der Praxis tatsächlich krank macht, muss erst noch überprüft werden. (Science, 2023; doi: 10.1126/science.adg7492)
Quelle: American Association for the Advancement of Science (AAAS)