Spannender Durchbruch: Die dreidimensionale Struktur eines Proteins nur anhand seiner Aminosäuresequenz vorherzusagen, gilt als eine der größten Herausforderungen der Biochemie. Jetzt ist dies einer künstlichen Intelligenz mit bislang unerreichter Treffsicherheit gelungen. Das KI-System „AlphaFold“ der Google-Tochter DeepMind hat für 70 von 100 unbekannten Proteinen die Struktur mit einem Genauigkeitswert von über 90 vorhergesagt – dafür benötigen Forscher mit klassischen Methoden meist Jahre.
Proteine sind die Bausteine unseres Lebens, nahezu alle Körperfunktionen gehen auf sie zurück. Entscheidend für ihre Funktion ist dabei die dreidimensionale Struktur der Proteine. Doch bisher ist nur von rund einem Prozent dieser unverzichtbaren Moleküle die dreidimensionale Struktur bekannt. Der Grund: Zwar bestehen Proteine „nur“ aus einer Kette von Aminosäuren, deren Abfolge sich aus der genetischen Bauanleitung ergibt. Doch wie sich diese Aminosäurekette dann faltet, hängt von einer Vielzahl von Faktoren ab und galt lange als nahezu unberechenbar.
1969 schätzte der Biochemiker Cyrus Levinthal, dass für ein typisches Protein 10 hoch 300 mögliche Konfigurationen existieren – mehr als es Sterne im gesamten Kosmos gibt. „Obwohl diese Struktur eindeutig durch die Gesetze der Physik vorgegeben ist, ist deren Berechnung ausgehend von den grundlegenden Formeln der Quantenmechanik als aussichtslos anzusehen. Der dazu benötigte Rechenaufwand wäre gigantisch“, erklärt Jürgen Cox vom Max-Planck-Institut für Biochemie.
Deshalb gilt die Vorhersage der Proteinstruktur allein auf Basis der Aminosäuresequenz als eine Art „heiliger Gral“ der Biologie.
Neuronales Netz als Strukturanalytiker
Jetzt könnte eine künstliche Intelligenz dem Erreichen dieses Grals einen entscheiden Schritt näher gekommen sein. Entwickelt wurde das lernfähige KI-System von DeepMind, dem KI-Forschungszentrum von Google/Alphabet, von dem auch die Systeme AlphaGo und AlphaZero stammen. „AlphaFold“ ist ein neuronales Netzwerk, das mithilfe von 170.000 bekannten Proteinstrukturen darauf trainiert wurde, Gesetzmäßigkeiten in der Proteinfaltung zu erkennen.
„Man kann sich ein gefaltetes Protein als einen räumlichen Graphen vorstellen, in dem die Aminosäurereste die Kanten und die Verbindungen zwischen ihnen die Ecken bilden“, heißt es im Blog von DeepMind. „AlphaFold versucht, die Struktur dieses Graphen zu interpretieren, während er den Graphen allmählich aufbaut.“ Durch ständigen Abgleich entwickelt das System dann eine Struktur, die den von ihm implizit gelernten Regeln am ehesten entspricht.
92 von 100 erreichbaren Punkten
Wie erfolgreich AlphaFold damit ist, hat das KI-System nun im weltweiten CASP-Wettbewerb (Critical Assessment of Protein Structure Prediction) unter Beweis gestellt. In diesem erhalten Forschergruppen die Aminosäuresequenzen für Proteine, deren dreidimensionale Struktur nicht veröffentlicht ist. Ihre Aufgabe ist es nun, die Faltung vorherzusagen. Ihr Ergebnis wird anschließend mit experimentellen Daten verglichen. Der sogenannte Global Distance Test (GDT) gibt dabei an, wie nah die prognostizierten Positionen der Proteinkomponenten ihrer tatsächlichen Position sind.
Das Ergebnis in diesem Jahr: AlphaFold konnte die Struktur von 70 der zu lösenden 100 Proteinsequenzen mit hoher Präzision vorhersagen. Er erreichte im Schnitt 92,4 GDT-Punkte von 100 möglichen, bei als schwer zu knackend eingestuften Strukturen lag sein Schnitt bei 85 GDT. Damit lag AlphaFold weit vor allen bisher in diesem Wettbewerb erreichten Werten und nahe an der Präzision, die normalerweise nur durch jahrelange experimentelle Analysen erzielt werden.
„Ein echter Game-Changer“
„Das ist ein echter Game-Changer“, kommentierte Andrei Lupas vom Max-Planck-Institut für Entwicklungsbiologie und einer der Gutachter beim CASP-Wettbewerb. Ähnlich sehen es auch andere Wissenschaftler: „Wow, das ist ein Durchbruch! Es gibt natürlich Einschränkungen und Aspekte, die verbessert werden müssen, bevor das Problem der Strukturvorhersage endgültig gelöst ist, aber die Genauigkeit und Erfolgsrate von AlphaFold ist beispiellos“, kommentiert Jan Kosinski vom Europäischen Laboratorium für Molekularbiologie (EMBL).
Die Fähigkeit, Proteinstrukturen auf Basis ihrer Aminosäuresequenz vorherzusagen, eröffnet neue Möglichkeiten in der Grundlagenforschung und Medizin. Denn die dreidimensionale Struktur erlaubt Rückschlüsse auf die Funktion eines Proteins und damit darauf, ob es das tut, was es soll oder ob es womöglich fehlgefaltet ist – wie bei vielen Krankheiten der Fall. Dies liefert auch Ansatzpunkte für neue Therapien und Medikamente.
Sogar bei der aktuellen Corona-Pandemie spielen Proteinstrukturen eine wichtige Rolle: Das AlphaFold-Team hat ihr KI-System bereits eingesetzt, um die Struktur mehrere viraler Proteine von SARS-CoV-2 zu entschlüsseln, darunter die von Mutationen betroffenen Proteine ORF8 und ORF3a.
Work in Progress
Allerdings: Vollständig gelöst ist damit das Proteinfaltungsproblem noch nicht, wie Kosinski erklärt: „Es gibt zwei grundlegende Herausforderungen: die ‚Vorhersage der Proteinfaltung‘ – die Kartierung der tatsächlichen Faltungswege, die Proteine nehmen, um ihre native Struktur anzunehmen – und die Vorhersage von Proteinstrukturen anhand von Sequenzen. Die erste Herausforderung ist noch weit davon entfernt, geknackt zu werden, aber DeepMind hat einen erstaunlichen Durchbruch bei der Lösung der zweiten Herausforderung erzielt.“
Auch die Forscher von DeepMind betonen, dass ihr KI-System noch in der Entwicklung ist: „Wie bei jeder wissenschaftlichen Forschung gibt es noch offene Fragen. Es gibt noch viel zu lernen, darunter wie Proteine Komplexe bilden, wie sie mit DNA, RNA oder kleinen Molekülen interagieren und wie wir die präzise Position aller Aminosäuren-Seitenketten bestimmen können.“
Quelle: DeepMind, Science Media Center