„Dunkle Materie“ der Virenwelt: Virenforscher haben in weltweiten Probendaten mehr als 161.000 zuvor unbekannte RNA-Viren entdeckt – so viele auf einmal wie nie zuvor. Die neuen Funde erweitern die bisher bekannte Virosphäre um das Eineinhalbfache und fügen ihr unzählige neue Virengruppen hinzu. Möglich wurde die Entdeckung der RNA-Viren durch eine künstliche Intelligenz, die die Virensignaturen in genetischen Daten aus Proben verschiedenster Lebensräume identifizierte.
Ob im Gletschereis, tief in der Erdkruste oder hoch oben in der Atmosphäre: Viren sind überall und in allem – auch wir Menschen sind Wirt für Milliarden virale Spezies. Seit Beginn der Evolution haben sich Viren an verschiedenste Wirte und Umwelten angepasst und können selbst extreme Bedingungen überstehen. Doch trotz ihrer Allgegenwart ist der größte Teil der Virosphäre für uns eine „Dunkle Materie“ – wir kennen erst einen Bruchteil ihrer wahren Vielfalt.
Besonders schwierig war bisher die Identifizierung neuer RNA-Viren. Sie sind durch ihre hohe Mutationsrate und genetische Vielfalt weit schwerer zuzuordnen als DNA-Viren und erfordern spezielle Analyseverfahren. Bei diesen wird neben der RNA-Sequenz auch gezielt nach den charakteristischen RNA-Bauanleitungen für die RNA-Polymerase gesucht, da diese die Zuordnung erleichtert. Dennoch bleibt die Dunkelziffer bei RNA-Viren enorm.
Ein Transformer-Modell für virale RNA-Signaturen
Jetzt bringt die künstliche Intelligenz Bewegung auch in die Virenfahndung. Ein Team um Xin Hou vom staatlichen Labor für Biokontrolle in Shenzhen hat ein KI-System entwickelt, das speziell auf das Aufspüren von viralen Signaturen in RNA-Daten ausgelegt ist. Die Basis des „LucaProt“ getauften KI-Systems bildet ein lernfähiges Transformer-Modell, das auf ähnlichen Grundprinzipien wie ChatGPT und anderen Großen Sprachmodellen beruht.
Anders als die Textgeneratoren analysiert der KI-Virenfahnder aber nicht Sprache, sondern RNA-Sequenzen und wertet sie auf wiederkehrende Muster hin aus. Für ihre Studie haben Hou und sein Team LucaProt zunächst an gut 5.000 bekannten RNA-Signaturen viraler RNA-Polymerasen trainiert. Dann ließen sie das KI-System 51 Terabyte an RNA-Daten aus Umweltproben analysieren.
Die untersuchten Proben stammten von 1.612 Orten weltweit und aus 32 verschiedenen Lebensräumen und Ökosystemtypen – vom Tiefsee-Sediment über antarktisches Eis und heiße Quellen bis zu Boden-, Luft- und Wasserproben aus unseren Breiten.
Neue RNA-Viren überall und weltweit
Das Ergebnis: Die KI-gestützte Fahndung enthüllte 161.979 neue Arten von RNA-Viren – so viel wie noch nie zuvor. „So viele neue Viren auf einen Streich zu finden ist umwerfend“, sagt Seniorautor Edwards Holmes von der University of Sydney. Die Neuentdeckungen erweitern die bisher bekannte Virosphäre auf einen Schlag um das Eineinhalbfache und die viralen Supergruppen sogar um das 8,6-Fache, wie das Team berichtet. „Das öffnet uns ein neues Fenster in diesen sonst verborgenen Teil der irdischen Lebenswelt“, so Holmes.
Die neu entdeckten RNA-Viren verteilen sich auf alle 32 untersuchten Ökosystemtypen. „Die höchste Viren-Vielfalt gab es in der Streu, in Feuchtgebieten, Binnengewässern und im Abwasser“, berichten die Forschenden. „Die höchsten Zahlen an neuen RNA-Viren fanden wir im antarktischen und marinen Sediment und in einigen Binnengewässern.“ Auch in so extremen Umgebungen wie heißen Quellen, der Atmosphäre oder hydrothermalen Schloten entdeckte das Team zuvor unerkannte RNA-Viren.
86 Prozent der neu identifizierten RNA-Virenarten kamen jeweils nur in einem Ökosystemtyp vor. Es gab aber auch Viren, die in fast allen Proben gefunden wurden. „Diese sind offenbar ökologische Generalisten“, so Hou und seine Kollegen.
„Wir kratzen erst an der Oberfläche“
Doch trotz der enormen Mengen der neu entdeckten RNA-Viren ist dies kaum mehr als die Spitze eines riesigen Eisbergs, wie die Forschenden betonen: „Wir kratzen damit gerade erst an der Oberfläche. Es gibt noch Millionen weitere Viren zu entdecken“, sagt Holmes. Zudem gebe es noch große Lücken im Wissen über die Evolution und Ökologie der neu entdeckten Virenarten. So ist bisher weitgehend unbekannt, welche Wirte diese Viren kolonisieren.
„Die Mehrheit der bisher bekannten RNA-Viren infizieren Eukaryoten“, erklären die Wissenschaftler. Darunter sind neben dem Menschen, Tieren und Pflanzen auch zellkerntragende Einzeller. „Es ist aber auch durchaus denkbar, dass ein substanzieller Teil der neuentdeckten Viren mit Bakterien oder Archaeen als Wirten assoziiert ist.“ Die Forschung steht in diesem Punkt noch ganz am Anfang.
„Der nächste Schritt ist es, unsere KI so zu trainieren, dass sie noch mehr von dieser erstaunlichen Vielfalt aufspüren kann“, sagt Holmes. „Wer weiß, was noch an Überraschungen auf uns wartet.“ (Cell, 2024; doi: 10.1016/j.cell.2024.09.027)
Quelle: Cell, University of Sydney