„Dunkle Materie“ der Virenwelt: Virenforscher haben in weltweiten Probendaten mehr als 161.000 zuvor unbekannte RNA-Viren entdeckt – so viele auf einmal wie nie zuvor. Die neuen Funde erweitern die bisher bekannte Virosphäre um das Eineinhalbfache und fügen ihr unzählige neue Virengruppen hinzu. Möglich wurde die Entdeckung der RNA-Viren durch eine künstliche Intelligenz, die die Virensignaturen in genetischen Daten aus Proben verschiedenster Lebensräume identifizierte.
Ob im Gletschereis, tief in der Erdkruste oder hoch oben in der Atmosphäre: Viren sind überall und in allem – auch wir Menschen sind Wirt für Milliarden virale Spezies. Seit Beginn der Evolution haben sich Viren an verschiedenste Wirte und Umwelten angepasst und können selbst extreme Bedingungen überstehen. Doch trotz ihrer Allgegenwart ist der größte Teil der Virosphäre für uns eine „Dunkle Materie“ – wir kennen erst einen Bruchteil ihrer wahren Vielfalt.
Besonders schwierig war bisher die Identifizierung neuer RNA-Viren. Sie sind durch ihre hohe Mutationsrate und genetische Vielfalt weit schwerer zuzuordnen als DNA-Viren und erfordern spezielle Analyseverfahren. Bei diesen wird neben der RNA-Sequenz auch gezielt nach den charakteristischen RNA-Bauanleitungen für die RNA-Polymerase gesucht, da diese die Zuordnung erleichtert. Dennoch bleibt die Dunkelziffer bei RNA-Viren enorm.
Ein Transformer-Modell für virale RNA-Signaturen
Jetzt bringt die künstliche Intelligenz Bewegung auch in die Virenfahndung. Ein Team um Xin Hou vom staatlichen Labor für Biokontrolle in Shenzhen hat ein KI-System entwickelt, das speziell auf das Aufspüren von viralen Signaturen in RNA-Daten ausgelegt ist. Die Basis des „LucaProt“ getauften KI-Systems bildet ein lernfähiges Transformer-Modell, das auf ähnlichen Grundprinzipien wie ChatGPT und anderen Großen Sprachmodellen beruht.