Überraschung im Genom: Die Zahl der proteinkodierenden DNA-Abschnitte in unserem Erbgut ist womöglich überschätzt worden. Wie eine Analyse zeigt, enthält das sogenannte Proteom wahrscheinlich doch nur 19.000 Gene – und damit rund 3.000 weniger als bisher angenommen. Zwar ist auch diese neue Zahl noch mit Unsicherheiten behaftet. Bestätigt sich das Ergebnis jedoch, könnte dies weitreichende Konsequenzen haben – zum Beispiel für die Medizin.
Die Entschlüsselung des menschlichen Genoms im Jahr 2003 war ein gewaltiger Durchbruch für die Wissenschaft. Seitdem wissen wir, dass unser DNA-Code rund drei Milliarden Basenpaare umfasst – und dass nur ein Bruchteil davon aus proteinkodierenden Genen besteht.
Wie viele dieser echten Gene aber enthält unser Erbgut genau? Diese komplizierte Frage beschäftigt Forscher seit nunmehr 15 Jahren. Gingen sie ursprünglich einmal von 100.000 Genen aus, deuten aktuelle Analysen auf nur etwas mehr als 20.000 hin. Doch womöglich sind es sogar noch weniger, wie Federico Abascal vom Wellcome Trust Sanger Institute in Cambridgeshire und seine Kollegen nun berichten.
Proteom im Fokus
Um die Gesamtzahl der proteinkodierenden Gene – das sogenannte Proteom – exakter zu bestimmen, haben sich die Wissenschaftler die drei wichtigsten derzeit zur Verfügung stehenden Referenzproteome noch einmal genauer angeschaut. Diese Datensätze enthalten insgesamt 22.210 Gene.
Vergleiche offenbarten allerdings Überraschendes: Nur 19.446 dieser Gene tauchen in allen drei Referenzproteomen auf – die anderen 2.764 kommen nur in einem oder zwei der Datensätze vor. Was hatte es mit diesen DNA-Sequenzen auf sich? Abascal und seine Kollegen analysierten die fraglichen Gene und kamen zu dem Schluss: Vieles deutet daraufhin, dass es sich bei einigen dieser Erbgutabschnitte doch um nicht-kodierende Gene oder sogenannte Pseudogene handelt.
Doch keine echten Gene
Zudem wiesen sie auch für 1.470 weitere, in allen drei Referenzproteomen enthaltenen Gene nach: Diese verhalten sich ebenfalls nicht wie typische proteinkodierende Gene. Alles in allem könnte die Mehrheit dieser insgesamt 4.234 vermeintlichen Gene demnach doch keinen Bauplan für Proteine enthalten, so das Fazit der Forscher.
Aktuell arbeiten sie daran, diesen Verdacht zu verifizieren: „Wir haben bereits viele dieser Gene im Detail analysiert“, berichtet Mitautor Michael Tress vom Nationalen Krebsforschungszentrum in Madrid. „Mehr als 300 Gene konnten dadurch bereits eindeutig als nicht-kodierend reklassifiziert werden.“
3.000 weniger als gedacht
„Unsere Arbeit deutet daraufhin, dass der Mensch womöglich nur über 19.000 kodierende Gene verfügt“, fasst Abascal zusammen. Dies bedeutet: Unser Erbgut könnte 3.000 weniger Gene enthalten als die drei Referenzproteome bisher in Summe nahelegten – doch auch diese Zahl ist noch unsicher, wie die Wissenschaftler betonen. Bestätigt sich ihr Verdacht jedoch, könnte dies weitreichende Konsequenzen haben.
So spielen proteinkodierende Gene und ihre Funktionen beispielsweise eine bedeutende Rolle für die Erforschung zahlreicher Krankheiten – von Krebs bis hin zu Herz-Kreislauf-Leiden. „Manche der uns nun aufgefallenen Gene tauchen in mehr als 100 wissenschaftlichen Publikationen auf – unter der Annahme, dass diese Gene für ein Protein kodieren“, konstatiert Mitautor David Juan von der Universität Pompeu Fabra in Barcelona. (Nucleic Acids Research, 2018; doi: 10.1093/nar/gky587)
(Centro Nacional de Investigaciones Oncológicas (CNIO), 03.09.2018 – DAL)