20 Jahre nach dem Humangenomprojekt haben Forscher ein neues, umfassenderes Bild der genetischen Vielfalt des Menschen gewonnen – dank 64 neuer Referenzgenome. Sie erfassen auch Strukturvarianten, die mit früherer Technik nicht gefunden werden konnten. Dies erlaubt den vollständigeren Vergleich der verschiedenen Populationen des Menschen, gibt aber auch Aufschluss darüber, welche Genanteile ein Mensch von seinen beiden Eltern geerbt hat, so das Team im Fachmagazin „Science“.
Sie ist der Code des Lebens – und das, was uns zu Menschen macht: Die DNA in unseren Zellen bestimmt unser Aussehen, unsere Gesundheit und in Teilen sogar unsere geistigen Fähigkeiten und unser Wesen. Doch diesen Code zu lesen, gelang Forschern erst vor rund 20 Jahren im Humangenomprojekt. Damals wurde aus Fragmenten verschiedener DNA-Proben ein erstes, noch unvollständiges Referenzgenom des Menschen zusammengestellt. Seither haben Wissenschaftler unzählige weitere Genome sequenziert, um Krankheitsgenen sowie Unterschieden zwischen Individuen, aber auch Populationen auf die Spur zu kommen.
Warum viele Varianten übersehen wurden
Das Problem jedoch: Bei gängigen Verfahren der DNA-Analyse werden kurze, nur rund hundert Basen lange Fragmente ausgelesen und dann anhand eines Referenzgenoms zusammengesetzt. Wiederholte Basenabfolgen oder größere Veränderungen der Struktur sind damit aber schwer bis gar nicht fassbar. Erst in jüngster Zeit wurden Sequenziermethoden entwickelt, mit denen längere DNA-Fragmente am Stück vervielfältigt und ausgelesen werden können.
„Die erste menschliche Genomsequenz war ein großer Schritt nach vorn, aber sie war unvollständig“, sagt Charles Lee vom Jackson Laboratory for Genomic Medicine. „Neben der Variation einzelner Basen wissen wir heute, dass auch strukturelle Varianten ganz wesentlich zu den genomischen Unterschieden zwischen Individuen beitragen.“
Hinzu kommt: „Diese Varianten beeinflussen die Genfunktion und können zu Krankheiten, Unterschieden im Ansprechen auf Medikamente und mehr beitragen“, erklärt seine Kollegin Qihui Zhu. „Zu wissen, wie sie sich bei Individuen und in verschiedenen Populationen unterscheiden, ist notwendig, um eine effektivere genomische Medizin zu implementieren.“
Zwei Sequenzen von jeder Testperson
Einen wichtigen Schritt hin zu diesem Wissen hat das internationale Forscher-Konsortium um Peter Ebert von der Heinrich-Heine-Universität Düsseldorf geschafft. Sie haben die neuen Sequenziermethoden genutzt, um neue, genauere Referenzgenome des Menschen zu erstellen. Die DNA dafür stammt von 32 Menschen aus verschiedensten Teilen der Erde, die zu 25 verschiedenen Populationsgruppen aus Afrika, Nordamerika, Ost- und Südasien und Europa gehören.
Für ihr Projekt unterzogen die Forscher das Erbgut einer sogenannten Long-Read-Genomanalyse. Gleichzeitig jedoch sequenzierten sie den jeweils väterlichen und mütterlichen Erbgutanteil jeder Person getrennt. Denn in jeder Zelle tragen wir 23 Chromosomenpaare und in jedem Paar stammt ein Chromosom vom Vater und eins von der Mutter.
„Für jedes menschliche Individuum, das an der Studie teilgenommen hat, haben wir nicht ein, sondern zwei Genome identifiziert – eines für jeden Chromosomensatz,“ erklärt Jan Korbel vom Europäischen Laboratorium für Molekularbiologie (EMBL). „Bisher konnten wir nicht unterscheiden, ob die genetische Variation von dem einen oder dem anderen Chromosomensatz stammt. Dies konnten wir nun dank der Fortschritte des Konsortiums lösen.“
Millionen neuer Varianten
Das Ergebnis sind 64 Referenzgenome, die erstmals einen umfassenderen Blick auf die genetischen Unterschiede zwischen den verschiedenen menschlichen Populationen, aber auch zwischen Individuen und sogar den Genanteilen innerhalb einer Person erlauben. „Mit diesen neuen Referenzdaten können genetische Unterschiede vor dem Hintergrund der globalen genetischen Variation mit bisher unerreichter Genauigkeit untersucht werden“, sagt Ebert.
Erste Vergleiche der Referenzgenome förderten bereits gut 107.500 Strukturvarianten zutage, von denen 68 Prozent zuvor unerkannt waren. Außerdem identifizierten die Forscher 316 Inversionen, Abschnitte mit umgekehrter Basenabfolge, sowie 2,3 Millionen Stellen an denen DNA-Stücke fehlten oder eingesetzt sind. Dazu kommen rund 15,8 Millionen Einzelnukleotidvarianten (SNV) – DNA-Positionen, an denen durch eine Mutation eine Base durch eine andere ersetzt worden ist.
Afrika ist einzigartiges Genomreservoir
Die Referenzgenome bestätigen auch, dass Afrika die Wiege der Menschheit ist. Denn dort sind sich die Genome in Bezug auf ihre Strukturvarianten am ähnlichsten, was auf die Herkunft aus einem gemeinsamen ursprünglichen Genpool hindeutet. Gleichzeitig aber finden sich in der afrikanischen Population die meisten anderswo nicht vorkommenden Genvarianten. „Unsere Ergebnisse zeigen klar, dass das aus Afrika stammende Erbgut das tiefste Reservoir noch unerforschter genetischer Strukturvarianten umfasst“, konstatieren Ebert und seine Kollegen.
Im Gegensatz dazu zeugen die Genome der meisten anderen Populationen von einer langen Geschichte der Wanderungen und Vermischungen. Eine besonders vielfältige Kombination von Strukturvarianten ganz verschiedener Herkunft fand sich im Genom von Afro-Amerikanern. „Dies ist höchstwahrscheinlich das Resultat des transatlantischen Sklavenhandels und der Migrationen der kolonialen Ära“, erklären die Wissenschaftler.
„Hotspots“ an den Chromosomen-Enden
Interessant auch: Die Strukturvarianten sind nicht zufällig über das menschliche Erbgut verteilt., sondern häufen sich an bestimmten Stellen – sie bilden „Hotspots“. Und diese Hotspots scheinen sich vor allem an den Enden der Chromosomen zu sammeln, wie die Wissenschaftler feststellten. Von den 278 neu identifizierten Hotspots der Strukturvarianten lag rund ein Drittel weniger als fünf Millionen Basenpaare vom Ende der Chromosomenarme entfernt.
Eine zweite Konzentration der Varianten-Hotspots fanden Ebert und sein Team in besonders genreichen und innerhalb unserer Spezies unterschiedlichen Regionen der Chromosomen. So lagen beispielsweise drei solcher Hotspots im Major Histocompatibility Complex (MHC), einer Gruppe von Immungenen, die auch bei der Partnerwahl von Säugetieren einschließlich des Menschen eine Rolle spielen.
„Neue Welle wissenschaftlicher Entdeckungen“
Noch haben die Erforschung und vergleichende Analyse der Referenzgenome gerade erst begonnen. Die Wissenschaftler sind sich aber jetzt schon sicher, dass sie eine neue Ära der Genomforschung einleiten werden. „Diese Genome werden den Weg für eine neue Welle wissenschaftlicher Entdeckungen über die Biologie des menschlichen Genoms und den Zusammenhang zwischen genetischer Variation und Krankheit ebnen“, sagt Bernardo Rodriguez-Martin vom EMBL.
„Wir haben bemerkenswerte Unterschiede in der genomischen Organisation entdeckt, die bisher übersehen wurden“, ergänzt Seniorautor Evan Eichler von der University of Washington. „Das Verständnis dieser Unterschiede wird unsere Fähigkeit verbessern, genetische Entdeckungen im Zusammenhang mit Gesundheit und Krankheit zu machen, insbesondere bei Gruppen, die traditionell von der Genomforschung vernachlässigt wurden.“ (Science 2021; doi: 10.1126/science.abf7117)
Quelle: Europäisches Laboratorium für Molekularbiologie (EMBL), Heinrich-Heine-Universität Düsseldorf