Das vollständige T2T-Genom durch Sequenzierung öffnet die Tür zur post-genomischen Ära.
Im Jahr 2021, zum 20. Jahrestag der Veröffentlichung des Entwurfs der menschlichen Genomsequenz, gab das Telomere-to-Telomere (T2T) Konsortium die neueste vollständige menschliche Genomsequenz, CHM13v1.1, bekannt, die nicht nur alle ungelösten Sequenzen enthält, sondern auch die ursprünglichen Zusammenbaufehler korrigiert, wodurch sie die vollständigste menschliche Genomsequenz bis heute darstellt. Die Ergebnisse umfassen den nahtlosen Zusammenbau aller 22 menschlichen Autosomen und der X-Chromosomen, mit Ausnahme des Y-Chromosoms, und vervollständigen eine herausfordernde Aufgabe, die 8 % des Human Genome Project noch nicht gelöst haben.
Hintergrund
Telomere sind der terminale Teil eukaryotischer linearer Chromosomen, eine spezielle Strukturregion, die eine wichtige Rolle in der Struktur und Stabilität linearer Chromosomen spielt. Telomer-DNA besteht aus einfachen, hochrepetitiven DNA-Sequenzen, die schwer zusammenzusetzen sind.
Die aktuellste Version des menschlichen Genomatlas wurde 2013 veröffentlicht, bevor das vollständige menschliche Genom veröffentlicht wurde, und trug den Namen GRCh38. Seitdem wurde es wiederholt aktualisiert. Bis heute weist es weiterhin Lücken auf und fehlen mehr als 8 % des Genoms, einschließlich aller Satellitenarrays der mitotischen Regionen, Telomere, großer Wiederholungen des Genoms und rRNA-Regionen, die seit langem in einem unbekannten oder nicht ermittelbaren Sequenzzustand sind. Diese fehlenden Genome sind in langen Sequenzen verborgen, die eine große Anzahl von repetitiven Genkopien enthalten, die durch Techniken mit kurzen Lese- und Zusammenbauverfahren nicht perfektioniert werden können.
Mit den HiFi-Technologien von Pacific Biosciences (PacBio) und Oxford Nanopore Technologies (ONT) überwinden die Langsequenzierungstechnologien die niedrige Durchsatzrate der Sanger-Sequenzierung und die kurze Leselänge der Kurzlesesequenzierungstechnologien. In Kombination mit der kontinuierlichen Optimierung von Assemblierungsalgorithmen werden immer mehr perfekte Genome von Modellorganismen veröffentlicht.
Vollständige T2T-Genomkarte
Mit ONT-Ultra-Long- und PacBio-HiFi-Sequenzierungsdaten, die hohe Präzision und lange Sequenzen bieten, haben Forscher des T2T-Konsortiums die erste vollständige Karte des menschlichen X-Chromosoms, die vollständige Karte der Autosomen und die vollständige Karte des menschlichen Genoms erstellt und veröffentlicht. Die entsprechenden Ergebnisse wurden in Science und anderen Fachzeitschriften veröffentlicht.
Der Zweck des T2T-Genoms besteht darin, ein hochqualitatives Genom mit hoher Genauigkeit, Kontinuität und Vollständigkeit von Telomer zu Telomer zu erhalten. Die Forscher schlossen die Zusammenstellung des Genoms auf Chromosomenebene ab, indem sie die Hi-C-Technologie kombinierten, um Informationen über die relativen Positionen der Gene auf den Chromosomen zu erhalten, und manuelle Anpassungen für komplexe Regionen vornahmen, um die T2T-Referenzgenomsequenz zu erhalten.
Die vollständige T2T-CHM13 menschliche Genomassemblierung (Nurk S u. a., 2022)
In dieser vervollständigten Karte des menschlichen Genoms fügten die Forscher 238 Mb neuer Sequenzen hinzu oder korrigierten diese, von denen 182 Mb völlig neu waren, und annotierten 2.226 neue Gene. Infolgedessen werden zehntausende falsch-positive Varianten in jeder Probe eliminiert, einschließlich einer Reduzierung der falsch-positiven Ergebnisse für 269 medizinisch relevante Gentests um mehr als 90 %.
Neben dem menschlichen Telomer-zu-Telomer-Genom ist die vollständige T2T-Genomsequenz von Arabidopsis wurde zusammengestellt. Mithilfe von PacBio HiFi- und ONT-ultra-langen Daten wurde eine nahezu vollständige Karte von Arabidopsis erstellt, die fünf Tether enthält: Die Chromosomen 1, 3 und 5 enthalten die vollständige Telomer-zu-Telomer-Sequenz, während 2 und 4 im 45s rDNA-Bereich des kurzen Arms und im angrenzenden telomerischen Bereich unzusammenhängend bleiben. Durch Identifizierung und Sequenzanalyse enthüllen die Forscher ein Modell für den rekombinationsbasierten Homogenisierungsprozess in Arabidopsis, die Untersuchung der Struktur und Funktion der Tether sowie der evolutionären Mechanismen voranzutreiben.
Bedeutung
Die T2T-Genomassemblierung ist sehr schwierig, und es ist nach wie vor schwierig, durch Regionen mit langen repetitiven Sequenzen sowie mitotischen Regionen in einigen Arten mit den aktuellen Sequenzierungs- und Datenanalysetechnologien zu lesen. Die gegenwärtige menschliche Genomassemblierung umgeht einige Komplexität, indem sie eine haploide Zelllinie mit menschlichen Staphylus-Erweiterungen verwendet, um die Sequenzierung von zwei unterschiedlichen X-Chromosomen zu vermeiden. Seitdem wird der Bau eines perfekteren Referenzgenoms, das T2T-, Haplotyp- und Geschlechtschromosomeninformationen enthält, ein Forschungstrend in der Genomik. Hochwertige T2T-Referenzgenomsequenzen können helfen, wichtigere genetische Informationen über Krankheiten, Alterung, Evolution und andere wichtige Lebensprozesse zu enthüllen.
Empfohlene Dienstleistungen
CD Genomics bietet Menschliches gesamtes Genom PacBio SMRT-Sequenzierung und Whole-Genome-Sequenzierung basierend auf Illumina, Nanoporen-Sequenzierung und PacBio SMRT-Sequenzierung Plattformen. Wir bieten umfassende Genomsequenzierungsdienste an, einschließlich Sequenzierung, Zusammenstellung und Datenanalyse für eine Vielzahl von Arten.
Referenzen:
- Nurk S, Koren S, Rhie A, u. a. Die vollständige Sequenz eines menschlichen Genoms. Wissenschaft, 2022, 376(6588): 44-53.
- Logsdon, G. A. u. a. Die Struktur, Funktion und Evolution eines vollständigen menschlichen Chromosoms 8. Natur 593, 101–107 (2021).
- Naish, M. u. a. Die genetische und epigenetische Landschaft der Arabidopsis Zentromere. Wissenschaft 374, eabi7489 (2021).