Die umfassende Charakterisierung menschlicher genomischer Varianten ist wichtig, um Einblicke in genetische Merkmale und Krankheiten zu gewinnen. Für Studien zu seltenen Krankheiten ist es besonders wichtig, vollständige Karten aller Variantentypen zu identifizieren, einschließlich Insertionen und Deletionen (Indels), kurzer tandemwiederholter Sequenzen (STRs) und struktureller Varianten (SVs). Eine besondere Herausforderung für die Genauigkeit der Genomsequenzierung ist de novo Mutation (DNM), was sich als eine Hauptursache für sporadische, schwere, früh einsetzende Erkrankungen erwiesen hat. Jedes menschliche Genom enthält im Durchschnitt etwa 40-90 DNMs, aber sie gehören auch zu den schwierigsten Varianten, die zu identifizieren sind. Daher erfordert die umfassende Erkennung aller Arten von DNMs hochwertige Sequenzierungsdaten.
Während die Kurzlesesequenzierung kleine Varianten genau erkennen kann, hat sie eine begrenzte Sensitivität für große STRs, CNVs und SVs. Die Langlesesequenzierung wurde umfassend für die de novo Assemblierung des menschlichen Genoms und für SVs, die von der Kurzlesesequenzierung nicht erkannt werden, eingesetzt, aber ihre geringe Genauigkeit auf der Ebene einzelner Basenpaare (bp) hindert sie daran, Varianten kleiner als 50 bp zuverlässig zu erkennen. Um dem doppelten Bedarf an langer Leselänge und hoher Genauigkeit in der Genomanalyse gerecht zu werden, hat PacBio entwickelt HiFi-Langlesequenzierung Technologie, die sowohl lange Lesezeichen als auch hohe Genauigkeit kombiniert, wodurch Langzeit-Sequenzierung auch geeignet zur Erkennung kleiner Varianten.
Ein Forschungsartikel mit dem Titel "Umfassende Entdeckung von de novo Mutationen mit HiFi-Langzeit-Sequenzierung" wurde veröffentlicht in GenommedizinDas Team hat den umfassendsten Mutationsdatensatz mit nur einer einzigen Technik, der HiFi-Langlesesequenzierung, erstellt, die eine genaue Erkennung von Substitutionen, Insertionen und Deletionen (Indels), STRs und strukturellen Varianten (SVs) ermöglicht. Die Genauigkeit der Technik ermöglicht sogar eine empfindliche Erkennung von DNM auf allen verschiedenen Mutationsniveaus und erlaubt auch das Phasieren, was hilft, echte von falschen positiven DNM zu unterscheiden.
Umfassende Entdeckung von de novo Mutationen mit HiFi-Langzeit-Sequenzierung. (Kucuk et al., 2023)
Die erhöhte Basengenauigkeit der HiFi-Sequenzierung ist besonders vorteilhaft für die Erkennung kleiner DNMs im Vergleich zur Kurzlesesequenzierung und kann sogar die Sensitivität verbessern. Darüber hinaus hat die HiFi-Technologie im Gegensatz zu anderen Langlesesequenzierungstechnologien keine hochinstabile Chemie, ihre Datenqualität ist stabiler, und die HiFi-Sequenzierung kann eine Genauigkeit von 99,9 % erreichen. HiFi kann daher ein leistungsstarkes Werkzeug für komplexe Herausforderungen in der Genomforschung sein.
Um die Nützlichkeit der Langsequenzierung bei der Entdeckung von de novo-Mutationen zu demonstrieren, sequenzierte das Team die Genome von acht Eltern-Kind-Trio mit hochgradiger PacBio HiFi-Langsequenzierung (~30x) und Illumina-Kurzsequenzierung des gesamten Genoms (~50x). Bei der HiFi-Langsequenzierung betrug die durchschnittliche Länge der aus der Studie gewonnenen Reads 17 kb. Über 99,0 % der 5,7 Millionen Reads pro Probe waren mit dem Referenzgenom ausgerichtet, mit einer Mapping-Qualität von 46,5.
Die Daten zeigten, dass im Durchschnitt 3,8 Millionen Substitutionsmutationen pro Probe zwischen den beiden Sequenzierungsplattformen geteilt wurden, was einer Übereinstimmung von 94,0 % zwischen Langzeit- und Kurzzeitsequenzierungsassays entspricht. Den Ergebnissen zufolge bot die HiFi-Langzeitsequenzierung etwa 240 Mb Sequenzabdeckung für das Genom, im Gegensatz zur Kurzzeitsequenzierung. Darüber hinaus betrug die mendelische genetische Fehlerquote für die HiFi-Langzeitsequenzierung nur 2,1 %, was darauf hinweist, dass die Mehrheit der Variantenaufrufe genau war.
Für Indels ergab die HiFi-Langsequenzierung im Durchschnitt 1 Million Mutationen pro Probe, während die Kurzlesesequenzierung im Durchschnitt 900.000 Indels ergab. Die Übereinstimmung lag bei 63,1 % für die Kurzlesesequenzierung und 58,0 % für die HiFi-Langlesesequenzierung, wobei etwa 25 % der Indels in Regionen nachgewiesen wurden, die nicht von der Kurzlesesequenzierung abgedeckt waren. Darüber hinaus war das MIE-Verhältnis von Indels, die einzigartig für die HiFi-Langlesesequenzierung waren (8,9 %), niedriger als das von Indels, die einzigartig für die Kurzlesesequenzierung waren (13,0 %), was darauf hindeutet, dass die HiFi-Langlesesequenzierung besser in der Lage ist, Indels zu erkennen.
Insgesamt ermöglicht die Genauigkeit der HiFi-Langsequenzierung eine empfindliche Identifizierung von DNMs auf der Ebene aller Varianten und ermöglicht auch die Fixierung, was hilft, echte positive von falsch positiven DNMs zu unterscheiden.
de novo Mutation (DNM). (Kucuk et al., 2023)
Umfassend WGS Ein Datensatz kann durch eine einzige Technologie, das HiFi-Langzeit-Sequencing, erstellt werden, die eine genaue Identifizierung von Substitutionen, Indels, STRs und SVs ermöglicht. Das bedeutet, dass Patienten mit seltenen Krankheiten, bei denen ein genetischer Ursprung vermutet wird, mit nur einem umfassenden Test wirklich umfassend getestet werden können. Die Genauigkeit dieser Technologie ist entscheidend für die Diagnose schwerer, früh einsetzender Krankheiten.
Referenz: