Nanoporen-Sequenzierung zur Erkennung struktureller Variationen, HLA-Typisierung und STR-Analyse

Im Bereich der Humangenetik dient die Forschung, die auf der Ganzgenomsequenzierung basiert, als Grundlage für die Erfassung wesentlicher Informationen über genomische Variationen, einschließlich einzelner Nukleotidpolymorphismen (SNPs), Insertionen und Deletionen (InDels), struktureller Varianten (SVs) und Kopienzahlvariationen (CNVs) sowie anderer. Diese genomischen Variationen werden als grundlegende Aufgaben und Kernziele in der wissenschaftlichen Untersuchung betrachtet. Technologien zur Langsequenzierung, wie sie von Pacbio und Nanopore bereitgestellt werden, haben sich aufgrund ihrer charakteristischen Fähigkeit, lange Reads zu erzeugen, als äußerst nützlich bei der Untersuchung menschlicher und nicht-menschlicher Genome erwiesen.

Was ist Nanopore-Nachsequenzierung?

Nanopore-Resequenzierung ist eine Sequenzierungstechnik, die die Durchführung von Ganzgenomsequenzierung an menschlichen Proben. Durch die Nutzung von langen Reads im Bereich von 10 kb bis 20 kb werden diese Sequenzen gegen das menschliche Referenzgenom ausgerichtet und analysiert. Dieser Prozess ermöglicht die präzise Erkennung genetischer Variationen, wie strukturelle Variationen (SVs) und Kopienzahlvariationen (CNVs), innerhalb der DNA-Sequenzen von Proben im Vergleich zum Referenzgenom oder zwischen verschiedenen Proben. Diese Technologie behebt die Einschränkungen der Next-Generation-Resequenzierung bei der Erkennung von großen Segmentvariationen.

Warum Nanopore-Nachsequenzierung durchführen?

Durch die Erforschung von SVs und CNVs findet diese Technik Anwendung in differentiellen Analysen zwischen Individuen oder Populationen. Sie spielt eine entscheidende Rolle in Studien, die sich mit Humanes Leukozytenantigen (HLA), Kurze Tandemwiederholungen (STRs)und andere Aspekte in den Bereichen Krankheiten und Krebs. Die Sequenzierung der dritten Generation, mit ihren Vorteilen langer Reads (die in der Lage sind, große strukturelle Variationen, sich wiederholende Regionen, hohen GC-Gehalt, hochhomologe Regionen und hochpolymorphe Regionen abzudecken) und dem Fehlen von PCR-Amplifikation (um Fehler zu vermeiden, die durch PCR-Amplifikation eingeführt werden), hat sich als eine neuartige Strategie zur Erforschung genetischer Variationsinformationen im menschlichen Genom herauskristallisiert.

Variantenerkennung:

Genomische strukturelle Variationen (SVs) beziehen sich typischerweise auf große segmentale strukturelle Variationen, die 50 bp überschreiten, und umfassen verschiedene Typen wie Deletionen (DEL), Insertionen (INS), Duplikationen (DUP), Inversionen (INV) und Kopienzahlvariationen (CNV). Diese Variationen, die sowohl auf individueller als auch auf Populationsebene auftreten, fördern die Vielfalt und Evolution des menschlichen Genoms. Im Vergleich zu Einzel-Nukleotid-Polymorphismen (SNPs) machen SVs einen höheren Anteil der Gesamtvariationen aus und haben einen weitreichenderen Einfluss auf das Genom. Sobald Veränderungen auftreten, haben sie oft tiefgreifende Auswirkungen auf lebende Organismen. Zunehmende Beweise deuten auf die Assoziation von SVs mit zahlreichen menschlichen Krankheiten hin, einschließlich neurodevelopmentaler Störungen, Herz-Kreislauf-Erkrankungen und Krebs. Daher hat eine systematische Analyse von SVs im menschlichen Genom erhebliche Implikationen für sowohl biologische als auch klinische Forschung.

Die Erkennung von strukturellen Varianten (SVs) bleibt jedoch eine bemerkenswert herausfordernde technologische Aufgabe. Erstens umfassen SVs selbst eine vielfältige Palette von Typen, die typischerweise in fünf Kategorien eingeteilt werden: Insertionen, Deletionen, Duplikationen, Translokationen und Inversionen. Die unterschiedliche Natur dieser fünf Mutationen führt zu erheblichen Variationen in der Komplexität der Erkennung. Zum Beispiel sind Deletionsmutationen relativ einfacher zu erkennen, während die Identifizierung von Insertionen oder Duplikationen größere Herausforderungen mit sich bringt. Darüber hinaus weisen bestimmte SV-Mutationen erhebliche Größenordnungen auf, die als über 50 Basenpaare definiert sind, wobei einige sich über mehrere hundert Kilobasen erstrecken. Für kurze Segmente, die typisch für die Next-Generation-Sequenzierung sind, stellt dies eine unbestreitbare Herausforderung dar, die die aktuellen technologischen Ansätze nur schwer bewältigen können. Zudem stellen sich aufgrund der begrenzten Länge der Sequierungsdaten auch bei repetitiven Sequenzen wie CNVs zusätzliche Schwierigkeiten, die ebenfalls schwer zu bewältigen sind.

Nutzung von Langzeitlesungen Nanoporen-Sequenzierung Technologie beseitigt die Notwendigkeit des Splicings und ermöglicht eine umfassende Abdeckung struktureller Variationen und/oder repetitiver Regionen, während Informationen über Polyploidie erhalten bleiben. Darüber hinaus wird es durch die eingehende Analyse der Sequenzen beider Elternquellen möglich, das Auftreten struktureller Variationen (SVs) präzise zu erkennen. Dies liefert wiederum genauere und verfeinerte Daten zur Untersuchung der Rolle struktureller Variationen bei Krankheiten, Evolution und genetischer Vielfalt. Daher stellt der Einsatz von Nanoporen-Langfragmenten derzeit die optimale Strategie zur Erkennung struktureller Variationen dar.

STR-Analyse:

Kurze Tandemwiederholungen (STRs) sind kurze DNA-Sequenzen, die typischerweise aus 2 bis 6 Basenpaaren (bp) bestehen und wiederholt an festen Positionen im Genom vorkommen. STRs machen etwa 7 % der menschlichen Genomsequenz aus und zeigen eine hohe Polymorphie, wobei unterschiedliche Längen bei verschiedenen Individuen beobachtet werden. Abnorm verlängerte oder "erweiterte" Allele von STRs stellen eine bedeutende Kategorie pathogener Variationen innerhalb von Populationen dar. Bis heute wurde festgestellt, dass Erweiterungen von STRs in über 40 Genen erblich bedingte Krankheiten verursachen. Die Mehrheit dieser Erkrankungen äußert sich hauptsächlich mit neurologischen oder neuromuskulären Symptomen und umfasst Störungen wie die Huntington-Krankheit (HD; HTT), das fragile X-Syndrom (FXS; FMR1), erbliche Ataxien (RFC1, FXN usw.), myotone Dystrophie (DMPK und CNBP), Muskelkanalopathien (CSTB, SAMD12, STARD7 usw.) sowie die mit C9orf72 assoziierte frontotemporale Demenz und amyotrophe Lateralsklerose (ALS).

Angesichts (i) der vielfältigen und weit verbreiteten Natur von Erkrankungen durch die Expansion von kurzen tandemartigen Wiederholungen (STR), (ii) der Vielzahl der beteiligten Gene, (iii) der fortlaufenden Entdeckung neuer Gene, (iv) der Vielfalt in Größe und Sequenzkonformation von pathogenen STR-Expansionen und (v) der bestehenden Lücken in unserem grundlegenden Verständnis ihrer Biologie gibt es eine zunehmende Nachfrage nach verbesserten molekularen Nachweismethoden für STRs. Etablierte molekulare Techniken (wie Southern Blotting und Repeat-Primed Polymerase Chain Reaction, RP-PCR) sind relativ langsam, arbeitsintensiv, ungenau und erfordern individuelle Tests mit spezifischen Primern/Sonden für jedes einzelne STR.

Dies wird problematisch, wenn mehrere unterschiedliche STR-Erweiterungen ähnliche Phänotypen manifestieren können (Locus-Heterogenität), was ein großes Hindernis für die Testung neu entdeckter STR-Gene darstellt. Die Next-Generation-Sequenzierung (NGS) bietet praktische Möglichkeiten zur Analyse von STR-Erweiterungen. Allerdings machen die große Größe, die geringe Sequenzkomplexität und der hohe GC-Gehalt vieler pathogener STR-Erweiterungen eine Analyse über Plattformen mit kurzen Reads (wie Illumina) herausfordernd. Daher besteht ein wachsender Bedarf an verfeinerten Methoden zur molekularen Detektion von STRs.

Nanoporen-Sequenzierung und Pazifische Sequenzierung, beide umfassend Langzeit-Sequenzierung Technologien sind anwendbar für die Genotypisierung großer und komplexer STR-Erweiterungen. Diese Methoden ermöglichen eine nahtlose Abdeckung von Regionen mit geringer Komplexität im Genom, ohne GC-Bias. Ein weiterer Vorteil dieser Technologien liegt in der gleichzeitigen Analyse der DNA-Methylierung an repetitiven Loci. Daher bietet die Nutzung von Long-Read-Daten der dritten Generation für die STR-Erkennung deutliche Vorteile.

Pathogenic STR sites with ONTPathogene STR-Stellen mit ONT

HLA-Typisierung:

Das Humane Leukozyten-Antigen (HLA), das sich auf dem kurzen Arm des Chromosoms 6 im menschlichen Genom befindet, umfasst eine Reihe von eng miteinander verbundenen genetischen Loci. HLA wird in drei Hauptkategorien unterteilt – Ⅰ, Ⅱ und Ⅲ – und zeichnet sich hauptsächlich durch die strukturellen, funktionalen und zellulären Verteilungseigenschaften seiner Genprodukte aus. Die Typisierung der Gene der Klassen Ⅰ und Ⅱ hat in klinischen Anwendungen eine erhebliche Bedeutung.

HLA weist ein charakteristisches hohes Maß an Polymorphismus auf, wodurch Immunzellen Selbst von Nicht-Selbst unterscheiden, indem sie HLA erkennen, was es zur genetischen "Identitätskarte" des Menschen macht. Eng verwoben mit dem Immunsystem des Körpers findet die HLA-Typisierung ihre Hauptanwendungen in Bereichen wie der Transplantationsmedizin, der Forschung zu immunologischen Erkrankungen, Arzneimittelreaktionen und Blutplättchen-Transfusionen. Angesichts der herausfordernden Natur einer genauen Typisierung aufgrund seiner polymorphen Merkmale hat die präzise Charakterisierung von HLA-Genen stets ein Forschungsrätsel dargestellt und ist eine Richtung, die von verschiedenen Sequenzierungstechnologien leidenschaftlich verfolgt wird.

In den letzten Jahren haben Hochdurchsatz-Sequenzierungstechnologien, die ihre Vorteile in Bezug auf Durchsatz, umfassende genomische Charakterisierung, verkürzte Bearbeitungszeiten und reduzierte Mehrdeutigkeit bei der Sequenzbestimmung nutzen, die Sanger-Sequenzierung als den Goldstandard für die hochauflösende Typisierung des menschlichen Leukozytenantigens (HLA) ersetzt. Dieser Übergang bietet einen erheblichen Vorteil gegenüber herkömmlichen Typisierungsmethoden.

Der Nanoporen-Sequenzierung Die Plattform hat eine außergewöhnliche Leistung bei der Generierung von langen Reads (Tausende oder Millionen von Basenpaaren) gezeigt. Durch die Anwendung der Strategie "langes Amplicon, langer Read" wird erfolgreich die Notwendigkeit einer DNA-Fragmentierung während der Vorbereitung von HLA-Sequenzierungsbibliotheken umgangen. Gleichzeitig optimiert sie die Identifizierung entfernter Variationen über Tausende von Basenpaaren. Diese Plattform erreicht herausragende Konsistenz und Genauigkeit und wird allgemein als schnelle und kosteneffektive Lösung für HLA-Typisierung angesehen.

Comparison of workflows by traditional NGS and nanopore sequencing.Vergleich der Arbeitsabläufe von traditionellem NGS und Nanoporen-Sequenzierung.

Referenzen:

  1. Chang Liu a., Xiao Yang b,1, Brian F Duffye, Jessica Hoisington-Lopezd, MariaLynn Crosby'Rhonda Porche-Sorbet, Katsuyuki Saito e, Rick Berry,, Victoria Swamidass', Robi D. Hochauflösende HLA-Typisierung durch lange Reads von den R10.3 Oxford Nanopore Flusszellen. Mitra Humanimmunologie 2021
  2. Igor Stevanovski et al., Umfassende genetische Diagnostik von Tandemwiederholungs-Erweiterungsstörungen mit programmierbarem gezieltem Nanoporen-Sequencing. Wissenschaftliche Fortschritte.8,eabm5386(2022).
  3. Liu C. Ein langer Weg/zur schnellen hochauflösenden HLA-Typisierung: Die Nanopore-Perspektive. Hum Immunol. 2021 Jul;82(7):488-495.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben