Next-Generation-Sequenzierung (NGS) ist eine revolutionäre genetische Analysetechnik, die das Fragmentieren des genetischen Materials (DNA oder RNA) umfasst und Oligonukleotide mit bekannten Sequenzen durch einen Prozess namens Adapterligierung anheftet. Dies ermöglicht es den resultierenden Fragmenten, mit der ausgewählten Sequenzierungsplattform zu interagieren. Anschließend werden die Basen innerhalb jedes Fragments basierend auf ihren Emissionssignalen identifiziert.
Der entscheidende Unterschied zwischen Sanger-Sequenzierung und NGS liegt im Bereich der Sequenzierung; NGS kann gleichzeitig Millionen von Reaktionen verarbeiten und bietet außergewöhnliche Durchsatzraten, erhöhte Sensitivität, schnelle Ergebnisse und Kosteneffizienz. Es ist jetzt möglich, zahlreiche Genomsequenzierungsprojekte in nur wenigen Stunden abzuschließen, eine Aufgabe, die mit traditionellen Sanger-Sequenzierungsmethoden viel länger gedauert hätte.
NGS-Technologie folgt hauptsächlich zwei Hauptansätzen: Short-Read und Langzeit-Sequenzierung, wobei jede ihre eigenen einzigartigen Vorteile und Einschränkungen bietet. Der treibende Faktor hinter umfangreichen Investitionen in die Entwicklung von NGS ist seine vielseitige Anwendbarkeit sowohl im klinischen als auch im Forschungsbereich.
Für Long-Read-Sequenzierung beziehen Sie sich bitte auf die Artikel. Nanoporen-Sequenzierung: Prinzipien, Plattformen und Vorteile und Übersicht über PacBio SMRT-Sequenzierung: Prinzipien, Arbeitsablauf und Anwendungen für weitere Informationen.
Die Methoden der Next-Generation-Sequenzierung sind gut etabliert und weisen gemeinsame Merkmale auf, können jedoch basierend auf ihrer zugrunde liegenden Nachweischemie kategorisiert werden. Diese Kategorien umfassen Sequenzierung durch Ligation und Sequenzierung durch Synthese (SBS).
Bitte beziehen Sie sich auf CD Genomics Sequenzierungsplattformen.
Die am weitesten verbreitete SBS-Methode ist die reversible Terminator-Sequenzierung, die "Brückenamplifikation" verwendet. DNA-Fragmente heften sich in diesem Prozess an Oligonukleotide auf einer Flusszelle und bilden eine Brücke von einer Seite der Sequenz zur anderen. Diese Brücke wird dann amplifiziert, und fluoreszenzmarkierte Nukleotide werden mittels direkter Bildgebung detektiert.
Prinzip der Illumina-Sequenzierung (Sequenzierung durch Synthese). (Untergasser et al., 2019)
Im Gegensatz zu SBS erfordert die Sequenzierung durch Ligation keine DNA-Polymerase, um einen zweiten Strang zu erzeugen. Stattdessen werden Fluoreszenzsignale verwendet, um die Zielsequenz zu identifizieren, wobei die Empfindlichkeit der DNA-Ligase genutzt wird, um Basenpaarfehlpaarungen zu erkennen.
NGS-Technologien bieten typischerweise mehrere Vorteile gegenüber alternativen Sequenzierungsmethoden, die schnelle, empfindliche und kosteneffektive Sequenzierungslesungen ermöglichen. Dennoch gibt es Nachteile, wie Herausforderungen bei der Interpretation von Homopolymeren und Polymerasefehlern aufgrund falscher dNTP-Inkorporation, die zu Sequenzierungsfehlern führen können.
Eine wesentliche Einschränkung aller NGS-Technologien ist die Notwendigkeit der PCR-Amplifikation vor der Sequenzierung, die während der Bibliotheksvorbereitung (im Zusammenhang mit dem GC-Gehalt der Sequenzen, der Fragmentlänge und der Pseudovielfalt) und während der Analyse (was zu Basisfehlern führt und bestimmte Sequenzen gegenüber anderen begünstigt) Verzerrungen einführt.
PacBio Einzelmolekül-Echtzeit (SMRT) Sequenzierung nutzt das Konzept der Sequenzierung während der Synthese und verwendet den SMRT-Chip als Sequenzierungsmedium. Dieser Chip enthält zahlreiche winzige Poren, in denen jeweils ein DNA-Polymerasemolekül untergebracht ist. Während des Basenpaarungsprozesses werden unterschiedliche Nukleotidbasen eingebaut, die einzigartige Wellenlängen und Spitzenwerte von Licht emittieren. Diese emittierten Signale dienen dazu, die Art der eingebauten Base zu bestimmen. Bemerkenswerterweise arbeitet die SMRT-Sequenzierung mit einer erstaunlichen Geschwindigkeit und verarbeitet mehrere Desoxyribonukleosidtriphosphate (dNTP) pro Sekunde.
Oxford Nanopore-Sequenzierung hebt sich von früheren Sequenzierungstechnologien ab, da sie auf elektrischen Signalen anstelle von optischen basiert. Ein entscheidendes Element dieser Technologie ist ein speziell gestalteter Nanopore, der nur ein einzelnes DNA-Molekül aufnehmen kann und innerhalb dessen kovalent gebundene molekulare Verbindungen vorhanden sind. Während die DNA-Basen den Nanopore durchqueren, verursachen sie vorübergehende Veränderungen in der elektrischen Ladung, die die Stromstärke beeinflussen, die durch den Nanopore fließt. Jeder Basistyp führt zu einer unterschiedlichen Veränderung der Stromstärke, die von der Elektronik empfindlich erfasst wird, wodurch die identifizierung der durchqueren Basen ermöglicht wird.
(1) Probenvorbereitung (Vorbehandlung)
Nukleinsäuren (DNA oder RNA) werden aus ausgewählten Proben (z. B. Blut, Sputum, Knochenmark) extrahiert. Die extrahierten Proben unterliegen einer Qualitätskontrolle (QC) mittels standardisierter Methoden wie Spektrophotometrie, Fluorimetrie oder Gelelektrophorese. Wenn RNA ist angestellt, kann es erforderlich sein, eine reversen Transkription durchzuführen, um cDNA zu erzeugen, obwohl einige Bibliotheksvorbereitungskits diesen Schritt möglicherweise integrieren.
Bitte beziehen Sie sich auf unser Richtlinien zur Einreichung von Mustern für weitere Informationen.
(2) Optimierung und Verbesserung von NGS-Bibliotheken
cDNA oder DNA wird typischerweise durch enzymatische Behandlung oder Sonikation zufällig fragmentiert. Die optimale Fragmentlänge hängt von der verwendeten Sequenzierungsplattform ab. Die Optimierung kann das Durchführen eines kleinen Teilsatzes von fragmentierten Proben auf einem Elektrophorese-Gel umfassen. Diese Fragmente werden anschließend endrepariert und mit kürzeren generischen DNA-Fragmenten, die als Adapter bekannt sind, verknüpft. Diese Adapter besitzen eine definierte Länge und bekannte Oligo-Sequenzen, die mit der gewählten Sequenzierungsplattform kompatibel sind, was die Erkennung während der Multiplex-Sequenzierung ermöglicht. Die Multiplex-Sequenzierung, die die jeweiligen Adaptersequenzen für jede Probe verwendet, erlaubt die gleichzeitige Sequenzierung zahlreicher Bibliotheken in einem einzigen Durchlauf. Der Pool von DNA-Fragmenten mit Adaptern wird als Sequenzierungsbibliothek bezeichnet.
Bitte beziehen Sie sich auf unseren Artikel. Qualitätskontrolle im NGS-Bibliotheksvorbereitungsworkflow für weitere Informationen.
Die Größenauswahl kann durch Gel-Elektrophorese oder den Einsatz von magnetischen Perlen erfolgen, um übermäßig kurze oder lange Fragmente zu eliminieren, die möglicherweise nicht optimal auf der ausgewählten Sequenzierungsplattform und dem Protokoll funktionieren. Anschließend wird PCR eingesetzt, um die Bibliothek zu amplifizieren/anzureichern. In Techniken, die Emulsions-PCR beinhalten, wird jedes Fragment an eine einzelne Emulsionsperle gebunden, die die Grundlage des Sequenzierungsclusters bildet. Ein "Reinigungs"-Schritt, der häufig magnetische Perlen nutzt, wird nach der Amplifikation durchgeführt, um unerwünschte Fragmente zu entfernen und die Sequenzierungseffizienz zu erhöhen.
Die endgültige Bibliothek kann einer Qualitätskontrolle mittels quantitativer PCR (qPCR) unterzogen werden, um sowohl die Qualität als auch die Menge der DNA zu bestätigen. Dieser Schritt erleichtert auch die Vorbereitung von Proben mit der geeigneten Konzentration für die Sequenzierung.
(3) Sequenzierung
Je nach gewählter Plattform und Chemie kann die klonale Amplifikation von Bibliotheksfragmenten entweder vor dem Laden des Sequenziergeräts (PCR) oder direkt auf dem Sequenziergerät selbst (Bridge-PCR) erfolgen. Die Sequenzen werden dann basierend auf der ausgewählten Plattform erkannt und berichtet.
(4) Datenanalyse
Die generierten Datendateien werden gemäß dem spezifischen Workflow analysiert, der verwendet wird. Analysemethoden sind stark von den Zielen der Studie abhängig.
Während das Pair-End- und das Pair-Pair-Sequencing die Anzahl der in einem einzelnen Lauf analysierten Proben reduzieren können, bieten sie besondere Vorteile bei der nachgelagerten Datenanalyse, insbesondere für die de novo-Assemblierung. Diese Technologien kombinieren Sequenzierungsreads, die von beiden Enden eines Fragments (Pair-End) oder von solchen, die durch interstitielle DNA-Regionen getrennt sind (Pair-Pairs), erhalten werden.
(a) Formulierung der Forschungsfrage
(b) Auswahl des Stichprobentyps
(c) Entscheidung zwischen Kurzlese- oder Langzeit-Sequenzierung
(d) Bestimmen, ob DNA- oder RNA-Sequenzierung erforderlich istGenom oder Transkriptomanalyse)
(e) Festlegung des Umfangs, ob er das gesamte Genom oder spezifische Regionen umfasst
(f) Festlegung der erforderlichen Lesetiefe (Abdeckung), die auf das Experiment zugeschnitten ist
(g) Berücksichtigung der Extraktionsmethode
(h) Bewertung der Probenkonzentration
(i) Auswahl zwischen Einzelend-, Paarend- oder Paar-Paar-Reads
(j) Angabe der erforderlichen Lesehöhe
(k) Untersuchung der Machbarkeit der Multiplexierung von Proben
(l) Bewertung der Bioinformatik Benötigte Werkzeuge, die je nach Experiment variieren. Der gesamte Prozess der Sequenzanalyse kann basierend auf der Probe und der biologischen Fragestellung angepasst werden.
Jede Next Generation Sequencing (NGS) Technologie erzeugt ein umfangreiches Volumen an Ausgabedaten. Der grundlegende Sequenzanalyse-Workflow ist zentralisiert und umfasst mehrere wichtige Schritte: Qualitätskontrolle der Rohdaten, Datenvorverarbeitung und -ausrichtung, gefolgt von Nachbearbeitung und Variantenannotation. Variantaufrufund Visualisierung.
Der erste Schritt in diesem Workflow besteht darin, die Qualität der Rohsequenzierungsdaten zu bewerten, was eine entscheidende Voraussetzung für alle nachfolgenden Analysen ist. Diese Bewertung liefert wesentliche Einblicke in die Gesamtdaten, einschließlich der Menge und Länge der Reads, das Vorhandensein von kontaminierenden Sequenzen und alle Reads mit unzureichender Abdeckung.
Bitte beziehen Sie sich auf unseren Service. Bioinformatischer Service für Next-Generation-Sequenzierung für weitere Informationen.
NGS hat unsere Fähigkeit revolutioniert, Genome zu erkunden und zu studieren. In klinischen Anwendungen spielt NGS eine entscheidende Rolle bei der Diagnose einer Vielzahl von Krankheiten, indem es Keimbahn- oder somatische Mutationen nachweist. Die zunehmende Verbreitung von NGS in der klinischen Praxis ist durch die Fähigkeit gerechtfertigt, fortschrittliche Technologie mit sinkenden Kosten effektiv zu kombinieren.
Darüber hinaus ist NGS ein unverzichtbares Werkzeug im Bereich der Metagenomikforschung, das die Diagnose, Überwachung und das Management von Infektionskrankheiten ermöglicht. Im Jahr 2020, NGS-Methoden spielte eine entscheidende Rolle bei der Charakterisierung des SARS-CoV-2-Genoms und ist weiterhin unerlässlich für die Überwachung der anhaltenden COVID-19-Pandemie.
Die Komplexität der NGS-Probenverarbeitung offenbart erhebliche Herausforderungen im Management, der Analyse und der Speicherung von Daten. Eine der Hauptschwierigkeiten sind die erheblichen Rechenressourcen, die für Aufgaben wie Datenzusammenstellung, Annotation und Analyse erforderlich sind.
Darüber hinaus stellt das enorme Datenvolumen, das durch NGS erzeugt wird, ein erhebliches Hindernis dar. Rechenzentren kämpfen mit hohen Speicheranforderungen und haben Schwierigkeiten, mit der zunehmenden Datenlast Schritt zu halten, was Bedenken hinsichtlich des Risikos eines dauerhaften Datenverlusts aufwirft. Kontinuierliche Bemühungen werden unternommen, um die Effizienz zu steigern, Sequenzierungsfehler zu reduzieren, die Reproduzierbarkeit zu maximieren und ein robustes Datenmanagement sicherzustellen, um diese Herausforderungen zu bewältigen.
Referenz: