Prinzipien der Illumina Next-Generation Sequencing (NGS)

Der Hauptvorteil von Illumina-Sequenzierung ist sein hoher Durchsatz, der einen großflächigen Betrieb zu niedrigen Kosten ermöglicht. Dank seines hohen Volumens und seiner Kosteneffizienz kann es die meisten Sequenzierungsbedürfnisse erfüllen und hat das Zeitalter der Hochdurchsatz-Sequenzierung eingeläutet. Die Illumina-Sequenzierung hat ein breites Anwendungsspektrum. Ursprünglich in der Genomassemblierung eingesetzt, wurde sie später auf die Variationsdetektion ausgeweitet, RNA-SequenzierungEinzelzellsequenzierung, pränatale Screening, Tumorerkennung und andere Bereiche.

Dennoch, Illumina-Sequenzierung hat einen erheblichen Mangel – die Leselänge ist relativ kurz. Begonnen mit einer initialen Länge von 35 bp, erhöhte sie sich allmählich auf 75 bp, 90 bp und derzeit die längste verfügbare Länge von 2x300 bp. Trotz dessen bleibt die Leselänge etwas kurz. Diese Unzulänglichkeit kann den Umgang mit Wiederholungssequenzen erschweren und stellt Herausforderungen für die Genomassemblierung, die Erkennung von großen Fragmentvariationen und Forschung zum gesamten TranskriptomDie in der Illumina-Technologie innewohnenden Einschränkungen begrenzen jede weitere Verlängerung der Leseweite, und dies dämpft bis zu einem gewissen Grad ihre Entwicklung.

Das grundlegende Prinzip hinter der Illumina/Solexa Genome Analyzer Sequenzierung ist 'Synthese durch Sequenzierung'. Während des Prozesses, in dem die DNA-Polymerase den komplementären Strang synthetisiert, werden nacheinander vier unterschiedlich farblich markierte dNTPs hinzugefügt. Die Hinzufügung jedes Typs von dNTP erzeugt ein spezifisches fluoreszierendes Signal. Dieses Signal wird erfasst und durch spezialisierte Computer-Software verarbeitet, was letztendlich die sequenzierten DNA-Daten ergibt.

Der Arbeitsablauf von Illumina-Sequenzierung kann grob in vier Phasen unterteilt werden:
Bibliotheksbau
Cluster-Generierung
Sequenzierung
Basisanerkennung

Dienstleistungen, an denen Sie interessiert sein könnten

Bibliothekskonstruktion

Was ist eine DNA-Bibliothek?

Zu Beginn muss das Konzept einer 'Bibliothek' erläutert werden. In diesem Zusammenhang bezeichnet eine Bibliothek eine Zusammenstellung von DNA-Fragmenten. Im Prozess der Bibliothekskonstruktion werden Sequenzfragmente fragmentiert, was zur Bildung einer DNA-Bibliothek führt.

Einfach ausgedrückt bedeutet es, zufällig angeordnete DNA-Moleküle mithilfe von Techniken wie Sonikation in kleinere Fragmente innerhalb eines bestimmten Längenbereichs zu zerlegen. Einzigartige Adapter werden dann an beiden Enden dieser winzigen Segmente angebracht, was zur Erstellung von Einzelstrang-DNA-Bibliotheken führt. Diese Bibliotheken werden vorbereitet und für nachfolgende Sequenzierungsprozesse aufbewahrt.

Wie man eine DNA-Bibliothek erstellt

Der erste Schritt beim Bau einer Bibliothek besteht in der zufälligen Fragmentierung von DNA-Proben. Zu diesem Zeitpunkt bestehen diese DNA-Proben hauptsächlich aus längeren Fragmenten, zum Beispiel aus Segmenten im Bereich von 100-300K. Durch die zufällige Fragmentierung werden diese größeren Stücke in kürzere Fragmente zerlegt. Es stehen verschiedene Methoden zur Verfügung, um DNA zu fragmentieren, darunter mechanische Zertrümmerung, Ultraschallbehandlung und enzymatische Verdauung, unter anderem.

Die Fragmentlänge kann im Voraus festgelegt werden; zum Beispiel, wenn wir die Fragmentlänge auf 500 Basenpaare (bp) setzen, werden diese größeren Stücke schließlich in zahlreiche 500bp kurze Fragmente zerbrochen, wodurch eine 500bp-Bibliothek erstellt wird. Auch andere Längen können ausgewählt werden, wie die weit verbreiteten 170bp- und 350bp-Bibliotheken sowie längere, einschließlich 500bp, 800bp, 2k, 5k, 6k-Bibliotheken und so weiter. Typischerweise werden Bibliotheken mit einer Größe unter 1000bp als kurze Fragmentbibliotheken bezeichnet, während diejenigen mit größeren Größen als lange Fragmentbibliotheken bezeichnet werden.

Es ist wichtig zu beachten, dass bei der Bezugnahme auf eine 500bp-Bibliothek die 500bp lediglich als Spitzenwert dient, der anzeigt, dass die Mehrheit der Fragmentlängen ungefähr 500bp beträgt. Tatsächlich messen nicht alle Fragmente genau 500bp; es kann Segmente unterschiedlicher Längen geben, wie 300bp oder 800bp. Nach der Fragmentierung können Fragmente innerhalb eines bestimmten Bereichs durch den Elektrophoreseprozess zurückgewonnen werden. Für eine 500bp-Bibliothek können Fragmente zwischen 300-800bp zurückgewonnen werden. Die Größe dieser Bibliothek – oder die Insertgröße – ist von monumentaler Bedeutung und wird eine wesentliche Rolle bei den nachfolgenden Prozessen der Sequenzassemblierung und der Ausrichtung von Kurzlesungen spielen. Sobald eine geeignete DNA-Bibliothek abgerufen wurde, müssen eine Reihe von nachfolgenden Verfahren durchgeführt werden.

Zuerst fügen wir eine Adenin (A) Base am 3'-Ende der Sequenz hinzu. Diese Umwandlung von einem stumpfen Ende zu einem klebrigen Ende erleichtert die Verbindung zu nachfolgenden Primern und Adaptern. Nach der Hinzufügung der Adeninbase werden Sequenzierungsprimer integriert. Als Nächstes wird ein Index-Tag eingeführt, ein 6-8 bp Fragment, das verwendet wird, um verschiedene Sequenzierungsproben zu unterscheiden. Angesichts der enormen Menge an Daten, die in Hochdurchsatz-Sequenzierungstechnologien erzeugt werden, wie zum Beispiel 30G Daten aus einem Lane, während die Sequenzierung eines bakteriellen Genoms möglicherweise nur 1G Daten benötigt, ist es möglich, DNA von verschiedenen Arten innerhalb eines einzigen Sequenzierungsprozesses zu mischen. Daher müssen wir einzigartige Index-Tags hinzufügen, um eine Unterscheidung zwischen gemischten Proben zu gewährleisten, sei es tierische, pflanzliche oder mikrobielle DNA, für die anschließende Datenpartitionierung.

Nach der Hinzufügung der Indizes werden die Adapter-Termini integriert. Die Adapter-Termini bestehen aus den P7- und P5-Terminen, die jeweils an beiden Enden der Sequenz integriert sind. Diese P7- und P5-Termini paaren sich komplementär mit den Termini auf dem Sequenzierungschip. Nach Durchführung der oben genannten Verfahren kann die Probe nun auf den Sequenzierungschip geladen werden.

Clustererzeugung

Nach dem Bau der Bibliothek wird die Cluster-Generierung durchgeführt – ein kritischer Schritt im Sequenzierungsprozess. 'Cluster' bezieht sich auf den Amplifikationsprozess jedes DNA-Fragments. Das Ziel der Amplifikation ist es, das Signal zu verstärken. Während des Sequenzierungsprozesses ist es notwendig, die fluoreszierenden Gruppen der Basen zu aktivieren und die entsprechenden fluoreszierenden Signale zu erfassen. Mit nur einer fluoreszierenden Gruppe wäre ihr Signal äußerst schwach. Daher wird durch den Anreicherungsprozess die ursprüngliche Einzelsequenz in einen Cluster amplifiziert, was eine Signalvergrößerung ermöglicht. Ein einzelnes fluoreszierendes Signal ist schwach und farblich schwer zu unterscheiden, doch wenn es in einem Cluster zusammengeführt wird, nimmt die Signalintensität erheblich zu, wodurch die fluoreszierenden Farben leichter erkennbar werden.

Der Prozess der Clustererzeugung findet auf einem Flowcell-Chip statt. Die Flowcell ist ein Kanal zum Aufnehmen beweglicher DNA-Fragmente und dient als der zentrale Behälter für Sequenzierungsreaktionen, wobei alle Sequenzierungsprozesse hier stattfinden. Wenn die Bibliothek vorbereitet ist, kann die DNA zufällig an den Bahnen der Oberfläche der Flowcell haften.

Flusszelle

Fillumina sequencing flowcellIllumina-Sequenzierungs-Flowcell (Bildquelle: Illumina)

Innerhalb einer bestimmten Flusszelle gibt es acht individuelle Kanäle, die hier als acht „Bahnen“ bezeichnet werden. Jede Bahn enthält zwei chemisch modifizierte Oberflächen – sowohl oben als auch unten – die reichlich mit Primern, speziell P7- und P5-Primern, besät sind, die genau mit den Adaptern in der Bibliothek paaren. Der Grund, warum DNA auf einem Chip für die Sequenzierung platziert wird, ergibt sich aus der ständigen Fluidbewegung, die während des Sequenzierungsprozesses stattfindet. Jede DNA, die sich nicht mit dem Adapter verbindet, ist aufgrund des Fluidstroms anfällig für Ablösung.

Jede Oberfläche ist in drei 'Bänder' unterteilt, wobei jedes Band 16 'Fliesen' enthält, die sich auf kleine Regionen beziehen. Somit enthält eine einzelne Spur 48 Fliesen (3 Bänder multipliziert mit 16 Fliesen), was bei den beiden Oberflächen zu insgesamt 96 Fliesen führt. Ein vollständiger Flusszelle umfasst daher 768 Fliesen (96 Fliesen multipliziert mit 8 Spuren). Wenn der Chip mit Sequenzierungsadaptern gefüllt wird, steigt die DNA-Kapazität, was zu einem entsprechenden Anstieg des Sequenzierungsdatenvolumens führt. Durch das Injizieren von Proben mit angehängten Primer-Adaptern in die Flusszelle wird die Bibliothek erfolgreich auf dem Chip platziert.

Bridge-PCR

In diesem Schritt fahren wir mit der Bridge-PCR-Amplifikation fort. Zunächst wird die Bibliothek auf die Flowcell implantiert. Während dieses Prozesses wird eine Bridge-PCR-Methode angewendet, die bestimmte Unterschiede zur herkömmlichen PCR aufweist. In Bridge-PCR-Reaktionen sind sowohl die Vorwärts- als auch die Rückwärtsprimer an einen flexiblen Adapter gebunden, der an dem festen Trägermaterial (festes Substrat) befestigt ist. Nach der PCR-Reaktion sind alle Amplifikationsprodukte von Vorlagen an bestimmten Stellen auf dem Chip immobilisiert. Da die Verbindungsstellen an beiden Enden der Bibliothek mit der Verbindungssequenz auf dem Chip komplementär sind, erfolgt bei der Einspritzung von Proben in die Flowcell eine komplementäre Hybridisierung, die die Bibliothekssequenz am Chip verankert.

dNTP und Polymerase werden anschließend hinzugefügt. Die Synthese einer neuartigen Sequenz vom Primer entlang der Vorlage, die komplementär zur ursprünglichen Sequenz ist, wird durch das Enzym erleichtert. Nach der Zugabe einer konzentrierten Natriumhydroxid-Lösung entfaltet sich der DNA-Doppelstrang in zwei Einzelstränge. Während ein Strang mit dem Adapter kombiniert, tut der andere Strang dies nicht und wird weggespült, während die Flüssigkeit vorbeifließt. Neutrale Lösungsmittel und neutralisierende Lösungen werden anschließend hinzugefügt, wodurch die einzelsträngige DNA auf der Platte an einem Ende eine Biegung erfährt und eine komplementäre Hybridisierung mit einem anderen Primer auf dem Chip eingeht.

Wir setzen die Zugabe der Polymerase und dNTP fort, um PCR-Reaktionen zu erleichtern und einen neuen Strang zu synthetisieren. Dieser gesamte Prozess wird mit der Zugabe einer alkalischen Lösung und einer neutralisierenden Lösung wiederholt, um die Hybridisierung mit einem neuen Adapter sicherzustellen. Was ursprünglich ein Einzelstrang war, ist nun aufgrund der Amplifikation doppelsträngig geworden. Mit mehreren Runden der Amplifikation folgt die DNA-Menge einem exponentiellen Wachstum, wobei der ursprüngliche Einzelstrang schließlich zu einem Cluster identischer Sequenzen wird, ähnlich einem Klonierungsprozess. Dieses Phänomen wird als Bridge-PCR bezeichnet, bei der ein Adapter am DNA-Ende mit einem Adapter auf dem Chip hybridisiert und eine gebogene „Brücke“ bildet. Eine einzelne Runde der PCR-Amplifikation findet auf dieser „Brücke“ statt.

Schematic showing the concept of bridge PCR and cluster formation.Schematische Darstellung des Konzepts der Brücken-PCR und der Clusterbildung. (Sandeep Ameta 2013)

Sequenzierung

Sobald die Cluster-Generierung abgeschlossen ist, kann die Sequenzierung beginnen, wobei die Illumina-Sequenzierung Technologieprinzip der gleichzeitigen Sequenzierung durch Synthese. Das Reaktionssystem wird gleichzeitig mit DNA-Polymerase, Adapterprimern und vier Typen von fluoreszenzmarkierten dNTPs (ähnlich der Sanger-Sequenzierung) infundiert. Die 3'-OH-Gruppe dieser dNTPs ist chemisch geschützt, was sicherstellt, dass jeweils nur ein dNTP eingebaut werden kann, sodass bei jedem Sequenzierungsschritt nur eine Base hinzugefügt wird.

Nachdem ein dNTP zur synthetisierenden Kette hinzugefügt wurde, werden ungenutzte freie dNTPs und DNA-Polymerase abgespült. Anschließend wird ein Puffer hinzugefügt, um Fluoreszenz zu induzieren, die durch Laserlicht angeregt und mit einem optischen Gerät aufgezeichnet wird. Schließlich wandelt die Computeranalyse das optische Signal in eine Sequenzierungsbase um.

Nach der Aufzeichnung der Fluoreszenz wird ein chemisches Reagenz hinzugefügt, um das fluoreszierende Signal zu löschen und die Schutzgruppe von der 3'-OH-Gruppe des dNTP zu entfernen, um sich auf die nächste Runde der Sequenzierungsreaktionen vorzubereiten. Dieser Prozess verbessert die Qualität der Sequenzierung, erhöht den Datenausstoß und gewährleistet Präzision.

Nach Abschluss einer Sequenzierungsrunde werden sowohl die fluoreszierende Gruppe als auch die 3'-Terminus-Blockierungsgruppe entfernt. Dieser Schritt dient dazu, diese Gruppen zu eliminieren, um die Fortsetzung der synthetischen Reaktionen zu ermöglichen, ein einzigartiges Merkmal der reversiblen Terminator-Blockiertechnologie. Anschließend werden neue dNTPs und Syntheseenzyme hinzugefügt, um neue Nukleotide zu konstruieren. Nach der Belichtung mit stimuliertem Licht werden fluoreszierende Signale erfasst und analysiert, um das zweite Nukleotid zu identifizieren. Dieser Prozess wird kontinuierlich wiederholt, was zu einer zunehmenden Anzahl sequenzierter Nukleotide führt und somit die Länge der Sequenz verlängert. Die Sequenzierung wird bis zur Beendigung fortgesetzt und die Ergebnisse der Einzelstrangsequenzierung werden anschließend präsentiert.

Illumina-Sequenzierung Die Technologie verwendet das Paar-End-Sequenzieren, bei dem sowohl der Vorwärts- als auch der Rückwärtsstrang einem Sequenzierungsprozess unterzogen werden. Zunächst wird eine Synthese durchgeführt, die zur Erstellung eines Doppelstrangs führt - nämlich des komplementären Strangs des ursprünglichen Sequenzierungsstrangs. Der ursprüngliche Strang wird dann mit chemischen Reagenzien herausgeschnitten, sodass nur der komplementäre Strang übrig bleibt. Basierend auf dieser Konfiguration verläuft der Sequenzierungsprozess. Ebenso wird eine Methode der gleichzeitigen Synthese und Sequenzierung verwendet, bei der die Nukleotidsynthese, die Anregung der fluoreszierenden Gruppe, die Erfassung des fluoreszierenden Signals und das Herauslösen der fluoreszierenden Gruppe sowie der 3'-Terminusblockierungsgruppe stattfinden. Nach diesem Prozess wird die nächste Runde der Synthese-Sequenzierung durchgeführt. Dieser Zyklus wird fortgesetzt, bis alle Sequenzierungsaufgaben abgeschlossen sind.

Sequenzierung durch Synthese

Illumina sequencing by synthesis (SBS)Illumina-Sequenzierung durch Synthese (SBS) (Syahzuwan Hassan) u. a.,. 2023)

In Bezug auf die besondere Natur von Illumina-Sequenzierung Die Technologie fügt jeweils nur ein dNTP hinzu. Sie löst effektiv die Herausforderung, die Längen von Homopolymeren zu messen. Ihre primären Sequenzierungsfehler stammen von Basenaustausch, wobei die aktuellen Fehlerquoten ungefähr zwischen 1 % und 1,5 % liegen. Um ein Beispiel zu geben: Für die Neusequenzierung des menschlichen Genoms würde die Hisq-Serie mit einer Sequenzierungstiefe von 30x bis 50x zwischen 3 und 5 Tagen benötigen. Im Vergleich dazu würde die kürzlich eingeführte NovaSeq-Serie nur etwa 40 Stunden benötigen.

Illumina Sequenzierungsvolumenvergleich

Sequencer Gesamtdatenausgabe pro Sequenzierung Anzahl der Lesevorgänge (Milliarden) Sequenzierleselänge (bp) Sequenzierungszeit
HiSeq 2500 720-800 Gb 8.0 PE 100 5 Tage
HiSeq 4000 1.500 Gb 10,0 PE 150 3,5 Tage
NovaSeq 5000 850-1.000 Gb 2,8-3,3 PE 150 1,7 Tage
NovaSeq 6000 3.000 Gb 10,0 PE 150 1,7 Tage

Laut Schätzungen des Datenvolumens kann ein NovaSeq6000 (S4) Sequenzierer, der mit voller Kapazität läuft, die Sequenzierung für über 6400 Individuen jährlich abschließen. Bemerkenswerterweise sind die von Illumina veröffentlichten Daten in der Regel konservativ. In der praktischen Anwendung haben wir festgestellt, dass der Anteil an hochqualitativen (Q30) Lesesegmenten über 90 % der Gesamtdaten beträgt, was deutlich höher ist als die offiziell angekündigten 75 %. Daher ist auch der tatsächliche Gesamtdatenausstoß höher als erwartet.

Basisanerkennung

Nach Abschluss der Sequenzierung erhalten wir eine Vielzahl von Fluoreszenzsignaldateien, anstatt unmittelbare Sequenzen von Adenin (A), Thymin (T), Cytosin (C) und Guanin (G) Basen. Diese Dateien müssen einer Bildverarbeitung unterzogen werden, um sie in farbcodierte Spotdateien umzuwandeln, die dann im bcl-Format gespeichert werden. Der Extraktionsprozess aus diesen bcl-Dateien zur Wiedergewinnung der Basen wird als Basecalling bezeichnet. Jede Spotdatei dokumentiert eine Reihe von Informationen, einschließlich der Bahnnr., Fliesen-Nr., x- und y-Achsen-Koordinaten der Spots und der Lichtintensität jedes A-, T-, C- und G-Zyklus. Die bcl-Dateien liegen jedoch im Binärformat vor, das nicht mit der fastq-Format-Textdatei übereinstimmt, die wir letztendlich benötigen. Daher ist die Nutzung einer bcl2fastq-Konvertierungssoftware erforderlich, um die bcl-Dateien entsprechend umzuwandeln.

Jedes Bild entspricht einem Foto, das während einer Sequenzierung aufgenommen wurde. Wir können leicht zwischen Rot, Gelb, Grün und Blau unterscheiden, wobei jede Farbe einen anderen Basistyp repräsentiert. Das Bild der zweiten Sequenzierung liest die zweite Base, immer von genau demselben Standort. Das Lesen von derselben Position während jeder Sequenzierung führt zur Konstruktion einer Sequenz. Im Wesentlichen besteht dieser Prozess darin, benachbarte Bilder zu verbinden und Basengruppen von demselben Standort zu extrahieren, wodurch eine Sequenz etabliert wird.

Die oben genannte Beschreibung zur Bestimmung des Basistyps anhand der Farbe des Bildes ist lediglich eine Vereinfachung. Die tatsächliche Situation ist erheblich komplexer. Unter den vier Basen haben Purine und Pyrimidine ähnliche chemische Strukturen, und die Wellenlängen der vier fluoreszierenden Basengruppen überlappen sich. Daher kann der Basistyp nicht allein anhand der Farbe sofort erkannt werden, insbesondere unter nicht-cluster Bedingungen, wo die Beurteilungen noch herausfordernder sind.

Tatsächlich bestimmt der Sequencer die Identifikation, indem er die Beitragsrate der vier fluoreszierenden Materialien bei vier verschiedenen Wellenlängen analysiert. Zum Beispiel zeigen die Tabellen, dass die Beitragsraten der vier fluoreszierenden Materialien zu den vier Wellenlängen unterschiedlich sind und eine vierdimensionale Quaternion-Beitragsmatrix bilden. Daher ist es beim Identifizieren jedes Beleuchtungspunktes vergleichbar mit der Lösung eines Satzes quaternärer linearer Gleichungen. Die Identifikation dieser Basis, die dem beleuchteten Punkt entspricht, erfolgt durch Auswahl derjenigen mit der höchsten Wahrscheinlichkeit. Dieser komplexe Prozess kann automatisch über die integrierte Software des Sequencers ausgeführt werden. Letztendlich ist die generierte Fastq-Sequenzdatei die gewünschte Sequenzierungsdaten.

FAQ zur Next-Generation-Sequenzierung von Illumina

A: Bei der Durchführung repetitiver Experimente, warum sollte man sich für die wiederholte Zugabe von Natriumhydroxid und neutralen Lösungen entscheiden, anstatt direkt das Prinzip der variablen Temperaturoperation von PCR-Geräten zu nutzen?

A: Die wiederholte Zugabe von Natriumhydroxid und neutralen Lösungen dient dem Zweck, DNA-Fragmente zu entfernen und zurückzugewinnen, was bei der Vorbereitung von Proben für die Sequenzierung hilft. Dies liegt hauptsächlich daran, dass die Illumina-Sequenzierungstechnologie die "Bridge-PCR"-Technik anstelle der traditionellen Flüssigphasen-PCR verwendet. Die Bridge-PCR ist ein entscheidender Schritt im Illumina-Sequenzierungsprozess, bei dem PCR-Produkte auf der Oberfläche des Sequenzierungschips fixiert werden, um DNA-"Brücken" zu bilden, die anschließend Sequenzierungsreaktionen durchlaufen. Die Bridge-PCR erfordert eine beträchtliche Menge an DNA-Fragmenten, die an der Oberfläche gebunden werden müssen, im Gegensatz zur DNA-Amplifikation in einer Flüssigphase. Folglich ist die direkte Anwendung des Flüssigphasen-PCR-Prinzips von PCR-Geräten nicht geeignet, um diese Fixierung von DNA-Fragmenten auf der Chip-Oberfläche zu ermöglichen.

Q: Sind die gruppierten Sequenzen identisch? Und was passiert, wenn mehr als ein DNA-Fragment vor der Amplifikation bindet?

A: Typischerweise teilen sich in einer Clustersequenz alle DNA-Fragmente die gleiche Sequenz. Dennoch kann es während der Sequenzierung vorkommen, dass mehr als ein DNA-Fragment zunächst bindet, ein Ereignis, das als "Clusterüberlappung" oder "Clusterkoaleszenz" bezeichnet wird. Clusterüberlappung kann während der Erstellung der DNA-Bibliothek oder der PCR-Amplifikation auftreten, bei denen einige DNA-Fragmente zusammenklumpen und auf der Oberfläche des Chips innerhalb desselben Sequenzclusters immobilisiert werden.

Clusterüberlappung kann potenziell Probleme mit Sequenzierungsdaten verursachen, wie zum Beispiel:

Überlagerte Signale: Während der Sequenzierung kann das Vorhandensein von mehr als einem DNA-Fragment in einem einzelnen Sequenzcluster zu überlappenden Signalen führen, die die Sequenzierungsergebnisse beeinträchtigen können.

Niedrigqualitative Daten: Wenn eine Vielzahl von DNA-Fragmenten innerhalb eines einzelnen Sequenzclusters vorhanden ist, könnte dies die effektive Sequenzierungsrate für jedes Fragment verringern und somit die Datenqualität beeinträchtigen.

Um die Überlappung von Clustern zu minimieren, werden während der Erstellung der DNA-Bibliothek und der PCR-Amplifikation häufig Kontrollmaßnahmen hinsichtlich der Fragmentkonzentration und -menge angewendet, um sicherzustellen, dass innerhalb jedes Sequenzclusters nur ein DNA-Fragment bindet. Darüber hinaus greift die Illumina-Sequenzierungsplattform auf eine Reihe von Bildverarbeitungs- und Datenanalysealgorithmen zurück, um Störsignale, die durch Clusterüberlappung verursacht werden, zu eliminieren oder zu korrigieren, wodurch die Datenqualität und -genauigkeit verbessert wird.

Q: Produzieren alle DNA-Fragmente innerhalb eines Clusters bei der Illumina-Sequenzierung identische fluoreszierende Signale? Besteht während der Sequenzierung die Möglichkeit, dass ein Strang noch gelb gefärbt ist, während ein benachbarter Strang die gelbe Färbung bereits abgeschlossen hat und beginnt, sich zu blau zu verändern?

A: Im Allgemeinen erzeugen alle DNA-Fragmente innerhalb eines bestimmten Clusters homogene fluoreszierende Signale in einem Illumina-Sequenzierungslauf. In Bezug auf das Tempo dieses Prozesses ist es wichtig zu beachten, dass die Sequenzierung normalerweise gleichzeitig oder mit einer sehr ähnlichen Geschwindigkeit über die Stränge hinweg erfolgt. Daher sind Situationen, in denen ein DNA-Strang beim Färben hinterherhinkt, während ein anderer Strang bereits zu einer anderen Nukleotidbasis übergegangen ist, unwahrscheinlich.

Es handelt sich jedoch nicht um ein absolutes Szenario. Praktische Komplikationen können zu Sequenzierungsfehlern oder Störsignalen führen. Darüber hinaus kann die Zuverlässigkeit der Sequenzierung im Laufe der Zeit abnehmen – Geschwindigkeitsunregelmäßigkeiten können entstehen, die die Sequenzierungsqualität weiter downstream der Fragmente beeinträchtigen. Um ein solches Problem zu bekämpfen, verwenden wir den Paired-End- (oder Double-Ended-) Sequenzierungsansatz. Diese Methode verbessert die Sequenzauflösung, insbesondere bei Langsequenzen, und sorgt für ein nuancierteres Verständnis des Prozesses.

F: Warum ist die Anzahl der Zyklen in Bezug auf die Länge der Reads festgelegt?

A: Während des Sequenzierungsprozesses werden DNA-Proben enzymatischer Amplifikation und anschließenden Sequenzierungsreaktionen unterzogen. Um die erforderliche Leseweite zu erreichen, müssen angemessene Anzahl von Amplifikations- und Sequenzierungszyklen durchgeführt werden, um sicherzustellen, dass wir eine ausreichende Anzahl von Basenpaaren abgedeckt haben. Daher betrachten wir die Anzahl der Zyklen als eng mit den Anforderungen an die Leseweite verbunden. Anders ausgedrückt, wenn eine Leseweite einer bestimmten Länge erforderlich ist, passt der Sequenzierer die Anzahl der Zyklen an, um dieses Ziel der Leseweite zu erreichen. Daher ist die Anzahl der Zyklen ein Parameter, der festgelegt wird, um die Anforderungen an die Leseweite zu erfüllen.

F: Warum ist es notwendig, die Paar-End-Sequenzierung zu nutzen?

A: Bei der Paar-End-Sequenzierung wird zunächst ein Ende des DNA-Fragments sequenziert, gefolgt von einer sekundären Sequenzierung des anderen Endes, was zu zwei unterschiedlichen Datensätzen führt. Es ist zu beachten, dass die Sequenzierungsqualität tendenziell abnimmt, während der Sequenzierungsprozess voranschreitet. Zum Beispiel fällt die Qualität gegen Ende der Einzel-End-Sequenzierung oft hinter die gewünschte Präzision zurück. Die Implementierung der Paar-End-Sequenzierung ermöglicht die gleichzeitige Sequenzierung beider Enden eines DNA-Fragments, was eine deutlich überlegene Sequenzierungsqualität am upstream Ende gewährleistet. Dies, kombiniert mit der Zusammenführung der beiden Sequenzierungsergebnisse, verbessert die Gesamtqualität der Sequenzierung erheblich und verlängert somit die effektive Länge des Sequenzierungsreads.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben