Illumina Next-Generation Sequencing (NGS): Prinzipien und Arbeitsablauf

Die Next-Generation Sequencing (NGS) Arbeitsabläufe von Illumina sind ein ausgeklügelter und äußerst effizienter Prozess, der es Forschern ermöglicht, die Geheimnisse der Genetik mit Geschwindigkeit und Genauigkeit zu entschlüsseln. Der Arbeitsablauf auf Illumina-Plattformen lässt sich in drei Hauptschritte unterteilen: Bibliotheksvorbereitung, Sequenzierung und Datenanalyse.

Prinzipien der Illumina-Sequenzierungstechnologie

Das grundlegende Prinzip der Illumina-Sequenzierungstechnologie basiert auf der Verwendung von fluoreszenzmarkierten Nukleotiden, die reversible Terminatoren besitzen. Dieser Ansatz teilt das Kernkonzept des "Sequenzierens durch Synthese in Echtzeit", ähnlich der Sanger-Methode. Im Gegensatz zur Sanger-Methode beinhaltet diese Technik jedoch eine vorübergehende Beendigung der DNA-Strangverlängerung nach der Einfügung jedes einzigartig modifizierten Nukleotids. Sobald die hinzugefügten Nukleotide optisch mit spezifischen fluoreszierenden Markern detektiert werden, werden die Terminator-Moleküle abgespalten, sodass die Synthese des neuen Strangs für die nächste Runde der Nukleotidaddition fortgesetzt werden kann.

Um die Nukleotidinkorporation in Millionen von Sequenzierungsreaktionen gleichzeitig zu erkennen, werden dATP, dCTP, dGTP und dTTP jeweils mit unterschiedlichen fluoreszierenden Markierungen versehen, die die Unterscheidung der Nukleotide basierend auf den emittierten fluoreszierenden Signalen ermöglichen. Diese fluoreszierenden Markierungen sowie die reversiblen Terminator-Moleküle sind durch dieselben chemischen Bindungen an die Nukleotide gebunden. Infolgedessen können nach der Integration und Detektion jedes Nukleotids während des Sequenzierungszyklus sowohl die fluoreszierenden Markierungen als auch die Terminator-Moleküle gleichzeitig in einer einzigen Reaktion abgespalten werden, was den Weg für die Integration des nächsten Nukleotids bereitet.

A comprehensive GWAS meta-analysis revealed a significant genetic association with long COVID. 3 Prinzipien der Illumina Solexa-Sequenzierung. (Choudhuri Supratim, 2014)

Wie funktioniert die Illumina-Sequenzierung?

Sequenzierungsreaktionen im Illumina NGS-System finden in einer Flusszelle statt. Die Flusszelle enthält mikrofluidische Kanäle, die oft als Bahnen bezeichnet werden, in denen die Sequenzierungsreaktion stattfindet und Sequenzierungssignale durch Scannen gesammelt werden.

Innerhalb dieser Kanäle sind die oberen und unteren Oberflächen mit einem "Rasen" aus Oligonukleotidsequenzen bedeckt, die den Ankersequenzkomponenten an der Verbindung entsprechen. Wenn die Sequenzierungsbibliothek in jeden Kanal eingeführt wird, binden die DNA-Vorlagen innerhalb der Bibliothek an diese Oligonukleotidsequenzen und werden auf der Kanaloberfläche immobilisiert.

Nach der Immobilisierung durchläuft jedes DNA-Vorlagenmolekül eine klonale Amplifikation durch einen Prozess, der als "Brückenamplifikation" bezeichnet wird. Dieser Prozess erzeugt bis zu 1.000 identische Kopien der Vorlage in enger Nähe zueinander und bildet Cluster mit einem Durchmesser von weniger als 1 Mikrometer. Diese Cluster dienen als grundlegende Detektionseinheiten während des Sequenzierungsprozesses und bieten eine ausreichende Signalstärke zur Basiserkennung.

Bibliotheksvorbereitung

Der erste Schritt im Illumina NGS-Workflow ist die Bibliotheksvorbereitung, eine entscheidende Phase, die sicherstellt, dass die DNA- oder RNA-Proben mit dem Sequenzierer kompatibel sind. Dieser Prozess umfasst das Fragmentieren der DNA in kleinere Stücke, gefolgt von der Hinzufügung spezifischer Adapter an die Enden, wodurch die Sequenzierungsbibliothek erstellt wird.

Bei der Illumina-Sequenzierung enthalten die Adapter komplementäre Sequenzen, die es den DNA-Fragmenten ermöglichen, an die Flusszelle zu binden, wo der Sequenzierungsprozess stattfindet. Sobald die Fragmente gebunden sind, durchlaufen sie eine Amplifikation und Reinigung. Um Ressourcen zu optimieren, können mehrere Bibliotheken zusammen gemischt und im selben Durchgang sequenziert werden, ein Prozess, der als Multiplex-Analyse bezeichnet wird. Einzigartige doppelte Indizes (UDI) werden jeder Bibliothek während der Verbindungsligatur hinzugefügt und dienen als Barcodes, um die verschiedenen Bibliotheken während der Datenanalyse zu unterscheiden.

UDI ist besonders nützlich in der Multiplexanalyse, um Probenübereinstimmungen aufgrund von Label-Jumping zu reduzieren, insbesondere bei Instrumenten mit gemusterten Flusszellen wie dem NovaSeq 6000-System. Darüber hinaus verbessert die Einbeziehung von molekularen Barcodes für jedes Molekül in der Bibliothek die Sensitivität der Variantenerkennung und hilft, PCR-Duplikate und Varianten mit niedriger Frequenz zu eliminieren.

Sequenzierung

Während des Sequenzierungsschrittes des NGS-Workflows wird die vorbereitete Bibliothek in eine Flusszelle hochskaliert und in den Sequenzierer eingesetzt. Der Cluster-Generierungsprozess amplifiziert Cluster von DNA-Fragmenten und produziert Millionen von einzelsträngigen DNA-Kopien. Die meisten Illumina-Sequenzierungsinstrumente können die Cluster-Generierung automatisch durchführen.

Die Sequenzierung durch Synthese (SBS) ist das Verfahren, das während des eigentlichen Sequenzierungsprozesses verwendet wird. Chemisch modifizierte Nukleotide binden an den DNA-Template-Strang durch natürliche Komplementarität. Jedes Nukleotid hat einen fluoreszierenden Marker und einen reversiblen Terminator, der die Einfügung der nächsten Base verhindert. Das fluoreszierende Signal zeigt die Art des hinzugefügten Nukleotids an, und der Terminator wird dann abgespalten, sodass die nächste Base binden kann.

Nachdem der vorwärts gerichtete DNA-Strang gelesen wurde, wird der Lesevorgang entfernt, und der Prozess wird wiederholt, um den rückwärts gerichteten Strang zu lesen, was es zu einer doppelseitigen Sequenzierungsmethode macht.

Datenanalyse

Nach Abschluss der Sequenzierung führt die Software des Instruments die Basenerkennung durch, identifiziert die vorhandenen Nukleotide (bekannt als primäre Analyse) und prognostiziert die Genauigkeit dieser Basenerkennung. Die erzeugten Sequenzierungsdaten können dann in Standardanalysetools für die weitere Verarbeitung importiert oder benutzerdefinierte Analyse-Pipelines erstellt werden (bekannt als sekundäre Analyse). Forscher nutzen häufig intuitive Datenanalyseanwendungen (tertiäre Analyse), um die NGS-Daten zu interpretieren und bedeutungsvolle Erkenntnisse zu gewinnen. Datenanalyse ist eine kritische Phase, da sie es Forschern ermöglicht, genetische Variationen, Mutationen und strukturelle Umstellungen im Genom zu identifizieren, was zu wichtigen Entdeckungen in Bereichen wie Krankheitsgenomik, personalisierter Medizin und Landwirtschaft führt.

Referenz:

Choudhuri, Supratim. Bioinformatik für Anfänger: Gene, Genome, molekulare Evolution, Datenbanken und analytische Werkzeuge. Elsevier, 2014.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.

Verwandte Dienstleistungen