Überblick über PacBio SMRT-Sequenzierung: Prinzipien, Arbeitsablauf und Anwendungen

Übersicht über PacBio-Sequenzierung

Pacific Biosciences (PacBio) Sequenzierung verkörpert eine wichtige Methode der Sequenzierung der dritten Generation, in der technischen Sprache als "Single Molecule Real-Time (SMRT) DNA-Sequenzierung" bezeichnet. Dieser direkte Ansatz umgeht die Notwendigkeit einer DNA-Amplifikation und ermöglicht somit eine zügige Sequenzlesung. Im Gegensatz zu herkömmlichen Sequenzierungsverfahren, die erfordern, dass DNA in kleinere Fragmente zerlegt wird, um sie zu sequenzieren, PacBio-Sequenzierungandererseits führt es eine Echtzeitlesung des gesamten DNA-Moleküls durch, während es durch ein spezialisiertes Sequenzierungsgerät passiert.

Seit seiner Gründung im Jahr 2005 ist PacBio ein Pionier im Bereich der Genomik mit der Einführung seiner einzigartigen Single Molecule Real Time (SMRT) Sequenzierungstechnologie. Durch die Nutzung der Leistungsfähigkeit von Zero Mode Waveguide (ZMW) Arrays ermöglicht die SMRT-Technologie die Echtzeit-Sequenzierung von DNA-Molekülen mit einer Länge von bis zu zehntausenden von Basenpaaren.

Im Jahr 2010 stellte PacBio sein erstklassiges SMRT-Sequenzierungssystem, das PacBio RS, vor, das Vorteile wie hohe Durchsatzraten, lange Reads und Präzision bot. Bis 2015, nach erheblichen Verbesserungen bei Reagenzien und Analyse-Software, begann die RSII-Plattform von PacBio, in der Genomforschung an Bedeutung zu gewinnen. Ein ständiger Strom von Veröffentlichungen, die diese Technologie nutzten, erschien in renommierten Fachzeitschriften wie Nature und Science. Insbesondere erschienen mehrere Forschungsarbeiten zum menschlichen Genom, die alles von der Genomverbesserung bis zur Entwicklung von Assemblierungsalgorithmen behandelten, in schneller Folge.

In den letzten Jahren hat PacBio kontinuierlich seine Sequenzierungstechnologie verfeinert, was zur Einführung der Systeme Sequel II und Sequel IIe führte. Diese Plattformen der zweiten Generation steigern die Sequenzierungseffizienz und -genauigkeit erheblich, dank verbesserter Hardware und Software, die die Verarbeitung von CCS direkt im Gerät unterstützen. Dadurch können Kunden HiFi-Lesungen direkt für nachfolgende Analysen nutzen. Diese Verbesserungen minimieren die Komplexität des Workflows, beschleunigen die Ergebnisslieferung und senken die Gesamtkosten des Systems, was zur weiteren Demokratisierung der Genomforschung beiträgt.

Prinzip der PacBio SMRT-Sequenzierung

Die Nutzung von PacBio-Sequenzierung umfasst eine Methodik, die durch gleichzeitige Synthese und Sequenzierung gekennzeichnet ist und den SMRT-Chip als Sequenzierungsvektor verwendet. Diese Technik basiert auf dem Prinzip der DNA-Polymerase-Aktivität. Grundsätzlich bindet die DNA-Polymerase an die Template-DNA, wobei jede der vier Nukleotidbasen (dNTPs) mit unterschiedlichen Farben fluoreszenzmarkiert ist.

Während der Basenpaarungsphase emittiert die Einfügung verschiedener Nukleotide unterschiedliche Lichtwellenlängen, die an ihren jeweiligen Peaks und Wellenlängen erkennbar sind. Darüber hinaus spielt das DNA-Polymerase-Enzym eine entscheidende Rolle bei der Erzielung außergewöhnlich langer Reads, ein Merkmal, das seiner enzymatischen Aktivität zugeschrieben wird. Die Länge der Reads korreliert hauptsächlich mit der Aufrechterhaltung der Enzymaktivität, die wiederum erheblich durch die durch Laserbestrahlung verursachten Schäden beeinflusst wird.

Der Aufbau der PacBio-Bibliothek der dritten Generation umfasst das Verbinden der Enden der doppelsträngigen DNA-Moleküle (Fragmente mit Längen von 10-20 kb oder länger) mit PacBio-Adaptern, die Haarnadelstrukturen aufweisen. Dies führt dazu, dass das DNA-Molekül eine hantelförmige Struktur annimmt, die als SMRTbell-Bibliothek bekannt ist. Während der Sequenzierung emittiert die Polymerase ein fluoreszierendes Signal unter dem Einfluss der fluoreszenzmarkierten Nukleotide. Dieses Signal wird von einer CCD-Kamera (Charge Coupled Device) erfasst. Das Verfahren wird auf der zyklischen Bibliothek wiederholt, wodurch die Sequenzierung abgeschlossen werden kann.

Der PacBio SMRT-Sequenzierung nutzt die innovative Zero-Mode-Wellenleiter (ZMW)-Technologie, um ideale Fluoreszenzsignale von den intensiven fluoreszierenden Hintergründen, die durch frei schwebende Nukleotide verursacht werden, zu unterscheiden. Die gebundene DNA-Polymerase und der DNA-Template-Strang sind an der Glasoberfläche an der Basis des ZMW befestigt. Laser dringen durch die Basis des ZMW, durchdringen ihn jedoch nicht vollständig, da die Größe des ZMW kleiner ist als die Wellenlänge des Lichts. Dadurch wird eine selektive Anregung und Erkennung des Lichts ermöglicht, das von den für die Basenerweiterung verwendeten Nukleotiden emittiert wird.

Workflow der PacBio SMRT-Sequenzierung

Der Arbeitsablauf von PacBio-Sequenzierung umfasst Schritte wie Probenvorbereitung, Bibliothekskonstruktion, Sequenzierungsreaktion, Datenanalyse und Interpretation der Ergebnisse.

Die Probenvorbereitung umfasst hauptsächlich die Isolierung von DNA aus den zu testenden Proben. DNA-Proben können aus Bakterien, Pflanzen, Tieren oder menschlichen Zellen gewonnen werden.

Die Bibliothekskonstruktion umfasst mehrere Schritte: die Bewertung der Qualität von genomischer DNA (gDNA), das Zerschneiden von gDNA mit einem g-TUBE (Covaris); die Auswahl der Größe und Anpassung der Konzentration; die Reparatur von DNA-Schäden und DNA-Fragmentenden; die Reinigung der DNA; die Durchführung einer blunt-end Ligation mit Haarspangen-Adaptern; und die Reinigung der Vorlage zur Einreichung beim Sequenzierer.

Template Preparation Workflow for PacBio RS II system.Abbildung 1. Arbeitsablauf zur Vorbereitung von Vorlagen für das PacBio RS II-System.

Für die Sequenzierungsreaktion, wie in Abbildung 2 dargestellt, diffundiert das SMRTbell (in Grau dargestellt) in den Zero-Mode Waveguide (ZMW), und der Adapter bindet an die Polymerase, die am Boden fixiert ist. Die vier Arten von Nukleotiden sind mit unterschiedlichen fluoreszierenden Farbstoffen markiert (dargestellt als rot, gelb, grün und blau, entsprechend G, C, T und A), sodass sie unterschiedliche Emissionsspektren aufweisen. Die Polymerase erzeugt einen Lichtblitz, der die Base identifiziert, wenn sie das Nukleotid im Detektionsvolumen behält.

Die Reaktion umfasst das an das Template gebundene, fluoreszenzmarkierte Nukleotid am aktiven Zentrum der Polymerase. (1) Die Fluoreszenzintensität steigt entsprechend der eingebauten Base (hier C, dargestellt in Gelb). (2) Der markierte Pyrophosphat-Farbstoff-Konjugat trennt sich vom Nukleotid und diffundiert aus dem ZMW, wodurch der fluoreszente Puls endet. (3) Die Polymerase schreitet zur nächsten Position vor. (4) Das folgende Nukleotid bindet an das Template am aktiven Zentrum der Polymerase und initiiert den nachfolgenden fluoreszenten Puls, der in diesem Kontext der Base A entspricht.

Sequencing via light pulses.Abbildung 2. Sequenzierung mittels Lichtblitzen.

Bioinformatische Analysen, wie de novo Assemblierung, Referenzgenom-Mapping, genomische Annotation (Vorhersage von pathogenen und Empfindlichkeitsgenen, Vorhersage von nicht-kodierender RNA, Vorhersage von CRISPRs), Genfunktionsannotation (COG/GO/KEGG), SNP/InDel-Identifizierung, vergleichende genomische Analysen sowie evolutionäre Analysen und Schätzung der Divergenzzeit, sind machbare Schritte.

Full-length transcriptome sequencing and assembly of C. album by the SMRT method. (Ye et al., 2024)Abbildung 3. Vollständige Transkriptom-Sequenzierung und -Zusammenstellung von C. album mittels der SMRT-Methode. (Ye et al., 2024)

Vorteile der PacBio-Sequenzierung

PacBio-Sequenzierung hat viele ausgezeichnete Funktionen wie folgt:

Außergewöhnlich lange Sequenzierungsleselänge: Die durchschnittliche Sequenzierleselänge kann 8-15 kb erreichen, wobei die längsten Sequenzen bis zu 40-70 kb erreichen.

Hohe Genauigkeit: Für die Genomassemblierung und die Erkennung genomischer Varianten kann eine Genauigkeit von bis zu 99,999 % erreicht werden. Durch die Verwendung eines speziellen Sequenzierungsmodus kann die Sequenziergenauigkeit auf 99 % auf Einzelmolekülebene mit einer Leselänge, die die klassische Sanger-Sequenzierungsmethode übertrifft, gesteigert werden.

Extreme Empfindlichkeit: Kann geringfügige Varianten mit einer Häufigkeit von 0,1 % erkennen.

Direkte Erkennung von Modifikationen an breiten Basen: Neben der Erkennung von 5-Methylcytosin-Modifikationen können auch N6-Methyladenin, N4-Methylcytosin, DNA-Oxidationsschäden und andere Basismodifikationen identifiziert werden.

Minimale GC-Bias: Eine komfortable Erkennung ist innerhalb von Bereichen mit extrem hohem GC- und extrem niedrigem GC-Gehalt möglich, wodurch eine einheitliche Sequenzabdeckung sichergestellt wird.

Keine PCR-Amplifikationsverzerrung: Die PCR-Amplifikation ist für Proben nicht erforderlich, wodurch ungleichmäßige Abdeckung und PCR-Redundanz vermieden werden.

Epigenetik: Da es keine PCR-Amplifikationsstufe gibt, können Basismodifikationen direkt während der Sequenzierung nachgewiesen werden. Die Notwendigkeit chemischer Modifikationen zur Erkennung von Basismodifikationen entfällt aufgrund der Messung von Änderungen der Polymerasekinetik während der DNA-Baseneinfügung. Dies ermöglicht die gleichzeitige Erfassung von Sequenz- und epigenetischen Informationen innerhalb eines einzigen Experiments.

Unterschiede zwischen PacBio, Illumina und Nanopore

Das Prinzip der Illumina-Sequenzierung beruht auf der Ansammlung von Tausenden von Fluoreszenzsignalen, um einzelne Nukleotide genau zu sequenzieren, was relativ kurze Reads für die Datenverarbeitung ergibt, mit einer Read-Länge von bis zu 600 bp und einer minimalen Fehlerquote von 1 %. Neben hoher Genauigkeit bietet es eine große Datenmenge und relativ günstigere Preise. Allerdings zeigt die auf PCR basierende Illumina-Sequenzierung eine GC-Bias und ist durch ihre kürzeren Read-Längen eingeschränkt, was sie ungeeignet für die Assemblierung langer repetitiver Sequenzen macht und ihre breiteren Anwendungen, wie die Genomassemblierung und die Erkennung langer nicht-kodierender RNAs, einschränkt.

PacBio-Sequenzierungauch bekannt als Single Molecule Real-Time (SMRT) Sequenzierung, nutzt die Zero-Mode Waveguide (ZMW) Technologie, um einzelne DNA-Moleküle und DNA-Polymerasen innerhalb eines ZMW-Pores zu konzentrieren, was Sequenzierung während der Synthese ermöglicht und somit leicht Leselängen von mehreren Kilobasen mit einer durchschnittlichen Lesegenauigkeit von bis zu 99 % erzielt. Aufgrund der Unabhängigkeit der ZMW-Poren und der Echtzeit-Sequenzierung erreichte jedoch die Fehlerrate der Reads einmal 15 %, was erhebliche Herausforderungen für die nachfolgende Datenanalyse darstellt. Kürzlich führte PacBio den CCS-Modus ein, der die Fehlerrate durch mehrfaches Sequenzieren einzelner Moleküle drastisch reduziert. Diese Sequenzierungsmethode eignet sich besonders gut für die Genomassemblierung, DNA-Methylierung, RNA-Methylierung, Erkennung struktureller Variationen und die Analyse von Long-reads-Transkriptomen.

Nanoporen-Sequenzierung erreicht lange Leselängen von bis zu mehreren Dutzend Kilobasen, indem DNA- oder RNA-Moleküle durch Nanoporen auf einer Membran geleitet werden, mit Rekorden von über Megabasen (wie zum Beispiel 2,3 Mb Sequenzierungsdaten im menschlichen Genom). Diese Sequenzierungsmethode basiert nicht auf PCR-Amplifikation, wodurch Probleme mit GC-Bias vermieden werden. Obwohl die Fehlerarten hauptsächlich aus Einsätzen und Löschungen bestehen, sind sie zufällig, und die Fehlerquoten können durch wiederholte Sequenzierung reduziert werden. Das macht Nanoporen-Sequenzierung vorteilhaft bei der Genomassemblierung, der direkten RNA-Sequenzierung und der Erkennung somatischer Mutationen.

Zusammenfassend lässt sich sagen, dass jede dieser drei Sequenzierungsmethoden ihre eigenen Vor- und Nachteile hat und die Wahl der Sequenzierungsstrategie auf den spezifischen Anforderungen der Forschung basieren sollte.

Anwendungen der PacBio SMRT-Sequenzierung

PacBio SMRT-Sequenzierung hat vielfältige Anwendungen wie de novo Whole-Genome-Sequenzierung, Optimierung oder Kartierung von genomischen Entwürfen, Whole-Transcriptom-Sequenzierung, metagenomische Sequenzierung, Vollständige 16S rRNA-Sequenzierung, Organellen-Genomsequenzierung, Whole-Genome-Resequenzierung und Identifizierung seltener Varianten, Epigenetik usw. Diese vielfältigen Anwendungen machen PacBio SMRT-Sequenzierung ein beeindruckendes Werkzeug im Bereich der Genomforschung.

De novo Assemblierung: Die langen Leseweiten von PacBio erhöhen erheblich die Erfolgsquote der Contig-Zusammenstellung und erzeugen lange Contigs. Es kann mühelos sich wiederholende und GC-reiche Sequenzen durchqueren. In der Praxis verwenden Forscher typischerweise PacBio-Sequenzen für die Contig-Zusammenstellung und setzen dann Illumina-Sequenzen zur Basiskorrektur ein.

Humane Leukozytenantigen (HLA) Typisierung: Genau HLA-Typisierung ist entscheidend für die Transplantation menschlicher Organe. HLA umfasst ein langes Fragment, und sein Haplotyp spielt eine entscheidende Rolle bei der erfolgreichen Typisierung und Transplantation. Mediziner versuchen nun, PacBio-Sequenzen als Lösung für eine genaue HLA-Typisierung.

Methylierungsforschung: PacBio kann eine Vielzahl von Basismodifikationen direkt lesen, einschließlich der Methylierung von Adenin und Cytosin sowie der Hydroxymethylierung von Cytosin, was PacBio einen einzigartigen Vorteil in der Forschung zu Basismodifikationen verschafft.

Forschung zur alternativen RNA-Spleißung: Die Voraussetzung für die Analyse des alternativen RNA-Spleißens besteht in einer Langzeitsequenz, die über die variablen Spleißstellen auf beiden Seiten hinausgeht. Bestehende Sequenzierungsmethoden zeigen aufgrund ihrer kürzeren Leselängen keine hohe Sensitivität für alternatives RNA-Spleißen. Hier füllt PacBio die Lücke.

Erkennung von mehrfachen Wiederholungssequenzen: Einige Krankheiten entstehen durch die Wiederholung bestimmter Wiederholungssequenzen über den normalen Bereich hinaus, wie die bis zu 750 CGG-Wiederholungen im Fragilen-X-Syndrom. Diese Sequenzen waren in der Vergangenheit schwierig vollständig durch direkte Sequenzierung zu bestimmen. Jetzt können Wissenschaftler diese Regionen direkt mit PacBio sequenzieren.

Referenzen:

  1. Ye Q, Zhang S, Xie Q, et al. De Novo Transkriptomanalyse durch PacBio SMRT-Seq und Illumina RNA-Seq bietet neue Einblicke in die Polyphenolbiosynthese in chinesischen Olivenfrüchten. Gartenbau, 2024, 10(3): 293.
  2. Kong N., Ng W., Thao K. u.a. Automatisierung der PacBio SMRTbell NGS-Bibliotheksvorbereitung für die Sequenzierung bakterieller Genome, Standards in Genomwissenschaften, 2017, 12(1), 27.
  3. Ye W, Xu W, Xu N, et al. Umfassende Transkriptomcharakterisierung von Grus japonensis mittels PacBio SMRT- und Illumina-Sequenzierung. Wissenschaftliche Berichte, 2021, 11(1): 23927.
  4. Cuber P, Chooneea D, Geeves C, et al. Vergleich der Genauigkeit und Effizienz von Sequenzierungstechnologien der dritten Generation, Oxford Nanopore Technologies und Pacific Biosciences, für Anwendungen der DNA-Barcodesequenzierung. Ökologische Genetik und Genomik, 2023, 28: 100181.
  5. Chen Z, He X. Anwendung der Sequenzierung der dritten Generation in der Krebsforschung. Medizinische Überprüfung, 2021, 1(2): 150-171.
  6. Die Website von PacBio.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
Sprechen Sie mit unseren Wissenschaftlern
Was möchten Sie besprechen?
Mit wem werden wir sprechen?

* ist ein erforderlicher Artikel.

Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben