Die Transkriptomik ist ein entscheidendes Forschungsfeld in der Biologie, das sich der Erforschung der Genexpression und ihrer regulatorischen Mechanismen widmet. Im Mittelpunkt steht die umfassende Analyse von Genexpressionsmustern in verschiedenen Geweben, Zellen oder experimentellen Bedingungen. Traditionelle Technologien zur Sequenzierung von kurzen und langen RNA-Transkripten, wie sie von Illumina angeboten werden, stoßen aufgrund von Fragmentierung an ihre Grenzen. Diese Fragmentierung verhindert die vollständige Abdeckung von vollständigen Transkripten, was zu unvollständigem Sequenz-Spleißen und ungenauer Genannotation führt. Im Gegensatz dazu bietet die Sequenzierung von vollständigen Transkripten umfassende Informationen über Transkripte, einschließlich der 5'- und 3'-Exons, Introns und Poly-A-Schwänze. Diese detaillierten Informationen ermöglichen ein tieferes Verständnis der Genexpression und der regulatorischen Mechanismen.
Iso-Seq Technologie ist eine Methode zur vollständigen Transkriptom-Sequenzierung, die auf basiert Einzelmolekül-Echtzeit (SMRT) Sequenzierung, das von der Firma PacBio entwickelt wurde. Durch die Synthese der cDNA-Bibliothek in voller Länge kann diese Technologie die vollständige Transkriptsequenz direkt erfassen, indem sie ihre superlange Lesefähigkeit nutzt (die durchschnittliche Länge kann 10-15 kb erreichen), ohne auf das Referenzgenom angewiesen zu sein. Die Iso-Seq-Technologie bietet erhebliche Vorteile bei der Sequenzierung von Transkripten in voller Länge, wie zum Beispiel:
Hohe Präzision bei der ErkennungIso-Seq zeigt eine bemerkenswerte Genauigkeit bei der Identifizierung von Spleißereignissen, Transkript-Isoformen, Fusionsgenen und nicht-kodierenden RNAs. Diese Präzision bietet Forschern eine differenziertere und genauere Sicht auf das Transkriptom, was ein tieferes Verständnis der Genfunktion und -regulation ermöglicht.
Umfassende TranskriptabdeckungDie vollständige Transkription vom 5'-Ende bis zum 3'-Ende, einschließlich Introns und Poly-A-Schwanz, ist hilfreich, um die komplexe Transkriptomstruktur zu analysieren.
Vielseitigkeit in der AnwendungEs eignet sich für die vollständige Transkriptom-Sequenzierung von Arten ohne Referenzgenom und unterstützt die parallele Analyse von Multigewebeproben.
Verbesserte Effekte durch InterfrationDie Kombination mit anderen Sequenzierungstechnologien (wie RNA-seq) kann die Analysefähigkeit von Transkriptomdaten weiter verbessern.
PacBio ist der Hauptförderer und führend in der Iso-Seq-Technologie. Die Sequel II-Serie, ihre Plattform für die Sequenzierung der dritten Generation, hat die Genauigkeit und Konsistenz von Voll-Längen-Transkripten durch optimierte HiFi-Sequenzierungstechnologie erheblich verbessert. Die Iso-Seq-Technologie von PacBio wird nicht nur in der akademischen Forschung weit verbreitet eingesetzt, sondern auch für die Genomanalyse und Transkriptomanalyse von Pflanzen, Tieren und Menschen.
Darüber hinaus hat PacBio eine Vielzahl von unterstützenden Werkzeugen und Software (wie SMRT Link, IsoCon, TAMA usw.) entwickelt, um uns eine vollständige Lösung von der Probenvorbereitung bis zur Datenanalyse zu bieten.
Dienste, an denen Sie interessiert sein könnten
Möchten Sie mehr über die Einzelheiten von Iso-seq erfahren? Schauen Sie sich diese Artikel an.:
Isoform-Sequenzierung (Iso-Seq) ist ein Verfahren zur Sequenzierung von Voll-Längen-Transkripten, das auf der SMRT-Technologie basiert, die von PacBio entwickelt wurde. Diese Technologie zielt darauf ab, die vollständigen Sequenzen verschiedener Isoformen im Genom zu erfassen und zu analysieren, um umfassendere Informationen über das Transkriptom bereitzustellen. Im Folgenden wird ein schematisches Prinzip von Iso-Seq beschrieben.
SMRT: SMRT ist eine Sequenzierungstechnologie der dritten Generation, die die Sequenzierung durch das Erfassen von DNA-Vorlagen in einem Zero-Mode Waveguide (ZMW) durchführt. Dieses Verfahren benötigt keine Unterbrechung von DNA-Fragmenten, sondern sequenziert direkt ein einzelnes DNA-Molekül, um eine lange Lesesequenz (in der Regel 10 kb oder länger) zu erzeugen und kann das vollständige Transkript von der 5'-Ende bis zum Poly-A-Ende vollständig erfassen.
Überblick über die SMRT-Sequenzierungstechnologie (Simon et al., 2018)
Die Iso-Seq-Technologie kann hochwertige Voll-Längen-Transkripte erzeugen, indem cDNA direkt ohne Unterbrechung oder Spleißen sequenziert wird. Diese Sequenzen enthalten vollständige Informationen vom 5'-Ende bis zum Poly-A-Ende, was es Forschern ermöglicht, Spleißvarianten, Initiationsstellen, Terminierungsstellen und posttranskriptionale Regulationsereignisse wie alternatives Spleißen und Polyadenylierung (APA) genau zu analysieren.
Die PacBio Iso-Seq-Technologie ist ein Verfahren zur Sequenzierung des vollständigen Transkriptoms, das auf SMRT basiert. Ihr Hauptvorteil besteht darin, dass sie vollständige Transkripte ohne Spleißen oder Inferenz sequenzieren kann, wodurch genauere Analysen der Genexpression und der Transkript-Isomere ermöglicht werden. Die SMRT-Technologie von PacBio ist eine Sequenzierungstechnologie der dritten Generation, die lange Lesesequenzen erzeugt, indem sie den DNA-Syntheseprozess in Echtzeit überwacht. Ihr Kernbestandteil ist die SMRT-Zelle, ein kleines Verbrauchsmaterial, das Millionen von Zero-Mode-Wellenleitern (ZMWs) enthält, um DNA-Moleküle zu erfassen und den Prozess der Nucleotidaddition in Echtzeit aufzuzeichnen. Diese Technik kann Sequenzen von bis zu 10 kb oder sogar länger erzeugen, und die Genauigkeit beträgt bis zu 99 %.
Die PacBio-Sequenzierung zeichnet sich durch ihre hohe Genauigkeit und lange Leselänge aus. Die durchschnittliche Leselänge liegt normalerweise zwischen 8-15 kb, und die längsten können 40-70 kb erreichen. Diese lange Leselänge macht PacBio besonders geeignet für das Studium von Spleißvarianten und Fusionsgenen in komplexen Genomregionen, repetitiven Sequenzen und dem Transkriptom.
Iso-Seq ist ein bioinformatisches Werkzeug, das auf der Voll-Längen-RNA-Sequenzierung basiert und in vielen Bereichen weit verbreitet ist. Im Folgenden sind spezifische Anwendungen von Iso-Seq in verschiedenen Bereichen aufgeführt.
Genentdeckung und Annotation
Verbesserung der gesamten Genomannotation: Iso-Seq kann eine vollständige Transkripsequenz erzeugen, was besonders wichtig für neue Arten oder unvollständig sequenzierte Genome ist. Durch den Vergleich mit dem Referenzgenom kann Iso-Seq Exon-Grenzen, Spleißstellen und alternative Spleißverbindungsstellen genau lokalisieren, wodurch die Genauigkeit der Genannotation verbessert wird.
Entdeckung neuer Gene und Isoformen: Iso-Seq kann viele nicht kommentierte Transkripte erkennen, einschließlich neuer Gene, Isomere (wie AS, APA) und Fusionsgene. Dies bietet reichlich Datenunterstützung für die Genomforschung.
Erhöhung der Annotierungsqualität: Im Vergleich zu traditionellen Methoden wie der Expression Sequence Tag (EST), RNA-Seq und homologer Inferenz kann Iso-Seq Gene aufgrund seiner kontinuierlichen Sequenzdaten genauer annotieren.
Schematische Darstellung von AS und APA (An et al., 2018)
Forschung zur alternativen Spleißung
Erkennung von alternativen Spleißereignissen (AS): Iso-Seq kann alternative Spleißereignisse direkt erkennen, einschließlich Intron-Retention, Exon-Skipping und Exon-Löschung. Diese Daten sind hilfreich, um den Regulationsmechanismus der Genexpression zu verstehen.
Untersuchung alternativer Polyadenylierung (APA): Iso-Seq kann APA-Ereignisse in verschiedenen Geweben oder Bedingungen nachweisen und den posttranskriptionalen Regulationsmechanismus in verschiedenen Zelltypen oder physiologischen Zuständen aufdecken.
Quantifizierung von differentieller Spleißung: Durch den Vergleich der Transkriptomdaten verschiedener Proben kann Iso-Seq differenzielle Spleißereignisse und deren funktionale Auswirkungen quantitativ analysieren und Unterstützung für die Krankheitsdiagnose sowie die Entwicklung von Biomarkern bieten.
Ein Ergebnisbeispiel aus der Forschung zu alternativem Spleißen (Nicola et al., 2014)
Transkriptom- und Isomeranalyse
Vereinfachung der Transkriptomassemblierung und -annotation: Die von Iso-Seq erzeugten Vollsequenzdaten vermeiden die Komplexität der Transkriptomassemblierung und verbessern die Integrität des Transkripts, wodurch sie das Genexpressionsniveau und den Mechanismus der posttranskriptionalen Regulation genauer widerspiegeln.
Profilierung der Isoformexpression: Mit Iso-Seq-Daten können wir die Expressionsmuster verschiedener Isomere genau analysieren, einschließlich gewebespezifischer Expression und Stressreaktion.
Fortschritte in der Erforschung von langen nicht-kodierenden RNAs (lncRNAs): Iso-Seq kann lncRNAs erkennen und annotieren, was ein wichtiges Werkzeug zum Verständnis ihrer Rolle in der Genregulation bietet.
Aktualisierung der Referenzannotation von Salat durch HIT-ISOseq (Shi et al., 2024)
Vergleichende Genomik
Aufdeckung interspezifischer Unterschiede: Durch den Vergleich der Iso-Seq-Daten verschiedener Arten können artspezifische Genexpressionsmuster und posttranskriptionale Regulationsmechanismen aufgedeckt werden. Studien haben gezeigt, dass Iso-Seq einzigartige Transkripte und Spleißisomere finden kann, wenn verschiedene Pflanzenarten verglichen werden.
Verfolgung evolutionärer Veränderungen: Iso-Seq-Daten sind hilfreich, um die Veränderungen der Genomstruktur und -funktion während der Speziesschreibung zu analysieren, insbesondere in Abwesenheit eines Referenzgenoms.
Als eine fortschrittliche RNA-Sequenzierungstechnologie hat Iso-Seq eine breite Anwendungsprognose. Es kann nicht nur die Genauigkeit und Vollständigkeit der Genannotationen verbessern, sondern auch die Funktionen von alternativem Spleißen, Transkriptom-Isomeren und langen nicht-kodierenden RNAs tiefgehend untersuchen. Darüber hinaus zeigt Iso-Seq auch großes Potenzial in der vergleichenden Genomik und der evolutionären Forschung. Aufgrund der hohen Kosten steht jedoch die großflächige Anwendung weiterhin vor bestimmten Herausforderungen.
Für detailliertere Informationen konsultieren Sie bitte die Artikel:
Iso-seq, nämlich die Voll-Längen-Transkript-Sequenzierung, ist ein Sequenzierungsverfahren, das auf der PacBio-Einzelmolekül-Echtzeit-Sequenzierungstechnologie basiert, und sein Ablauf umfasst hauptsächlich die folgenden Schlüsselschritte:
Probenvorbereitung
RNA-Extraktion und Qualitätskontrolle: Die RNA-Extraktion ist ein entscheidender Schritt in der Transkriptom-Sequenzierung. In der Regel werden spezifische Methoden verwendet, um RNA-Moleküle aus Proben zu trennen und unnötige Verunreinigungen zu entfernen. Zum Beispiel wird DNase I-Verdau verwendet, um DNA-Kontamination zu beseitigen, und anschließend wird die RNA weiter durch magnetische Perlen gereinigt. Die extrahierte RNA benötigt eine Qualitätskontrolle, einschließlich der Verwendung von Qubit oder Agilent Bioanalyzer zur Bestimmung der RNA-Konzentration und -Integrität.
cDNA-Synthese: Rücktranskription von RNA in cDNA (komplementäre DNA) für nachfolgende Analysen. Häufig verwendete Methoden umfassen die Verwendung des SMARTer Total RNA-Seq cDNA-Synthesekits, das RNA am Ende der Poly(A)-Kette in cDNA rücktranskribieren kann. Im Prozess der cDNA-Synthese wird normalerweise ein spezieller Adapter hinzugefügt, um die anschließende PCR-Amplifikation und Bibliothekskonstruktion zu ermöglichen.
Phasen der Iso-Seq-Bibliotheksvorbereitung (Marta et al., 2020)
Sequenzierung und Datenerzeugung
PacBio-Bibliotheksvorbereitung: Die Bibliothek wird erstellt, indem cDNA-Fragmente mit Vektoren verbunden werden, die für das Sequenzieren geeignet sind. Zum Beispiel wurde eine Bibliothek unter Verwendung der SMARTer P5/P7-Linker-Vorlage vorbereitet und mit dem KAPA HiFi HotStart PCR-System amplifiziert. Die amplifizierte Bibliothek muss einer Qualitätsprüfung unterzogen werden, um sicherzustellen, dass sie für das Sequenzieren geeignet ist. Zum Beispiel wurde die Bibliothekskonzentration mit dem Qubit BR DNA HS Assay bestimmt und die Größe wurde mit E-gel ausgewählt.
Sequenzierungsoperation und Datensammlung: Die PacBio Sequel II Sequenzierungsplattform wurde für die Sequenzierung verwendet. Während der Sequenzierung können mehrere SMRT-Zellen für die parallele Sequenzierung verwendet werden, um die Datenabdeckung zu verbessern. Nach Abschluss der Sequenzierung müssen die erzeugten Subreads qualitätskontrolliert und getrimmt werden, um niedrigqualitative oder fehlerhafte Sequenzfragmente zu entfernen.
Datenanalyseprozess
Datenvorverarbeitung: Eine Qualitätskontrolle wurde an den ursprünglichen Sequenzierungsdaten durchgeführt, um niedrigqualitative Lesesegmente und Linkersequenzen zu entfernen. Verwenden Sie Tools wie Trimmomatic oder Cutadapt, um die Daten zu kürzen und die Datenqualität sicherzustellen.
Identifizierung und Annotation von Voll-Längen-Transkripten: Mit der Iso-Seq-Technologie von PacBio werden die Daten von der SMRT-Analyse-Software (wie SMRT-Analyse) gespleißt und annotiert, um Voll-Längen-Transkripte (einschließlich der 5'- und 3'-UTR-Regionen) zu generieren. Die Struktur und Funktion der Transkripte wurden weiter analysiert, indem Referenzgenome verglichen oder die de novo-Assemblierungsmethode verwendet wurde.
Downstream-Analyse Daten: Die Analyse umfasst die Analyse der differentiellen Expression, die Erkennung alternativer Spleißereignisse und die Analyse von Transkriptionsstartstellen. Beispielsweise können Werkzeuge wie DESeq2 und EdgeR verwendet werden, um die Analyse der differentiellen Expression durchzuführen. Die Visualisierung der Ergebnisse kann durch Vulkan-Karten, Wärme-Karten und andere Methoden erfolgen, um Forschern zu helfen, die Unterschiede der Genexpression unter verschiedenen Bedingungen zu verstehen.
Datenverarbeitungs- und Analysepipelines für sowohl RNA-seq-Daten als auch Iso-Seq-Daten (Jiang et al., 2017)
Basierend auf den oben genannten Schritten umfasst das vollständige Iso-Seq-Protokoll die Probenvorbereitung, die Bibliotheksvorbereitung, den Sequenzierungsprozess und die Datenanalyse. Dieser Prozess kann hochwertige, vollständige Transkript-Daten erzeugen und umfassende Informationsunterstützung für die Transkriptomforschung bieten.
Für detailliertere Informationen beziehen Sie sich bitte auf den Artikel:
Die Iso-Seq ist ein Verfahren zur Sequenzierung von Voll-Längen-Transkripten, das auf der Sequenzierungstechnologie der dritten Generation basiert, die von PacBio entwickelt wurde. Durch die Bereitstellung einer vollständigen cDNA-Sequenz vermeidet es den Schritt der Transkriptomrekonstruktion in der traditionellen RNA-Sequenzierung (wie RNA-Seq), wodurch die Genauigkeit und Vollständigkeit der Transkriptannotationen verbessert wird. Iso-Seq kann ein vollständiges, nicht-repetitives Lesesegment (FLNC) von bis zu 10 kb erzeugen, das alle Bereiche vom 5'-Cap bis zum Polyadenylierungsschwanz abdeckt, was einen erheblichen Vorteil bei der Aufdeckung der Komplexität des Transkriptoms darstellt.
Dennoch hat Iso-Seq auch einige Einschränkungen, wie höhere Kosten und geringeren Durchsatz. Mit dem Fortschritt der Technologie und der Senkung der Kosten wird jedoch erwartet, dass Iso-Seq ein wichtiges Werkzeug für die Transkriptomforschung wird.
In der Zukunft wird die Entwicklung der Iso-Seq-Technologie weitreichende Auswirkungen auf die Genomforschung haben. Im Folgenden sind mehrere mögliche Entwicklungsrichtungen und deren potenzielle Auswirkungen aufgeführt:
Integration mehrerer Sequenzierungstechnologien: Kombination von Kurzlese- und Langsequenzierungstechnologien (Sowie RNA-seq und Iso-seq) werden helfen, ihre jeweiligen technischen Einschränkungen zu überwinden. Zum Beispiel können Forscher durch die Integration von Kurzlese-RNA-seq- und Langlese-Iso-seq-Daten die Komplexität des Transkriptoms umfassender analysieren und die Genauigkeit der Genannotierung verbessern.
Anwendung auf weitere Arten: Mit der Popularisierung der Iso-Seq-Technologie wird ihre Anwendung bei Nicht-Modellarten umfangreicher sein. Zum Beispiel wird die Iso-Seq-Technologie in der Forschung zu Meeresorganismen, Insekten und Pflanzen dazu beitragen, die einzigartigen genomischen Eigenschaften und evolutiven Mechanismen dieser Arten aufzudecken.
Unterstützung der personalisierten Medizin: Mit der Vertiefung der Genomforschung könnte die Iso-Seq-Technologie eine wichtige Rolle in der personalisierten Medizin spielen. Zum Beispiel kann durch die Analyse der Transkriptomdaten einer Person ein individuellerer Plan für eine genaue Diagnose und Behandlung bereitgestellt werden.
Die Iso-Seq-Technologie wird in der Transkriptomforschung immer wichtiger, und ihre zukünftige Entwicklung wird den Fortschritt der Genomforschung erheblich fördern und neue Möglichkeiten für die Biologie, Medizin und andere Bereiche schaffen.
Referenzen: