RNA-Seq ist das Fundament für die Analyse der differentiellen Genexpression (DGE), eine entscheidende Methode in der Molekularbiologie. Der herkömmliche Workflow beginnt mit der RNA-Extraktion im Labor, gefolgt von der Anreicherung von mRNA oder der Entfernung von ribosomaler RNA, der cDNA-Synthese und der Erstellung von adapter-ligierten Sequenzierungsbibliotheken. Diese Bibliotheken werden anschließend einer Hochdurchsatz-Sequenzierung unterzogen, oft unter Verwendung von Illumina-Plattformen, die Lesungen von 100 bis 30 Millionen pro Probe erzeugen. Die anschließende rechnerische Phase umfasst die Ausrichtung oder Assemblierung der Reads in Transkriptome, die Quantifizierung überlappender Transkripte, die Inter-Proben-Normalisierung und -Filterung, die in statistischer Modellierung gipfelt, um signifikante Veränderungen in den Gen- oder Transkriptexpressionsniveaus über Probenkohorten hinweg zu erkennen.
Historisch gesehen hat RNA-Seq verschiedene Plattformen angenommen, insbesondere Illumina, bekannt für seine kurzen Lese-Längen, im Vergleich zu Long-Read-Sequenzierungsplattformen wie PacBio und Nanopore, die jeweils unterschiedliche Vorteile und Kompromisse bieten.
CD Genomics Hochdurchsatz-Sequenzierungs- und Bibliothekskonstruktionsdienste ermöglichen eine eingehende Analyse von Transkriptomen. CD Genomics bietet Short-Read- und Long-Read-RNA-Seq-Dienste an, die eine robuste Transkriptomforschung in Proben von höchster Qualität gewährleisten.
Short-Read-Sequenzierung und Long-Read-Sequenzierung sind unterschiedliche Methoden in der DNA- oder RNA-Sequenzierung, die jeweils einzigartige Merkmale und Vorteile beim Entschlüsseln genetischer Informationen bieten.
Kurzzeit-Sequenzierung beinhaltet das Parsen von DNA- oder RNA-Sequenzen in kürzere Fragmente. Hervorzuheben unter den Technologien für Kurzlesesequenzierung ist die Plattform von Illumina, die dafür bekannt ist, Sequenzen zu erzeugen, die sich über Dutzende bis Hunderte von Basenpaaren erstrecken.
Andererseits, Langzeit-Sequenzierung zeichnet sich durch die Erfassung längerer DNA- oder RNA-Fragmente aus, die oft Tausende bis Hunderttausende von Basenpaaren umfassen.
Die Auswahl zwischen Short-Read- und Long-Read-Sequenzierung hängt von den spezifischen Anforderungen der Studie ab. Short Reads eignen sich gut für großangelegte Sequenzierungsprojekte, SNP-Erkennung und Genexpressionsstudien, während Long Reads besonders gut geeignet sind, um komplexe genomische Strukturen aufzulösen, die Genomassemblierung zu erleichtern und strukturelle Variationen innerhalb von Genen zu identifizieren. Häufig entscheiden sich Forscher für einen hybriden Ansatz, bei dem beide Technologien genutzt werden, um ein nuancierteres Verständnis der genetischen Landschaften zu gewinnen.
Tabelle 1 Kurzlese- vs. Langlese-RNA-seq
| Kurzlese cDNA-Seq | Long-Read cDNA-Sequenzierung | Long-Read-RNA-Seq | |
| Plattformen | Illumina, Ion Torrent | PacBio | Oxford Nanopore |
| Vorteile | - Sehr hohe Durchsatzrate: 100-1.000 Mal mehr Reads pro Lauf als bei Long-Read-Plattformen. - Verzerrungs- und Fehlerkurven sind leicht verständlich. - Bietet zahlreiche kompatible Methoden und rechnerische Arbeitsabläufe für die Analyse von degradiertem RNA. |
- Erfasst viele vollständige Transkripte in 1-50 kb langen Reads. - Vereinfacht rechnerische Methoden für die ab initio Transkriptomanalyse. |
- Lange Leseabschnitte von 1-50 kb erfassen effektiv vollständige Transkripte. - Vereinfachte Berechnungen erleichtern die ab initio Transkriptomanalyse. - Probenvorbereitung ohne die Notwendigkeit einer reversen Transkription oder mit reduziertem PCR-Bias. - Die Erkennung von RNA-Basenmodifikationen ist möglich, einschließlich der direkten Schätzung der Poly(A)-Schwanzlängen durch Einzelmolekül-Sequenzierung. |
| Nachteile | - Die Probenvorbereitung (reverse Transkription, PCR, Größenselektion) führt zu Verzerrungen. - Begrenzte Isoform-Erkennung und -Quantifizierung. - Erfordert ab initio Transkriptom-Matching und/oder Assemblierungsschritte zur Transkriptentdeckung. |
- Niedrig bis mittelmäßiger Durchsatz: 500.000 bis 10 Millionen Reads pro Lauf. - Probenvorbereitungsbiases, die bei der Entdeckung von Leitern, der ab initio Transkriptomanalyse und der Entdeckung von Fusionstranskripten auftreten. - Nicht empfohlen für die Analyse von degradiertem RNA. |
- Die Technologie bietet eine niedrige Durchsatzrate, die derzeit zwischen 500.000 und 1 Million Reads pro Durchgang liegt. Das Verständnis von Probenvorbereitung und Sequenzierungsverzerrungen ist nach wie vor unvollständig. - In der Lage, Modifikationen in Ribonukleinsäure (RNA) zu erkennen. |
| Hauptanwendungen | - DGEWTA, kleine RNA, Einzelzellanalyse, räumliche Omik, de novo RNA-Assemblierung, Translatom-Analyse, strukturelle und RNA-Protein-Interaktionsanalyse usw. | - Isoform-Entdeckung, ab initio Transkriptom-Analyse, Entdeckung von Fusionstranskripten, MHC, HLA oder andere komplexe Transkriptanalysen. | - Isoform-Entdeckung, ab initio Transkriptom-Analyse, Entdeckung von Fusions-Transkripten, MHC, HLA oder andere komplexe Transkript-Analysen. - In der Lage, Modifikationen in Ribonukleinsäure (RNA) zu identifizieren. |
| Technologische Überlegungen | - Hohe Durchsatzrate mit bekannten Verzerrungen. - Computationale Workflows bedienen verschiedene RNA-Analyseanwendungen. |
- Mittlerer Durchsatz mit Probenvorbereitungs-Bias. - Direkte Detektion von RNA-Modifikationen. |
|
| Empfehlungen | - Geeignet für eine Vielzahl von RNA-Analyseanwendungen. - Nicht empfohlen für die Analyse von degradiertem RNA. |
- Empfohlen für die Entdeckung von Isoformen, die Analyse von Fusionstranskripten und die Analyse komplexer Transkripte. - Nicht geeignet für die Analyse von degradiertem RNA. |
Die Sequenzierung glänzt in Aufgaben wie der Entdeckung von Isoformen, der ab initio Transkriptomanalyse, der Erkennung von Fusionstranskripten und der Untersuchung komplexer Transkripte wie MHC und HLA. Es wird jedoch nicht empfohlen, degradierte RNA zu analysieren. |