Sanger-Sequenzierung und Mikroarray. Sanger-Sequenzierungstechnologie wurde zuerst verwendet für Transkriptomik, was Methoden wie SAGE (serielle Analyse der Genexpression) ermöglicht. SAGE war einer der ersten Versuche, die Genexpression auf globaler Ebene zu quantifizieren. Fast sofort, Mikroarray Durch die Nutzung komplementärer Sondenhybridisierung entstand schnell ein dominierendes Verfahren im Bereich der Transkriptom-Profilierung für das nächste Jahrzehnt.
NGS. Das Kommen von Next-Generation-Technologien hat den Sequenzierungsansatz ermöglicht, zu übertreffen Mikroarray Ansatz. Im Jahr 2006 wurde der erste RNA-Seq Das Papier wurde unter Verwendung der 454/Roche-Technologie veröffentlicht. Die Ära der RNA-Seq Die Dominanz begann im Jahr 2008 mit der Reife der Illumina/Solexa-Technologie. Die beliebtesten technischen Plattformen für RNA-Seq der Illumina Genome Analyzer und Hi-Seq. Während die Illumina/Solexa-Technologie pro Lauf Gigabasen an Daten erzeugen kann (anfänglich 1 GB pro Lauf für den Genome Analyzer im Jahr 2006 und 600 GB pro Lauf für den HiSeq im Jahr 2012), erzeugt die Roche/454-Technologie Reads, die lang genug sind für RNA-Seq aber werden durch den relativ niedrigen Durchsatz und die hohen Kosten behindert.
Dritte Generation Sequenzierung. Trotz der Popularisierung des NGS-Technologiendie Anwendung der dritten Generation der Sequenzierung in RNA-Seq ist auf dem Weg. Zum Beispiel Heliscope-Sequenzierung und Einzelmolekül-Echtzeit (SMRT) Sequenzierung wurden bereits in einigen angewendet RNA-Seq Studien. Die PacBio SMRT-Langlese-Sequenzierungstechnologie kann problemlos vollständige Transkripte vom 5'-Ende bis zum 3'-Poly-A-Schwanz abdecken, ohne dass eine Fragmentierung erforderlich ist, um vollständige cDNA-Sequenzen zu erhalten. Dies ist nützlich, um neue Transkripte und neue Introns zu identifizieren, wodurch Isoformen, alternative Spleißstellen, die Expression von Fusionsgenen und allelische Expression genau identifiziert werden können.
Dienste, an denen Sie interessiert sein könnten
Tabelle 1. Die Vorteile von RNA-Seq im Vergleich zu anderen Transkriptomansätzen (Wang et al. 2009).
| Technologie | Fliesen-Mikroarray | cDNA- oder EST-Sequenzierung | RNA-Seq |
| Technische Spezifikationen | |||
|---|---|---|---|
| Prinzip | Hybridisierung | Sanger-Sequenzierung | Hochdurchsatz-Sequenzierung |
| Auflösung | Von mehreren bis 100 bp | Einzelbasis | Einzelbasis |
| Durchsatz | Hoch | Niedrig | Hoch |
| Abhängigkeit von genomischer Sequenz | Ja | Nein | In einigen Fällen |
| Hintergrundgeräusch | Hoch | Niedrig | Niedrig |
| Anwendung | |||
| Gleichzeitig transkribierte Regionen und Genexpression kartieren | Ja | Begrenzt für die Genexpression | Ja |
| Dynamischer Bereich zur Quantifizierung des Genexpressionsniveaus | Bis zu mehreren Hundertfache. | Nicht praktisch | über 8.000-fach |
| Fähigkeit, verschiedene Isoformen zu unterscheiden | Begrenzt | Ja | Ja |
| Fähigkeit, allelische Expression zu unterscheiden | Begrenzt | Ja | Ja |
| Praktische Probleme | |||
| Erforderliche Menge an RNA | Hoch | Hoch | Niedrig |
| Kosten für die Kartierung von Transkriptomen großer Genome | Hoch | Hoch | Relativ niedrig |
Der Arbeitsablauf von RNA-Seq durch die Nutzung Hochdurchsatz-Sequenzierung Die Technologie ist in Abbildung 1 dargestellt. Kurz gesagt, werden lange RNAs zunächst in eine Bibliothek von cDNA-Fragmenten durch RNA- oder DNA-Fragmente umgewandelt. Sequenzierungsadapter werden dann an jedes cDNA-Fragment angeheftet, und Sequenzdaten werden in einem Hochdurchsatzverfahren von beiden Enden (paired-end sequencing) generiert. Die resultierenden Sequenzlesungen werden anschließend mit dem Referenzgenom oder Transkriptom ausgerichtet und in drei Typen klassifiziert: exone Reads, Junction Reads und poly(A) End-Reads. Ein expressionsprofil mit Basenauflösung kann durch die Verwendung dieser drei Typen von Sequenzlesungen erstellt werden.
Abbildung 1. Ein typischer Workflow von RNA-seq (Wang et al. 2009).
Abbildung 2. Ein typisches Bibliothekskonstruktionspipeline von RNA-seq.
Nach der Probenentnahme wird die gesamte RNA normalerweise durch organische Extraktion und/oder Silikagelmembranen von Spin-Säulen isoliert. Die Gesamt-RNA-Probe wird anschließend entweder durch direkte Auswahl von poly(A)-RNA oder durch selektive Entfernung von rRNA verarbeitet, da die reichlich vorhandene rRNA normalerweise nicht im Fokus der Forschung steht und die Abdeckung der nützlichen Transkripte erheblich verringert. Das Oligo(dT)-basierte mRNA-Reinigungsverfahren wird in Eukaryoten häufig verwendet. Allerdings werden einige RNA-Transkripte, die keine poly(A)-Schwänze aufweisen, übersehen. Im Vergleich zur Auswahl von poly(A)-RNA wird der Ansatz zur Ribodepletion bevorzugt, da er alle nicht-ribosomalen RNA-Spezies anreichert, einschließlich tRNA, ncRNAs, nicht-poly(A) mRNA und vorverarbeiteter RNA. Die zwei beliebtesten Methoden zur rRNA-Depletion sind: (i) Hybridisierung von rRNA mit biotin-markierten Anti-rRNA-Sonden, gefolgt von der Entfernung mit streptavidin-beschichteten magnetischen Perlen; und (ii) selektive Degradation von rRNA durch eine 5'-3' Exonuklease, die spezifisch rRNA mit einem 5'-Phosphat erkennt.
Die Fragmentierung wird anschließend durchgeführt, um die gewünschte Länge für verschiedene zu erreichen. NGS Technologien. Einige kleine RNAs, wie Mikro-RNAs, piwi-interagierende RNAs und kurze interferierende RNAs, können direkt ohne Fragmentierung sequenziert werden. Größere RNA-Moleküle müssen vor der Tiefensequenzierung in kleinere Stücke (200-500 bp) fragmentiert werden. cDNA-Fragmentierung (DNase I-Behandlung oder Sonikation) und RNA-Hydrolyse oder Nebelung. Allerdings kann jede dieser Methoden eine andere Verzerrung im Ergebnis erzeugen. Zum Beispiel ist die cDNA-Fragmentierung in der Regel stark verzerrt zugunsten der Identifizierung von Sequenzen von den 3'-Enden der Transkripte, während die RNA-Fragmentierung wenig Verzerrung über das Transkript aufweist, aber die Transkriptenden verringert. Daher liefert die cDNA-Fragmentierung wertvolle Informationen über die genaue Identität dieser Enden, während die RNA-Fragmentierung Zugang zur genauen Identität des Transkriptkörpers bietet.
Im Klassiker NGS Protokolle, Adapter werden an gemeinsame doppelsträngige DNA-Fragmente ligiert. Ein wesentlicher Nachteil dieses Ansatzes ist jedoch der Verlust von Informationen über die Transkriptionale Richtung. Eine Vorbehandlung der RNA-Proben mit Natriumbisulfat kann das Cytidin in Uridin umwandeln. Die weit verbreitete C-T-Transition kennzeichnet somit den codierenden Strang jedes Transkripts. Einige andere Methoden, die die Strangspezifität beibehalten, wurden vorgeschlagen, wie die direkte Ligierung von RNA-Adaptern an die RNA-Probe vor der reversen Transkription.
Dienste, an denen Sie interessiert sein könnten
Der RNA-Seq wird derzeit von drei verschiedenen Plattformen dominiert: Illumina (Genome Analyzer und HiSeq), Applied Biosystems SOLID und Roche 454 Life Science Systeme. Die Leselängen reichen von 30-100 bp für Illumina und SOLiD und von 200-500 bp für das 454-Pyrosequenzierungssystem. 454-basiert RNA-Seq ist besonders attraktiv für Nicht-Modellorganismen ohne Referenzgenome oder Transkriptome. Längere Reads oder gepaarte kurze Reads können die Verbindung zwischen mehreren Exons aufzeigen. RNA-Seq ist eine leistungsstarke Methode, um komplexe Transkriptome zu untersuchen und Sequenzvariationen in den transkribierten Regionen aufzudecken.
Abbildung 3. Eine typische Analysepipeline von RNA-seq-Daten.
Die Qualitätsbewertung ist der erste Schritt für die Bioinformatikanalyse von RNA-Seq, das ein kohärentes Endergebnis durch die Entfernung von Sequenzen niedriger Qualität, überrepräsentierten Sequenzen und Adaptersequenzen gewährleistet. Sobald alle Reads gefiltert und zugeordnet oder assembliert wurden, können die Genexpressionsniveaus somit abgeleitet werden, was zu einer genomweiten Transkriptomkarte in Bezug auf Qualität und Quantität führt. RNA-Seq ermöglicht auch die Erkennung von differentieller Expression (DE) über Behandlungen von Bedingungen. Eine Normalisierung muss durchgeführt werden, um die Unterschiede zwischen den Proben, wie z. B. die Bibliotheksgröße und gene-spezifische Merkmale, anzupassen. Darüber hinaus, RNA-Seq ermöglicht es uns, SNPs, Fusionsgene und posttranskriptionale Genregulation, wie RNA-Bearbeitung, Abbau und Translation, zu identifizieren.
Wenn Sie mehr Informationen über die Anwendungen von RNA-Seq oder Bioinformatik Workflow von RNA-Seq, Sie können sich auf den Artikel beziehen.
Referenzen: