Die Technologien und Arbeitsabläufe von RNA-Seq

Kurze Übersicht

01 Was sind die technischen Fortschritte in der RNA-Sequenzierung? 02 Was sind die Herausforderungen von RNA-seq? 03 Workflow von RNA-Seq basierend auf NGS

Was sind die technischen Fortschritte in der RNA-Sequenzierung?

Sanger-Sequenzierung und Mikroarray. Sanger-Sequenzierungstechnologie wurde zuerst verwendet für Transkriptomik, was Methoden wie SAGE (serielle Analyse der Genexpression) ermöglicht. SAGE war einer der ersten Versuche, die Genexpression auf globaler Ebene zu quantifizieren. Fast sofort, Mikroarray Durch die Nutzung komplementärer Sondenhybridisierung entstand schnell ein dominierendes Verfahren im Bereich der Transkriptom-Profilierung für das nächste Jahrzehnt.

NGS. Das Kommen von Next-Generation-Technologien hat den Sequenzierungsansatz ermöglicht, zu übertreffen Mikroarray Ansatz. Im Jahr 2006 wurde der erste RNA-Seq Das Papier wurde unter Verwendung der 454/Roche-Technologie veröffentlicht. Die Ära der RNA-Seq Die Dominanz begann im Jahr 2008 mit der Reife der Illumina/Solexa-Technologie. Die beliebtesten technischen Plattformen für RNA-Seq der Illumina Genome Analyzer und Hi-Seq. Während die Illumina/Solexa-Technologie pro Lauf Gigabasen an Daten erzeugen kann (anfänglich 1 GB pro Lauf für den Genome Analyzer im Jahr 2006 und 600 GB pro Lauf für den HiSeq im Jahr 2012), erzeugt die Roche/454-Technologie Reads, die lang genug sind für RNA-Seq aber werden durch den relativ niedrigen Durchsatz und die hohen Kosten behindert.

Dritte Generation Sequenzierung. Trotz der Popularisierung des NGS-Technologiendie Anwendung der dritten Generation der Sequenzierung in RNA-Seq ist auf dem Weg. Zum Beispiel Heliscope-Sequenzierung und Einzelmolekül-Echtzeit (SMRT) Sequenzierung wurden bereits in einigen angewendet RNA-Seq Studien. Die PacBio SMRT-Langlese-Sequenzierungstechnologie kann problemlos vollständige Transkripte vom 5'-Ende bis zum 3'-Poly-A-Schwanz abdecken, ohne dass eine Fragmentierung erforderlich ist, um vollständige cDNA-Sequenzen zu erhalten. Dies ist nützlich, um neue Transkripte und neue Introns zu identifizieren, wodurch Isoformen, alternative Spleißstellen, die Expression von Fusionsgenen und allelische Expression genau identifiziert werden können.

Dienste, an denen Sie interessiert sein könnten

Tabelle 1. Die Vorteile von RNA-Seq im Vergleich zu anderen Transkriptomansätzen (Wang et al. 2009).

*Technische Spezifikationen*
Technologie	Fliesen-Mikroarray	cDNA- oder EST-Sequenzierung	RNA-Seq
Prinzip	Hybridisierung	Sanger-Sequenzierung	Hochdurchsatz-Sequenzierung
Auflösung	Von mehreren bis 100 bp	Einzelbasis	Einzelbasis
Durchsatz	Hoch	Niedrig	Hoch
Abhängigkeit von genomischer Sequenz	Ja	Nein	In einigen Fällen
Hintergrundgeräusch	Hoch	Niedrig	Niedrig
*Anwendung*
Gleichzeitig transkribierte Regionen und Genexpression kartieren	Ja	Begrenzt für die Genexpression	Ja
Dynamischer Bereich zur Quantifizierung des Genexpressionsniveaus	Bis zu mehreren Hundertfache.	Nicht praktisch	über 8.000-fach
Fähigkeit, verschiedene Isoformen zu unterscheiden	Begrenzt	Ja	Ja
Fähigkeit, allelische Expression zu unterscheiden	Begrenzt	Ja	Ja
*Praktische Probleme*
Erforderliche Menge an RNA	Hoch	Hoch	Niedrig
Kosten für die Kartierung von Transkriptomen großer Genome	Hoch	Hoch	Relativ niedrig

Was sind die Herausforderungen von RNA-seq?

KurzleseDie Illumina-Sequenzierungstechnologie hat seit ihrer Einführung im Jahr 2007 kontinuierlich die Lese- und Durchsatzlängen erhöht. Lange, gepaarte, strangspezifische Reads werden häufig für höhere Mappbarkeit verwendet und von neuem Zusammenstellung von Transkriptomen. Darüber hinaus ermöglicht die Sequenzierungstechnologie der dritten Generation (wie PacBio und Ion-Torrent) Vollständige Transkripte-Sequenzierung.
PCR-BiasesEin weiteres Anliegen ist die Auswirkung der PCR-Amplifikation auf die Genauigkeit der Quantifizierung der Genexpression über RNA-SeqHelicos und einige der dritten Sequenzierer verwendeten eine amplifikationsfreie Technologie. Es gibt auch PCR-freie Methoden für Illumina-Sequenzierung.

Workflow von RNA-Seq basierend auf NGS

Der Arbeitsablauf von RNA-Seq durch die Nutzung Hochdurchsatz-Sequenzierung Die Technologie ist in Abbildung 1 dargestellt. Kurz gesagt, werden lange RNAs zunächst in eine Bibliothek von cDNA-Fragmenten durch RNA- oder DNA-Fragmente umgewandelt. Sequenzierungsadapter werden dann an jedes cDNA-Fragment angeheftet, und Sequenzdaten werden in einem Hochdurchsatzverfahren von beiden Enden (paired-end sequencing) generiert. Die resultierenden Sequenzlesungen werden anschließend mit dem Referenzgenom oder Transkriptom ausgerichtet und in drei Typen klassifiziert: exone Reads, Junction Reads und poly(A) End-Reads. Ein expressionsprofil mit Basenauflösung kann durch die Verwendung dieser drei Typen von Sequenzlesungen erstellt werden.

Figure 1. Typical workflow of RNA-seq (Wang et al. 2009). Abbildung 1. Ein typischer Workflow von RNA-seq (Wang et al. 2009).

Bibliotheksbau

Figure 2. RNA-seq library construction pipeline. Abbildung 2. Ein typisches Bibliothekskonstruktionspipeline von RNA-seq.

Nach der Probenentnahme wird die gesamte RNA normalerweise durch organische Extraktion und/oder Silikagelmembranen von Spin-Säulen isoliert. Die Gesamt-RNA-Probe wird anschließend entweder durch direkte Auswahl von poly(A)-RNA oder durch selektive Entfernung von rRNA verarbeitet, da die reichlich vorhandene rRNA normalerweise nicht im Fokus der Forschung steht und die Abdeckung der nützlichen Transkripte erheblich verringert. Das Oligo(dT)-basierte mRNA-Reinigungsverfahren wird in Eukaryoten häufig verwendet. Allerdings werden einige RNA-Transkripte, die keine poly(A)-Schwänze aufweisen, übersehen. Im Vergleich zur Auswahl von poly(A)-RNA wird der Ansatz zur Ribodepletion bevorzugt, da er alle nicht-ribosomalen RNA-Spezies anreichert, einschließlich tRNA, ncRNAs, nicht-poly(A) mRNA und vorverarbeiteter RNA. Die zwei beliebtesten Methoden zur rRNA-Depletion sind: (i) Hybridisierung von rRNA mit biotin-markierten Anti-rRNA-Sonden, gefolgt von der Entfernung mit streptavidin-beschichteten magnetischen Perlen; und (ii) selektive Degradation von rRNA durch eine 5'-3' Exonuklease, die spezifisch rRNA mit einem 5'-Phosphat erkennt.

Die Fragmentierung wird anschließend durchgeführt, um die gewünschte Länge für verschiedene zu erreichen. NGS Technologien. Einige kleine RNAs, wie Mikro-RNAs, piwi-interagierende RNAs und kurze interferierende RNAs, können direkt ohne Fragmentierung sequenziert werden. Größere RNA-Moleküle müssen vor der Tiefensequenzierung in kleinere Stücke (200-500 bp) fragmentiert werden. cDNA-Fragmentierung (DNase I-Behandlung oder Sonikation) und RNA-Hydrolyse oder Nebelung. Allerdings kann jede dieser Methoden eine andere Verzerrung im Ergebnis erzeugen. Zum Beispiel ist die cDNA-Fragmentierung in der Regel stark verzerrt zugunsten der Identifizierung von Sequenzen von den 3'-Enden der Transkripte, während die RNA-Fragmentierung wenig Verzerrung über das Transkript aufweist, aber die Transkriptenden verringert. Daher liefert die cDNA-Fragmentierung wertvolle Informationen über die genaue Identität dieser Enden, während die RNA-Fragmentierung Zugang zur genauen Identität des Transkriptkörpers bietet.

Im Klassiker NGS Protokolle, Adapter werden an gemeinsame doppelsträngige DNA-Fragmente ligiert. Ein wesentlicher Nachteil dieses Ansatzes ist jedoch der Verlust von Informationen über die Transkriptionale Richtung. Eine Vorbehandlung der RNA-Proben mit Natriumbisulfat kann das Cytidin in Uridin umwandeln. Die weit verbreitete C-T-Transition kennzeichnet somit den codierenden Strang jedes Transkripts. Einige andere Methoden, die die Strangspezifität beibehalten, wurden vorgeschlagen, wie die direkte Ligierung von RNA-Adaptern an die RNA-Probe vor der reversen Transkription.

Dienste, an denen Sie interessiert sein könnten

Sequenzierung

Der RNA-Seq wird derzeit von drei verschiedenen Plattformen dominiert: Illumina (Genome Analyzer und HiSeq), Applied Biosystems SOLID und Roche 454 Life Science Systeme. Die Leselängen reichen von 30-100 bp für Illumina und SOLiD und von 200-500 bp für das 454-Pyrosequenzierungssystem. 454-basiert RNA-Seq ist besonders attraktiv für Nicht-Modellorganismen ohne Referenzgenome oder Transkriptome. Längere Reads oder gepaarte kurze Reads können die Verbindung zwischen mehreren Exons aufzeigen. RNA-Seq ist eine leistungsstarke Methode, um komplexe Transkriptome zu untersuchen und Sequenzvariationen in den transkribierten Regionen aufzudecken.

Bioinformatik

Figure 3. Data analysis pipeline for RNA-seq. Abbildung 3. Eine typische Analysepipeline von RNA-seq-Daten.

Die Qualitätsbewertung ist der erste Schritt für die Bioinformatikanalyse von RNA-Seq, das ein kohärentes Endergebnis durch die Entfernung von Sequenzen niedriger Qualität, überrepräsentierten Sequenzen und Adaptersequenzen gewährleistet. Sobald alle Reads gefiltert und zugeordnet oder assembliert wurden, können die Genexpressionsniveaus somit abgeleitet werden, was zu einer genomweiten Transkriptomkarte in Bezug auf Qualität und Quantität führt. RNA-Seq ermöglicht auch die Erkennung von differentieller Expression (DE) über Behandlungen von Bedingungen. Eine Normalisierung muss durchgeführt werden, um die Unterschiede zwischen den Proben, wie z. B. die Bibliotheksgröße und gene-spezifische Merkmale, anzupassen. Darüber hinaus, RNA-Seq ermöglicht es uns, SNPs, Fusionsgene und posttranskriptionale Genregulation, wie RNA-Bearbeitung, Abbau und Translation, zu identifizieren.

Wenn Sie mehr Informationen über die Anwendungen von RNA-Seq oder Bioinformatik Workflow von RNA-Seq, Sie können sich auf den Artikel beziehen.

Referenzen:

Wang Z, Gerstein M, Snyder M. RNA-Seq: ein revolutionäres Werkzeug für die Transkriptomik. Naturwissenschaftliche Rezensionen Genetik, 2009, 10(1): 57.
Qian X, Ba Y, Zhuang Q, et al. RNA-Seq-Technologie und ihre Anwendung in der Fischtranskriptomik. Omics: Eine Zeitschrift für integrative Biologie, 2014, 18(2): 98-110.
Marguerat S, Bähler J. RNA-Seq: Von der Technologie zur Biologie. Zell- und Molekularbiowissenschaften, 2010, 67(4): 569-579.
Wilhelm B T, Landry J R. RNA-Seq—quantitative Messung der Expression durch massiv paralleles RNA-Sequencing. Methoden, 2009, 48(3): 249-257.
McGettigan P A. Transkriptomik im RNA-seq-Zeitalter. Aktuelle Meinungen in der chemischen Biologie, 2013, 17(1): 4-11.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.

Verwandte Dienstleistungen