Faktenblatt: RNA-Sequenzierung und Datenanalyse

Was macht die RNA-Sequenzierung?

RNA-Sequenzierung, oder RNA-Seqist eine leistungsstarke molekularbiologische Technik, die umfassende Einblicke in das Transkriptom eines Organismus bietet.

Zum Beispiel könnte gen3 eine erhöhte Aktivität in normalen Zellen zeigen, während gen2 eine erhöhte Expression in mutierten Zellen aufweist. In der Zwischenzeit zeigt gen1 konsistente Expressionsniveaus in beiden Zelltypen. Hochdurchsatz-RNA-Sequenzierung Die Technologie misst die Transkriptionshäufigkeit verschiedener Gene innerhalb der Zellen und zeigt, welche Gene aktiv transkribiert werden.

Was ist RNA-Sequenzierung (RNA-Seq)? könnte ein nützlicher Artikel sein, um mehr über RNA-Seq zu lernen.

Was sind Reads, Read-Länge, Read-Tiefe und Anzahl der Reads?

Liestauch bekannt als downstream Sequenzen, sind Sequenzen von Nukleotidbasen, die aus den Nukleinsäurefragmenten einer Probe gewonnen werden, die von einem Sequenzierer analysiert wurden, dargestellt als Zeichenfolgen wie "ATCAGATA.....".

RNA-Seq Reads sind Sequenzen, die aus RNA-Molekülen in einer Probe gewonnen werden, typischerweise durch RNA-Sequenzierungstechniken erzeugt. Diese Reads repräsentieren Fragmente von RNA-Molekülen und sind entscheidend für das Verständnis der Genexpression, des alternativen Spleißens und anderer RNA-bezogener Prozesse. Ähnlich wie genomische Sequenzierungsreads bestehen RNA-Seq-Reads ebenfalls aus Nukleotidbasen, und ihre Analyse liefert wertvolle Einblicke in das Transkriptom eines Organismus unter bestimmten Bedingungen oder Behandlungen.

Der Leseumfang bezeichnet die Anzahl der Basen in jedem Read. Wenn wir sagen, dass ein Read 50 Basenpaare (bp) lang ist, bedeutet das, dass er aus 50 gemessenen Basen in einer einzigen Sequenz besteht.

Lese-Tiefe bezieht sich auf die Menge an Reads, die durch das Sequenzieren einer Probe gewonnen wurden. Oft wird es mit der Genomsequenzierungsabdeckung verwechselt, die sich auf das Ausmaß der sequenzierten genomischen Regionen bezieht, und der Sequenzierungstiefe, die entweder die Häufigkeit der Sequenzierung eines einzelnen Nukleotids oder die durchschnittliche Tiefe über alle sequenzierten Nukleotide darstellt.

Der Anzahl der Lesevorgänge spiegelt das Volumen der durch Sequenzierung generierten Daten wider, oft ausgedrückt als Einträge. Im Kontext von Anwendungen wie metagenomische Next-Generation-Sequenzierung (mNGS)Die Anzahl der Reads dient als entscheidende Kennzahl zur Erkennung spezifischer pathogener Mikroorganismen und unterstützt deren Charakterisierung und Quantifizierung.

CD Genomics bietet Hochdurchsatz-RNA-Sequenzierungs- und Bibliothekskonstruktionsdienste, die eine umfassende Analyse von Transkriptomen ermöglichen. CD Genomics stellt robuste Transkriptomforschungsdienste mit hochwertigen Proben zur Verfügung.

Hauptschritte der RNA-Seq (Basierend auf dem Illumina-Protokoll)

Schritt 1: RNA-Extraktion

Die RNA aus der interessierenden Probe wird extrahiert.

Schritt 2: Fragmentierung von RNA

RNA-Moleküle, die typischerweise Tausende von Basen lang sind, werden in kleinere Stücke fragmentiert. Diese Fragmentierung ist notwendig, da die Leselänge des Sequenziergeräts begrenzt ist (in der Regel 200 bis 300 bp), was das Sequenzieren ermöglicht.

Schritt 3: Rücktranskription

Die fragmentierte RNA wird in komplementäre DNA (cDNA) umgeschrieben. Doppelsträngige DNA ist stabiler als RNA und lässt sich leichter amplifizieren und manipulieren.

Schritt 4: Hinzufügen von Sequenzierungsadaptern

Sequenzierungsadapter werden an die Enden der doppelsträngigen DNA angefügt. Diese Adapter enthalten Sequenzen, die komplementär zu denen auf dem Sequenzierchip sind, was es dem Sequenzierer ermöglicht, die DNA-Fragmente effizient zu erkennen und zu sequenzieren. Verschiedene Proben können unterschiedliche Adaptersequenzen verwenden, was die Multiplexierung von Proben in einem einzigen Sequenzierungslauf ermöglicht. Es ist wichtig zu beachten, dass die Effizienz der Adapteraddition variieren kann, was dazu führen kann, dass einige DNA-Fragmente vom Sequenzierer nicht erkannt werden.

Schritt 5: PCR-Amplifikation

Die PCR-Amplifikation wird unter Verwendung von Primern durchgeführt, die auf den hinzugefügten Adaptersequenzen basieren. Dieser Amplifikationsschritt amplifiziert selektiv DNA-Fragmente, die die Adaptersequenzen enthalten.

Schritt 6: Qualitätskontrolle

Die Konzentration und Länge der erstellten Bibliothek werden bestimmt, um eine optimale Sequenzierungsleistung zu gewährleisten. Bibliotheken mit geeigneter Konzentration und Länge werden ausgewählt, um mit der Sequenzierung fortzufahren.

Schritt 7: Sequenzierung

Die konstruierte Bibliothek wird mit der gewählten Sequenzierungsplattform sequenziert.

RNA-Sequenzierungsdatenvorverarbeitung

Nach der Sequenzierung umfasst der Datensatz typischerweise etwa 400 Millionen RNA-seq-Reads, von denen jeder aus vier Zeilen besteht. Vor der Analyse ist es wichtig, diese Daten vorzubereiten.

1. Datenvorverarbeitung: Filterung von substandard RNA-seq Reads

Unterdurchschnittlich RNA-Seq Reads, die durch eine niedrige Qualität der Basiserkennung oder durch Verbindungsinterferenzen gekennzeichnet sind, müssen herausgefiltert werden. Unter normalen Bedingungen besteht ein RNA-seq-Fragment aus zwei Sequenzierungsjunctions und einem DNA-Fragment. Unter abnormalen Bedingungen kann ein RNA-seq-Fragment jedoch nur aus zwei Sequenzierungsjunctions bestehen.

2. Ausrichtung von hochqualitativen RNA-seq-Lesungen auf das Genom

Die umfangreiche Basensequenz des Genoms erfordert eine Fragmentierung in zahlreiche kurze Basensequenzen, die indiziert und deren chromosomale Standorte aufgezeichnet werden. Ebenso, RNA-Seq Reads werden in kleine Segmente fragmentiert. Diese Lese-Fragmenten werden dann mit den entsprechenden Fragmenten des Genoms ausgerichtet. Durch das Abgleichen der kleinen Fragmente der RNA-seq-Reads mit denen des Genoms kann der chromosomale Standort jedes Lese-Fragmentes abgeleitet werden.

3. Zählen der Reads pro Gen

Sobald der chromosomale Standort jedes einzelnen RNA-Seq Wenn ein Read bestimmt ist, wird es möglich, festzustellen, ob ein Read innerhalb eines bestimmten Gens liegt. Zum Beispiel kann man, indem man die Koordinaten von Genen wie Xkr4 (Chromosom 1, Position: 3204563-3661579) und Rp1 (Chromosom 1, Position: 4280927-4399322) kennt, die Anzahl der Reads an diesen Koordinaten zählen, was zu Read-Zählungen für die Gene führt. Dieser Prozess ermöglicht den Aufbau einer Read-Zählmatrix.

4. Normalisierung von Sequenzierungsdaten

Da verschiedene Proben mit unterschiedlichen Anzahl an Reads im Genom verglichen werden können, können Abweichungen in den Read-Zahlen auftreten. Zum Beispiel könnte Probe 1 insgesamt 635 Reads haben, während Probe 2 1270 Reads hat, was fast doppelt so viel wie Probe 1 ist. Dies deutet jedoch nicht auf eine doppelte Genexpression in Probe 2 hin. Vielmehr bedeutet es, dass in Probe 2 weniger Reads von niedriger Qualität vorhanden sind, die vom Sequenzierer als fluoreszierender interpretiert werden. Um die Read-Zahlen genau zu vergleichen und die Unterschiede in der Genexpression widerzuspiegeln, müssen die Read-Zahl-Daten für jedes Gen angepasst werden. Einfache Methoden umfassen die Division des Read-Zahl-Wertes für jedes Gen durch die Gesamtanzahl der Reads für die Probe. Alternativ können auch komplexere Normalisierungsmethoden wie RPKM, FPKM, TPM usw. angewendet werden.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben