Kleine RNA-Sequenzierung: Methoden, Arbeitsablauf, Plattform und Anwendungen

Die kleine RNA-Sequenzierung (sRNA-seq) zielt auf die Klasse der nicht-kodierenden RNA-Moleküle ab, die kürzer als 200 Nukleotide sind, einschließlich Mikro-RNAs (miRNAs), Piwi-interagierenden RNAs (piRNAs), kleinen interferierenden RNAs (siRNAs) und tRNA-abgeleiteten kleinen RNAs (tsRNAs). Im Gegensatz zur messenger RNA werden diese Moleküle nicht in Proteine übersetzt, sondern fungieren als Regulatoren der Genexpression auf transkriptioneller und post-transkriptioneller Ebene. Ihre kleine Größe, Heterogenität und distinct biochemischen Eigenschaften schaffen einzigartige Herausforderungen sowohl für die Bibliotheksvorbereitung als auch für die bioinformatische Analyse, die in standardmäßigen RNA-seq-Workflows nicht vorhanden sind.

Dieser Leitfaden richtet sich an Forscher, die über grundlegende Kenntnisse in RNA-seq verfügen und einen praktischen, entscheidungsorientierten Überblick über die Sequenzierung kleiner RNAs benötigen. Er behandelt die sRNA-Klassen, die für die biomedizinische Forschung relevant sind, die Methoden zur Bibliotheksvorbereitung und deren Verzerrungsprofile, die spezialisierten bioinformatischen Werkzeuge, die für sRNA-seq-Daten erforderlich sind, sowie aufkommende Anwendungen in der Flüssigbiopsie und der Forschung zu zirkulierenden miRNAs. Der Fokus liegt dabei darauf, wie methodische Entscheidungen die Datenqualität und die biologische Interpretation beeinflussen, und bietet den Kontext, der benötigt wird, um Experimente zu entwerfen, die reproduzierbare Ergebnisse liefern, und um veröffentlichte Ergebnisse kritisch zu bewerten, die möglicherweise mit unterschiedlichen Protokollen und Analysepipelines generiert wurden.

Im Gegensatz zu mRNA-seq, bei dem Standardprotokolle vergleichbare Ergebnisse in verschiedenen Laboren liefern, sind die Ergebnisse von sRNA-seq stark abhängig von der spezifischen Bibliotheksvorbereitungsmethode, dem Adapterdesign und der verwendeten bioinformatischen Pipeline. Zwei Labore, die dasselbe biologische Probenmaterial mit unterschiedlichen sRNA-seq-Protokollen untersuchen, können erheblich unterschiedliche Listen der detektierten miRNAs und unterschiedliche Expressionsverhältnisse erzeugen. Das Verständnis dieser methodologischen Sensitivität ist entscheidend für die Planung von Experimenten, die Bewertung der veröffentlichten Literatur und den Vergleich von Ergebnissen aus unabhängigen Studien, um robuste biologische Schlussfolgerungen zu ziehen.

Kleine RNA-Sequenzierungsdienste deckt den gesamten Workflow von der Bibliotheksvorbereitung bis zur bioinformatischen Analyse ab, mit Protokollen, die für verschiedene sRNA-Klassen, Probenarten und Forschungsziele in einer Vielzahl biologischer Systeme optimiert sind.

Was sind kleine RNAs und warum sollten sie sequenziert werden?

Kleine RNAs sind eine vielfältige Gruppe von nicht-kodierenden RNA-Molekülen, die die Genexpression durch sequenzspezifische Interaktionen mit Ziel-mRNAs oder Chromatin regulieren. Die vier Hauptklassen, die für sRNA-seq-Projekte relevant sind, unterscheiden sich in Größe, Biogeneseweg und Wirkungsmechanismus.

  • Mikro-RNAs (miRNAs)Ungefähr 22 nt lang binden miRNAs an komplementäre Sequenzen im 3' UTR von Ziel-mRNAs, um die Translation zu hemmen oder den mRNA-Abbau zu fördern. Über 2.600 reife miRNAs wurden im menschlichen Genom annotiert, und eine Dysregulation der miRNA-Expression ist an nahezu allen wichtigen Krankheitskategorien beteiligt, einschließlich Krebs, Herz-Kreislauf-Erkrankungen und neurologischen Störungen.
  • Piwi-interagierende RNAs (piRNAs)Mit einer Länge von 24-31 nt werden piRNAs hauptsächlich in Keimzellen exprimiert und sind an der Stummschaltung von Transposons beteiligt. Ihre Rolle in somatischen Geweben und Krankheiten ist ein aktives Forschungsgebiet.
  • Kleine interferierende RNAs (siRNAs)20-24 nt in Pflanzen und Wirbellosen stammen siRNAs von doppelsträngiger RNA und leiten eine sequenzspezifische Genstilllegung ein. Bei Säugetieren sind endogene siRNAs weniger ausgeprägt, aber synthetische siRNAs werden häufig als Forschungswerkzeuge und therapeutische Mittel eingesetzt.
  • tRNA-abgeleitete kleine RNAs (tsRNAs)18-40 nt Fragmente, die von reifen oder Vorläufer-tRNAs abgeleitet sind, tsRNAs, die als wichtige Regulatoren der Genexpression auftreten, wurden als häufige Bestandteile des zirkulierenden RNA-Repertoires in Bioflüssigkeiten identifiziert.

Die Analyse von kleinen RNAs durch Sequenzierung bietet mehrere Vorteile gegenüber traditionellen Methoden wie Northern Blotting oder qPCR. sRNA-seq ermöglicht eine unvoreingenommene Entdeckung sowohl bekannter als auch neuartiger kleiner RNAs, quantifiziert die Expression über den gesamten dynamischen Bereich und erkennt Isoform-Variationen (isomiRs), die mit hybridisierungsbasierten Methoden nicht aufgelöst werden können. Der Nachteil ist, dass sRNA-seq spezialisierte Protokolle zur Bibliotheksvorbereitung erfordert, um mit den kurzen RNA-Eingaben umzugehen, und die bioinformatische Analyse muss die einzigartigen Herausforderungen bei der Ausrichtung und Quantifizierung von Daten zu kleinen RNA-Sequenzen bewältigen.

Major classes of small RNAs — size range, biogenesis, and biological functionsAbbildung 1: Hauptklassen von kleinen RNAs — Größenbereich, Biogenese und biologische Funktionen

Vorbereitung von kleinen RNA-Bibliotheken — Vier Methoden und ihre Verzerrungsprofile

Die Bibliotheksvorbereitung für sRNA-seq ist technisch anspruchsvoller als die standardmäßige RNA-seq-Bibliotheksvorbereitung, da die Ziel-RNAs kurz (18-200 nt) sind und ohne die Einführung schwerwiegender sequenzabhängiger Verzerrungen erfasst werden müssen. Es stehen vier methodische Ansätze zur Verfügung, die jeweils unterschiedliche Verzerrungsmerkmale aufweisen, die beeinflussen, welche kleinen RNAs detektiert und quantifiziert werden.

Polyadenylierungsbasierte MethodenEin Poly(A)-Schwanz wird an das 3'-Ende kleiner RNAs angefügt, gefolgt von Oligo-dT-Priming für die reversen Transkription. Diese Methode vermeidet den Ligationsschritt, der in anderen Protokollen Verzerrungen einführt. Der Nachteil ist, dass die Polyadenylierungseffizienz je nach RNA-Sequenz und -Struktur variiert und einige kleine RNAs bevorzugt von der Poly(A)-Polymerase modifiziert werden.

Direkte Ligation-basierte MethodenRNA-Adapter werden sequenziell an die 3'- und 5'-Enden kleiner RNAs ligiert, bevor die reversen Transkription und PCR-Amplifikation erfolgen. Dies ist der am häufigsten verwendete Ansatz, der in kommerziellen Kits wie Illumina TruSeq Small RNA und QIAGEN QIAseq miRNA Bibliothekskits implementiert ist. Die Hauptquelle für Verzerrungen ist die unterschiedliche Effizienz der Ligation — die Adapterligatur an einigen miRNA-Sequenzen ist bis zu 100× effizienter als an anderen, abhängig von der 3'-Nukleotid-Zusammensetzung und der Sekundärstruktur der kleinen RNA.

Größenauswahlbasierte MethodenKleine RNAs werden durch Gelelektrophorese oder SPRI-Perlen-basierte Größenselektion vor der Adapterligatur isoliert. Dies entfernt größere RNA-Spezies (mRNA, rRNA), die andernfalls die Sequenzierungsergebnisse dominieren würden. Die Verzerrung ist hauptsächlich größenabhängig – kleine RNAs an den Grenzen des Selektionsfensters könnten unterrepräsentiert sein.

Modifizierte Methoden für spezifische KlassenSpezialisierte Protokolle existieren für spezifische sRNA-Klassen. Zum Beispiel verwenden piRNA-fokussierte Protokolle Perjodatsoxidation, um die 3'-Enden von Nicht-piRNA-Molekülen zu blockieren und gezielt piRNAs anzureichern. tsRNA-fokussierte Protokolle modifizieren die Bedingungen der Adapterligatur, um die modifizierten 3'-Enden, die für tRNA-Fragmente charakteristisch sind, zu erfassen.

Methode Primäre Verzerrung Eingangs-RNA erforderlich Am besten geeignet für
Polyadenylierungsbasiert Sequenzabhängige Polyadenylierungseffizienz 100-500 ng miRNA-Profiling, Entdeckung neuer sRNAs
Direkte Ligation-basiert 3'-Ligation-Bias (10-100× Bereich) 10-1000 ng Hochdurchsatz-miRNA-Screening, Standardarbeitsabläufe
Größenauswahlbasiert Größenabhängige Wiederherstellung an Fenstergrenzen 500 ng - 5 µg Umfassende sRNA-Profilierung einschließlich piRNAs und tsRNAs
Klassen-spezifisch modifiziert Bereichert auf Kosten anderer Klassen 100-500 ng Gezielte Analyse von piRNAs, tsRNAs oder anderen spezifischen Klassen

Für Projekte, die eine unvoreingenommene miRNA-Detektion über einen breiten dynamischen Bereich erfordern, reduzieren direkte Ligationstechniken mit randomisierten Adaptersequenzen im Vergleich zu festen Adaptern die Ligationseffekte. miRNA-Sequenzierungsdienste Verwenden Sie optimierte Ligation-Protokolle, um Verzerrungen zu minimieren und die Nachweisempfindlichkeit zu maximieren.

Library preparation bias — ligation efficiency varies by miRNA sequenceAbbildung 2: Bibliotheksvorbereitungsbias — Ligationseffizienz variiert je nach miRNA-Sequenz

Der Workflow für die kleine RNA-Sequenzierung — Schritt für Schritt

Der Standard-Workflow für sRNA-seq umfasst sechs Phasen, von denen jede spezifische Qualitätskontrollpunkte aufweist, die sich aufgrund der kurzen Größe der Zielmoleküle und der einzigartigen biochemischen Eigenschaften von kleinen RNAs von der standardmäßigen RNA-seq unterscheiden.

  1. Stichproben-QC und RNA-IntegritätsbewertungDie Integrität der RNA wird anhand des RIN-Werts (RIN ≥ 7 für die meisten Anwendungen) oder DV200 für FFPE-Proben bewertet. Für sRNA-spezifische Analysen wird auch der Anteil der kleinen RNA im Verhältnis zur Gesamt-RNA bewertet – Proben mit starker RNA-Degradation können ein verschobenes kleines RNA-Profil aufweisen. Die kleine RNA-Fraktion (RNAs <200 nt) kann durch Größenausschluss-Säulen oder SPRI-Perlen-basierte Reinigung vor der Bibliotheksvorbereitung angereichert werden, was den Anteil informativer kleiner RNA-Reads in den endgültigen Daten verbessert.
  2. BibliotheksvorbereitungKleine RNAs werden nach Größe oder biochemischer Anreicherung ausgewählt und dann durch Adapterligatur, reversen Transkription und PCR-Amplifikation in sequenzierungsbereite Bibliotheken umgewandelt.
  3. GrößenauswahlDie Bibliothek ist größenselektiert, um Adapter-Dimere (~120 bp) und große Fragmente (>200 bp) zu entfernen. Der Zielgrößenbereich für miRNA-Bibliotheken liegt bei etwa 140-160 bp (22 nt Insert + Adapter).
  4. Bibliotheks-QCDie endgültige Bibliothekskonzentration wird durch qPCR gemessen, und die Größenverteilung wird durch Bioanalyzer oder TapeStation bestätigt. Der Gehalt an Adapterdimeren sollte <5% der gesamten Bibliotheksmasse betragen. Die endgültige Bibliothek sollte 2 nM überschreiten, um eine zuverlässige Clusterbildung auf Illumina-Flow-Zellen zu gewährleisten.
  5. SequenzierungSingle-End 50 bp-Sequenzierung ist für die meisten miRNA-Anwendungen ausreichend, da die typische miRNA nur 22 nt lang ist. Für die Detektion von piRNA oder tsRNA bietet eine 50 bp-Sequenzierung ebenfalls eine angemessene Abdeckung. Eine Paar-End-Sequenzierung ist für sRNA-seq im Allgemeinen nicht erforderlich.
  6. DatenanalyseRohdaten werden vorverarbeitet, um Adaptersequenzen zu entfernen, an das Referenzgenom oder bekannte sRNA-Datenbanken ausgerichtet, auf miRNA- oder isomiR-Ebene quantifiziert und auf differentielle Expression analysiert.

Bioinformatische Analyse von Small RNA-Seq-Daten

Die Bioinformatik-Pipeline für sRNA-seq unterscheidet sich in mehreren wichtigen Punkten von der standardmäßigen RNA-seq. Die kurze Leseweite (50 bp im Vergleich zu 150 bp für mRNA-seq), das Vorhandensein von RNA-Modifikationen und die Mehrfachzuordnung von kleinen RNAs erfordern spezialisierte Werkzeuge und Analyseansätze.

Vorverarbeitung und AdaptertrimmenRohe sRNA-seq-Lesarten enthalten die vollständige kleine RNA-Sequenz plus den 3'-Adapter. Da kleine RNAs kürzer als die Leselänge sind, ist die Adaptersequenz in den meisten Lesarten vorhanden und muss vor der Ausrichtung entfernt werden. Werkzeuge wie Cutadapt und fastp mit spezifischen Einstellungen für kleine RNAs entfernen den Adapter und behalten das Insert bei. Die Genauigkeit des Adapter-Trimmens ist entscheidend – unzureichendes Trimmen lässt Adaptersequenzen zurück, die die Ausrichtung stören, während übermäßiges Trimmen echte kleine RNA-Sequenzen entfernt und die Mapping-Raten verringert. Ein Qualitätssicherungs-Schritt nach dem Trimmen sollte bestätigen, dass die Verteilung der Leselängen mit dem erwarteten Größenbereich der kleinen RNAs (18-31 nt für miRNAs) übereinstimmt.

LeseausrichtungKleine RNA-Reads können aufgrund der Sequenzähnlichkeit zwischen miRNA-Familienmitgliedern, Pseudogenen und repetitiven Elementen an mehreren Stellen im Genom zugeordnet werden. Standard-Aligner (Bowtie, BWA) können Mehrfachzuordnungen durchführen, aber die Analyse-Strategie muss entscheiden, wie mit Reads umgegangen wird, die an mehreren Loci zugeordnet sind – Optionen sind, nur eindeutig zugeordnete Reads zu behalten, Mehrfachzuordnungs-Reads proportional zu verteilen oder probabilistische Zuordnungen zu verwenden. miRDeep2 und sRNAbench sind spezialisierte Werkzeuge, die Mehrfachzuordnungen handhaben und bekannte sowie neuartige miRNAs quantifizieren.

Quantifizierung und differentielle ExpressionDie miRNA-Expression wird als Leseanzahlen pro miRNA-Lokus quantifiziert. Normalisierungsmethoden für miRNA-seq umfassen TPM, DESeq2 Median der Verhältnisse (das auf Zähldaten basiert) und Methoden, die die unterschiedliche Gesamtzahl der zugeordneten Reads über die Proben hinweg berücksichtigen. Die Analyse der differentiellen Expression verwendet die gleichen Werkzeuge wie mRNA-seq (DESeq2, edgeR), erkennt jedoch an, dass miRNA-seq-Daten aufgrund der geringeren Anzahl an Merkmalen (~2.000 miRNAs im Vergleich zu ~20.000 mRNAs) unterschiedliche Verteilungseigenschaften aufweisen. Die Belastung durch die Korrektur mehrfacher Tests ist für miRNAs geringer, was bedeutet, dass ein höherer Anteil an nominal signifikanten Ergebnissen die FDR-Korrektur im Vergleich zu mRNA-seq übersteht. Für Projekte, die sich auf spezifische miRNA-Kandidaten konzentrieren, kann die Anwendung eines strengeren Signifikanzschwellenwerts (z. B. FDR < 0,01 anstelle von FDR < 0,05) falsch-positive Befunde reduzieren.

IsomiR-ErkennungIsomiRs sind miRNA-Sequenzvarianten, die sich von der kanonischen miRNA-Sequenz durch 5'- oder 3'-Trimmen, Nukleotidergänzungen oder -substitutionen unterscheiden. Die Analyse von IsomiRs erfordert spezialisierte Werkzeuge, die Reads an die Vorläufer-miRNA-Haarnadel ausrichten und Varianten klassifizieren. Diese Analyse wird zunehmend als wichtig anerkannt, da verschiedene IsomiRs unterschiedliche Zielspezifitäten und biologische Funktionen haben können.

Small RNA-seq bioinformatics pipeline — from raw reads to differential expressionAbbildung 3: Bioinformatik-Pipeline für kleine RNA-Sequenzierung – von Rohdaten zu differentieller Expression

Bibliotheksvorbereitungs-Bias – Warum die Methodenwahl die Datenqualität bestimmt

Die Wahl der Bibliotheksvorbereitungsmethode hat einen tiefgreifenderen Einfluss auf die Qualität von sRNA-seq-Daten als auf standardmäßiges RNA-seq, da die kurzen Zielmoleküle direkt von den biochemischen Schritten der Adapterligatur und der reversen Transkription betroffen sind.

Ligation-Bias ist die dominante Quelle technischer Variation.T4 RNA-Ligase, das Enzym, das für die Adapterligatur in den meisten sRNA-seq-Protokollen verwendet wird, zeigt eine starke Präferenz für bestimmte 3'-terminale Nukleotide. miRNAs, die mit Guanosin (G) enden, werden bis zu 100-mal effizienter ligiert als solche, die mit Cytidin (C) oder Adenosin (A) enden. Das bedeutet, dass die relative Häufigkeit der detektierten miRNAs sowohl die biologische Expression als auch die Ligationseffizienz widerspiegelt – eine biologisch häufige miRNA, die jedoch ein ungünstiges 3'-terminales Nukleotid aufweist, kann im Vergleich zu einer weniger häufigen miRNA mit einem günstigen terminalen Nukleotid unterrepräsentiert erscheinen.

GC-Bias und GrößenpräferenzNeben dem Ligationsbias bei 3' zeigt die Vorbereitung von sRNA-seq-Bibliotheken auch einen Bias in Bezug auf den GC-Gehalt – miRNAs mit ausgewogenem GC-Gehalt werden effizienter erfasst als solche mit extremem GC-Gehalt. Auch die Größenpräferenz beeinflusst die Detektion, wobei sehr kurze RNAs (<18 nt) und längere kleine RNAs (>30 nt) mit geringerer Effizienz erfasst werden als der für die meisten Ligationsenzyme optimale Bereich von 20-25 nt. Diese kombinierten Verzerrungen bedeuten, dass das gemessene miRNA-Expressionsprofil eine Faltung des wahren biologischen Ausdrucks und des Biasprofils der Bibliotheksvorbereitung ist.

Praktische Implikationen für das experimentelle DesignBeim Vergleich der miRNA-Expression unter verschiedenen Bedingungen innerhalb desselben Experiments unter Verwendung desselben Protokolls beeinflussen diese Verzerrungen alle Proben gleichermaßen, und relative Vergleiche bleiben gültig. Die Gefahr entsteht, wenn Daten verglichen werden, die mit unterschiedlichen Bibliotheksvorbereitungsverfahren erzeugt wurden – eine miRNA, die in einem Protokoll 5-fach hochreguliert erscheint, kann in einem anderen aufgrund unterschiedlicher Verzerrungen 2-fach hochreguliert sein. Für Vergleiche über mehrere Studien oder Metaanalysen ist es der sicherste Ansatz, nur Daten zu verwenden, die mit demselben Protokoll erzeugt wurden. Für Projekte, bei denen die Vergleichbarkeit über Protokolle hinweg erforderlich ist, können polyadenylierungsbasierte Methoden, die Ligationen vermeiden, trotz ihrer insgesamt geringeren Ausbeute bevorzugt werden. Eine alternative Strategie besteht darin, kommerziell erhältliche Referenz-RNA-Proben mit bekannten miRNA-Konzentrationen zu verwenden, um das Verzerrungsprofil jedes Protokolls zu kalibrieren.

Strategien zur Reduzierung von Ligation BiasZufällige Adaptersequenzen (bei denen die 5'- und 3'-Adapter degenerierte Nukleotide an der Ligationstelle enthalten) verringern die Sequenzpräferenz der Ligation. Kommerzielle Kits, die diesen Ansatz verwenden, sind das QIAGEN QIAseq miRNA Library Kit und das NEXTFLEX Small RNA-Seq Kit. Eine weitere Strategie besteht darin, eine polyadenylierungsbasierte Methode zu verwenden, die die Ligation vollständig vermeidet, jedoch auf Kosten der Einführung eines Polyadenylierungsbias. Der effektivste Ansatz zur Minimierung von Bias besteht darin, eine Kombination aus zufälligen Adaptern und optimierten Ligationbedingungen (Temperatur, Enzymkonzentration und Inkubationszeit) zu verwenden, wodurch der Bias-Bereich von 100-fach auf etwa 5-10-fach reduziert werden kann.

Praktische AnleitungFür Projekte, die die miRNA-Expression unter verschiedenen Bedingungen im selben Labor unter Verwendung desselben Protokolls vergleichen, ist die Verzerrung systematisch und sollte die relativen Vergleiche nicht beeinflussen. Für Projekte, die absolute Expressionsniveaus vergleichen oder Daten aus verschiedenen Protokollen integrieren, kann die Verzerrung erheblich sein und sollte im experimentellen Design berücksichtigt werden. Für Projekte, bei denen die absolute Quantifizierung entscheidend ist, sollten Spike-in-Kontrollen (synthetische RNA-Oligonukleotide in bekannten Konzentrationen) vor der Bibliotheksvorbereitung zu jeder Probe hinzugefügt werden.

Ligation bias profile — relative ligation efficiency varies by miRNA 3' nucleotideAbbildung 4: Ligation-Bias-Profil — relative Ligationseffizienz variiert je nach miRNA 3'-Nukleotid

Bioinformatik-Herausforderungen bei Small RNA-Seq

Drei bioinformatische Herausforderungen sind spezifisch für sRNA-seq und erfordern analytische Ansätze, die in der Standard-RNA-seq nicht verwendet werden.

Multi-Mapping-LesungenKurze Reads aus sRNA-seq (18-50 bp nach Adaptertrimmen) kartieren häufig auf mehrere Stellen im Genom. Mitglieder der miRNA-Familie teilen sich oft die gleiche Seed-Sequenz (Positionen 2-8) und unterscheiden sich nur im 3'-Bereich. Wenn ein 22 nt Read auf fünf verschiedene miRNA-Loci kartiert, muss die Quantifizierung entscheiden, welcher Locus das Read beigetragen hat. miRDeep2 verwendet einen bayesischen Rahmen, um Mehrfachkartierungen basierend auf der Wahrscheinlichkeit zuzuordnen, dass jeder Locus exprimiert wird, während andere Tools einfach nur eindeutig kartierte Reads verwenden (was die Expression von Mehrfachkopien von miRNA-Familien unterschätzt). Die Entscheidung zwischen diesen Ansätzen sollte im Methodenabschnitt dokumentiert werden, da sie direkt die Anzahl der detektierten miRNAs und deren relative Expressionswerte beeinflusst.

IsomiR-KlassifizierungJedes miRNA-Gen produziert mehrere Sequenzvarianten (IsomiRs), die sich von der kanonischen Referenzsequenz unterscheiden. Template-IsomiRs entstehen durch ungenaue Spaltung durch Drosha oder Dicer, was zu verschobenen 5'- oder 3'-Enden führt. Non-Template-IsomiRs weisen Nukleotid-Ergänzungen (typischerweise Adenylierung oder Uridylierung) am 3'-Ende auf. Um echte IsomiRs von Sequenzierungsfehlern zu unterscheiden, ist eine statistische Modellierung der Fehlerquote und ein Vergleich mit der erwarteten miRNA-Sequenz erforderlich. Werkzeuge wie isomiR-SEA und CPSS erkennen und quantifizieren IsomiRs, indem sie Reads an die Vorläufer-miRNA-Haarpins anpassen, anstatt an reifen miRNA-Sequenzen. Die biologische Relevanz von IsomiRs ist ein aktives Forschungsgebiet, mit Belegen dafür, dass spezifische IsomiRs eine veränderte Zielspezifität im Vergleich zur kanonischen miRNA aufweisen können.

Klassifizierung von sRNA-FragmentenEin erheblicher Teil der sRNA-seq-Lesungen sind Fragmente größerer RNAs (mRNA, rRNA, tRNA, lncRNA) und keine echten regulatorischen kleinen RNAs. Um miRNA- und piRNA-Lesungen von Abbauprodukten zu unterscheiden, ist eine Ausrichtung gegen Sequenzdatenbanken für jede sRNA-Klasse erforderlich, sowie eine Filterung basierend auf Merkmalen wie der Verteilung der Leselängen, dem genomischen Ursprung und dem Vorhandensein von RNA-Modifikationen. Werkzeuge wie sRNAbench und miRMaster automatisieren diese Klassifizierung, indem sie die Lesungen nacheinander an miRNA-, piRNA-, tRNA- und andere RNA-Datenbanken ausrichten und den Anteil berichten, der jeder Klasse zugeordnet wird. Für zirkulierende sRNA-seq-Proben, bei denen der Anteil der miRNA-Lesungen so niedrig wie 10-20% sein kann, ist dieser Klassifizierungsschritt entscheidend, um interpretierbare miRNA-Expressionsprofile zu erhalten.

sRNA-seq bioinformatics challenges — multi-mapping, isomiRs, and fragment classificationAbbildung 5: Bioinformatik-Herausforderungen bei sRNA-seq — Mehrfachzuordnungen, IsomiRs und Fragmentklassifizierung

Neue Anwendungen — Flüssige Biopsie und zirkulierende miRNAs

Eine der am schnellsten wachsenden Anwendungen von sRNA-seq ist die Analyse zirkulierender kleiner RNAs in Biofluiden zur nicht-invasiven Entdeckung von Biomarkern.

miRNAs sind stabil im Blut, Serum, Plasma, Urin und anderen Bioflüssigkeiten vorhanden und vor RNase-Abbau geschützt, indem sie in Exosomen, Mikrovakuolen eingekapselt oder an Argonaute-Proteine gebunden sind. Zirkulierende miRNA-Profile haben gezeigt, dass sie Krankheitszustände, einschließlich Krebs, Herz-Kreislauf-Erkrankungen und neurologische Störungen, widerspiegeln, was sie zu vielversprechenden Kandidaten für diagnostische Verfahren auf Basis von Flüssigbiopsien macht. Jüngste Studien mit großen Kohorten haben gezeigt, dass Panels von 10-50 zirkulierenden miRNAs Krebspatienten von gesunden Kontrollen mit hoher Sensitivität und Spezifität unterscheiden können.

Technische Herausforderungen der zirkulierenden sRNA-seqDie Konzentration von kleinen RNAs in Biofluiden ist extrem niedrig – typischerweise 1-50 ng Gesamt-RNA pro mL Plasma oder Serum. Die Protokolle zur Bibliotheksvorbereitung müssen für niedrige Eingabemengen optimiert werden, wobei eine Kontamination mit Adapter-Dimeren ein erhebliches Risiko darstellt, da die begrenzte Insert-RNA möglicherweise nicht mit den Ligationserzeugnissen von Adapter-Adapter konkurrieren kann. Einzigartige doppelte Indizes (UDI) werden für multiplexierte zirkulierende miRNA-Projekte empfohlen, um ein Index-Hopping zwischen den Proben zu verhindern, was die Genauigkeit der Detektion von miRNAs mit niedriger Häufigkeit beeinträchtigen würde.

Überlegungen zur DatenanalyseZirkulierende sRNA-seq-Datensätze enthalten oft einen hohen Anteil an Nicht-miRNA-Reads, einschließlich mRNA-Fragmenten, rRNA-Fragmenten und Y-RNA-Fragmenten. Die bioinformatische Pipeline muss diese Nicht-miRNA-Reads vor der nachgelagerten Analyse ausdrücklich klassifizieren und filtern. Die Normalisierung von zirkulierenden miRNA-Daten ist ebenfalls herausfordernd, da der gesamte RNA-Gehalt zwischen Individuen und zwischen Biofluidtypen variiert – die Verwendung von Spike-in-Kontrollen oder die Normalisierung nach Mittelwert-Expression wird empfohlen. Die hohe Variabilität zwischen Individuen in den zirkulierenden miRNA-Spiegeln bedeutet, dass für Studien zur Entdeckung von Biomarkern unter Verwendung von sRNA-seq im Vergleich zu gewebebasierten Studien typischerweise größere Kohorten erforderlich sind. Um 1,5-fache Veränderungen mit angemessener statistischer Power zu erkennen, sind für zirkulierende miRNA-Studien in der Regel 30-50 Proben pro Gruppe erforderlich.

Exosomales vs. gesamtes zirkulierendes RNAEine entscheidende experimentelle Entwurfsentscheidung bei der zirkulierenden sRNA-seq ist, ob RNA aus isolierten Exosomen oder aus totaler Biofluid-RNA sequenziert werden soll. Exosomale RNA ist angereichert mit spezifischen miRNA-Populationen und enthält weniger kontaminierende mRNA und rRNA, was die Detektion von zirkulierenden miRNAs mit niedriger Abundanz potenziell verbessert. Die totale Biofluid-RNA erfasst eine breitere Darstellung zirkulierender RNAs, einschließlich vesikelfreier miRNAs, die an Argonaute-Proteine gebunden sind. Die Wahl sollte durch die Forschungsfrage geleitet werden – exosomale RNA wird für die Entdeckung von Biomarkern bevorzugt, die sich auf spezifische Vesikelpopulationen konzentriert, während die totale zirkulierende RNA einen umfassenderen Überblick über das zirkulierende Transkriptom bietet.

Agrarische Anwendungen von sRNA-seqwird die sRNA-Sequenzierung zunehmend in der Pflanzen- und Agrarforschung eingesetzt. Pflanzen produzieren eine vielfältige Palette von kleinen RNAs, einschließlich 21-22 nt siRNAs, die an der antiviralen Abwehr beteiligt sind, und 24 nt siRNAs, die die DNA-Methylierung steuern. sRNA-seq ermöglicht die Charakterisierung dieser kleinen RNA-Populationen in Nutzpflanzen unter Stressbedingungen, die Identifizierung neuartiger miRNAs, die agronomische Merkmale regulieren, und die Analyse der kreuzköniglichen RNA-Interferenz, die durch pflanzenabgeleitete exosomähnliche Nanopartikel vermittelt wird. Für Forscher, die an der Biologie kleiner RNAs in Pflanzen arbeiten, Dienste für die Sequenzierung von kleinen RNAs Bieten Sie Protokolle an, die für pflanzliche RNA mit ihren einzigartigen Sekundärstrukturen und Modifikationsprofilen optimiert sind. Für Projekte, die sich auf zirkulierende miRNA-Biomarker konzentrieren, sind spezialisierte Protokolle für Biofluidproben mit niedrigem Input verfügbar, die die Bildung von Adapterdimeren minimieren und Spike-in-Kontrollen für die absolute Quantifizierung enthalten.

Common sRNA-seq pitfalls — problems, causes, and solutionsAbbildung 6: Häufige sRNA-seq-Fallen — Probleme, Ursachen und Lösungen

Rechnerische Anforderungen für kleine RNA-Seq-Projekte

sRNA-seq-Projekte erzeugen pro Probe erheblich weniger Daten als mRNA-seq-Projekte, wodurch die rechnerischen Anforderungen bescheidener werden.

  • Daten pro ProbeEin standardmäßiger miRNA-seq-Lauf mit 10 Millionen Reads pro Probe erzeugt ungefähr 500 MB an FASTQ-Daten. Für ein Projekt mit 48 Proben planen Sie etwa 25 GB an Rohdaten ein.
  • SpeicheranforderungenDer gesamte Speicherbedarf, einschließlich getrimmter Reads, ausgerichteter Dateien und Analyseergebnisse, beträgt für ein Projekt mit 48 Proben etwa 50-100 GB.
  • BerechnungszeitmiRDeep2-Analyse: 30-60 Minuten pro Probe. Differenzielle Expression: insgesamt 10-30 Minuten. Ausrichtung mit Bowtie: 10-20 Minuten pro Probe. Die gesamte Analysezeit für ein Projekt mit 48 Proben unter Verwendung einer standardisierten Pipeline beträgt ungefähr 24-48 Stunden, wobei der Großteil der Zeit für die Ausrichtung benötigt wird, die über mehrere CPU-Kerne parallelisiert werden kann.
  • SpeicheranforderungenDie meisten sRNA-seq-Analysetools benötigen 8-16 GB RAM, was sie auf Standard-Laptops oder Desktop-Computern zugänglich macht. miRDeep2 und Bowtie benötigen etwa 4-8 GB für eine Analyse menschlicher miRNAs, während Werkzeuge zur differentiellen Expression 2-4 GB benötigen. Cloud-Computing ist für die meisten sRNA-seq-Projekte nicht erforderlich.

Häufige Fallstricke bei kleinen RNA-Seq-Projekten

Beobachtetes Problem Ursache Prävention
Niedriger miRNA-Leseanteil (<20% des Gesamten) Hohe rRNA/mRNA-Abbaufragmente in der Bibliothek Verbessern Sie die RNA-Integrität; optimieren Sie den Schritt der Größenselektion.
Adapter-Dimer-Kontamination Unzureichende Eingabe-RNA für das verwendete Adapterverhältnis Reduzieren Sie die Adapterkonzentration für Proben mit niedrigem Input; verwenden Sie Stem-Loop-Adapter.
Niedrige Übereinstimmungsrate (<50%) Multi-Mapping-Reads verworfen; Referenzdatenbank-Mismatch Verwenden Sie eine miRBase-bewusste Ausrichtung; schließen Sie Mehrfachzuordnungen in die Quantifizierung ein.
Batch-Effekte dominieren die miRNA-Expression. Verschiedene Chargen oder Kit-Lots der Bibliotheksvorbereitung Verarbeiten Sie alle Proben in einem Projekt in einem einzigen Batch; verwenden Sie Spike-in-Kontrollen.
Inkonsistente IsomiR-Erkennung Variable Lesetiefe über Proben hinweg Normalisiere die Sequenzierungstiefe; wende Mindestlesezählerfilter an.

Häufig gestellte Fragen (FAQ)

Welche Sequenzierungstiefe ist für Small RNA-Seq erforderlich?
Für die miRNA-Profilierung in Säugetiergeweben sind in der Regel 5-10 Millionen Reads pro Probe ausreichend, um die Mehrheit der exprimierten miRNAs nachzuweisen. Für seltene oder niedrig exprimierte miRNAs können 10-20 Millionen Reads pro Probe erforderlich sein. Für die Analyse zirkulierender miRNAs werden aufgrund des geringeren Anteils an miRNA-Reads in Biofluidproben 10-15 Millionen Reads pro Probe empfohlen.

Sollte ich für sRNA-seq Einzel-End- oder Paar-End-Sequenzierung verwenden?
Single-End 50 bp-Sequenzierung ist für die meisten sRNA-seq-Anwendungen ausreichend, da die typischen kleinen RNAs 18-31 nt lang sind. Die Paar-End-Sequenzierung liefert keine zusätzlichen Informationen für kleine RNAs und erhöht die Sequenzierungskosten ohne Nutzen.

Wie wähle ich zwischen verschiedenen Methoden zur Bibliotheksvorbereitung für sRNA-seq?
Die Wahl hängt von der Menge des Eingangs-RNA und der Forschungsfrage ab. Direkte Ligationstechniken (TruSeq, QIAseq) sind für die meisten Projekte mit 10-1000 ng Eingangsmenge geeignet. Polyadenylierungsbasierte Methoden werden bevorzugt, wenn die Ligationseffekte minimiert werden müssen. Methoden zur Größenfraktionierung sind für umfassende Profile geeignet, einschließlich piRNAs und tsRNAs, wenn ausreichend Eingangs-RNA vorhanden ist.

Was ist ein isomiR und warum ist er wichtig?
Ein IsomiR ist eine Sequenzvariante eines kanonischen miRNAs, die sich in Länge oder Nukleotidzusammensetzung unterscheidet. IsomiRs können unterschiedliche Zielspezifitäten und biologische Funktionen aufweisen. Die Erkennung und Quantifizierung von IsomiRs erfordert spezialisierte bioinformatische Werkzeuge und eine ausreichende Sequenzierungstiefe.

Wie gehe ich mit Multi-Mapping-Reads in der sRNA-seq-Analyse um?
Multi-Mapping-Lesungen sind Lesungen, die an mehreren genomischen Standorten ausgerichtet sind. Werkzeuge wie miRDeep2 verwenden statistische Modelle, um Multi-Mapping-Lesungen probabilistisch zuzuordnen. Für die meisten nachgelagerten Analysen ist es akzeptabel, nur eindeutig zugeordnete Lesungen zu verwenden, wenn das Ziel darin besteht, die miRNA-Expression zwischen Bedingungen zu vergleichen, aber es wird die Expression von miRNAs mit mehreren genomischen Kopien unterschätzen.

Welche Kontrollen sollte ich in einem sRNA-seq-Experiment einbeziehen?
Spike-in-Kontrollen (synthetische RNA-Oligonukleotide in bekannten Konzentrationen) sollten vor der Bibliotheksvorbereitung zu jeder Probe hinzugefügt werden, um technische Variationen zu bewerten und eine absolute Quantifizierung zu ermöglichen. Positive und negative Kontrollproben sollten in jede Charge aufgenommen werden, um den Workflow zu validieren.

Wie unterscheidet sich die Datenqualität von sRNA-seq von der Datenqualität von mRNA-seq?
sRNA-seq hat typischerweise niedrigere Alignierungsraten (50-70%) als mRNA-seq (>80%), was auf Mehrfachzuordnungen von Reads und das Vorhandensein von Abbaufragmenten größerer RNAs zurückzuführen ist. Der Anteil der miRNA-Reads in einer typischen sRNA-seq-Bibliothek liegt je nach Probenart und Bibliotheksvorbereitungsmethode zwischen 20-60%. Zirkulierende sRNA-Proben weisen tendenziell die niedrigsten Anteile an miRNA-Reads auf, manchmal unter 15% der insgesamt zugeordneten Reads.

Kann ich Standard-RNA-Seq-Analysetools für sRNA-Seq-Daten verwenden?
Nicht direkt. Standard-RNA-Seq-Aligner wie STAR und HISAT2 sind für längere Reads und gespleißte Ausrichtungen konzipiert und daher nicht für sRNA-Seq-Daten geeignet. Stattdessen werden Short-Read-Aligner wie Bowtie und BWA verwendet. Quantifizierungs- und Differenzexpressionswerkzeuge, die für mRNA-Seq entwickelt wurden (DESeq2, edgeR), können auf sRNA-Seq-Zähldaten angewendet werden, jedoch wurden die Normalisierung und statistischen Annahmen für mRNA-Seq-Daten entwickelt und sind möglicherweise nicht optimal für die kleinere Anzahl von Merkmalen und die unterschiedlichen Verteilungsmerkmale von sRNA-Seq-Daten.

Referenzen

  1. Optimierte Identifizierung und Charakterisierung von kleinen RNAs. Naturprotokolle2025;20:1587-1615.
  2. Die Untersuchung von kleinen RNA-Sequenzen aus biologischen Proben. Methoden in der Molekularbiologie. 2024;2889:151-174.
  3. Nanoporen-Sequenzierungstechnologie, Bioinformatik und Anwendungen. Naturwissenschaftliche Biotechnologie. 2021;39:1348-1365.
  4. Zirkulierende MikroRNA-Panels zur Multi-Krebs-Erkennung. BMC Medizinische Genomik2025;18:20.
  5. MicroRNA-Bioinformatik in der präzisen Onkologie: eine Überprüfung integrierter Pipelines. Journal für Angewandte Genetik. 2025;66:551-570.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
Sprechen Sie mit unseren Wissenschaftlern
Was möchten Sie besprechen?
Mit wem werden wir sprechen?

* ist ein erforderlicher Artikel.

Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben