RNA-SeqDie Variantenaufruf ist eine effektive Methode, um genetische Veränderungen in transkribierten Teilen des Genoms zu finden. Die traditionelle DNA-Variantenentdeckung zeigt eine breite Sicht auf genomische Veränderungen. Der RNA-Seq-Variantenaufruf hingegen hebt gewebespezifische Expressionsmuster und alternative Spleißereignisse hervor. Diese können wichtige funktionale Auswirkungen haben.
Dieses Papier befasst sich mit RNA-Seq. VariantaufrufEs hilft, genetische Veränderungen in aktiven Genen zu finden. Diese Methode zeigt gewebespezifische Muster und funktionale Veränderungen. Sie ergänzt die traditionellen Methoden zur Erkennung von DNA-Varianten.
RNA-Seq wurde hauptsächlich für die Expressionsprofilierung verwendet. Doch jetzt erkennen Forscher seinen Wert bei der Auffindung genomischer Varianten in exprimierten Regionen des Genoms. Die Variantenbestimmung mittels RNA-Seq funktioniert gut in Kombination mit traditionellen DNA-Methoden zur Auffindung von Varianten. RNA-Seq konzentriert sich auf transkribierte Regionen, im Gegensatz zur Ganzgenom- oder Ganzexomsequenzierung. Dieser Ansatz bietet mehrere wesentliche Vorteile für die Variantenanalyse. Er bietet eine bessere Abdeckung exprimierter Gene. Dies könnte wichtige Varianten aufdecken, die DNA-Sequenzierung könnte in ähnlichen Tiefen fehlen. RNA-Seq zielt auf Bereiche des Genoms ab, die aktiv transkribiert werden. Dieser Fokus erhöht die Chancen, Varianten zu finden, die funktionale Auswirkungen haben könnten. RNA-Seq ermöglicht es Forschern, genetische Variation und Genexpression gleichzeitig zu analysieren. Dies hilft ihnen, Genotypen direkt mit transkriptionalen Phänotypen zu verknüpfen.
RNA-Seq zeigt Mutationen in Bereichen, die aktiv transkribiert werden. Dies unterscheidet sich von der DNA-Sequenzierung, die den gesamten genetischen Bauplan erfasst, unabhängig davon, ob die Gene exprimiert werden oder nicht. Diese Unterscheidung bietet mehrere einzigartige Vorteile:
RNA-Seq-Variantenerkennung ist besonders geeignet, um Varianten zu erkennen, die das Spleißen beeinflussen, einschließlich:
Trotz dieser Vorteile bringt die Variantenbestimmung aus RNA-Seq-Daten im Vergleich zu DNA-basierten Ansätzen einzigartige Herausforderungen mit sich. Die Identifizierung von Varianten aus RNA-Seq-Daten ist schwierig. Dies liegt an intronischen Sequenzen, alternativem Spleißen, RNA-Bearbeitung und variierenden Expressionsniveaus. Eine leistungsstarke Pipeline ist entscheidend, um diese Herausforderungen zu überwinden und zuverlässige Varianteninformationen zu erhalten.
Abbildung 1. Übersicht des T1K-Workflows. (Song, L, 2023)
Dienste, die Sie interessieren könnten
Mehr erfahren
RNA-Seq-Abdeckung ist von Natur aus variabel und direkt proportional zu den Genexpressionsniveaus. Hoch exprimierte Gene können Tausende von Reads haben. Im Gegensatz dazu haben schwach exprimierte Gene normalerweise weniger Reads. Diese spärliche Abdeckung erschwert die Erkennung von Varianten in diesen Bereichen. Diese ungleiche Darstellung führt zu mehreren Komplikationen:
Die Herausforderung ist klar in Gewebeproben mit vielen Zelltypen. Hier können einige Varianten nur in bestimmten Zellgruppen auftreten. Statistische Methoden können bei variabler Abdeckung und ausdrucksbasiertem Filtern helfen. Diese Probleme stellen jedoch weiterhin große Herausforderungen bei der Variantenbestimmung in RNA-Seq dar.
Strandspezifische Verzerrungen und Rücktranskriptionsartefakte
Die RNA-Seq-Bibliotheksvorbereitung umfasst mehrere enzymatische Schritte. Diese Schritte können systematische Verzerrungen und Artefakte verursachen.
Diese technischen Artefakte könnten mit echten genetischen Varianten verwechselt werden. Daher benötigen wir fortschrittliche Filterstrategien. Diese Strategien sollten die Strang-Bias, den Sequenzkontext und den Standort der unterstützenden Reads berücksichtigen.

Abbildung 2. Aktuelle Entwicklungen und Herausforderungen bei Technologien und Algorithmen zur Variantenidentifizierung. (Stepanka Zverinova, 2021)
RNA-Bearbeitung ist ein Prozess, der die RNA-Sequenz nach ihrer Herstellung verändert. Dies geschieht, ohne die DNA-Vorlage zu verändern. Die häufigste Form beim Menschen ist die Adenosin-zu-Inosin-Bearbeitung. Dies zeigt sich als A-zu-G-Änderungen in Sequenzierungsdaten und wird von ADAR-Enzymen durchgeführt. Andere Formen umfassen die Cytidin-zu-Uridin-Bearbeitung (C-zu-T), die von APOBEC-Enzymen katalysiert wird.
Diese Bearbeitungsereignisse stellen erhebliche Herausforderungen für die Variantenerkennung bei RNA-Seq dar:
Ohne übereinstimmende DNA-Sequenzierungsdaten können Sie wahre genomische Varianten nicht leicht von RNA-Bearbeitungsereignissen unterscheiden. Dies beruht auf:
Fortgeschrittene Methoden nutzen diese Merkmale und maschinelle Lernalgorithmen. Diese Algorithmen werden auf vertrauenswürdigen Bearbeitungsseiten trainiert. Sie helfen dabei, besser zwischen Bearbeitung und Mutation zu unterscheiden.
Die Einzelzell-RNA-Sequenzierung (scRNA-Seq) stellt einen Paradigmenwechsel in der Transkriptomik dar, da sie die Analyse der Genexpression und genetischen Variation auf zellulärer Ebene ermöglicht. Dieser Ansatz bietet mehrere Vorteile für die Variantenbestimmung:
Jüngste methodische Fortschritte haben die Variantenentdeckung in scRNA-Seq-Daten verbessert:
Trotz dieser Fortschritte bleiben Herausforderungen bestehen, darunter eine begrenzte Abdeckung pro Zelle, hohe Abbruchraten und Verzerrungen bei der Amplifikation. Laufende Entwicklungen in den Methoden zur Bibliotheksvorbereitung und in rechnergestützten Werkzeugen verbessern weiterhin die Zuverlässigkeit der Variantenbestimmung aus Einzelzell-Daten.

Abbildung 3. Die Anzahl der exprimierten KIR-Allel in einer Zelle. (Song, L, 2023)
Traditionelle Kurzlese-RNA-Seq-Technologien sind in ihrer Fähigkeit eingeschränkt, komplexe Spleißmuster aufzulösen und Varianten innerhalb alternativ gespleißter Regionen zu erkennen. Langzeit-Sequenzierung Plattformen wie Pacific Biosciences (PacBio) Iso-Seq und Oxford Nanopore Technologies (ONT) überwinden diese Einschränkungen, indem sie Reads erzeugen, die gesamte Transkripte abdecken:
Diese Vorteile sind besonders wertvoll für:
Während langlesetechnologien historisch gesehen durch höhere Fehlerquoten eingeschränkt waren, haben jüngste Verbesserungen in der Sequenzierungstechnologie und den Basiserkennungsalgorithmen die Genauigkeit erheblich erhöht. Hybride Ansätze, die die hohe Genauigkeit von Kurzlesungen mit den strukturellen Erkenntnissen von Langlesungen kombinieren, stellen eine vielversprechende Richtung für umfassende Variantenaufrufe dar.
Traditionelle Ansätze zur Variantenbestimmung basieren auf linearen Referenzgenomen und positionsbasierten Ausrichtungen, die suboptimal sind, um das gesamte Spektrum der menschlichen genetischen Vielfalt zu erfassen. Zwei aufkommende Technologien verändern dieses Umfeld:
Graph-basierte Alignierer Ersetzen Sie lineare Referenzen durch Graphstrukturen, die bekannte genetische Variationen einbeziehen:
Maschinenlernen und Deep Learning Ansätze mehrere Merkmale nutzen, um echte Varianten von technischen Artefakten zu unterscheiden:
Werkzeuge wie DeepVariant, die konvolutionale neuronale Netze verwenden, um "Bilder" von ausgerichteten Reads zu analysieren, haben eine überlegene Leistung bei der DNA-Variantenerkennung gezeigt und werden für RNA-Seq-Anwendungen angepasst. Diese computergestützten Fortschritte, kombiniert mit zunehmenden Datenmengen für das Training, versprechen eine erhebliche Verbesserung der Erkennung von Varianten mit niedriger Frequenz aus RNA-Seq-Daten.
Die Konvergenz dieser aufkommenden Technologien – Einzelzellauflösung, Langlesesequenzierung, graphbasierte Ausrichtung und maschinelles Lernen – läutet eine neue Ära in der RNA-Seq-Variantenerkennung ein, die eine umfassendere, genauere und funktional relevante Charakterisierung genetischer Variation in exprimierten Genen ermöglicht.
Die Variantenbestimmung aus RNA-Seq-Daten ist ein effektiver, aber anspruchsvoller Weg, um genomische Veränderungen in aktiven Teilen des Genoms zu finden. RNA-Seq-Daten bringen einzigartige Herausforderungen mit sich. Dazu gehören variable Abdeckung, allelische Ausfälle, strangspezifische Verzerrungen und RNA-Bearbeitung. Aus diesem Grund benötigen wir spezielle Methoden. Die reguläre auf DNA basierende Variantenbestimmung funktioniert hier nicht. Die Variantenbestimmung aus RNA-Seq-Daten hat klare Vorteile. Sie zielt auf aktive Regionen ab und erfasst die einzigartige genetische Komplexität von Transkripten.
Das Feld entwickelt sich schnell weiter, angetrieben von technologischen und rechnerischen Innovationen. Technologien zur Einzelzell-RNA-Sequenzierung enthüllen neue Schichten der Zellvielfalt. Auch Plattformen für Langzeitsequenzierung bieten klare Einblicke in komplexe Transkriptomstrukturen. Rechnerische Fortschritte in der graphenbasierten Ausrichtung und im maschinellen Lernen verbessern die Variantenerkennung. Sie erhöhen sowohl die Sensitivität als auch die Spezifität. Dies gilt insbesondere für Varianten mit niedriger Frequenz, die traditionelle Methoden möglicherweise übersehen.
Mit der Entwicklung und Verknüpfung dieser Technologien können wir uns auf ein tieferes Verständnis freuen, wie genetische Variation die phänotypische Expression beeinflusst. Die Zukunft der RNA-Seq-Variantenerkennung besteht nicht nur darin, Mutationen zu erkennen. Es geht darum, diese Mutationen im größeren Kontext der Genexpression, der Spleißdynamik und der zellulären Vielfalt einzuordnen. Diese integrierte Perspektive wird entscheidend sein, um unser Verständnis der Humangenetik, der Krankheitsmechanismen und der Ansätze der personalisierten Medizin voranzubringen.
Für Forscher und Kliniker ist es unerlässlich, über diese Entwicklungen informiert zu bleiben. Die Wahl geeigneter Methoden und analytischer Pipelines sollte durch die spezifischen Forschungsfragen, die Eigenschaften der Proben und die verfügbaren Ressourcen geleitet werden. Da sich das Feld weiterhin entwickelt, wird die Integration mehrerer Ansätze – die Stärken verschiedener Sequenzierungstechnologien, computergestützter Methoden und Validierungsstrategien kombinierend – wahrscheinlich die umfassendsten und zuverlässigsten Einblicke in die komplexe Welt der exprimierten genetischen Variationen liefern.
Referenz: