Transkriptomik ist ein Fachgebiet, das die Genexpression untersucht. Durch die Analyse des Transkriptoms können Menschen verstehen, welche Gene aktiviert sind, wann und wie sich ihre Expressionsniveaus ändern. In diesem Artikel fassen wir zunächst die gängigen Arten von Transkriptom-Technologien zusammen und überprüfen sie. Anschließend vergleichen und analysieren wir die technischen Vorteile und Hauptprobleme verschiedener Forschungsstrategien, um das aktuelle experimentelle Design und die Forschungsanalyse zu unterstützen. Schließlich betonen wir die Bedeutung der Transkriptomik in der integrierten Analyse von Multi-Omics und blicken auf ihre Entwicklungsperspektiven.
TranskriptomIm weitesten Sinne bezieht sich dies auf die Summe aller RNAs, die in einer Zelle oder einer Gruppe von Zellen unter denselben Bedingungen (oder physiologischen Bedingungen) transkribiert werden können, einschließlich messenger RNA (mRNA), ribosomaler RNA (rRNA), transfer RNA (tRNA) und nicht-kodierender RNA.[1]In einer engen Definition bezieht es sich auf alle messenger RNA (mRNA), die von Zellen transkribiert werden kann. Daher kann Transkriptomik einfach wie folgt definiert werden: Es ist das Studium aller RNA-Moleküle in Zellen. Transkriptomik, auch bekannt als Expressionsprofilierung, untersucht die Expressionsniveaus von RNA in einer bestimmten Zellpopulation. Die Analyse des Transkriptoms hat ein breites Anwendungsspektrum, einschließlich Medizin, Landwirtschaft, Umwelt und Mikroorganismen.[2-5]Hier werden wir mit Transkriptom-Sequenzierungstechnologien und Methoden der Transkriptomanalyse beginnen, um die funktionale Entdeckung der Transkriptomik im Genom zu erklären, die molekulare Zusammensetzung von Zellen und Geweben aufzudecken und die Rolle von Entwicklungs- und Krankheitsregulationswegen zu verstehen.
RNA-Seq ist eine kürzlich entwickelte Technologie, die verwendet wird Next-Generation Sequenzierung Technologien zur Transkriptomanalyse. Sie können umfassend und schnell die Sequenzinformationen und Ausdrucksinformationen nahezu aller Transkripte einer bestimmten Zelle oder eines Gewebes in einem bestimmten Zustand abrufen, einschließlich protein-codierender mRNA und verschiedener nicht-codierender RNAs, die Ausdrucksmenge unterschiedlicher Transkripte, die durch alternatives Spleißen von Genen erzeugt werden, usw.[6,7]Bei der Analyse der Struktur und des Expressionsniveaus von Transkripten können auch unbekannte und seltene Transkripte entdeckt werden, wodurch wichtige Fragen in den Lebenswissenschaften wie Unterschiede in der Genexpression, strukturelle Variationen von Genen und das Screening von molekularen Markern genau analysiert werden können.[8].
Abb. 1 Klassifizierung der RNA-Seq-Technologien
Dienstleistungen, an denen Sie interessiert sein könnten
Ressource
Der Workflow für RNA-Sequenzierung ist genau ähnlich (Abb. 2). Er beginnt mit der Qualitätskontrolle der Proben (Sample QC), um sicherzustellen, dass Ihre Proben die Kriterien der RNA-Seq-Technik erfüllen. Anschließend wird die geeignete Bibliothek entsprechend Ihrem Zielorganismus und der Anwendung vorbereitet und anschließend auf ihre Qualität getestet (Library QC). Danach wird eine Sequenzierungsstrategie verwendet, um die Proben zu sequenzieren, und die resultierenden Daten werden ebenfalls auf ihre Qualität überprüft (Data QC). Schließlich, bioinformatische Analysen werden durchgeführt und Ergebnisse bereitgestellt. Sie können die Sequenzierungsergebnisse entsprechend Ihren eigenen experimentellen Zwecken analysieren.
Abb. 2 Ein typischer Workflow für RNA-Seq-Experimente
Wie oben erwähnt, ist das Ziel der transkriptomischen Forschung RNA unter unterschiedlichen oder denselben physiologischen/umweltlichen Bedingungen. Sie haben oft unterschiedliche Funktionen. Die Methoden der transkriptomischen Analyse für RNA mit unterschiedlichen Funktionen werden im Folgenden erörtert.
mRNAs sind Vorlagen, die die Synthese von Proteinen leiten, und sie sind Boten, die genetische Informationen von DNA zu Proteinen übertragen. mRNA-Seq ist ein leistungsstarkes Werkzeug zur Analyse des Zelltranskriptomprofils. Derzeit gibt es viele Studien, die sich mit dem mRNA-Transkriptom befassen. Die Hauptforschungsziele/-richtungen umfassen: 1. Quantitative Profilierung von Transkripten in verschiedenen Geweben oder Proben unter verschiedenen Bedingungen und Behandlungen. 2. Entdeckung neuer Transkripte, alternativer Spleißungen (AS) und Transkriptvariationen (Abb. 3)[9]3. Forschung zu Entwicklungsmechanismen[10] und Arzneimittelresistenz[11] durch gewebespezifische Transkripte oder zeitliche Genexpression (Abb. 4). 4. Entdeckung von Biomarkern[12] basierend auf Transkripten/Isoformen des Novels, SNP/InDel-Identifizierung und Analyse von Fusionsgenen.
Abb. 3 Genfunktionsannotation und Genstruktur-Analyse von Wiesen-Roggen
Abb. 4 Transkriptomanalyse von Yamsknollen in verschiedenen Entwicklungsstadien
Lange nicht-kodierende RNAs (lncRNAs) sind ein moderat reichlicher Teil des eukaryotischen Transkriptoms, das aus länger als 200 nt langen nicht-kodierenden RNAs (ncRNAs) besteht, die multiple zelluläre Funktionen durch ihre Regulation der Gentranskription, post-transkriptionale Modifikationen und Epigenetik beeinflussen. lncRNA-Sequenzierung (lncRNA-seq) ist ein leistungsstarkes NGS-Tool, um funktionale Rollen in verschiedenen biologischen Prozessen und menschlichen Krankheiten wie Krebs und neurologischen Störungen zu untersuchen.[13,14].
Kleine RNAs (sRNAs) sind kurze RNA-Moleküle, in der Regel nicht kodierend, die an der Genstilllegung und der posttranskriptionalen Regulation der Genexpression beteiligt sind. sRNA-Sequenzierung (sRNA-seq) ist eine Methode, die eine eingehende Untersuchung dieser RNAs, insbesondere von Mikro-RNAs (miRNAs, 18-40 nt lang), ermöglicht. sRNA-seq ist ein effektiver Ansatz, um gezielt jede Art von sRNAs mit beispielloser Sensitivität und hoher Auflösung in einer einzigen Analyse zu erfassen. In Kombination mit einer robusten internen Bioinformatik-Pipeline unterstützt der sRNA-seq-Service Forscher dabei, die differentielle Expression von miRNAs, strukturelle Veränderungen zu beschreiben und neuartige sRNAs zu entdecken.[14,15].
Zirkuläre RNA (circRNA) ist ein hochstabiles Molekül der ncRNA, in Form einer kovalent geschlossenen Schleife, die die 5'-Endkappen und die 3'-Poly(A)-Schwänze fehlen. Die zirkuläre Struktur verleiht circRNAs eine Resistenz gegen Exonuklease-Abbau, ein Merkmal, das bei der Bibliothekskonstruktion genutzt werden kann. Der Sequenzierungsdienst von CD Genomics für circRNA (circRNA-seq) verwendet die Next-Generation-Sequencing (NGS)-Technologie, um eine breite Palette von Untersuchungen zu unterstützen, die sich auf circRNA konzentrieren. Die regulatorische Funktion von circRNAs könnte an vielen biologischen Prozessen beteiligt sein.[14]wie die Regulation der Genexpression durch das Agieren als miRNA "Schwämme", den Transport von miRNAs und die allgemeine Regulation der Proteinsynthese.
Dienste, an denen Sie interessiert sein könnten
Ressource
Es kann viele Zellen mit unterschiedlichen Phänotypen und Genotypen innerhalb desselben Zelltyps geben. Die Einzelzell-RNA-Sequenzierungstechnologie bietet Wissenschaftlern die Möglichkeit, das Verhalten, die Mechanismen und die Beziehungen einzelner Zellen zu untersuchen und zu analysieren, indem das Transkriptom auf Einzelzellebene sequenziert wird.[16]Es wird häufig in heißen Forschungsbereichen wie Keimzellen, embryonalen Stammzellen, Nervenzellen, Tumorzellen und Immunzellen eingesetzt. Die aktuelle Einzelzell-Transkriptom-Sequenzierungsplattform 10x Genomics kann mit Technologien wie Mikrofluidik und Barcode-Beschriftung nahezu 100.000 Zellen erfassen, um eine große Menge an Transkriptominformationen zu erhalten.[17]Der Kern der Einzelzell-Transkriptomanalyse ist die Klassifizierung von Zellen und die Identifizierung von differentiellen Genen in Subpopulationen. Die Gruppierung und differenzielle Analyse von Zellen wird durchgeführt, und die funktionelle Anreicherung der differentiellen Gene erfolgt, um die funktionalen Merkmale der Subpopulationen zu identifizieren (Abb. 5).[18]Es bietet einzigartige Vorteile bei der Zelltypisierung und der Identifizierung von Markerfaktoren und bringt neue Methoden sowie bequeme Mittel für die Identifizierung von Zelltypen, die differenzielle Reaktion von Signalwegen, molekulare Regulierungsnetzwerke und die Forschung zur Zellheterogenität.[19,20].
Abb. 5 Die Landschaftsanalyse von 22 Typen von Immunzellen bei normalen und Kawasaki-Krankheit-Patienten.
Die räumliche Transkriptom-Sequenzierung kann Dateninformationen wie das Transkriptom des Forschungsobjekts bereitstellen und auch dessen räumliche Position im Gewebe lokalisieren. Die Kombination der Transkriptominformationen mit den Informationen zur räumlichen Position bietet eine Grundlage für die Erkennung der räumlichen Zusammensetzung und der Genexpression von Zellen im Gewebe.[21,22]Die Visium-Spatial-Transkriptom-Technologie ist eine Methode, die die Genexpression des gesamten Transkriptoms in situ in Geweben erfasst. Dadurch können wir die Genexpressionsniveaus erkennen und gleichzeitig die Standortinformationen der räumlichen Expression von Genen innerhalb des Gewebes erhalten. Im Vergleich zum räumlichen Transkriptom verliert die traditionelle Transkriptom-Sequenzierung des gesamten Gens oder der Einzelzellen die Informationen über die räumliche Verteilung von Genen oder Zellen innerhalb von Geweben, während die weit verbreitete RNA-Sondenhybridisierung nur eine begrenzte Anzahl von Proben gleichzeitig erfassen kann. Das räumliche Transkriptom kann die Genexpression und die HE-Färbungsergebnisse überlagern, ohne das Gewebe zu verdauen (Abb. 6), wodurch die räumliche Struktur innerhalb des Gewebes erhalten bleibt und es uns ermöglicht wird, die zelluläre Heterogenität in verschiedenen Regionen innerhalb des Gewebes zu untersuchen.[23-25].
Abb. 6 Visualisierung und bioinformatische Analysen von Gewebedomen, die durch Morphologie oder Genexpressionsprofile definiert sind.
In diesem Artikel haben wir mehrere gängige Strategien und Sequenzierungstechnologien für die Transkriptomanalyse besprochen. Die Bulk-Transkriptomsequenzierung kann nur das durchschnittliche Expressionsniveau von Genen in gemischten Zellen erfassen und enthält keine spezifischen Informationen über Zellen und räumliche Standorte.[26]Die Einzelzell-Transkriptom-Sequenzierung kann individuelle Genexpressionsprofile von Zellen erhalten und die Zellheterogenität untersuchen, jedoch kann die Quelle der räumlichen Standortinformationen nicht erlangt werden.[16]Die räumliche Transkriptomik liefert Informationen über die räumliche Verteilung von Genexpressionsprofilen, wodurch gleichzeitig Zellgenexpressionsdaten und räumliche Standortinformationen erfasst werden und die räumliche Heterogenität untersucht wird. Sie fördert zudem das Studium der realen Genexpression von Zellen im Gewebe in situ und die morphologische Darstellung interzellulärer Kommunikationsnetzwerke.[22].
Im Prozess der Analyse von Biomolekülen ist es ein unvermeidlicher Trend, vom Ganzen zu den Details zu gehen und dann von den Details zurück zum Ganzen. Wenn Menschen die biologische Struktur auf molekularer und zellulärer Ebene verstehen, möchten sie natürlich Zellgruppen und Gewebe auf einer makroskopischeren Ebene untersuchen und sogar die physiologischen Prozesse und pathologischen Zusammenhänge von Organen. Multi-Omics-Forschungsmethoden werden nicht nur im Bereich der Krankheiten weit verbreitet eingesetzt, sondern können auch ein umfassendes und systematisches Verständnis der Wechselbeziehungen und Regulationsnetzwerke verschiedener Biomoleküle in den Bereichen Grundlagenforschung, molekulare Züchtung, klinische Diagnostik und Arzneimittelentwicklung bieten und eine Grundlage für die Netzwerkbiologie und Systeme schaffen.[27-29]Daher wird die Strategie, Transkriptom mit Genom, Proteom, Metabolom und anderen Multi-Omics-Gemeinschaftsanalyse zu kombinieren, von immer mehr Wissenschaftlern übernommen. Es wird angenommen, dass Multi-Omics-Forschungsstrategien in Zukunft weitere Forschungsfelder eröffnen können.
Referenzen: