Derzeit hat sich die Einzelzell-RNA-Sequenzierung als ein herausragendes und aktuelles Thema etabliert. Sie bietet unschätzbare Einblicke, die durch traditionelle Bulk-RNA-Sequenzierung nicht erreichbar sind, insbesondere wenn es darum geht, Entwicklungsbiologie, Tumorbiologie, Immunologie und verwandte Bereiche zu untersuchen. Im Zentrum der Einzelzell-Sequenzierung stehen T-SNE-Dimensionalitätsreduktion und Clustertechniken, die die Erkundung und Analyse von Daten erleichtern. Es ist jedoch entscheidend zu betonen, dass der Erfolg oder Misserfolg der gesamten Analyse stark von sorgfältigen Qualitätskontrollmaßnahmen abhängt, die vor diesen Schritten durchgeführt werden. In diesem Artikel bieten wir einen umfassenden Überblick über die Qualitätskontrolle von Einzelzellen.
Verschiedene Faktoren beeinflussen die Präferenzen bei der Einzelzell-RNA-Sequenzierung, einschließlich:
Durch das Verständnis und die Berücksichtigung dieser Präferenzen können Forscher die Zuverlässigkeit und Validität von Einzelzell-RNA-Sequenzierungsstudien verbessern.
Vor der Durchführung von Einzelzell-Sequenzierungen ist es entscheidend, die Zellen effektiv zu trennen. Ein Versäumnis, dies innerhalb eines begrenzten Zeitrahmens zu tun, kann die Zellintegrität negativ beeinflussen und möglicherweise zu RNA-Austritt aus den Zellen führen. Hier sind mehrere wichtige Faktoren, die bei der Isolierung einzelner Zellen aus Geweben zu beachten sind:
Daher ist es bei der Analyse von Clusterergebnissen entscheidend, gründlich zu überprüfen, ob es Gene gibt, die spezifische Expressionsmuster in bestimmten Zellgruppen aufweisen, die auf das Zelltrennungsexperiment zurückzuführen sein könnten.
Bei der Zellsortierung stehen wir vor mehreren Herausforderungen, darunter:
Um diese Herausforderungen zu bewältigen, wurden verschiedene Strategien zur Sequenzierung einzelner Zellen entwickelt. Es ist entscheidend, die geeignete Einzelzellstrategie für das Studium spezifischer Gewebe sorgfältig auszuwählen. Darüber hinaus kann eine niedrige Zellqualität oder das Vorhandensein von toten Zellen oder Zelltrümmern dazu führen, dass mehrere Zellen innerhalb von Tröpfchen eingekapselt werden. Während der anschließenden Datenanalyse können diese Tröpfchen entweder einen eigenen Cluster bilden oder zwischen zwei Zellgruppen angereichert erscheinen.
Um das Vorhandensein von Tropfen mit mehreren Zellen zu bestimmen, werden typischerweise die folgenden Kriterien verwendet:
Derzeit sind mehrere Softwaretools verfügbar, die bei der Identifizierung von Doppelten helfen, wie zum Beispiel:
Diese Doppelterkennungsalgorithmen weisen Ähnlichkeiten in ihrem Ansatz auf und folgen einem grundlegenden Prinzip, das aus den folgenden Schritten besteht:
Vor der Durchführung von Einzelzell-Sequenzierungen ist es notwendig, die Zellen zu lysieren. Die Lysisbedingungen variieren je nach den zu untersuchenden Zellgeweben. Wenn die Lysisbedingungen zu streng sind, hat dies negative Auswirkungen auf die Bibliotheksvorbereitung.
Die Effizienz der reversen Transkriptase ist von größter Bedeutung. Die Ausfallrate liegt typischerweise zwischen 60 % und 90 %. In Fällen, in denen dieselbe Zelllinie auf dieselbe Weise verarbeitet wird, jedoch mit zwei verschiedenen Bibliotheken, kann die Ausfallrate erhebliche Schwankungen aufweisen.
Jeder Amplifikationsschritt kann Verzerrungen einführen. Viele Techniken zur Einzelzell-Transkriptom-Sequenzierung nutzen molekulare Barcodes als Maßnahme, um Verzerrungen, die durch die Amplifikation verursacht werden, zu korrigieren. Vollständige Transkriptome wie SmartSeq2 verfügen jedoch nicht über molekulare Barcodes, was es unmöglich macht, Amplifikationspräferenzen mit auf molekularen Barcodes basierenden Methoden zu korrigieren.
Durch die Verwendung von Spike-in-RNAs, einer Sammlung von RNA-Transkripten mit bekannten Sequenzen, umfasste der Prozess der Bibliothekskonstruktion die Zugabe von Spike-in-Molekülen in bekannten Konzentrationen. Dieses Set von Spike-ins beinhaltete:
Anwendungen von Spike-ins:
Einschränkungen von Spike-ins:
Trotz ihrer Nützlichkeit unterscheiden sich Spike-Ins weiterhin von endogenen Genen, insbesondere in Bezug auf die Amplifikationspräferenz. Diese Diskrepanz muss bei der Interpretation der Ergebnisse berücksichtigt werden. Darüber hinaus werden Spike-Ins in der Regel nicht in Drop-Seq-Methodologien verwendet.
Typischerweise umfassen die Kontrollpunkte für die Qualitätskontrolle (QC) Folgendes:
Ein niedriges Verhältnis oder eine geringe Anzahl von Reads kann auf Probleme bei der Bibliothekskonstruktion zurückgeführt werden. Eine geringe Anzahl von Reads kann auf eine erhöhte Bildung von Primer-Dimeren zurückzuführen sein, während ein niedriges Verhältnis typischerweise auf Probleme während der Bibliothekskonstruktion hinweist.
Das Fehlen von Spike-in-RNA-Sequenzen weist direkt auf einen Fehler bei der Bibliothekskonstruktion hin. Wenn jedoch der Spike-in normal ist und die Zelle eine geringe Anzahl von RNA-Sequenzen aufweist, könnte dies auf die geringe Größe der Zelle oder auf Schäden an der Zelle vor der Bibliothekskonstruktion zurückzuführen sein.
Die Anzahl der detektierten Gene steht in direktem Zusammenhang mit der Größe der Zelle. Wenn eine übermäßige Anzahl von Genen (molekularen Barcodes) detektiert wird, ist es wahrscheinlich, dass mehrere Zellen innerhalb des Tropfens vorhanden sind. Es kann jedoch nicht ausgeschlossen werden, dass die Zelle selbst einfach sehr groß ist. Wie unten gezeigt, wird es als nicht normal angesehen, zu viele oder zu wenige Gene zu haben.
Im Allgemeinen besteht eine positive Korrelation zwischen Zellgröße, Spike-in-RNA-Verhältnis und der Anzahl der detektierten Gene. Erhöhte Werte von mitochondrialer RNA weisen ebenfalls auf eine beschädigte Zelle hin. Wenn eine Zelle bricht, wird zytoplasmatische RNA freigesetzt, während mitochondriale RNA innerhalb der mitochondrialen Membran eingeschlossen bleibt. Daher steigt der Prozentsatz an mitochondrialer RNA, wenn die Zellmembran beschädigt ist. Hinweis: Dieses Phänomen kann auch während der Apoptose oder Nekrose auftreten.
Hohe Mengen an ribosomaler RNA können auf eine erhöhte RNA-Abbau innerhalb der Zelle hinweisen. In vollständigen Einzelzell-Transkriptomen kann die 3'-Präferenz genutzt werden, um erheblichen RNA-Abbau innerhalb der Zelle zu identifizieren.
In der Regel werden die meisten Zellen denselben Trend aufweisen, und wir kombinieren mehrere Metriken, um einige der Zellen zu entfernen, die nicht qualifizieren. Schauen Sie sich also die Verteilung der Daten an, bevor Sie entscheiden, welche Zellen herausgefiltert werden müssen.
Basierend auf PCA kann dieser Algorithmus auch für die Qualitätskontrolle verwendet werden, um Zellen zu finden, die eindeutig nicht mit anderen Zellen gruppiert sind. Diese Zellen gelten als diejenigen, die die Qualitätskontrollstandards nicht erfüllen.
Der nächste Schritt besteht darin, zu besprechen, wie die Gene gefiltert werden sollen. In der überwiegenden Mehrheit der Fälle werden wir nicht alle Gene verwenden, um eine Herunterskalierungsanalyse durchzuführen, daher ist eine Auswahl von Gen-Sets erforderlich.
Das Gen-Set basiert auf:
Nur die ersten paar Hauptkomponenten werden für die t-SNE-Reduzierung ausgewählt.
Eines der herausforderndsten Probleme bei der Einzelzell-RNA-Sequenzierung sind die Batch-Effekte. Batch-Effekte können in verschiedenen Szenarien auftreten, wie:
Um Batch-Effekte zu mildern, ist es entscheidend, unterschiedliche Qualitätskontrollstandards für verschiedene Probenchargen festzulegen. Ein Ansatz besteht darin, die Hauptkomponentenanalyse (PCA) zu verwenden, um auffällige Batch-Effekte in den erhaltenen Ergebnissen zu identifizieren.