Zielgerichtetes räumliches Panel-Design für Xenium & CosMx: Ein praktischer Leitfaden zur Genselektion aus Einzelzell-Referenzdaten
Warum das Panel-Design einen eigenen Workflow verdient
Die meisten Gespräche über gezielte räumliche Transkriptomik Standardmäßig auf Plattform-Spezifikationen. Welches Instrument liefert eine höhere Auflösung? Bewahrt die Chemie RNA unter verschiedenen Fixierungsbedingungen besser? Dies sind vernünftige Ausgangspunkte, aber sie überspringen einen bedeutenderen Engpass: Sobald die Plattform gewählt ist, müssen Sie immer noch entscheiden, welche 300 bis 5.000 Gene Ihr benutzerdefiniertes Panel füllen werden.
Die Qualität dieser Entscheidung ist oft der Unterschied zwischen einem Datensatz, der jede erwartete Zellart klar auflöst, und einem, der einen darüber nachdenken lässt, ob ein fehlendes Signal echte Biologie oder einen Designfehler darstellt. Stellen Sie sich vor, Sie entwerfen ein Panel mit 400 Genen für eine Glioblastom-Studie, nur um nach dem ersten Pilotversuch festzustellen, dass Ihre drei besten Mikroglia-Marker nicht nachweisbar sind, weil ihre Transkripte kürzer sind als die erforderliche Sondenlänge, und Ihre negativen Kontrollsonden von den Hauskeeping-Genen nicht zu unterscheiden sind. Das ist kein Plattformproblem — es ist ein Problem des Panel-Designs. Und es ist weitaus häufiger, als die meisten Forscher erwarten.
Ein gut strukturiertes Panel, selbst mit einem Bruchteil der Gene, die auf einer Whole-Transcriptome-Plattform verfügbar sind, kann fokussierte, hochvertrauenswürdige räumliche Daten über Hunderte von Proben erzeugen. Der Unterschied liegt in einem systematischen Auswahlprozess: die ordnungsgemäße Vorbereitung Ihrer Referenzdaten, die Organisation der Gene in funktionale Schichten mit klaren Auswahlkriterien, das Testen an Pilotabschnitten und das Iterieren, bevor man sich für eine vollständige Kohorte entscheidet.
Für die meisten Forschungsgruppen ist hochwertige Einzelzell-RNA-Sequenzierung Referenzdaten sind bereits verfügbar – entweder aus demselben Gewebe oder aus öffentlichen Atlanten. Die Herausforderung besteht darin, diese Expressionsdaten in eine plattformkompatible Genliste zu übersetzen, die keine biologische Auflösung zugunsten einer Begrenzung der Genanzahl opfert.
Abbildung 1: Gene Slot Zuteilungstrichter. Eine dreidimensionale Trichterillustration, die den progressiven Filterprozess vom gesamten Transkriptom (~20.000 Gene) über scRNA-seq-Filterung, Auswahl von Marker-Kandidaten und Panel-Design bis hin zum endgültigen räumlichen Panel zeigt. Jede Verengungsstufe stellt eine wichtige Filterentscheidung dar, die Gene ausschließt, die wahrscheinlich nicht gut auf gezielten räumlichen Plattformen abschneiden werden.
Beginnend mit einem soliden scRNA-seq-Referenz
Die Genauigkeit Ihres Panels hängt direkt von der Qualität Ihrer Ausgangsdaten ab. Zielgerichtete räumliche Plattformen kann nur einen Bruchteil des Transkriptoms messen, daher muss jeder Genplatz seinen Platz durch klare Beweise verdienen. Ein Panel, das aus rauschhaften oder schlecht annotierten Einzelzell-Daten entworfen wurde, wird diese Fehler in das räumliche Experiment übertragen.
Wenn Sie Ihre eigenen scRNA-seq-Daten haben
Abgestimmte oder benachbarte Gewebe-Einzelzell-Daten aus demselben biologischen System sind der Goldstandard. Ihre bestehenden Cluster-Anmerkungen und Listen unterschiedlich exprimierter Gene wurden bereits durch unabhängige Analyse-Pipelines validiert, was bedeutet, dass sie weniger Unsicherheiten aufweisen als Daten, die aus externen Quellen entnommen wurden.
Bevor Sie diese Daten für das Panel-Design verwenden, sind drei Vorbereitungsschritte unerlässlich.
Zunächst sollten Sie von einer normalisierten Expressionsmatrix anstelle von Rohzählungen ausgehen. Rohzählungen spiegeln die Variation der Sequenzierungstiefe von Zelle zu Zelle wider, die die Rangfolge der Marker-Gene verzerren kann. Ein Gen, das scheinbar ein Top-Marker ist, nur weil sein Zelltyp tiefer sequenziert wurde, ist ein falsch positives Ergebnis für die Panel-Design-Zwecke. Normalisierungsmethoden wie CPM, SCTransform oder der Deconvolutionsansatz von scran entfernen diese technische Variation und zeigen die biologischen Ausdrucksmuster, die von Bedeutung sind.
Zweitens, überprüfen Sie, ob Ihre Zelltypannotationen stabil sind. Cluster, die bei niedriger Auflösung definiert oder nur durch eine Handvoll Marker validiert wurden, können Klassifikationsfehler in das Panel übertragen. Ein schneller Abgleich mit der Expression kanonischer Marker – entweder in Ihren eigenen Daten oder gegen veröffentlichte Atlanten – erkennt Annotationenabweichungen, bevor sie die Genwahl beeinflussen. Wenn sich ein Cluster nach einer Neugliederung bei höherer Auflösung in seiner Identität ändert, sind die aus diesem Cluster abgeleiteten Marker unzuverlässig.
Drittens, erstellen Sie eine Liste von Kandidatengenen, die sowohl auf Spezifität als auch auf Ausdrucksreichweite filtert. Ein Gen, das perfekt spezifisch für einen seltenen Zelltyp ist, aber nur mit einem Transkript pro Zelle in der scRNA-seq exprimiert wird, wird wahrscheinlich kein nachweisbares Signal auf einer gezielten räumlichen Plattform erzeugen, wo die Sensitivität pro Gen von Natur aus geringer ist als vollständige Transkriptom-SequenzierungDas Festlegen eines minimalen Durchschnittsausdrucksgrenzwerts — typischerweise das 25. Perzentil aller detektierten Gene — entfernt diese Kandidaten mit niedrigem Ertrag früh im Prozess.
Wann Sie öffentliche Daten verwenden müssen
Für Projekte ohne passende scRNA-seq-Daten – eine häufige Situation in FFPE-Klinik-Kohorten, Modellen seltener Krankheiten oder Nicht-Modellorganismen – können öffentliche Ressourcen die Lücke schließen. Mehrere kuratierte Atlanten decken mittlerweile wichtige menschliche und murine Gewebe mit ausreichender Auflösung für das Design von Panels ab:
Tabula Sapiens bietet Einzelzell-Transkriptome aus 24 menschlichen Gewebetypen von einzelnen Spendern und bewahrt die spenderangepasste Vergleichbarkeit zwischen den Geweben.
Das Human BioMolecular Atlas Program (HuBMAP) bietet räumlich registrierte Einzelzell-Daten mit detaillierten anatomischen Metadaten, was es besonders nützlich für Projekte macht, die von Anfang an sowohl Zelltyp- als auch räumlichen Kontext benötigen.
Das Allen Brain Atlas und seine Derivate decken sowohl das menschliche als auch das Mausgehirn in feiner Zelltypauflösung ab, einschließlich inhibitorischer und exzitatorischer Neuronensubtypen, die mit generischen Markern schwer zu unterscheiden sind.
Für einfachere Marker-Suchen stellen Datenbanken wie CellMarker 2.0 und PanglaoDB veröffentlichte Zelltypmarker aus Hunderten von Gewebe- und Krankheitskontexten zusammen. Diese sind nützlich für die erste Nominierung von Kandidaten, sollten jedoch mit mindestens einer weiteren Quelle abgeglichen werden, da die Spezifität von Markern je nach Krankheitszustand, Gewebeverarbeitungsmethode und Plattformchemie variieren kann.
Die Vier-Schichten-Panel-Architektur
Ein häufiger Fehler im Design von Panels besteht darin, die Genliste als flache Sammlung interessanter Kandidaten zu behandeln. Ein robusterer Ansatz besteht darin, Gene in vier funktionale Schichten zu organisieren, die jeweils einen eigenen Zweck und eine eigene Auswahllogik haben. Die Organisation der Gene in diese vier Schichten verwandelt das Panel-Design von einer reaktiven Auffüllübung in einen proaktiven, hypothesengestützten Prozess. So sollte jede Schicht aufgebaut werden.
Schicht 1: Zelltypmarker — Die unverzichtbare Grundlage
Jeder Zelltyp, der in Ihrem Gewebe erwartet wird, sollte durch mindestens drei bis fünf gut validierte Marker-Gene repräsentiert sein. Diese Marker bilden das Rückgrat des Panels, da sie bestimmen, ob die räumliche Dateninterpretation kann in der Zelltypzusammensetzung verankert sein, die den Ausgangspunkt für die meisten nachgelagerten Analysen darstellt.
Die Auswahlkriterien für Layer-1-Markierungen umfassen drei Überprüfungen.
Spezifität über unabhängige Quellen. Ein Gen, das in Ihren scRNA-seq-Daten als wichtigster Marker erscheint, aber in CellMarker 2.0 oder PanglaoDB für dasselbe Gewebe nicht aufgeführt ist, sollte mit Vorsicht behandelt werden. Idealerweise wird jeder Marker in mindestens zwei unabhängigen Datensätzen bestätigt, bevor er in das Panel aufgenommen wird. Ein Marker, der diesen Kreuzvalidierungscheck nicht besteht, stellt sich oft als datensatzspezifisch und nicht biologisch universell heraus.
Konsistente Erkennung. Gene in den obersten 200 der am häufigsten vorkommenden Transkripte in Ihrem Referenzdatensatz haben eine hohe Wahrscheinlichkeit, ein robustes räumliches Signal zu erzeugen. Marker in der unteren Hälfte der Expressionsverteilung tragen ein höheres Risiko, auf der räumlichen Plattform zu versagen, wo die Sensitivität pro Gen geringer ist als bei der vollständigen Transkriptom-Sequenzierung. Wenn ein Marker hoch im Verhältnis zur Veränderung, aber niedrig in der absoluten Expression eingestuft wird, ziehen Sie in Betracht, ein Backup hinzuzufügen.
Orthogonale Bestätigung. Wenn veröffentlichte Immunhistochemie- oder RNAscope-Bilder das erwartete räumliche Muster für einen Kandidatenmarker bestätigen, ist das ein starkes unterstützendes Beweis. Für Kandidaten ohne räumliche Validierungsdaten sollten Sie in Erwägung ziehen, sie einem Pilotpanel hinzuzufügen, anstatt sie der endgültigen Genliste zuzuordnen. Pilotdaten werden schnell zeigen, ob der Marker die erwartete räumliche Verteilung erzeugt.
Für ein typisches Gewebe mit acht bis zwölf erwarteten Zelltypen benötigt Schicht 1 ungefähr 30 bis 60 Gene. In einer Tumorstudie, in der Makrophagen, Monozyten und dendritische Zellen alle unterschieden werden müssen, könnte Schicht 1 allein für den myeloiden Kompartiment acht bis zehn Marker benötigen. Das Schlüsselprinzip besteht darin, alle erwarteten Zelltypen mit Redundanz abzudecken und nicht die Anzahl der Marker pro Zelltyp zu maximieren.
Schicht 2: Status- und Funktionsmarker
Über die Identifizierung von Zelltypen hinaus zielen die meisten räumlichen Studien darauf ab, biologische Prozesse zu erfassen – Immunaktivierung, metabolische Umprogrammierung, hypoxische Reaktion oder Entwicklungs-Signalisierung. Die Gene der Schicht 2 decken diese funktionalen Dimensionen ab.
Die genaue Zusammensetzung von Schicht 2 hängt von Ihrer Studie ab. Für ein Projekt zur Tumormikroumgebung könnten relevante Marker interferon-gamma-antwortende Gene (IFNG, STAT1, IRF1), Marker für T-Zell-Erschöpfung (PDCD1, LAG3, TOX) und hypoxie-induzierbare Faktoren (HIF1A, VEGFA) umfassen. Bei einer Studie zur Neurodegeneration verschiebt sich die Liste zu Amyloid-verarbeitenden Enzymen (BACE1, PSEN1), synaptischen Proteinen (SYN1, DLG4) und Markern der Astrozytenreaktivität (GFAP, VIM).
Eine praktische Zuteilungsrichtlinie besteht darin, etwa ein Drittel Ihres gesamten Genbudgets für Layer 2 zu reservieren. Passen Sie das Verhältnis basierend auf Ihrem Hauptziel an: ein 70:30-Verhältnis für Projekte zur Zelltyp-Kartierung oder 50:50 für mechanismusorientierte Studien. Der Schlüssel ist, das Verhältnis zu bestimmen, bevor die Auswahl beginnt, anstatt funktionale Marker in die verbleibenden Slots zu integrieren, nachdem die Zelltypmarker ausgewählt wurden.
Schicht 3: Technische Kontrollen — Das am meisten übersehene Wesentliche
Positive Kontrollen sollten zwei bis drei Hauskeeping-Gene umfassen — GAPDH, ACTB und B2M sind gängige Auswahlmöglichkeiten — die in allen erwarteten Zelltypen konsistent exprimiert werden. Diese Kontrollen erfüllen drei Funktionen: Sie bestätigen, dass der Gewebeschnitt nachweisbare RNA enthält, sie bieten einen Vergleichsmaßstab für die Normalisierung der Signalintensität und sie kennzeichnen Proben mit allgemeiner RNA-Abbau, wenn ihr Signal unter einen erwarteten Bereich fällt.
Negative Kontrollen sollten fünf bis zehn nicht zielgerichtete Sondensequenzen umfassen, die so entworfen sind, dass sie nicht an irgendeinem bekannten Transkript der Spezies hybridisieren. Diese Sonden quantifizieren das Hintergrund-Autofluoreszenzsignal und die unspezifische Bindung. Ohne sie könnte jedes räumlich gemusterte Signal echte Biologie oder ein Färbeartefakt sein. Die Kosten für negative Kontrollen im Genbudget sind vernachlässigbar – typischerweise fünf bis zehn Sonden aus mehreren hundert oder tausend – aber ihr Wert für die Interpretierbarkeit der Daten ist enorm.
Schicht 4: Reservierte Slots
Kein Panel übersteht den ersten Kontakt mit echtem Gewebe unverändert. Reservieren Sie fünf bis zehn Prozent Ihres Genbudgets für Marker, die während der Pilotstudien identifiziert wurden. Dazu können Ersatzmarker für Layer-1-Marker gehören, die kein Signal erzeugt haben, neu veröffentlichte Genziele in Ihrem Bereich oder Gene, die sich aus den Pilotdaten als unerwartet informativ herausgestellt haben.
Ein praktischer Ansatz besteht darin, Layer 4 während der Proben-Synthese mit Platzhalterkandidaten zu füllen und dann die Zusammensetzung zu aktualisieren, bevor die Proben für die Hauptkohorte bestellt werden. Das Einbauen dieses Puffers in das ursprüngliche Design vermeidet das kostspielige Szenario, eine kritische Lücke zu entdecken, nachdem die Proben-Synthese abgeschlossen ist.
Abbildung 2: Vier-Lagen-Panel-Architektur — Konzentrische Ringe. Ein Querschnittsdiagramm, das vier ineinander geschachtelte Ringe zeigt, die die funktionalen Schichten eines gezielten räumlichen Panels darstellen. Der innerste Ring (Zelltypmarker) bildet den Kern, umgeben von Zustands- und Funktionsmarkern, technischen Kontrollen und einem äußeren Ring für Reserveschlitze mit einer gestrichelten Grenze, die Flexibilität anzeigt. Jede Schicht ist farblich codiert und mit ihrer empfohlenen Gene-Budget-Zuweisung beschriftet.
Maximierung der Auflösung innerhalb eines festen Genbudgets
Jeder zielgerichtete räumliche Plattform setzt eine harte Obergrenze für die Anzahl der Gene, die gleichzeitig gemessen werden können. Mit Xenium, das bis zu 5.000 unterstützt, und CosMx, das bis zu 6.000 unterstützt, konkurriert jede Genwahl um einen begrenzten Platz. Die Maximierung der biologischen Auflösung innerhalb dieser Grenzen erfordert zwei Strategien: die Beseitigung von Redundanz und das Design von Backup-Markern für kritische Zelltypen.
Vermeidung von Genfamilienredundanz
Ein oft übersehenes Problem ist die Einbeziehung mehrerer Mitglieder derselben Genfamilie, die nahezu identische räumliche Informationen tragen. Mehrere Histon-Gene, HLA-Paraloge oder Mitglieder der Keratin-Familie können hochgradig korrelierte Expressionsmuster über Zelltypen hinweg aufweisen. Die Einbeziehung aller dieser Gene verbraucht Slots, ohne biologischen Wert hinzuzufügen.
Eine schnelle Korrelationsanalyse Ihrer scRNA-seq Referenzdaten kann diese redundanten Kandidaten identifizieren. Wenn zwei Gene eine Pearson-Korrelation von über 0,9 zwischen den Zelltypen aufweisen, reicht es in der Regel aus, nur das mit höherer Expression oder spezifischerer räumlicher Annotation beizubehalten. Dieser einzelne Schritt kann 5 bis 15 Prozent Ihres Genbudgets für informativere Marker zurückgewinnen.
Backup-Marker-Strategie
Für Zelltypen, die für Ihre Studie entscheidend sind, benennen Sie zwei Backup-Marker zusätzlich zum primären Marker. Wenn der primäre Marker aufgrund von RNA-Abbau, geringer Expression in einem bestimmten Gewebebereich oder Einschränkungen im Probe-Design ausfällt, stellt das Backup sicher, dass der Zelltyp weiterhin nachweisbar bleibt.
Diese Redundanz ist besonders wichtig für FFPE-Proben, bei denen RNA-Fragmentierung die Nachweisempfindlichkeit für längere Sonden verringern kann. Ein Marker mit einer Transkriptlänge von unter 2 Kilobasen hat eine höhere Wahrscheinlichkeit, die FFPE-Bearbeitung zu überstehen als einer, der 3 Kilobasen überschreitet.
Abbildung 4: Plattform Gene Budget vs. Auflösungs-Radar-Diagramm. Ein Radar-Diagramm, das Xenium, CosMx und GeoMx über fünf Leistungsachsen vergleicht: Genbudget, räumliche Auflösung, FFPE-Kompatibilität, Durchsatz und Analysekomplexität. Das Diagramm ermöglicht einen direkten visuellen Vergleich der Plattformkompromisse für Projekte zur Gestaltung gezielter Panels.
Wann ein Discovery Run Sinn macht zuerst
Für Gewebetypen mit begrenzten räumlichen Referenzdaten kann eine Whole-Transcriptome-Raumplattform wie Visium oder Visium HD als leistungsstarker Vorläufer dienen für zielgerichtetes Panel-DesignDie vollständige Transkriptomabdeckung bietet einen unvoreingenommenen Blick auf die Genexpression in verschiedenen Geweberegionen und zeigt räumliche Gradienten und regionale Anreicherungen, die allein durch Einzelzell-Daten möglicherweise nicht erfasst werden.
Dieser Kaskaden-Workflow — Visium-Entdeckungsphase, gefolgt von gezieltes Panel Optimierung, gefolgt von der Profilierung mit großen Kohorten wie Xenium oder CosMx — ist besonders effektiv für drei Szenarien.
- Neue Krankheitsmodelle oder gezielte Gewebe, bei denen räumliche Expressionsmuster nicht beschrieben sind und veröffentlichte Marker unzuverlässig sind. In diesen Fällen besteht das Risiko, dass beim Versuch, ein gezieltes Panel nur aus scRNA-seq-Daten zu entwerfen, räumlich informative Gene übersehen werden, die erst im Gewebe-Kontext offensichtlich werden.
- Große Kohortenstudien, bei denen die Kosten für die Durchführung von 100 bis 200 Proben auf einer gezielten Plattform nur gerechtfertigt sind, nachdem das Gen-Set an einem kleineren Entdeckungsset validiert wurde. Ein Visium-Pilot mit 4 bis 6 Abschnitten kostet typischerweise nur einen Bruchteil einer vollständigen gezielten Kohorte und kann die viel höheren Kosten verhindern, die durch die Entdeckung einer schlechten Markerwahl zur Hälfte des Probenverarbeitungsprozesses entstehen.
- Projekte, die Entdeckung und Validierung innerhalb eines einzigen Förderbudgets kombinieren, bei denen die anfängliche Visium-Investition das Risiko verringert, die falschen Gene für die gezielte Phase auszuwählen. Die Entscheidung, eine Entdeckungsphase einzubeziehen, sollte getroffen werden, bevor das Design des Panels beginnt, nicht nach einem ersten gescheiterten gezielten Pilotprojekt.
Ein konkretes Beispiel: Ein Forscher, der die Immuninfiltration in einem transgenen Bauchspeicheldrüsenkrebsmodell ohne veröffentlichte räumliche Daten untersucht, führt zwei Visium HD-Schnitte durch und identifiziert 150 regional angereicherte Gene, die in keiner öffentlichen Datenbank vorhanden sind. Diese 150 Gene bilden den Kern eines maßgeschneiderten Xenium-Panels, das auf 80 Mäusen angewendet wird. Ohne die Entdeckungsphase wären diese räumlich informativen Gene niemals einbezogen worden.
Abbildung 3: Visium zu Xenium Cascade-Workflow. Eine horizontale dreistufige Pipeline, die den sequenziellen Workflow von der Visium-Whole-Transcriptome-Entdeckung über das Design und die Optimierung von Panels bis hin zur gezielten Profilierung der gesamten Kohorte mit Xenium zeigt. Jede Stufe ist mit Probenzahlen und wichtigen Entscheidungsstellen annotiert, die veranschaulichen, wie die Erkenntnisse aus der Entdeckungsphase direkt die Zusammensetzung des gezielten Panels beeinflussen.
Auswahl zwischen vordefinierten und maßgeschneiderten Paneelen
Sowohl Xenium als auch CosMx bieten vorkonzipierte Panels an, die gängige Gewebetypen abdecken. Die Xenium Multi-Tissue- und Human Brain-Panels umfassen 250 bis 500 Gene. Die CosMx Universal Cell Characterization-Panels erfüllen einen ähnlichen Zweck.
Vordefinierte Panels sind praktisch und in mehreren Gewebetypen validiert. Ihre Einschränkung liegt in der Breite gegenüber der Tiefe. Wenn Ihre Studie einen spezifischen Weg oder einen Krankheitsmechanismus anvisiert, der im vordefinierten Set unterrepräsentiert ist, ein benutzerdefinierte Panelgestaltung wird relevantere Daten liefern.
Ein kosteneffektiver Mittelweg: Verwenden Sie ein vorgefertigtes Panel zur ersten Machbarkeitscharakterisierung und entwerfen Sie dann ein maßgeschneidertes Panel für die Hauptkohorte basierend auf den Ergebnissen. Dieser zweiphasige Ansatz stellt sicher, dass das maßgeschneiderte Panel nur die Gene anspricht, die für Ihre spezifische Fragestellung von Bedeutung sind, während das vorgefertigte Panel das Entdeckungsrisiko verringert.
Eine weitere Überlegung ist der Aktualisierungszyklus. Vorgefertigte Panels werden regelmäßig vom Hersteller aktualisiert – neue Versionen können verbesserte Sonden-Designs oder erweiterten Genabdeckungen enthalten. Wenn Ihr Studienzeitraum mehrere Panelversionen umfasst, berücksichtigen Sie die Kosten für die erneute Validierung beim Wechsel zwischen vorgefertigten Iterationen. Individuelle Panels bleiben nach der Validierung über das gesamte Projekt hinweg stabil, was den Vergleich longitudinaler Daten vereinfacht.
Validierung Ihres Panels vor der Skalierung
Die Durchführung eines Pilotversuchs an ein oder zwei repräsentativen Gewebeschnitten ist die Investition mit dem höchsten Ertrag im Prozess der Panelgestaltung. Keine Menge an in silico-Analysen kann vorhersagen, wie jedes Gen unter Ihrem spezifischen Protokoll auf fixiertem Gewebe abschneiden wird. Ein einzelner Pilotversuch kostet typischerweise nur einen Bruchteil von einem vollständiges Kohortenexperiment und kann die viel größeren Kosten verhindern, die entstehen, wenn man nach der Verarbeitung aller Proben feststellt, dass ein wichtiger Zelltyp nie erkannt wurde.
Pilot-QC-Metriken
Nach dem Pilotversuch drei Kennzahlen auswerten.
- Geneerkennungsrate. Welcher Anteil der Panel-Gene erzeugt ein Signal über dem Negativkontrollschwellenwert? Eine Rate unter 70 Prozent weist auf eine schlechte Sondenleistung, geringe Transkriptmenge oder unzureichende RNA-Qualität hin.
- Qualität der Zellsegmentierung. Dichte Gewebe, lipidreiche Regionen und autofluoreszierende Proben können die Segmentierungsgenauigkeit beeinträchtigen. Überprüfen Sie die Grenzen manuell in mehreren Geweberegionen.
- Signal-zu-Hintergrund-Verhältnis. Teilen Sie die durchschnittliche Intensität der positiven Kontrolle durch die durchschnittliche Intensität der negativen Kontrolle. Ein Verhältnis unter drei deutet darauf hin, dass der Test das echte Signal nicht vom Hintergrund trennt.
Pilot-Entscheidungsbaum
Drei Ergebnisse sind nach dem Pilotprojekt möglich.
- Fortfahren. Alle Zelltypen nachweisbar, Nachweisrate über 70 Prozent, Kontrollen im Bereich. Das Panel ist bereit für die vollständige Kohorte.
- Überarbeiten und erneut testen. Fehlende Zelltypen oder schlechte Erkennung in bestimmten Regionen. Ersetzen Sie fehlerhafte Marker und führen Sie einen zweiten Testdurchlauf durch.
- Überprüfen Sie erneut. Wenn die RNA-Qualität oder die Plattformkompatibilität grundlegend einschränkend ist, ziehen Sie in Betracht, die Probenvorbereitung oder die Plattformwahl zu überdenken, bevor Sie weitere Investitionen tätigen.
Abbildung 5: Entscheidungsbaum für Piloten. Ein vertikales Entscheidungsflussdiagramm mit drei Endergebnissen: Fortfahren mit der vollständigen Kohorte, Überarbeiten und erneut testen oder Plattform oder Probenvorbereitung neu bewerten. Jeder Zweig wird durch ein spezifisches QC-Ergebnis ausgelöst — Erkennungsrate über oder unter 70 Prozent, erfolgreiche oder fehlgeschlagene Zellsegmentierung und Signal-zu-Hintergrund-Verhältnis über oder unter drei.
Paneldesign ohne scRNA-seq-Daten
Wenn kein Einzelzellreferenz verfügbar ist, wird das Design des Panels schwieriger, aber nicht unmöglich.
- Öffentliche Marker-Kataloge. PanglaoDB und CellMarker 2.0 bieten kuratierte Listen, die über Studien hinweg referenziert sind.
- Literaturbasierte Kuratierung. Durchsuchen Sie veröffentlichte Bulk-RNA-seq- oder Proteomikdaten nach Kandidatenmarkern in Ihrem Gewebe.
- Klein-Panel-Pilotstrategie. Beginnen Sie mit 30 bis 50 linienbestimmenden Genen, testen Sie einen Abschnitt, bewerten Sie die Nachweisbarkeit und erweitern Sie iterativ. Langsamere Vorgehensweise, reduziert jedoch das Risiko, sich auf ein großes, ungetestetes Gen-Set festzulegen.
Abbildung 6: Datenquellenvergleich — Drei Wege für das Paneldesign. Ein Vergleichslayout mit drei Spalten, das die Datenqualität, den Vorbereitungsaufwand und die besten Nutzungsszenarien für jede der drei Referenzdatenquellen zeigt: abgeglichene scRNA-seq-Daten, öffentliche Atlasdaten und Szenarien ohne Einzelzell-Referenzdaten.
Häufige Designfehler bei Panels
Alle Marker aus einem Referenzcluster. Eine Genliste, die vollständig aus einem einzelnen scRNA-seq-Cluster abgeleitet ist, birgt das Risiko einer räumlichen Verzerrung – dieser Cluster könnte ein Dissociationsartefakt oder eine seltene Subpopulation widerspiegeln, die nicht repräsentativ für das gesamte Gewebe ist. Überprüfen Sie die Marker anhand von mindestens zwei unabhängigen Quellen, idealerweise einer aus einem anderen Labor oder einer anderen Plattform.
Niedrig exprimierte Gene im Panel. Hohe Faltungsänderung, aber niedrige absolute Zählungen bedeuten schwaches räumliches Signal. Ersetzen Sie alle Marker, die unter dem 25. Ausdrucksperzentil in Ihren Referenzdaten liegen, durch eine reichhaltigere Alternative. Ein gängiger Workaround besteht darin, zu überprüfen, ob das Gen erfolgreich durch RNAscope oder smFISH im gleichen Gewebetyp nachgewiesen wurde – positive Nachweisdaten sind ein starker Indikator für die Kompatibilität mit der räumlichen Plattform.
Ignorieren Sie die FFPE-Beschränkungen. FFPE verringert die Nachweisempfindlichkeit für längere Transkripte. Priorisieren Sie Transkripte unter 2 kb und fügen Sie zusätzliche Hauskeeping-Kontrollen hinzu. Ein Marker, der in frisch gefrorenem Gewebe gut funktioniert, kann in FFPE vollständig versagen. Bei der Planung für FFPE führen Sie eine schnelle Vorhersage der Sondenleistung mithilfe der Design-Pipeline des Herstellers durch, bevor Sie sich auf die endgültige Zusammensetzung des Panels festlegen.
Überspringen von negativen Kontrollen. Ohne sie könnte jedes Signal Autofluoreszenz oder unspezifische Bindung sein. Nicht verhandelbar.
Überblick über die Bioinformatik ÜbergabeDie von Ihnen entworfene Genliste muss mit der Analysepipeline kompatibel sein, die die räumlichen Daten verarbeitet. Wenn Ihr Panel Gene mit mehrdeutiger Annotation, überlappenden genomischen Koordinaten oder schlecht charakterisierten Spleißvarianten enthält, können diese während der Ausrichtung oder Quantifizierung herausgefiltert werden, was effektiv diese Slots verschwendet. Überprüfen Sie die Genidentifikatoren anhand der Referenzgenomannotation der Plattform, bevor Sie das Panel finalisieren.
Die Behandlung des Paneldesigns als einmalige Übung. Der teuerste Fehler. Immer eine Pilotphase mit einem klaren Entscheidungspunkt einplanen, bevor man sich auf eine große Kohorte festlegt. Ein zweiwöchiger Pilotversuch kann Monate an Nacharbeiten bei einem gescheiterten Experiment mit 200 Proben sparen.
Wie CD Genomics das Design gezielter Panels unterstützt
Die Gestaltung eines gezielten räumlichen Panels umfasst mehrere spezialisierte Schritte: scRNA-seq-DatenanalyseMarker-Gen-Auswahl, plattformspezifische Sondenentwicklung, Pilotdurchführung und iterative Qualitätskontrolle. Jeder Schritt hat seine eigenen Fehlerquellen - ein falsch spezifizierter Gen-Identifikator, eine übersehene Korrelation zwischen zwei Familienmitgliedern, ein nicht getesteter FFPE-Schnitt - die das endgültige Datenset stillschweigend beeinträchtigen können.
CD Genomics bietet umfassende Unterstützung in diesem Workflow, von der Verarbeitung von Referenzdaten und der Genstratifizierung über die Koordination von maßgeschneiderten Sonden, Pilotversuchen und vollständige Kohorten-RaumtranskriptomikEgal, ob Sie mit Ihren eigenen Einzelzell-Daten beginnen, von öffentlichen Atlanten ausgehen oder ein Panel aus veröffentlichten Markern erstellen, unser Team kann Ihnen helfen, Ihre Forschungsfrage in ein fokussiertes, kosteneffizientes Gen-Set zu übersetzen, das die Zelltypauflösung und das biologische Signal bewahrt. Kontaktieren Sie unser Team, um Ihr Panel-Design-Projekt, die Anforderungen an Referenzdaten und die Pilotstrategie zu besprechen – wir können Ihnen helfen, von der Genliste zu einem validierten räumlichen Panel in einem strukturierten, wiederholbaren Workflow zu gelangen.
Häufig gestellte Fragen (FAQ)
Q1: Ich habe nur Visium-Daten, keine scRNA-seq. Kann ich trotzdem ein Xenium-Panel entwerfen?
Ja. Visium-Whole-Transcriptomdaten können scRNA-seq ersetzen, sofern die Spots eine ungefähre Zelltypauflösung bieten. Für größere Spots schätzen Tools wie cell2location oder RCTD die Zelltypanteile und unterstützen die Auswahl von Markern.
Q2: Was ist der Hauptunterschied zwischen den Arbeitsabläufen für das Design von Xenium- und CosMx-Panels?
Die Designprinzipien sind ähnlich, aber die Größenbeschränkungen der Panels und die Chemie der Sonden unterscheiden sich. Xenium unterstützt bis zu 5.000 Gene mit festen In-situ-Sonden. CosMx unterstützt bis zu 6.000 mit modularer Chemie. Die Vier-Schichten-Architektur gilt für beide.
Q3: Welches Verhältnis von Zelltyp- zu Signalwegmarkern empfehlen Sie?
60:40 für Entdeckungsstudien; 40:60 für mechanikfokussierte Projekte. Technische Kontrollen sind getrennt.
Q4: Kann ich Gene nach der Sonden-Synthese hinzufügen?
Ja, aber die Bestellung zusätzlicher Sonden erhöht die Kosten und die Durchlaufzeit. Die Layer-4-Reservestrategie minimiert Ergänzungen während des Projekts.
Q5: Erfordert FFPE-Gewebe ein spezielles Panel-Design?
Ja. FFPE-Fragmentierung verringert die Nachweiseffizienz für längere Transkripte. Priorisieren Sie kürzere Gene, fügen Sie zusätzliche Kontrollen hinzu und führen Sie immer einen Pilotversuch durch, bevor Sie in größerem Maßstab arbeiten.
Q6: Wie kann ich feststellen, ob mein Panel bereit ist, bevor ich das vollständige Experiment durchführe?
Die Pilotphase ist darauf ausgelegt, dies zu beantworten. Wenn Ihre Genentdeckungsrate 70 Prozent übersteigt, Ihr Signal-zu-Hintergrund-Verhältnis über drei liegt und alle erwarteten Zelltypen in den Pilotdaten identifizierbar sind, ist Ihr Panel bereit für die vollständige Kohorte. Wenn eines dieser Kriterien nicht erfüllt ist, verwenden Sie den Entscheidungsbaum im Validierungsabschnitt, um zu entscheiden, ob das Panel überarbeitet oder die Plattformwahl neu bewertet werden soll.
Referenzen
- Milholland B, et al. Auswahl von Genpanels für gezielte räumliche Transkriptomik. Genome Biol. 2024;25:31. doi: 10.1186/s13059-024-03174-1
- Van den Berge K, et al. Spapros: Auswahl von Sonden-Sets für gezielte räumliche Transkriptomik. Nat Methoden. 2024;21:2260-2270. doi: 10.1038/s41592-024-02496-z
- Tian L, et al. Vorhersagbare und robuste Genselektion für räumliche Transkriptomik. Nat Commun. 2023;14:2091. doi: 10.1038/s41467-023-37392-1
- Janesick A, et al. Systematische Benchmarking von Imaging-Spatial-Transcriptomics-Plattformen in FFPE-Geweben. Nat Commun. 2025;16:64990. doi: 10.1038/s41467-025-64990-y
Verwandte Dienstleistungen
- 10x räumliche Transkriptom-Sequenzierungsdienstleistung
- RNA-Seq
- Genpanel-Sequenzierungsdienst
- Multi-Omics-Dienstleistung
- Gezielte Regionssequenzierung
- Whole Exome Sequenzierung
- Vollständige Transkript-Sequenzierung (Iso-Seq)
- CUT&Tag-Sequenzierungsdienst
- Bakterielle RNA-Sequenzierung
- Kleine RNA-Sequenzierung
Die beschriebenen Anwendungen sind nur für Forschungszwecke bestimmt. Nicht für den Einsatz in diagnostischen Verfahren. (RUO)