Validierung von RNA-Seq CNV: Warum DNA-Sequenzierung unerlässlich ist

RNA-Seq ist oft bereits verfügbar, wenn Fragen zur Kopienzahl auftauchen: Ist MYC in dieser Zelllinie amplifiziert? Hat dieses Modell nach der Passage abgedriftet? Beobachten wir eine breite chromosomale Instabilität oder einen fokalen Gewinn, der die Screening-Ergebnisse verändern könnte? Es ist verlockend, einen starken Anstieg des Ausdrucks als "CNV-ähnlich" zu betrachten, insbesondere wenn die Zeitpläne eng sind.

Aber in RUO-Workflows – insbesondere wenn die Modellcharakterisierung, die Auswahl von Treffern oder die Hypothesen zu Mechanismen von der Gen-Dosierung abhängen –Der Ausdruck ist ein nachgelagerer Phänotyp, kein direktes Maß für die DNA-Kopienzahl.RNA kann in einigen Kontexten mit der Kopienzahl korrelieren, kann jedoch aus genau dem Grund, der Ihnen wichtig ist, auch überzeugend falsch sein: Das "Signal", das Sie sehen, könnte Regulierung, Zusammensetzung oder technischen Bias darstellen, anstatt einen echten Gewinn/Verlust.

1.1 Warum Teams CNV aus RNA-seq ableiten (Geschwindigkeit, vorhandene Daten)

Häufige RUO-Treiber:

  • RNA-Seq existiert bereits. von Basislinien- oder Störungsprofilierung (so dass CNV-aus-RNA wie ein "kostenloses" Add-On aussieht).
  • Schnelle Triage: breite Instabilität vs stabiles Modell, oder "Ist dieses Gen plausibel dosierungsabhängig?"
  • PriorisierungErstellen Sie eine Shortlist von Loci für die nachfolgende DNA-Validierung, anstatt alles zu validieren.

RNA-Seq kann unterstützen Hypothesenbildung—aber "Validierung" erfordert einen Wechsel der Datentypen.

1.2 Das Missverhältnisproblem: Ausdruck ≠ DNA-Kopienzahl

Die operationalste Aussage ist:

  • Kopiennummer ist ein DNA-Ebene Eigenschaft (Lese Tiefe, allelische Imbalance, segmentierte Log2-Verhältnisse).
  • Ausdruck ist ein Ergebnis von Transkription + Verarbeitung + Stabilität + Zusammensetzung.

Wenn die Frage lautet "Haben wir CNV-Beweise?", ist die richtige Folgefrage: "Haben wir DNA-Beweise?"

Reasons RNA and CNV disagreeAbbildung 1. Gründe für die Diskrepanz zwischen RNA und CNV. Dieses Diagramm fasst fünf häufige Quellen der RNA-DNA-Diskrepanz zusammen (Regulation, Abbau, Batch, gemischte Zusammensetzung, Normalisierung). Verwenden Sie es als Checkliste, um zu entscheiden, ob ein RNA-seq CNV-ähnliches Muster vorliegt. nur Triage oder ob eine DNA-Validierung erforderlich ist, bevor Sie es als Beweis für die Kopienanzahl behandeln.

1.3 Was "Validierung" für partnerorientierte Datenpakete und interne Prüfungsunterlagen (RUO) bedeuten sollte

In der präklinischen Entdeckung bedeutet "Validierung" normalerweise, dass Sie diese mit nachvollziehbaren Dateien und Qualitätskontrolle beantworten können:

  1. Gibt es eine DNA-Ebene Kopienzahlveränderung am interessierenden Locus?
  2. Ist es fokal (Gen/Region) oder breit (Arm/ganzes Chromosom)?
  3. Ist das Signal über Durchgänge/Chargen/Replikate stabil?
  4. Kann ein anderes Team die Schlussfolgerung aus den Ergebnissen reproduzieren?

Das impliziert einen DNA-basierten Kopienzahl-Anker – oft ein standardisierter Arbeitsablauf, der auf genomweiten Profilierungen basiert, wie z. B. CNV-Sequenzierungsdienste für RUO-Projekte, die konsistente Segmentierungsergebnisse, QC-Zusammenfassungen und wiederverwendbare Artefakte erfordern.

2. RNA-seq CNV-Identifikation Einschränkungen (RUO-Triage vs. Validierung)

RNA-abgeleitete CNV-Aufrufe schlagen auf gemusterte Weise fehl. Behandeln Sie Folgendes als Risikoprüfliste: Wenn mehrere Punkte zutreffen, sollte RNA-seq CNV beibehalten werden. nur Triage bis DNA-Beweise hinzugefügt werden.

2.1 Gemischte Populationen und Zusammensetzungsverzerrung

Wenn Ihre Probe eine Mischung aus Subpopulationen ist, wird die RNA-Expression zu einer gewichteten Summe von Transkriptionsprogrammen. Selbst wenn ein Subklon einen echten Gewinn aufweist, kann die Expression verdünntIm Gegensatz dazu kann eine transcriptionell dominante Subpopulation einen Dosisschub nachahmen.

Typische RUO-Szenarien:

  • Xenotransplantat/PDX-abgeleitetes Material mit variable nicht-ziel Hintergrundinhalt (Modellzusammensetzung variiert…)
  • Zelllinien mit aufkommenden Subklonen im Laufe der Zeit
  • Organoid- oder Kultursysteme mit wechselnder Zusammensetzung

Praktische Implikation: RNA-abgeleitete CNV ist am wenigsten zuverlässig, wenn die Populationsstruktur instabil ist. Wenn Ihr Ziel Integritätsprüfungen des Modells umfasst, kombinieren Sie die Kopienzahlprofilierung mit Zelllinienidentifikation So Drift/Kontamination wird nicht mit Biologie verwechselt.

2.2 Wegweisende Ausdrucksänderungen, die eine Amplifikation nachahmen

Wegwechsler (Stressreaktion, Zellzyklusverschiebungen, hypoxieähnliche Programme usw.) können die Expression vieler Gene auf koordinierte Weise erhöhen. Wenn Sie die Expression entlang der genomischen Koordinaten glätten, kann diese Koordination einem "Segment" ähneln.

Die Falle: Genomische Nachbarschaft ist nicht die Kopienzahl.und funktionale Co-Regulation kann überzeugende CNV-ähnliche Ausdrucksbänder erzeugen.

False positive vs true amplificationAbbildung 2. Falsch positive vs. echte Amplifikation. Das linke Panel veranschaulicht eine regulierungsgetriebene RNA-Erhöhung ohne DNA-Zuwachs; das rechte Panel zeigt eine echte Amplifikation, die durch segmentierte DNA-Kopienzahlbeweise unterstützt wird. Nutzen Sie diesen Kontrast, um zu erklären, warum "hohe RNA" nicht gleichbedeutend mit "DNA-Zuwachs" ist, insbesondere bei fokalen Ereignissen.

2.3 Abdeckung und Normalisierungsartefakte (Bibliotheksgröße, Genlänge, GC-Bias, Kartierbarkeit)

RNA-Seq hat eine Messgeometrie, die DNA-CNV-Pipelines nicht haben:

  • Die Abdeckung variiert um Größenordnungen zwischen den Genen aufgrund der Expression.
  • GC, Transkriptlänge und Mapping-Ambiguität verzerren die Zählungen.
  • Normalisierungsentscheidungen verändern die relativen Formen entlang des Genoms.

Die meisten RNA-basierten CNV-Ansätze beruhen auf Glättung/Aggregation über Gene; wenn das lokale Gen-Set verzerrt ist (hoch exprimiert, GC-verschoben, schwer zuzuordnen), können "Segmente" technische Strukturen sein.

3. Wie man RNA-seq CNV mit DNA-Sequenzierung (Low-Pass WGS) validiert

DNA-basierte Kopienzahlprofilierung liefert direkte Beweise: Lese-Tiefe über das gesamte Genom (und optional allelische Signale), mit Bias-Korrektur und Segmentierung, die für die CNV-Inferenz ausgelegt sind. Für viele RUO-Workflows, Der Tiefpass-WGS ist oft ein praktischer Ausgangspunkt. wenn das Ziel eine umfassende CNA-Fingerabdruckanalyse (Arm-Ebene/ganze Chromosomenereignisse) und Modell-QC ist—und wenn Tiefe/Blockgröße/Pipeline-Einstellungen gewählt werden, um Ihren Auflösungsanforderungen gerecht zu werden.

3.1 Direkte Lesetiefenbeweise im gesamten Genom

Low-Pass-WGS (oder andere genomweite DNA-Strategien) misst relative Lese-Tiefe über Bins, was der wesentliche Vorteil ist: Sie interpretieren einen nachgelagerten Phänotyp nicht mehr als Kopienzahl.

Ein robuster DNA-CNV-Workflow umfasst typischerweise:

  • Genom-Binning (feste Fenster)
  • GC/Mappierbesserung
  • Problembereichsfilterung
  • Segmentierung (stückweise konstante Regionen)
  • Aufruf (relative Kopierzustände)
  • Genebasierte Zusammenfassungen, die von Segmenten abgebildet sind

Wenn Sie dies als kollaboratives oder ausgelagertes Arbeitspaket durchführen, stimmen Sie ab, was „prüfbare Nachweise“ bedeutet – ob Sie nur Segmente und Plots oder vollständige Nachvollziehbarkeit über Alignments-Dateien benötigen. Viele Teams standardisieren dies über End-to-End. Whole-Genome-Sequenzierung Workflows, die konsistente Bibliotheksvorbereitungs- und Analyseartefakte umfassen.

Vergleich von Low-Pass-WGS und Mikroarrays für CNV (Leitfaden).

3.2 Breite CNAs vs. fokale Ereignisse: Entscheiden Sie, was Sie beweisen müssen.

Ein wichtiger Grund, warum RNA-seq CNV fehlerhaft ist, besteht darin, dass alle Ereignisse als gleichwertig behandelt werden:

  • Breite Ereignisse (chromosom/arm) werden oft mit Low-Pass-WGS unterstützt. wenn Bin-Größe und Tiefe stabile Segmentierung ergeben.
  • Fokale Ereignisse (gene-level) erfordert mehr Informationen: ausreichende Bins/Ziele über das Locus und genügend Tiefe, um das Rauschen zu reduzieren.

Hier wird "Validierung" zu einer Entscheidung, nicht zu einem Slogan:

  • Wenn Ihre Frage lautet "Ist dieses Modell genomisch instabil?", kann eine Low-Pass-WGS angemessen sein. für umfassende CNA-Fingerabdruckerfassung im RUO-Modell QC.
  • Wenn Ihre Frage lautet "ist dieses Gen "verstärkt bei hoher Kopie?" Möglicherweise benötigen Sie eine Eskalation.

Assay-Auswahl-Mini-Matrix (RUO)

Analyse Am besten für (RUO) Typische Einschränkung Ausgabe, die "Validierung" unterstützt
Tiefpass-WGS Breite CNA-Fingerabdruck; Arm-niveau/ganze Chromosomen Verschiebungen; Modell-QC-Überwachung Weniger zuversichtlich bei sehr fokalen Grenzen, es sei denn, Design/Tiefe unterstützen es. Segmente + genomweite CN-Darstellung + QC-Zusammenfassung
Tiefer WGS Verbesserte Auflösung für fokale CN-Ereignisse und -Grenzen Höhere Kosten/Datenbelastung Segmente mit engerem Vertrauen; Locus-Schnappschüsse
Gezielte DNA-Sequenzierung Hochgradige Evidenz an vordefinierten Loci Nicht genomweit; erfordert vorherige Locus-Liste Lokus-spezifische Tiefenprofile + gezielte CN-Anrufe
Mikroarray (SNP/CNV-Arrays) Breite CNA in großen Kohorten; standardisierte Fußabdrücke Probenbegrenzte Regionen; weniger flexibel Probe-Ebene Log2-Verhältnisse + Segmente (plattformabhängig)
MLPA Spezifische Lokusbestätigung (kleine Zielgruppe) Nicht Entdeckung; nicht genomweit Zielwertdosierung mit Kontrollen

Wie man diese Matrix verwendet
Beginnen Sie mit der Formulierung des Anspruchs, den Sie unterstützen müssen. Wenn der Anspruch... breite Modellinstabilität oder ARM-Level CNA-Fingerabdruckerkennung, ist ein Tiefpass-WGS oft ein vernünftiger erster Schritt bereitgestellt Ihre Tiefe/Größenverteilung und Pipeline erzeugen stabile Segmentierung und QC-Durchlaufquoten. Wenn die Behauptung so ist Genebasierte Amplifikation (z. B. ein Treiberlocus für Mechanismus-Hypothesen) sollte Low-Pass-WGS als Kontext betrachtet und auf tiefere WGS oder gezielte DNA-Beweise zur Grenzkonfidenz eskaliert werden. Arrays können effizient für die Konsistenz großer Kohorten sein, während MLPA am besten zur Bestätigung einer kleinen Anzahl vordefinierter Loci reserviert ist. In allen Fällen sollte "Validierung" Ergebnisse umfassen, die von einem anderen Team geprüft werden können (QC-Zusammenfassung + Segmente + Locus-Schnappschüsse), nicht nur ein einzelnes Diagramm.

3.3 Prüfbare Ergebnisse: Was DNA hinzufügt, was RNA nicht kann

Bei der RUO-Zusammenarbeit schlägt die "Validierung" am häufigsten fehl, wenn das Ergebnis nicht erneut überprüft werden kann.

Ein DNA-basiertes CNV-Lieferpaket wird prüfbar, wenn es Folgendes umfasst:

  • QC-Zusammenfassung (Abgleichrate, Duplikation, Abdeckungsverteilung, GC-Bias-Indikatoren)
  • Per-Bin-Abdeckungs-Tabelle (Postkorrektur, falls für die Prüfung erforderlich)
  • Segmenttabelle (chrom, start, ende, log2 Verhältnis, aufruf/zustand)
  • Genebasierte CN-Zusammenfassung (Gene, Segmentüberlappung, abgeleiteter Zustand)
  • Handlungen (genomweite CN-Profil + Lokus-Schnappschüsse)
  • Ausrichtungsdateien (BAM/CRAM + Index), wenn die Anforderungen an die Reproduzierbarkeit streng sind

Wenn Ihre Validierung von einer kleinen Anzahl von Loci abhängt, können Sie hinzufügen Zielgerichtete Regionssequenzierung um das Vertrauen auf Genebene zu stärken, ohne eine gesamte Genomstrategie neu zu gestalten.

4. Praktisches Validierungs-Playbook für präklinische F&E

Dieser Abschnitt ist dafür vorgesehen, in einen Projektplan kopiert zu werden: wann zu validieren, wie man Diskrepanzen interpretiert und was in das Berichterstattungspaket aufgenommen werden soll.

4.1 Wann zu validieren: Kontrollpunkte, die an Entscheidungen gebunden sind

Modell QC-Prüfpunkte

  • Bei Erhalt/ Auftauen
  • Nach definierten Durchgangsfenstern
  • Vor großen Bildschirmen oder Störungsversuchen
  • Wenn sich der Phänotyp unerwartet ändert

Trefferselektion / Mechanismusprüfpunkte

  • Wenn ein Ziel vorgeschlagen wird, das dosierungsabhängig ist
  • Wenn "amplifikationssensible" Hypothesen priorisiert werden
  • Wenn Modelle über Kohorten/Zeitpunkte hinweg vergleichbar sein müssen

Wenn Sie mit wiederholtem Monitoring rechnen, wählen Sie einen Basisassay, der für Ihr Volumen und Ihre Ereignisklasse (breit vs. fokal) skalierbar ist, und definieren Sie im Voraus Eskalationstrigger.

4.2 Interpretation von Diskrepanzen (RNA hoch, aber CN neutral; CN Gewinn, aber RNA flach)

Diskrepanz ist nicht automatisch ein Fehler – es ist Information. Das Ziel ist, sie zu klassifizieren.

Fall A: RNA hoch, CN neutral
Am wahrscheinlichsten Erklärungen:

  • Transkriptionale Aktivierung / Signalwegprogramme
  • Zusammensetzungsverschiebung (Subpopulationseffekt)
  • Normalisierungsartefakte
  • Änderungen der RNA-Stabilität

RUO nächste Schritte:

  • Suchen Sie nach der Unterstützung von DNA-Segmenten: Bewegen sich benachbarte Regionen wie erwartet zusammen bei einem Gewinn?
  • Validieren Sie mit einer DNA-Kopienzahl-Baseline (breiter Kontext), und eskalieren Sie dann auf locus-fokussierte DNA, wenn die Behauptung auf Genebene erfolgt.

Fall B: CN Gewinn, RNA stabil
Häufige Erklärungen:

  • Gen in diesem Kontext inaktiv
  • Ausgleichende Regulierung
  • Isoform-spezifische Expression nicht in Ihrer Zusammenfassung dargestellt.
  • Allelspezifische Effekte

RUO nächste Schritte:

  • Bestätigen Sie die Grenzen: Liegt das Gen vollständig innerhalb des Segments?
  • Entscheiden Sie, ob CN als Charakterisierung (immer noch wertvoll) oder als erwartet, um die Expression zu steuern, verwendet wird.

Decision tree from RNA-seq CNV signal to DNA validationAbbildung 3. Entscheidungsbaum vom RNA-seq CNV-Signal zur DNA-Validierung. Dieser Entscheidungsbaum leitet ein RNA-seq CNV-ähnliches Signal in DNA-Validierungsoptionen basierend darauf, was Sie nachweisen müssen (breite CNA-Fingerabdruckanalyse vs. Bestätigung fokaler Loci). Verwenden Sie ihn, um die Eskalation zu standardisieren (Low-Pass → tiefere/gezielte Analysen) und um konsistente Interpretationen für diskordante Ergebnisse zu verfassen.

4.3 Berichtspaket (QC + Segmente + Genebene-Zusammenfassung)

Ein praktisches RUO "Validierungspaket" sollte Folgendes enthalten:

Minimum

  • Genom-weite CN-Plot mit Segmentierung
  • Segmenttabelle
  • Genebasierte Zusammenfassung für Loci von Interesse
  • QC-Zusammenfassung

Empfohlen für Nachvollziehbarkeit

  • Per-Bin-Zählungen nach der Korrektur (falls angefordert)
  • BAM/CRAM + Index (wenn Reproduzierbarkeitsstandards dies erfordern)
  • Parameter-Manifest (Bin-Größe, Referenz-Build, Segmentierungseinstellungen)

Wenn Sie planen, CN mit anderen genomischen Merkmalen zu integrieren, stimmen Sie die Ausgabeformate frühzeitig ab und halten Sie die Builds konsistent. Viele Teams kombinieren die CN-Charakterisierung mit standardisierten Variantenerkennung Liefergegenstände, damit die nachgelagerte Integration nicht zu einem Formatabgleichsprojekt wird.

5. Wo dies in präklinischen Onkologie-Modellen am wichtigsten ist

Leitplanke Alle Aussagen in diesem Abschnitt gelten. nur für nicht-klinische, RUO präklinische Modellcharakterisierung und Hypothesenbildung (z. B. Zelllinien, Xenotransplantate, PDX). Nichts hiervon ist für klinische Diagnosen, Behandlungsentscheidungen oder die Verwendung durch Patienten gedacht.

In der präklinischen Onkologie-Modellarbeit können Veränderungen der Kopienzahl die Gen-Dosierung verschieben, Abhängigkeiten von Signalwegen umgestalten und das Verhalten eines Modells in Screenings oder Störungsexperimenten verändern – daher bestimmt die CN-Evidenz oft, ob eine mechanistische Behauptung als plausibel oder spekulativ angesehen wird.

5.1 Bestätigung der Onkogenamplifikation

Wenn eine Hypothese davon abhängt, dass ein Gen amplifiziert wird, ist RNA allein selten ausreichend:

  • Die Aktivierung des Weges kann RNA erhöhen, ohne einen Gewinn zu erzielen.
  • Echte Gewinne können ohne dramatische RNA-Erhöhung existieren.
  • Grenzen (fokal vs. breit) verändern die Interpretation.

Eine gängige Eskalationsleiter:

  1. Niedrigpass-WGS für genomweite Kontexte und breite CNA-Fingerabdrücke (wenn geeignet für Ihre Tiefe/Größe der Bins/Pipeline)
  2. Tiefere oder gezielte DNA-Sequenzierung für die Vertrauenswürdigkeit von Gen-Grenzen
  3. Optionale orthogonale Bestätigung, falls von den Kriterien der internen Prüfung gefordert.

Wenn Sie eine gezielte Strategie für eine definierte Standortliste benötigen, Genpanel-Sequenzierungsdienst kann als fokussierte Bestätigungsebene in RUO-Einstellungen dienen.

Siehe die Präklinischer Onkologie CNA Arbeitsablaufleitfaden für Interpretationsbeispiele:

5.2 Verfolgung der genomischen Instabilität in Zelllinien und PDX-Modellen

Für das Modell QC lautet die Frage oft nicht "wird ein Gen amplifiziert?", sondern "hat sich das Modell verschoben?" Breite CNA-Muster können als Fingerabdrücke für die Verfolgung von Drift dienen – insbesondere in Kombination mit Identitätsüberprüfung und standardisierten Probenzeitpunkten.

Wenn Sie throughput-freundliches Monitoring benötigen, standardisieren Sie:

  • Zeitpunkte (Durchgangsfenster)
  • Eingang/SOP
  • Erwartungen an Tiefe/Behältergröße
  • Entscheidungsauslöser (neu bewerten, neu ableiten oder Profiling wiederholen)

Wo es für die Ziele des RUO-Projekts angemessen ist, sind Strategien mit geringer Abdeckung wie Skim-Sequenzierung kann ein genomisches Signal für breites Tracking (nicht für fokale Grenznachweise) beitragen.

5.3 Verknüpfung von CNA-Profilen mit Mechanismus-Hypothesen (Forschung)

CNA-Profile können Mechanismus-Hypothesen unterstützen, indem sie:

  • Unterscheidung zwischen breiter Instabilität und fokalen Treiber-ähnlichen Gewinnen
  • Priorisierung von dosissensitiven Wegen für die Nachverfolgung
  • Erläuterung divergierender Antworten unter verwandten Subklonen/Modellen

CNA wird am nützlichsten, wenn DNA den Anker bietet und RNA die Phänotyp-Schicht bereitstellt; die Integration von CN mit Transkriptomik (z. B. RNA-Seq) ist am effektivsten, wenn Sie RNA-abgeleitete CN nur für die Triage verwenden und DNA zur Validierung einsetzen.

QC und Fehlersuche (RUO): Schwellenwerte, Symptome, Ursachen, Lösungen

Verwenden Sie dies als eine Tabelle "Symptom → wahrscheinliche Ursache → wie zu überprüfen → was zu tun ist" für interne Überprüfungen oder Gespräche mit Anbietern.

Symptom Wahrscheinliche Ursache Schnelle Überprüfung Praktische Lösung (RUO)
Das genomweite CN-Profil ist "wellig" mit vielen kleinen Oszillationen. Residual GC-/Mappabilitätsbias; Bins zu klein für die Tiefe Abdeckung vs. GC-Trend; erhöhte Varianz Erhöhen Sie die Bin-Größe; verfeinern Sie die GC-Korrektur; maskieren Sie problematische Bereiche.
Übersegmentierung (zu viele Segmente) Hoher Lärm (geringe Tiefe), schwache Referenz, aggressive Segmentierung Segmentanzahl + log2 Varianz Tiefe erhöhen; Segmentierungsstrafen anpassen; übereinstimmende Referenz verwenden
RNA deutet auf einen fokalen Gewinn hin, aber DNA zeigt keinen. Regulierungs-/Zusammensetzungsstörung Überprüfen Sie das Locus-Nachbarschaft in Segmenten. Betrachten Sie es als Vorschrift, bis locus-fokussierte DNA dies unterstützt.
DNA zeigt breite Gewinne/Verluste, aber RNA ist flach. Gen inaktiv, Regulationspufferung Basisexpression/Isoformen; Replikatkonsistenz Behalte CN als Charakterisierung bei; vermeide es, RNA-Kongruenz zu erzwingen.
Replikate stimmen nicht überein Batch-/Zusammensetzungs-/Bibliotheksvariabilität QC-Deltas; Korrelation replizieren Protokoll standardisieren; Replikat/Zeitpunkt hinzufügen; Pipeline sperren
CN verschiebt sich über Passagen hinweg Drift/Kontamination/Subklon-Auswahl Identität + CNA-Fingerabdruck Re-Bank; Passage-SOP straffen; regelmäßig überwachen

Daumenregel-Akzeptanzprüfungen (Beispiele für RUO-Auditpakete)

Diese sind Beispielprüfungen "akzeptabel" vs "erneut ausführen/eskalieren" operationalisieren. Passen Sie die Schwellenwerte an Ihr Organismus/Build/Pipeline an, halten Sie sie jedoch explizit:

  • Mapping-Rate: zielen auf ≥95% ausgerichtete Reads (Flag, wenn <90%).
  • Duplikatquote: untersuchen, ob >50% (insbesondere wenn es mit lauter Segmentierung zusammenfällt).
  • Abdeckungsuniformität (Bin-Ebene): wenn die genomweite Log2-Verhältnisverteilung ungewöhnlich breit ist (z. B., MAD > 0,25), erwarten Sie instabile Segmentierung und ziehen Sie eine Anpassung der Tiefe/der Bin-Größe in Betracht.
  • Segment-Sinnhaftigkeit: Wenn Sie Hunderte von Mikrosegmenten in ansonsten stabilen Proben sehen, behandeln Sie dies als einen QC-Fehlermodus (Rauschen/Überanpassung) und nicht als "echte Biologie".
  • Konkordanz replizieren: Erfordern Sie eine klare qualitative Übereinstimmung für bedeutende Ereignisse auf Arm-Ebene; für fokale Ansprüche sind locus-fokussierte Beweise erforderlich.

Für die Charakterisierung von Kopienzahlen im Kohortenmaßstab kann die Konsistenz der Plattform von Bedeutung sein; einige Teams verwenden weiterhin Array-Workflows für die Vergleichbarkeit bei hohem Volumen, während andere auf sequenzierungsbasierte CN standardisieren. Wenn Arrays Teil Ihrer RUO-Strategie sind, SNP-Mikroarray ist eine Option für umfassendes CNA-Profiling im großen Maßstab, während MLPA-Test ist am besten geeignet, um eine kleine Anzahl vordefinierter Loci zu bestätigen (nicht zur Entdeckung).

Entscheidungsrahmen: Wann RNA-seq CNV-Signale verwenden und wann mit DNA validieren

Wann RNA-seq CNV-ähnliche Signale verwendet werden können (nur Triage)

  • Sie benötigen eine grobe Einschätzung der allgemeinen Instabilität.
  • Sie haben prozessangepasste Kohorten und eine stabile Zusammensetzung.
  • Ihre Pipeline-Annahmen sind für Ihren Kontext validiert.
  • Sie werden das Ergebnis nicht als Beweis für die DNA-Kopienzahl behandeln.

Wann Sie mit DNA validieren sollten (empfohlen für die meisten präklinischen Entscheidungen)

  • Sie müssen bestätigen. Genkopienzahlvariation an einem bestimmten Locus
  • Sie schließen die Modellcharakterisierung für die Zusammenarbeit ab.
  • Sie benötigen lieferbare Ergebnisse, die erneut auditiert werden können (Segmente/QC).
  • Ihre Proben haben eine variable Zusammensetzung oder Batch-Struktur.
  • Sie treffen kostspielige Entscheidungen im Nachgang, die von einer Dosierung ausgehen.

Häufig gestellte Fragen

Kann ich CNV zuverlässig aus Bulk-RNA-Seq ableiten?

Manchmal kann man allgemeine Trends ableiten, aber die Zuverlässigkeit hängt von der Kohortenanpassung, der Stabilität der Zusammensetzung und den Annahmen über den Prozess ab. In den meisten RUO-Workflows wird RNA-abgeleiteter CNV am besten als Triage behandelt und dann mit DNA-Beweisen validiert, bevor er als Nachweis für die Kopienzahl verwendet wird.

2) Wenn RNA stark hochreguliert ist, bedeutet das dann eine Amplifikation?

Nicht unbedingt. Regulierung, Programmwege und Zusammensetzungsänderungen können starke Ausdruckssteigerungen ohne DNA-Zuwachs bewirken. Verwenden Sie segmentierte DNA-Beweise, um die Amplifikation zu bestätigen, insbesondere bei fokalen Ansprüchen.

3) Was ist ein skalierbarer Ansatz zur DNA-Validierung für viele Modelle?

Niedrigpass-WGS ist oft praktisch. für umfassende CNA-Fingerabdruckerfassung und Ereignisse auf Arm-Ebene Im RUO-Modell QC hängt die Leistung jedoch von der Tiefe/der Bin-Größe/den Pipeline-Einstellungen und der gewünschten Auflösung ab.

4) Wie entscheide ich mich zwischen Low-Pass-WGS und gezielter Validierung?

Wenn Sie genomweite Kontexte und Drift-Fingerabdrücke benötigen, beginnen Sie mit Low-Pass-WGS. Wenn Sie die Vertrauenswürdigkeit von Gen-Grenzen benötigen, steigen Sie auf tiefere WGS oder gezielte DNA-Sequenzierung um den Locus herum um.

5) Welche Ergebnisse sollte ich anfordern, damit das Ergebnis überprüfbar ist?

Mindestens: QC-Zusammenfassung, Segmenttabelle, Genebene-Zusammenfassung und Diagramme. Für strikte Reproduzierbarkeit: Zählungen pro Bin und Ausrichtungsdateien (BAM/CRAM + Index), sowie ein Parameter-/Einstellungsmanifest.

6) Warum könnte DNA einen CN-Gewinn zeigen, während RNA konstant bleibt?

Das Gen könnte in diesem Kontext inaktiv sein, oder die Regulation puffert die Expression. CN kann dennoch für die Modellcharakterisierung gültig sein, auch wenn RNA nicht reagiert.

7) Warum könnte RNA CNV-ähnlich aussehen, während DNA neutral ist?

Am häufigsten auftretende Artefakte bei Regulierung/Zusammensetzung/Normalisierung. Betrachten Sie RNA als Hypothese-generierend, bis DNA-Beweise einen Gewinn/Verlust unterstützen.

8) Wie oft sollte ich die Kopienzahl in Zelllinien erneut überprüfen?

An wichtigen operativen Kontrollpunkten: beim Empfang/Auftauen, nach definierten Durchgangsfenstern, vor wichtigen Bildschirmen und wenn sich die Phänotypen ändern. Die Häufigkeit sollte mit der Sensitivität Ihrer nachgelagerten Entscheidungen gegenüber Abweichungen übereinstimmen.

Referenzen

  1. Talevich E, Shain AH, Botton T, Bastian BC. CNVkit: Genomweite Erkennung und Visualisierung von Kopienzahlen aus gezielter DNA-Sequenzierung. PLOS Computational Biology (2016). Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text ein, den Sie übersetzt haben möchten.
  2. Flensburg C, et al. Erkennung von Kopienzahlveränderungen in RNA-Seq mit SuperFreq. Bioinformatik (2021). Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text ein, den Sie übersetzen möchten.
  3. Serin Harmanci A, et al. CaSpER identifiziert und visualisiert CNV-Ereignisse durch integrative Analyse von Einzelzell- oder Bulk-RNA-Sequenzierungsdaten. Naturkommunikation (2019). Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text ein, den Sie übersetzt haben möchten.
  4. Scheinin I, et al. DNA-Kopienzahlanalyse von frischen und formalinfixierten Proben durch flächendeckende Genomsequenzierung mit Identifizierung und Ausschluss problematischer Regionen in der Genomassemblierung. Genomforschung (2014). Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen oder darauf zugreifen. Wenn Sie den Text, den Sie übersetzen möchten, hier einfügen, helfe ich Ihnen gerne dabei.
  5. Wang N, Tao Z-Y, Wu T, et al. Benchmarking der Erkennung von Kopienzahlvariationen mit niedrigdeckender Ganzgenomsequenzierung. Briefings in Bioinformatik (2025). Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text, den Sie übersetzt haben möchten, direkt hier ein.
  6. Bioconductor. infercnv: Kopienzahlvariation aus Einzelzell-RNA-Seq-Daten ableiten. Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text ein, den Sie übersetzt haben möchten.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben