Identifizierung von DMC, DMR und DMG in der DNA-Methylierungsanalyse

DNA-Methylierung, eine chemische Modifikation der DNA, kann die genetische Expression beeinflussen, ohne die DNA-Sequenz zu verändern. Sie umfasst die kovalente Bindung einer Methylgruppe an die 5-Kohlenstoff-Position des Cytosins im genomischen CpG-Dinukleotid durch die Wirkung der DNA-Methyltransferase. Dieser Prozess hat sich als fähig erwiesen, Veränderungen in der Chromatinstruktur, der DNA-Konformation, der DNA-Stabilität und den DNA-Protein-Interaktionen hervorzurufen, wodurch die Genexpression reguliert wird.

Für das Data Mining folgt die DNA-Methylierungsanalyse typischerweise drei Schritten:

  • Analyse von genomweiten MethylierungsänderungenDies umfasst die Bewertung von Veränderungen des durchschnittlichen Methylierungsniveaus, Veränderungen in der Verteilung des Methylierungsniveaus, die Durchführung von Dimensionsreduktion-Analysen, Clusteranalysen, Korrelationsanalysen und anderen verwandten Techniken.
  • Analyse des Methylierungsunterschiedsniveaus: Dieser Schritt umfasst die Identifizierung spezifischer differentieller Gene durch die Identifizierung von DMC/DMR/DMG (differenziell methylierten CpGs/Regionen/Genen), die Lokalisierung von DMC/DMR auf genomischen Elementen, die Durchführung von TF (Transkriptionsfaktor) Bindungsanalysen an DMC/DMR, die Implementierung von Analyse-Strategien für Zeitreihen-Methylierungsdaten und die Durchführung einer funktionalen Analyse von DMG.
  • Methylierungsgenomik & Transkriptomik-AssoziationsanalyseIn dieser Phase wird die Gesamtassoziation von Meta-Genen bewertet, sowie die korrespondierende Assoziation zwischen DMG (differenziell methylierten Genen) und DEG (differenziell exprimierten Genen) sowie die Erstellung von Netzwerkassoziationen.

Wie führt man dann die Analyse des differentiellen Methylierungsniveaus durch, um DMC, DMR und DMG in spezifischen differentiellen Genen zu identifizieren?

Differenzielle Methylierungsstellen-/Regionen-Analyse - DMC/DMR-Analyse

(1) DMC/DMR Identifikation

In diesem Schritt besteht das Hauptziel darin, spezifische Stellen (DMCs) und Regionen (DMRs) im Genom zu identifizieren, an denen eine unterschiedliche Methylierung zwischen verschiedenen experimentellen Gruppen auftritt. Dies kann den Vergleich der Methylierungslevel zwischen Krankheits- und Kontrollproben, behandelten und unbehandelten Proben oder verschiedenen Zeitpunkten in einem Zeitverlaufsexperiment umfassen.

  • DMC (Differential Methylation Site) Identifikation: Statistische Tests werden auf einzelne CpG-Stellen angewendet, um festzustellen, ob es signifikante Unterschiede in den Methylierungslevels zwischen den experimentellen Gruppen gibt. CpG-Stellen, die statistisch signifikante Unterschiede aufweisen, werden als DMCs bezeichnet.
  • DMR (Differentially Methylated Region) Identifikation: DMCs, die sich in unmittelbarer Nähe zueinander befinden, werden zu DMRs gruppiert. Verschiedene Algorithmen und statistische Methoden werden verwendet, um Regionen des Genoms mit koordinierten Veränderungen in der Methylierung zu identifizieren.

(2) DMC/DMR Transkriptionsfaktor-Bindungsanalyse (TF-Bindungsmotiv)

Der Fokus in diesem Schritt liegt darauf, zu untersuchen, ob DMCs/DMRs mit bekannten Bindungsstellen von Transkriptionsfaktoren (TF) überlappen, insbesondere in regulatorischen Regionen wie Promotoren und Enhancern.

TF-Bindungsmotiv-Analyse: Bioinformatik-Tools und Datenbanken werden verwendet, um TF-Bindungsmotive an DMCs/DMRs vorherzusagen. Diese Informationen können Einblicke in die potenziellen regulatorischen Faktoren geben, die an der differentiellen Methylierung beteiligt sind.

(3) Analyse-Strategie von temporalen Methylierungsdaten (Zeitverlauf)

Wenn das experimentelle Design mehrere Zeitpunkte oder Zeitverlaufsdaten umfasst, wird die Analyse-Strategie angepasst, um Veränderungen in der Methylierung über die Zeit zu vergleichen.

  • Vergleich zwischen benachbarten Zeitpunkten: Unterschiede in den Methylierungsprofilen zwischen angrenzenden Zeitpunkten werden bewertet, um dynamische Veränderungen zu identifizieren.
  • Direktes Screening von zeitabhängigen DMCs und DMRs: Spezifische DMCs/DMRs, die über die Zeitpunkte hinweg konsistente Veränderungen zeigen, werden identifiziert.
  • Lineares Modell/Hybirdes Lineares Modell: Statistische Modelle, wie die lineare Regression oder hybride lineare Modelle, werden verwendet, um Störfaktoren (z. B. Geschlecht) zu berücksichtigen und zeitbezogene Veränderungen in der Methylierung zu bewerten.
  • Co-Methylierungs-Musteranalyse (Stufen-spezifische Cluster-Screening): Cluster-Methoden wie WGCNA, MEGENA und mfuzz können angewendet werden, um Gruppen von co-methylisierten Standorten oder Regionen zu identifizieren, die ähnliche Muster über verschiedene Stufen oder Zeitpunkte hinweg aufweisen.

(4) DMC/DMR-Verteilung auf Gen-Elementen

In dieser Phase führen wir eine eingehende Untersuchung der genomischen Lokalisation von unterschiedlich methylierten CpGs (DMCs) und unterschiedlich methylierten Regionen (DMRs) durch, wobei wir uns auf ihre Verteilung innerhalb verschiedener Genelemente konzentrieren.

  • Analyse von Transponierbaren Elementen (TE): Transponierbare Elemente stellen genomische Entitäten dar, die innerhalb des Genoms mobilisieren können und das Potenzial haben, erhebliche Auswirkungen auf die Genomstabilität auszuüben. Die Untersuchung ihrer Methylierungsmuster bietet wertvolle Einblicke in die komplexe Regulation des Genoms.
  • Promoteranalyse: Die Aufklärung von Veränderungen in der Methylierung innerhalb von Genpromotoren hat entscheidende Auswirkungen auf die Genexpression, da sie die Bindung wichtiger Transkriptionsfaktoren und der RNA-Polymerase beeinflussen kann.
  • Genkörperanalyse: Das Eintauchen in die Methylierungsmuster innerhalb der Genkörper ist auch relevant für die Genexpression und alternative Spleißprozesse, die wiederum das funktionale Ergebnis der Gene beeinflussen.

Die DMC/DMR-Analyse umfasst einen vielschichtigen Ansatz, der rechnergestützte Methoden, strenge statistische Analysen und die Integration vielfältiger genomischer Informationen beinhaltet. Diese umfassende Methodik ermöglicht es uns, charakteristische Muster von DNA-Methylierungsänderungen aufzudecken und deren potenzielle funktionale Konsequenzen zu erläutern. Letztendlich bieten die Ergebnisse dieser Untersuchung wertvolle Einblicke in die komplexen epigenetischen Mechanismen, die die Genexpression steuern, und werfen somit Licht auf die zugrunde liegenden molekularen Grundlagen verschiedener biologischer Prozesse und pathologischer Zustände.

Funktionale Analyse von unterschiedlich methylierten Genen (DMGs)

Die funktionale Analyse von unterschiedlich methylierten Genen (DMGs) ist ein entscheidender Schritt, um die biologischen Prozesse und Wege zu verstehen, die durch Veränderungen der DNA-Methylierung beeinflusst werden. DMGs sind Gene, die mindestens eine unterschiedlich methylierte Region (DMR) haben, die ihrem Promotor oder Genkörper zugeordnet ist. DMRs im Promotorbereich haben das Potenzial, die Genexpression zu beeinflussen, während DMRs im Genkörperbereich oft eine positive Korrelation mit den Genexpressionsniveaus zeigen. Die Analyse dieser DMGs kann wertvolle Einblicke in die regulatorischen Funktionen der DNA-Methylierung bieten.

(1) Kategorisierung von DMGs

  • Hyper-DMG: Gene, die im Vergleich zur Kontrollgruppe erhöhte DNA-Methylierungsniveaus in den DMRs zeigen. Eine erhöhte Methylierung in der Promotorregion kann zu einer Transkriptionshemmung führen.
  • Hypo-DMG: Gene, die im Vergleich zur Kontrollgruppe verringerte DNA-Methylierungsniveaus in den DMRs aufweisen. Eine verringerte Methylierung im Bereich des Genkörpers kann mit einer erhöhten Genexpression assoziiert sein.

(2) Promoter-DMG und Genebody-DMG

  • Promoter-DMG: Gene mit unterschiedlich methylierten Regionen in ihren Promotorregionen. Diese Gene können aufgrund von Veränderungen in der Promotormethylierung eine veränderte transkriptionale Regulation erfahren.
  • Genebody-DMG: Gene mit unterschiedlich methylierten Regionen in ihren Genkörperregionen. Methylierungsänderungen im Genkörper können die Genexpression und alternatives Splicing beeinflussen.

(3) Funktionelle Anreicherungsanalyse

Die funktionelle Anreicherungsanalyse ist ein entscheidender Untersuchungsansatz, der wertvolle Einblicke in die komplexe Landschaft der DNA-Methylierungsänderungen und deren Auswirkungen in verschiedenen biologischen Kontexten bietet. Diese Analyse umfasst die Untersuchung der Genontologie (GO), um angereicherte biologische Prozesse, molekulare Funktionen und zelluläre Komponenten zu erkennen, die mit differentiell methylierten Genen (DMGs) verbunden sind. Darüber hinaus erstreckt sich die Untersuchung auf die KEGG-Pfad-Analyse, die die signifikante Anreicherung von DMGs innerhalb verschiedener biologischer Pfade aufzeigt und somit ihren funktionalen Kontext beleuchtet.

Darüber hinaus enthüllt die Erforschung der Reactome-Pfad-Analyse die spezifischen molekularen Wege und Signalwege, an denen DMGs beteiligt sind. Durch die Integration von DisGeNET-Krankheiten und der Krankheitsontologie-Analyse erhalten Forscher wertvolle Einblicke in die Assoziation von DMGs mit bestimmten Krankheiten und krankheitsbezogenen Begriffen, was entscheidende Hinweise auf die potenzielle Rolle der DNA-Methylierung in der Krankheitsentstehung liefert.

Zweifellos ermöglicht die eingehende funktionale Analyse von DMGs den Forschern, ein umfassendes Verständnis des komplexen Zusammenspiels zwischen Veränderungen der DNA-Methylierung und verschiedenen biologischen Prozessen zu fördern. Folglich erleichtert dieses Unterfangen die Formulierung von Hypothesen über die regulatorischen Rollen der DNA-Methylierung und deren Auswirkungen in verschiedenen physiologischen und pathologischen Kontexten. Letztendlich trägt die Zusammenführung von epigenetischen und funktionellen Genomdaten erheblich zu einem tiefen Verständnis der Genregulation und der Komplexität zugrunde liegender zellulärer Prozesse bei.

Differenzielle Methylierungsgrad-Erkennung

Der oben beschriebene Workflow zur Erkennung und Analyse von differentieller Methylierungsniveaus umfasst mehrere wichtige Schritte, darunter die DMR-Erkennung, DMR-Annotierung, funktionale Analyse von differentiell methylierte Genen (DMGs) und die Visualisierung von DMRs. Dieser umfassende Ansatz ermöglicht es Forschern, Regionen mit signifikanten Veränderungen der DNA-Methylierung zu identifizieren, ihre potenziellen funktionalen Implikationen zu verstehen und die Ergebnisse zur besseren Interpretation zu visualisieren.

(1) Erkennung von differentieller Methylierungsregionen (DMR)

DMRs werden mit der Software Metilene erkannt, die einen binären Segmentierungsalgorithmus in Kombination mit doppelten statistischen Tests (MWU-Test und 2D-KS-Test) verwendet.

Die folgenden Kriterien werden verwendet, um DMRs zu definieren:

  • Sequenzierungstiefe jeder CpG-Stelle >= 5x.
  • Differenzielle Methylierung von CpG-Stellen >= 0,2 (was auf eine erhebliche Veränderung der Methylierungsniveaus hinweist).
  • Anzahl der unterschiedlich methylierten CpG-Stellen in der Region >= 5 (um eine ausreichende Abdeckung sicherzustellen).
  • Abstand zwischen benachbarten unterschiedlich methylierten CpG-Stellen <= 300 bp.
  • MWU-Test p-Wert < 0,05 (was auf statistische Signifikanz hinweist).

CpG-Stellen, die diese Kriterien erfüllen, werden verwendet, um die unterschiedlich methylierten Regionen zu definieren.

(2) Annotation von differentiellen Methylierungsregionen (DMR)

Die identifizierten DMRs sind jeweils den Genkörper- und Promotorregionen zugeordnet. Dieser Schritt hilft dabei, die DMRs mit spezifischen Genen zu verknüpfen und ihre potenziellen regulatorischen Auswirkungen auf die Genexpression zu verstehen.

(3) Funktionale Analyse von unterschiedlich methylierten Genen (DMGs)

Die GO (Gene Ontology) und KEGG (Kyoto Encyclopedia of Genes and Genomes) Anreicherung Analyse wird durchgeführt, um die Funktionen der DMGs zu untersuchen. Die Anreicherung der DMGs in GO-Begriffen und KEGG-Wegen wird mithilfe eines hypergeometrischen Verteilungstests analysiert. Diese Analyse liefert Einblicke in die biologischen Prozesse und Wege, die durch die differentielle DNA-Methylierung beeinflusst werden.

(4) Visualisierung von unterschiedlich methylierten Regionen (DMRs)

Aufgrund der großen Anzahl an DMRs werden die 20 besten DMRs mit Q-Wert (angepasster p-Wert) für die Visualisierung ausgewählt.

Durch die Befolgung dieses Arbeitsablaufs können Forscher unterschiedlich methylierten Regionen identifizieren und charakterisieren, Einblicke in die potenziellen funktionalen Konsequenzen von Veränderungen der DNA-Methylierung gewinnen und die Ergebnisse effektiv visualisieren, um die Dateninterpretation und Hypothesenbildung zu unterstützen.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben