DNA-Methylierung, eine chemische Modifikation der DNA, kann die genetische Expression beeinflussen, ohne die DNA-Sequenz zu verändern. Sie umfasst die kovalente Bindung einer Methylgruppe an die 5-Kohlenstoff-Position des Cytosins im genomischen CpG-Dinukleotid durch die Wirkung der DNA-Methyltransferase. Dieser Prozess hat sich als fähig erwiesen, Veränderungen in der Chromatinstruktur, der DNA-Konformation, der DNA-Stabilität und den DNA-Protein-Interaktionen hervorzurufen, wodurch die Genexpression reguliert wird.
Für das Data Mining folgt die DNA-Methylierungsanalyse typischerweise drei Schritten:
Wie führt man dann die Analyse des differentiellen Methylierungsniveaus durch, um DMC, DMR und DMG in spezifischen differentiellen Genen zu identifizieren?
(1) DMC/DMR Identifikation
In diesem Schritt besteht das Hauptziel darin, spezifische Stellen (DMCs) und Regionen (DMRs) im Genom zu identifizieren, an denen eine unterschiedliche Methylierung zwischen verschiedenen experimentellen Gruppen auftritt. Dies kann den Vergleich der Methylierungslevel zwischen Krankheits- und Kontrollproben, behandelten und unbehandelten Proben oder verschiedenen Zeitpunkten in einem Zeitverlaufsexperiment umfassen.
(2) DMC/DMR Transkriptionsfaktor-Bindungsanalyse (TF-Bindungsmotiv)
Der Fokus in diesem Schritt liegt darauf, zu untersuchen, ob DMCs/DMRs mit bekannten Bindungsstellen von Transkriptionsfaktoren (TF) überlappen, insbesondere in regulatorischen Regionen wie Promotoren und Enhancern.
TF-Bindungsmotiv-Analyse: Bioinformatik-Tools und Datenbanken werden verwendet, um TF-Bindungsmotive an DMCs/DMRs vorherzusagen. Diese Informationen können Einblicke in die potenziellen regulatorischen Faktoren geben, die an der differentiellen Methylierung beteiligt sind.
(3) Analyse-Strategie von temporalen Methylierungsdaten (Zeitverlauf)
Wenn das experimentelle Design mehrere Zeitpunkte oder Zeitverlaufsdaten umfasst, wird die Analyse-Strategie angepasst, um Veränderungen in der Methylierung über die Zeit zu vergleichen.
(4) DMC/DMR-Verteilung auf Gen-Elementen
In dieser Phase führen wir eine eingehende Untersuchung der genomischen Lokalisation von unterschiedlich methylierten CpGs (DMCs) und unterschiedlich methylierten Regionen (DMRs) durch, wobei wir uns auf ihre Verteilung innerhalb verschiedener Genelemente konzentrieren.
Die DMC/DMR-Analyse umfasst einen vielschichtigen Ansatz, der rechnergestützte Methoden, strenge statistische Analysen und die Integration vielfältiger genomischer Informationen beinhaltet. Diese umfassende Methodik ermöglicht es uns, charakteristische Muster von DNA-Methylierungsänderungen aufzudecken und deren potenzielle funktionale Konsequenzen zu erläutern. Letztendlich bieten die Ergebnisse dieser Untersuchung wertvolle Einblicke in die komplexen epigenetischen Mechanismen, die die Genexpression steuern, und werfen somit Licht auf die zugrunde liegenden molekularen Grundlagen verschiedener biologischer Prozesse und pathologischer Zustände.
Die funktionale Analyse von unterschiedlich methylierten Genen (DMGs) ist ein entscheidender Schritt, um die biologischen Prozesse und Wege zu verstehen, die durch Veränderungen der DNA-Methylierung beeinflusst werden. DMGs sind Gene, die mindestens eine unterschiedlich methylierte Region (DMR) haben, die ihrem Promotor oder Genkörper zugeordnet ist. DMRs im Promotorbereich haben das Potenzial, die Genexpression zu beeinflussen, während DMRs im Genkörperbereich oft eine positive Korrelation mit den Genexpressionsniveaus zeigen. Die Analyse dieser DMGs kann wertvolle Einblicke in die regulatorischen Funktionen der DNA-Methylierung bieten.
(1) Kategorisierung von DMGs
(2) Promoter-DMG und Genebody-DMG
(3) Funktionelle Anreicherungsanalyse
Die funktionelle Anreicherungsanalyse ist ein entscheidender Untersuchungsansatz, der wertvolle Einblicke in die komplexe Landschaft der DNA-Methylierungsänderungen und deren Auswirkungen in verschiedenen biologischen Kontexten bietet. Diese Analyse umfasst die Untersuchung der Genontologie (GO), um angereicherte biologische Prozesse, molekulare Funktionen und zelluläre Komponenten zu erkennen, die mit differentiell methylierten Genen (DMGs) verbunden sind. Darüber hinaus erstreckt sich die Untersuchung auf die KEGG-Pfad-Analyse, die die signifikante Anreicherung von DMGs innerhalb verschiedener biologischer Pfade aufzeigt und somit ihren funktionalen Kontext beleuchtet.
Darüber hinaus enthüllt die Erforschung der Reactome-Pfad-Analyse die spezifischen molekularen Wege und Signalwege, an denen DMGs beteiligt sind. Durch die Integration von DisGeNET-Krankheiten und der Krankheitsontologie-Analyse erhalten Forscher wertvolle Einblicke in die Assoziation von DMGs mit bestimmten Krankheiten und krankheitsbezogenen Begriffen, was entscheidende Hinweise auf die potenzielle Rolle der DNA-Methylierung in der Krankheitsentstehung liefert.
Zweifellos ermöglicht die eingehende funktionale Analyse von DMGs den Forschern, ein umfassendes Verständnis des komplexen Zusammenspiels zwischen Veränderungen der DNA-Methylierung und verschiedenen biologischen Prozessen zu fördern. Folglich erleichtert dieses Unterfangen die Formulierung von Hypothesen über die regulatorischen Rollen der DNA-Methylierung und deren Auswirkungen in verschiedenen physiologischen und pathologischen Kontexten. Letztendlich trägt die Zusammenführung von epigenetischen und funktionellen Genomdaten erheblich zu einem tiefen Verständnis der Genregulation und der Komplexität zugrunde liegender zellulärer Prozesse bei.
Der oben beschriebene Workflow zur Erkennung und Analyse von differentieller Methylierungsniveaus umfasst mehrere wichtige Schritte, darunter die DMR-Erkennung, DMR-Annotierung, funktionale Analyse von differentiell methylierte Genen (DMGs) und die Visualisierung von DMRs. Dieser umfassende Ansatz ermöglicht es Forschern, Regionen mit signifikanten Veränderungen der DNA-Methylierung zu identifizieren, ihre potenziellen funktionalen Implikationen zu verstehen und die Ergebnisse zur besseren Interpretation zu visualisieren.
(1) Erkennung von differentieller Methylierungsregionen (DMR)
DMRs werden mit der Software Metilene erkannt, die einen binären Segmentierungsalgorithmus in Kombination mit doppelten statistischen Tests (MWU-Test und 2D-KS-Test) verwendet.
Die folgenden Kriterien werden verwendet, um DMRs zu definieren:
CpG-Stellen, die diese Kriterien erfüllen, werden verwendet, um die unterschiedlich methylierten Regionen zu definieren.
(2) Annotation von differentiellen Methylierungsregionen (DMR)
Die identifizierten DMRs sind jeweils den Genkörper- und Promotorregionen zugeordnet. Dieser Schritt hilft dabei, die DMRs mit spezifischen Genen zu verknüpfen und ihre potenziellen regulatorischen Auswirkungen auf die Genexpression zu verstehen.
(3) Funktionale Analyse von unterschiedlich methylierten Genen (DMGs)
Die GO (Gene Ontology) und KEGG (Kyoto Encyclopedia of Genes and Genomes) Anreicherung Analyse wird durchgeführt, um die Funktionen der DMGs zu untersuchen. Die Anreicherung der DMGs in GO-Begriffen und KEGG-Wegen wird mithilfe eines hypergeometrischen Verteilungstests analysiert. Diese Analyse liefert Einblicke in die biologischen Prozesse und Wege, die durch die differentielle DNA-Methylierung beeinflusst werden.
(4) Visualisierung von unterschiedlich methylierten Regionen (DMRs)
Aufgrund der großen Anzahl an DMRs werden die 20 besten DMRs mit Q-Wert (angepasster p-Wert) für die Visualisierung ausgewählt.
Durch die Befolgung dieses Arbeitsablaufs können Forscher unterschiedlich methylierten Regionen identifizieren und charakterisieren, Einblicke in die potenziellen funktionalen Konsequenzen von Veränderungen der DNA-Methylierung gewinnen und die Ergebnisse effektiv visualisieren, um die Dateninterpretation und Hypothesenbildung zu unterstützen.