DNA-Methylierung, ein wesentlicher epigenetischer Prozess, spielt eine entscheidende Rolle bei der Genregulation und verschiedenen biologischen Prozessen. Die CpG-Dichte, die Häufigkeit von CpG-Dinukleotiden in einem bestimmten genomischen Bereich, hat sich als ein entscheidender Faktor in der Analyse der DNA-Methylierung herausgestellt. Verschiedene molekulare Techniken wurden entwickelt, um die Muster der DNA-Methylierung in Genomen zu untersuchen. In diesem Artikel beabsichtigen wir, drei weit verbreitete Methoden zu vergleichen: Methylierte DNA-Immunpräzipitation gefolgt von Sequenzierung (MeDIP-Seq), Reduzierte Repräsentation-Bisulfid-Sequenzierung (RRBS) und Whole-Genome-Bisulfid-Sequenzierung (WGBS). Wir analysieren ihre Präferenzen für verschiedene CpG-Dichtebereiche und heben ihre Stärken und Einschränkungen in der DNA-Methylierungsanalyse hervor.
Genomische Regionen können basierend auf ihrer CpG-Dichte in verschiedene Kategorien eingeteilt werden, wie CpG-Inseln (CGIs), CpG-Ufer, CpG-Regale und CpG-kontinentale Regale. Frühere genomweite Analysen in verschiedenen Arten, einschließlich Mensch, Ratte, Vogel und Fisch, haben gezeigt, dass die Mehrheit der genomischen Regionen zur Kategorie mit niedriger Dichte (1-3 CpG/100bp) gehört. Hochdichte Regionen (>5 CpG/100bp) machen weniger als 10% des Genoms aus.
Empfohlene Lektüre: Identifizierung von DMC, DMR und DMG in der DNA-Methylierungsanalyse.
Genomweite CpG-Dichte. (Beck et al., 2022)
MeDIP-seq (Methylierte DNA-Immunpräzipitation gefolgt von Sequenzierung) ist eine weit verbreitete epigenomische Technik, die die genomweite Analyse von DNA-Methylierungsmustern zu geringeren Kosten im Vergleich zu anderen hochauflösenden Methoden ermöglicht. Dieses Verfahren umfasst eine Reihe von Schritten zur Anreicherung methylierter DNA-Fragmente, gefolgt von Sequenzierung, um DNA-Methylierungsprofile im gesamten Genom zu erstellen. MeDIP-Seq verwendet einen Anti-5-Methylcytosin-Antikörper, um methylierten DNA-Regionen anzureichern, gefolgt von Next-Generation-Sequencing. MeDIP-Seq zielt überwiegend auf Regionen mit niedriger CpG-Dichte (<5 CpG/100 bp) ab und deckt mehr als 95 % des Genoms ab. Es bietet einen umfassenden Überblick über DNA-Methylierungsmuster, jedoch ohne Auflösung auf Einzelbasenebene.
Methyliertes DNA-Immunpräzipitations-Sequenzieren (MeDIP-Seq). (Beck et al., 2022)
Trotz seiner Nützlichkeit hat MeDIP-seq einige Einschränkungen, die Forscher beachten sollten.
Eine der Hauptbeschränkungen von MeDIP-seq ist seine Unfähigkeit, eine Auflösung auf Einzelbasenebene zu bieten. Da die DNA während der Sonikation in mehrere hundert Basenpaare fragmentiert wird, kann der genaue Standort einzelner CpG-Methylierungsstellen nicht bestimmt werden. Stattdessen liefert MeDIP-seq Informationen über den allgemeinen DNA-Methylierungsstatus innerhalb von Regionen, die methylierte CpG-Stellen enthalten.
Im Vergleich zu anderen Sequenzierungsmethoden wie der Whole-Genome-Bisulfite-Sequenzierung (WGBS) wird MeDIP-seq nicht als Hochdurchsatztechnik angesehen. Dies liegt daran, dass es selektiv methylierte DNA-Fragmente anvisiert, anstatt das gesamte Genom zu sequenzieren. Folglich bietet MeDIP-seq möglicherweise nicht die umfassende Abdeckung des Genoms wie WGBS.
MeDIP-seq liefert Informationen über das Vorhandensein von methylierten DNA-Fragmenten, misst jedoch nicht direkt den Grad der CpG-Methylierung an jedem Standort. Folglich kann es nicht zwischen unterschiedlichen Graden der Methylierung (z. B. 50% Methylierung versus 80% Methylierung) an einzelnen CpG-Stellen unterscheiden.
MeDIP-seq kann Schwierigkeiten bei der Analyse von Regionen mit hoher Dichte an CpG-Stellen haben. Die Bindungseffizienz der Antikörper könnte für dicht methylierte Regionen variieren, was zu potenziellen Verzerrungen in der Analyse führen könnte.
RRBS (Reduzierte Repräsentations-Bisulfid-Sequenzierung) und WGBS (Whole Genome Bisulfite Sequencing) sind fortschrittliche DNA-Methylierungs-Sequenzierungstechniken, die für ihre Fähigkeit bekannt sind, eine Einzelbasenauflösung zu erreichen.
RRBS ist eine gezielte DNA-Methylierungsprofilierungstechnik, die die Bisulfitbehandlung mit der Next-Generation-Sequenzierung kombiniert. Sie konzentriert sich auf CpG-reiche Regionen, indem Restriktionsenzyme verwendet werden, um genomische DNA vor der Bisulfitkonversion zu fragmentieren, wodurch Forscher einen repräsentativen Teil des Genoms mit höherer Auflösung als bei MeDIP-seq analysieren können. RRBS besteht aus einem zweistufigen Prozess. Zunächst werden methylierungsempfindliche Restriktionsendonukleasen verwendet, um unmethylierte DNA an spezifischen CpG-Stellen mit hoher GC-Dichte enzymatisch zu spalten, was zu DNA-Fragmenten führt. Diese Fragmente werden dann sorgfältig nach Größe ausgewählt und auf Regionen wie Promotoren und CpG-Inseln ausgerichtet. Anschließend unterziehen sich die Fragmente einer Sulfit-Konversion, die unmethylierte Cytosin in Uracil umwandelt, während methylierte Cytosine erhalten bleiben. Danach werden PCR-Amplifikation und Sequenzierung an diesen Fragmenten durchgeführt.
Reduzierte Repräsentation Bisulfit-Sequenzierung (RRBS). (Beck et al., 2022)
Andererseits beinhaltet WGBS die Behandlung des gesamten Genoms mit Sulfit, ohne zuvor methylierten Fragmente zu isolieren. WGBS wird als der Goldstandard für das Studium der DNA-Methylierung angesehen, da es eine Basenpaarauflösung über das gesamte Genom bietet. Es umfasst die Bisulfit-Konversion von genomischer DNA, die unmethylierte Cytosine in Uracile umwandelt, während methylierte Cytosine unverändert bleiben. Die anschließende Sequenzierung ermöglicht die präzise Identifizierung einzelner methylierter und unmethylierter Cytosine und bietet ein umfassendes und detailliertes Bild der DNA-Methylierungslandschaft. Während der Sulfit-Konversion werden unmethylierte Cytosine in Uracil umgewandelt, während methylierte Cytosine unverändert bleiben. Die nach der Konversion erhaltene DNA wird dann sequenziert, und verschiedene bioinformatische Protokolle werden angewendet, was oft zu einer umfassenden Charakterisierung des Genoms führt.
Whole-Genome-Bisulfit-Sequenzierung (WGBS). (Beck et al., 2022)
Die MeDIP-seq-Analyse hat interessante Ergebnisse hinsichtlich der Verteilung der CpG-Dichte über verschiedene Arten hinweg geliefert. Die Datenanalyse ergab, dass die Mehrheit der identifizierten differentially methylated regions (DMRs) in den MeDIP-seq-Datensätzen hauptsächlich mit Regionen niedriger CpG-Dichte assoziiert war, insbesondere im Bereich von 0-3 CpG-Stellen pro 100 Basenpaaren (bp). Bemerkenswert ist, dass eine verbreitete CpG-Dichte von 1 CpG-Stelle pro 100 bp beobachtet wurde, die eng mit der vorherrschenden Dichte im repräsentativen Genom korrelierte.
Diese Ergebnisse deuten stark darauf hin, dass MeDIP-seq eine Neigung hat, genomische Regionen mit niedriger CpG-Dichte zu untersuchen, wodurch Veränderungen in der Methylierung in solchen Bereichen effektiv erfasst werden. Diese Regionen mit niedriger CpG-Dichte sind weit verbreitet und umfassen über 90 % der Genome verschiedener Arten. Folglich, MeDIP-seq ist eine gut geeignete Methode zur Untersuchung von DNA-Methylierungsmustern in diesen Regionen und bietet somit einen umfassenden Überblick über die Methylierungsdynamik im gesamten Genom.
Dennoch ist es bemerkenswert, dass bei dem Vergleich von Proben verschiedener Arten einige Variationen in der Verteilung der CpG-Dichte beobachtet wurden. So deutete die Analyse der DMRs bei Zebrafischen auf eine Verschiebung hin, die zu leicht höheren CpG-Dichten führte, insbesondere im Bereich von 1-4 CpG-Stellen pro 100 bp. Diese Verschiebung könnte auf das Vorhandensein von zwei unterschiedlichen Zelltypen, Spermatozoen und Erythrozyten, in den Zebrafischproben zurückzuführen sein, von denen jeder möglicherweise einzigartige Methylierungsmuster aufweist.
Die RRBS (Reduced Representation Bisulfite Sequencing) Analyse, die über verschiedene Arten hinweg durchgeführt wurde, ergab interessante Erkenntnisse über die Verteilung der CpG-Dichte in den erfassten Datensätzen. Insbesondere wiesen die durch RRBS identifizierten unterschiedlich methylierten Regionen (DMRs) eine ausgeprägte Bifurkation in den CpG-Dichten auf. Bestimmte Datensätze zeigten eine Verschiebung hin zu höheren CpG-Dichten, insbesondere im Bereich von >10 CpG/100bp, während andere eine Präferenz für mittlere CpG-Dichten aufwiesen.
Bei näherer Betrachtung wurde festgestellt, dass in RRBS-Datensätzen mit CpG-Dichten von über 10 CpG/100 bp die dominante Dichte bei 10-12 CpG/100 bp lag. Dennoch fiel bei der Erweiterung der Analyse auf CpG-Dichten über 1 kb ein erheblicher Teil (ungefähr zwei Drittel) der >10 CpG-Regionen unter 10 CpG/1 kb. Dies deutet darauf hin, dass Regionen mit hoher CpG-Dichte dazu neigen, über längere DNA-Strecken eine Abnahme der Dichte aufzuweisen.
Darüber hinaus ein Vergleich zwischen MeDIP-Seq und RRBS Methoden, die beide auf dieselben Proben aus Datensätzen von Regenbogenforellen angewendet wurden, jedoch von verschiedenen Laboren durchgeführt wurden, zeigten unterschiedliche Verzerrungen, die mit jedem Ansatz verbunden sind. MeDIP-Seq wies eine Präferenz für Regionen mit niedriger CpG-Dichte auf, während RRBS eine Neigung zu Regionen mit höherer CpG-Dichte zeigte.
RRBS erweist sich als besonders gut geeignet, um Veränderungen der DNA-Methylierung in CpG-reichen Regionen, wie Promotoren und CpG-Inseln, zu untersuchen, während MeDIP-Seq besser geeignet ist, um Methylierungsmuster in CpG-armen Regionen im gesamten Genom zu profilieren. Die Verfügbarkeit sowohl von MeDIP-Seq- als auch von RRBS-Datensätzen für dieselben Proben in der Studie über den Regenbogenforelle bot eine wertvolle Gelegenheit zur Kreuzvalidierung und hob die Stärken und Einschränkungen jeder Methode hervor.
Die Analyse von Whole-Genome-Bisulfid-Sequenzierung (WGBS) Daten aus verschiedenen Arten haben wertvolle Einblicke in die Verteilung der CpG-Dichte innerhalb der gewonnenen Datensätze geliefert. Die Ergebnisse zeigen, dass die CpG-Dichte im WGBS-Datensatz in einem vergleichbaren Bereich liegt wie die im Datensatz der reduzierten Repräsentations-Bisulfid-Sequenzierung (RRBS). Es wurden jedoch bemerkenswerte Unterschiede in den Verteilungen der CpG-Dichte zwischen diesen beiden Analysen festgestellt.
Insbesondere weisen die WGBS-Datensätze subtile Variationen auf und zeigen eine Neigung zu höheren CpG-Dichten, insbesondere im Bereich von 2-5 CpG/100bp und CpG-Dichten, die 10 CpG/100bp überschreiten. Dies deutet darauf hin, dass WGBS-Daten dazu neigen, DNA-Methylierungsänderungen in Regionen zu erfassen, die mit einer höheren Dichte von CpG-Stellen angereichert sind.
Bemerkenswerterweise waren neben Hühnern Regionen mit 1 CpG/100bp in den WGBS-Datensätzen am wenigsten nachgewiesen, was darauf hindeutet, dass WGBS weniger wahrscheinlich unterschiedliche methylierte Regionen (DMRs) in Bereichen mit extrem niedrigen CpG-Dichten identifiziert.
Referenz:
Beck, Daniel, Millissia Ben Maamar und Michael K. Skinner. "Vergleich von genomweiten CpG-Dichten und Methoden zur DNA-Methylierungsanalyse (MeDIP, RRBS und WGBS)." Epigenetik 17.5 (2022): 518-530.