Die Genomforschung umfasst verschiedene Dimensionen, die hauptsächlich in 1D-, 2D- und 3D-Darstellungen kategorisiert werden. Im 1D-Bereich nutzen Forscher lineare Abbildungstechniken, um genomische Sequenzen zu untersuchen. Im 2D-Bereich beschäftigen sie sich mit Netzwerkanalysen, wobei der Schwerpunkt auf skalenfreien Netzwerken liegt. Schließlich untersucht die 3D-Dimension die strukturellen und dynamischen Aspekte des Genoms.
Die Hi-C-Technologie zeichnet sich als leistungsstarkes Verfahren zur Untersuchung der 3D-Struktur von Genomen aus. Abgeleitet von der Fusion von Hochdurchsatz-Sequenzierung (HTS) und Chromosomenkonformationsfang (3C) bieten Hi-C Einblicke in die räumliche Organisation von Chromatin im Zellkern.
Die Chromosomenkonformationsauffangung (3C) umfasst eine Reihe von Schritten: Fixierung der nukleären Chromatin, Verdau von Chromatin-Protein-Kreuzvernetzungen, Ligation der Verdauprodukte, Freisetzung gebundener Proteine und PCR-Analyse zur Erkennung von Interaktionen zwischen DNA-Fragmenten. Diese Methode geht davon aus, dass physisch interagierende DNA-Fragmente höhere Verknüpfungshäufigkeiten aufweisen, die durch locus-spezifische PCR identifiziert werden.
Hi-C geht einen Schritt weiter, indem es chromosomale Assemblierungen von fragmentierten genomischen Sequenzen erstellt und deren Reihenfolge und Orientierung auf dem Chromosom bestimmt. Darüber hinaus kann Hi-C mit anderen Omics-Daten integriert werden, wie zum Beispiel RNA-Seq und ChIP-Sequm die genetischen Regulations- und epigenetischen Netzwerke, die den organismischen Eigenschaften zugrunde liegen, zu erläutern.
Formen komplexer genomischer Umstellungen: Chromoplexy ist gekennzeichnet durch den Austausch größerer Fragmente zwischen Chromosomen. (Schöpflin et al., 2022)
Zellen durchlaufen eine Vorbereitung und Fixierung durch Vernetzung mit entweder Formaldehyd oder Paraformaldehyd. Dieser Prozess bewahrt die intrazellulären Protein-DNA- und DNA-DNA-Interaktionen und erhält somit die 3D-Struktur innerhalb der Zelle. Bei lebenden Proben besteht eine typische Behandlung aus 1-3% Formaldehyd für 10-30 Minuten bei Raumtemperatur. Es ist jedoch wichtig zu beachten, dass dieser Schritt die Effizienz der DNA-Sequenzverdauung durch Restriktionsendonukleasen beeinträchtigen kann und eine präzise Kontrolle erfordert.
DNA wird enzymatisch mit Restriktionsendonukleasen geschnitten, wodurch klebrige Enden an beiden Seiten der Quervernetzungen entstehen. Die Größe der resultierenden Fragmente beeinflusst die Sequenzierungsauflösung. Im Allgemeinen stehen zwei Enzyme zur Auswahl: ein 6 bp Restriktionsendonuklease oder ein 4 bp Restriktionsendonuklease. Enzyme wie EcoR1 oder HindIII werden verwendet, um das Genom ungefähr alle 4000 bp zu schneiden, was zu etwa 1 Million Fragmenten im menschlichen Genom führt.
Hauptschritte im Hi-C-Protokoll vor der Sequenzierung. (Lun et al., 2015)
Die fragmentierte DNA besitzt entweder gerade oder klebrige Enden, die repariert werden, um stumpfe Enden zu erzeugen. Während dieses Prozesses werden biotinmarkierte Basen eingeführt, um die anschließende DNA-Reinigung und -Erfassung zu erleichtern.
End-reparierte DNA-Fragmente werden zwischen DNA-Segmenten, die Wechselwirkungen enthalten, mit T4-DNA-Ligase geschleift. Anschließend werden die Proteine, die die DNA-Fragmente verbinden, abgebaut, um die quervernetzten Fragmente zu isolieren.
Die DNA wird de-kreuzvernetzt, gereinigt und in Fragmente von 300 bp bis 700 bp zerlegt. Fragmente, die Interaktionen enthalten, werden dann zur Bibliothekskonstruktion mit straffinierenden magnetischen Perlen erfasst. Ultraschall oder ähnliche Methoden werden eingesetzt, um die Fragmente weiter zu zerkleinern.
Biotinhaltige Fragmente werden mit magnetischen Perlen erfasst, Bibliotheken werden erstellt und die Sequenzierung wird durchgeführt.
Der Datenanalyseprozess für Hi-C-Sequenzierung umfasst sechs kritische Schritte:
Hi-C-Assemblierung
Die Hi-C-Assemblierung wird typischerweise mit Software wie LACHESIS durchgeführt, die das Genom basierend auf der Unterstützung durch gültige Lese-Paare segmentiert, sequenziert und orientiert. Dieser Prozess umfasst die manuelle Kartierung und Verifizierung des Genoms, um eine endgültige Chromosomenebene-Assemblierung zu erhalten.
Gültige Lese-Paare erzeugen Signale auf der Karte, wobei die Signalstärke direkt proportional zur räumlichen und sequenziellen Distanz zwischen Contigs ist. Diese Informationen ermöglichen eine Fehlerkorrektur, einschließlich der Identifizierung und Korrektur von falsch zusammengebauten Contigs, der Anpassung der Contig-Ausrichtungen und der Bestimmung der Contig-Platzierung innerhalb von Chromosomen durch Clusterbildung.
Letztendlich wird eine verfeinerte Chromosomen-niveau Genomassemblierung erreicht, wobei verbleibende Diskrepanzen manuell angepasst werden, um die Genauigkeit sicherzustellen. Der manuelle Anpassungsprozess zielt darauf ab, ein klares diagonales Signal zu erreichen, das auf ein gut zusammengesetztes Genom hinweist.
In den letzten Jahren hat die Hi-C-Technologie eine entscheidende Rolle bei der Fortschritt der Genomassemblierung und dem Verständnis der dreidimensionalen (3D) Struktur von Genomen verschiedener Organismen gespielt, darunter Menschen, Ziegen, Mücken, Hefe, Gerste und Weizen. Die erfolgreiche Assemblierung von Chromosomen-niveau Genomen in diesen Arten unterstreicht die Zuverlässigkeit und Vielseitigkeit der Hi-C-unterstützten Genomassemblierungstechnologie.
Die Hi-C-Technologie enthüllt die komplexe dreidimensionale Struktur von Genomen und erläutert die hierarchische Organisation von Chromatin von Kompartimenten (A/B-Kompartimente) über topologisch assoziierte strukturelle Domänen (TADs) bis hin zu Schleifen. Dieses umfassende Verständnis ist entscheidend für das Studium räumlicher Interaktionen zwischen DNA-Sequenzen, den Aufbau hochauflösender Chromosomen-3D-Strukturen, das Entschlüsseln von Mechanismen der Genregulation und die Erleichterung des Aufbaus von trans-chromosomalen Genomen und chromosomenübergreifenden Haplotypen. Bemerkenswerterweise wurden die 3D-Strukturen von Genomen erfolgreich in verschiedenen Organismen rekonstruiert, darunter Menschen, Drosophila, Hefen, Arabidopsis thaliana, Reis und Baumwollarten. Auch die vergleichende Analyse von 3D-Strukturen von Genomen über verschiedene Proben hinweg wurde durchgeführt, was Einblicke in evolutionäre und funktionale Aspekte bietet.
Referenzen: