Übersicht über Hi-C-Sequenzierung

Was ist Hi-C-Sequenzierung?

Die Genomforschung umfasst verschiedene Dimensionen, die hauptsächlich in 1D-, 2D- und 3D-Darstellungen kategorisiert werden. Im 1D-Bereich nutzen Forscher lineare Abbildungstechniken, um genomische Sequenzen zu untersuchen. Im 2D-Bereich beschäftigen sie sich mit Netzwerkanalysen, wobei der Schwerpunkt auf skalenfreien Netzwerken liegt. Schließlich untersucht die 3D-Dimension die strukturellen und dynamischen Aspekte des Genoms.

Die Hi-C-Technologie zeichnet sich als leistungsstarkes Verfahren zur Untersuchung der 3D-Struktur von Genomen aus. Abgeleitet von der Fusion von Hochdurchsatz-Sequenzierung (HTS) und Chromosomenkonformationsfang (3C) bieten Hi-C Einblicke in die räumliche Organisation von Chromatin im Zellkern.

Die Chromosomenkonformationsauffangung (3C) umfasst eine Reihe von Schritten: Fixierung der nukleären Chromatin, Verdau von Chromatin-Protein-Kreuzvernetzungen, Ligation der Verdauprodukte, Freisetzung gebundener Proteine und PCR-Analyse zur Erkennung von Interaktionen zwischen DNA-Fragmenten. Diese Methode geht davon aus, dass physisch interagierende DNA-Fragmente höhere Verknüpfungshäufigkeiten aufweisen, die durch locus-spezifische PCR identifiziert werden.

Hi-C geht einen Schritt weiter, indem es chromosomale Assemblierungen von fragmentierten genomischen Sequenzen erstellt und deren Reihenfolge und Orientierung auf dem Chromosom bestimmt. Darüber hinaus kann Hi-C mit anderen Omics-Daten integriert werden, wie zum Beispiel RNA-Seq und ChIP-Sequm die genetischen Regulations- und epigenetischen Netzwerke, die den organismischen Eigenschaften zugrunde liegen, zu erläutern.

Forms of complex genomic rearrangements: Chromoplexy is characterized by the exchange of larger fragments between chromosomes. (Schöpflin et al., 2022)Formen komplexer genomischer Umstellungen: Chromoplexy ist gekennzeichnet durch den Austausch größerer Fragmente zwischen Chromosomen. (Schöpflin et al., 2022)

Vorteile der Hi-C Chromosomenkonstruktion

  • Individuenzentrierter Ansatz: Im Gegensatz zu traditionellen Methoden, die oft den Aufbau von Populationen erfordern, kann die Hi-C-Chromosomenkonstruktion effektiv von einer einzelnen Person durchgeführt werden. Dies vereinfacht den Prozess und verringert die Notwendigkeit umfangreicher bevölkerungsbasierter Studien.
  • Verbesserte Lokalisierungseffizienz: Der Hi-C-Chromosomenaufbau weist eine höhere Lokalisierungseffizienz im Vergleich zu vielen herkömmlichen Techniken auf. Das bedeutet, dass er die räumliche Organisation genomischer Sequenzen präzise bestimmen kann und detaillierte Einblicke in Chromatininteraktionen und strukturelle Anordnungen bietet.
  • Fehlerkorrekturfähigkeiten: Ein bemerkenswerter Vorteil der Hi-C-Chromosomenkonstruktion ist ihre Fähigkeit zur Fehlerkorrektur während der Assemblierung des Genoms. Dieses Merkmal ermöglicht es Forschern, die Genauigkeit des assemblierten Genoms zu verfeinern und zu verbessern, was zuverlässige Ergebnisse für nachgelagerte Analysen und Interpretationen gewährleistet.

Workflow der Hi-C-Sequenzierungstechnologie

  • Zellvernetzung

Zellen durchlaufen eine Vorbereitung und Fixierung durch Vernetzung mit entweder Formaldehyd oder Paraformaldehyd. Dieser Prozess bewahrt die intrazellulären Protein-DNA- und DNA-DNA-Interaktionen und erhält somit die 3D-Struktur innerhalb der Zelle. Bei lebenden Proben besteht eine typische Behandlung aus 1-3% Formaldehyd für 10-30 Minuten bei Raumtemperatur. Es ist jedoch wichtig zu beachten, dass dieser Schritt die Effizienz der DNA-Sequenzverdauung durch Restriktionsendonukleasen beeinträchtigen kann und eine präzise Kontrolle erfordert.

  • Endonukleaseverdauung

DNA wird enzymatisch mit Restriktionsendonukleasen geschnitten, wodurch klebrige Enden an beiden Seiten der Quervernetzungen entstehen. Die Größe der resultierenden Fragmente beeinflusst die Sequenzierungsauflösung. Im Allgemeinen stehen zwei Enzyme zur Auswahl: ein 6 bp Restriktionsendonuklease oder ein 4 bp Restriktionsendonuklease. Enzyme wie EcoR1 oder HindIII werden verwendet, um das Genom ungefähr alle 4000 bp zu schneiden, was zu etwa 1 Million Fragmenten im menschlichen Genom führt.

Main steps in the Hi-C protocol prior to sequencing. (Lun et al., 2015)Hauptschritte im Hi-C-Protokoll vor der Sequenzierung. (Lun et al., 2015)

  • Endreparatur

Die fragmentierte DNA besitzt entweder gerade oder klebrige Enden, die repariert werden, um stumpfe Enden zu erzeugen. Während dieses Prozesses werden biotinmarkierte Basen eingeführt, um die anschließende DNA-Reinigung und -Erfassung zu erleichtern.

  • Zyklisierung

End-reparierte DNA-Fragmente werden zwischen DNA-Segmenten, die Wechselwirkungen enthalten, mit T4-DNA-Ligase geschleift. Anschließend werden die Proteine, die die DNA-Fragmente verbinden, abgebaut, um die quervernetzten Fragmente zu isolieren.

  • DNA-Reinigung und -Erfassung

Die DNA wird de-kreuzvernetzt, gereinigt und in Fragmente von 300 bp bis 700 bp zerlegt. Fragmente, die Interaktionen enthalten, werden dann zur Bibliothekskonstruktion mit straffinierenden magnetischen Perlen erfasst. Ultraschall oder ähnliche Methoden werden eingesetzt, um die Fragmente weiter zu zerkleinern.

  • Sequenzierung

Biotinhaltige Fragmente werden mit magnetischen Perlen erfasst, Bibliotheken werden erstellt und die Sequenzierung wird durchgeführt.

Datenanalyse für Hi-C-Sequenzierung

Der Datenanalyseprozess für Hi-C-Sequenzierung umfasst sechs kritische Schritte:

  • Vorabfilterung der Rohdaten: Dieser erste Schritt umfasst das Filtern von Rohdaten, um niedrigqualitative oder fehlerhafte Sequenzen zu entfernen, ähnlich den Standardverfahren zur Verarbeitung von Sequenzierungsdaten der zweiten Generation.
  • Sequenzvergleich: Die Verwendung des Paar-End-Sequenzierungsmodus wird für die Hi-C-Datenanalyse empfohlen, um einen genauen Vergleich von Sequenzen zu ermöglichen.
  • Positionierung der Schnittstellen: Nachdem die physische Lage der Lese-Paare im Genom bestimmt wurde, besteht der nächste Schritt darin, die nächstgelegene Schnittstelle eines Restriktionsenzym zu identifizieren, die zu jedem Lese-Paar gehört. Dies wird erreicht, indem die Einschränkung der Größe des Einfügefragments berücksichtigt wird. Die Position des enzymatisch geschnittenen Segments liefert einen ungefähren Standort, an dem DNA-Interaktionen stattgefunden haben.
  • Screening für gültige Vergleichsfragmente: Gültige Vergleichsfragmente werden als gepaarte Reads identifiziert, die sich an den gegenüberliegenden Enden der Schnittstelle befinden und in entgegengesetzte Richtungen kartiert sind, um eine genaue Darstellung der chromosomalen Interaktionen zu gewährleisten.
  • Integration der Intensitäten von DNA-Fragment-Interaktionen: Die Intensitäten der DNA-Fragment-Interaktionen werden integriert, um Einblicke in die Stärke und Häufigkeit der Interaktionen zwischen genomischen Loci zu erhalten.
  • Normalisierung der DNA-Fragment-Interaktionsmatrix: Die Normalisierung der DNA-Fragment-Interaktionsmatrix wird durchgeführt, um unverzerrte Vergleiche und eine genaue Interpretation der Interaktionsdaten zu gewährleisten.

Hi-C-Assemblierung

Die Hi-C-Assemblierung wird typischerweise mit Software wie LACHESIS durchgeführt, die das Genom basierend auf der Unterstützung durch gültige Lese-Paare segmentiert, sequenziert und orientiert. Dieser Prozess umfasst die manuelle Kartierung und Verifizierung des Genoms, um eine endgültige Chromosomenebene-Assemblierung zu erhalten.

Gültige Lese-Paare erzeugen Signale auf der Karte, wobei die Signalstärke direkt proportional zur räumlichen und sequenziellen Distanz zwischen Contigs ist. Diese Informationen ermöglichen eine Fehlerkorrektur, einschließlich der Identifizierung und Korrektur von falsch zusammengebauten Contigs, der Anpassung der Contig-Ausrichtungen und der Bestimmung der Contig-Platzierung innerhalb von Chromosomen durch Clusterbildung.

Letztendlich wird eine verfeinerte Chromosomen-niveau Genomassemblierung erreicht, wobei verbleibende Diskrepanzen manuell angepasst werden, um die Genauigkeit sicherzustellen. Der manuelle Anpassungsprozess zielt darauf ab, ein klares diagonales Signal zu erreichen, das auf ein gut zusammengesetztes Genom hinweist.

Anwendungen der Hi-C-Technologie

In den letzten Jahren hat die Hi-C-Technologie eine entscheidende Rolle bei der Fortschritt der Genomassemblierung und dem Verständnis der dreidimensionalen (3D) Struktur von Genomen verschiedener Organismen gespielt, darunter Menschen, Ziegen, Mücken, Hefe, Gerste und Weizen. Die erfolgreiche Assemblierung von Chromosomen-niveau Genomen in diesen Arten unterstreicht die Zuverlässigkeit und Vielseitigkeit der Hi-C-unterstützten Genomassemblierungstechnologie.

Die Hi-C-Technologie enthüllt die komplexe dreidimensionale Struktur von Genomen und erläutert die hierarchische Organisation von Chromatin von Kompartimenten (A/B-Kompartimente) über topologisch assoziierte strukturelle Domänen (TADs) bis hin zu Schleifen. Dieses umfassende Verständnis ist entscheidend für das Studium räumlicher Interaktionen zwischen DNA-Sequenzen, den Aufbau hochauflösender Chromosomen-3D-Strukturen, das Entschlüsseln von Mechanismen der Genregulation und die Erleichterung des Aufbaus von trans-chromosomalen Genomen und chromosomenübergreifenden Haplotypen. Bemerkenswerterweise wurden die 3D-Strukturen von Genomen erfolgreich in verschiedenen Organismen rekonstruiert, darunter Menschen, Drosophila, Hefen, Arabidopsis thaliana, Reis und Baumwollarten. Auch die vergleichende Analyse von 3D-Strukturen von Genomen über verschiedene Proben hinweg wurde durchgeführt, was Einblicke in evolutionäre und funktionale Aspekte bietet.

  • Whole Genome Hi-C Karten: Dies umfasst eine umfassende Analyse der cis/trans Interaktionen innerhalb des Genoms.
  • Identifikation und Analyse von Kompartimenten A/B: Hi-C ermöglicht die Identifikation und Analyse von genomischen Kompartimenten, ergänzt durch gemeinsame Analysen mit Chip-seq und RNA-Seq Daten.
  • Analyse der Interaktionen zwischen Genen und Wiederholungssequenzen: Hi-C ermöglicht die Untersuchung der Interaktionen zwischen Genen und repetitiven Sequenzen, oft in Kombination mit RNA-seq-Daten für eine umfassende Analyse.
  • TAD-Identifikation und -Analyse: Die Hi-C-Technologie unterstützt die Identifikation und Analyse von topologisch assoziierten Domänen (TADs), oft in Verbindung mit Chip-seq und RNA-Seq Analysen.
  • Genomweite Schleifenmodellierung: Dieser Aspekt erfordert ergänzende Daten wie DNase-seq und wird oft gemeinsam mit analysiert. Chip-seq und RNA-seq-Daten.
  • Differenzielle Analyse von 3D-Strukturen: Hi-C ermöglicht die differenzielle Analyse von 3D-Strukturen zwischen mehreren Proben, einschließlich der differenziellen Analyse von Kompartiment A/B, TADs und Schleifen.

Referenzen:

  1. Schöpflin, Robert, et al. "Integration von Hi-C mit kurzen und langen Lese-Genomsequenzierungen enthüllt die Struktur von keimbahnumgeordneten Genomen." Naturwissenschaften Kommunikation 13.1 (2022): 6470.
  2. Lun, Aaron TL, und Gordon K. Smyth. "diffHic: ein Bioconductor-Paket zur Erkennung differenzieller genomischer Interaktionen in Hi-C-Daten." BMC Bioinformatik 16 (2015): 1-11.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben