Die Methoden der gesamten Genomsequenzierung

Übersicht über die gesamte Genomsequenzierung

Das Genom jedes einzelnen Organismus enthält seine gesamte genetische Information. Whole-Genome-Sequenzierung Die Technologie kann ganze Genome umfassend und genau analysieren, wodurch die darin enthaltenen Informationen entschlüsselt und die Komplexität sowie Vielfalt des Genoms offenbart werden. Das Aufkommen der Technologie zur gesamten Genomsequenzierung ist ein revolutionärer Fortschritt in allen Bereichen der Lebenswissenschaften. Die gesamte Genomsequenzierung kann Varianten erkennen, einschließlich einzelner Nukleotidvarianten, Insertionen/Löschungen, Änderungen der Kopienzahl und großflächiger struktureller Varianten. Whole-Genome-Sequenzierung kann in zwei Kategorien unterteilt werden, basierend auf der Verfügbarkeit eines Referenzgenoms: de-novo-Sequenzierung und Resequenzierung. Das Vorhandensein eines Referenzgenoms erleichtert und beschleunigt den Prozess der Genomassemblierung.

Unterschiede zwischen WGS und WES

Whole Exome Sequenzierung (WES) beinhaltet die Nutzung von Zielanreicherungsverfahren, um die gesamte exone Region des Genoms zu erfassen und zu sequenzieren. Diese Methode kann direkt Einzelne Nukleotidpolymorphismen (SNPs) nachweisen, die mit funktionalen Variationen in Proteinen assoziiert sind. Im menschlichen Genom machen Exons (protein-codierende Regionen) trotz nur 1% des genischen Inhalts etwa 85% der krankheitsverursachenden Mutationen aus, was WES von entscheidender Bedeutung macht.

Whole-Genome-Sequenzierung (WGS) hingegen bezieht sich auf das Hochdurchsatz-Sequenzieren des gesamten Genoms, analysiert interindividuelle Variationen und annotiert SNPs sowie genomische Strukturen. Aufgrund der großen Mengen an umfassenden Daten, die WGS bereitstellt, erfasst es exklusive Details, die WES oder gezielte Sequenzierung könnte übersehen werden. Mit den Fortschritten in der Sequenzierungstechnologie und erheblichen Kostensenkungen in den letzten Jahren ist die Nutzung von WGS zunehmend machbar geworden. Darüber hinaus hat WGS einen Vorteil bei der Identifizierung von SNPs, Insertionen und Deletionen; daher ist es zu einer alternativen Wahl sowohl für klinische Anwendungen als auch für die Grundlagenforschung geworden.

Zwei klassische Ansätze zur Sequenzierung großer Genome

In den frühen 80er Jahren gelang es Sanger, eine vollständige Genomsequenzierung des Lambda-Phagen erfolgreich mit der Shotgun-Methode abzuschließen, und die Methode wurde erfolgreich auf die DNA größerer Viren, die DNA von Organellen und die Sequenzierung der bakteriellen Genom-DNA angewendet. Shotgun-Sequenzierung ist eine klassische Strategie für die vollständige Genomsequenzierung. Die Shotgun-Sequenzierungsstrategie bietet eine technische Garantie für die großangelegte Sequenzierung. Die Technologie unterbricht zunächst eine vollständige Zielsequenz zufällig in kleine Fragmente, sequenziert diese separat und fügt sie dann unter Verwendung der Überlappungsbeziehungen dieser kleinen Fragmente zu einer konsistenten Sequenz zusammen. Sie umfasst hauptsächlich zwei Methoden: die eine ist die hierarchische Shotgun-Sequenzierung (Clone-by-Clone-Methode) und die andere ist die vollständige Genom-Shotgun-Sequenzierung.

Klon-für-Klon-Sequenzierung

Dieses Verfahren wurde einst vom HGP-Konsortium übernommen. Dieses Verfahren kann hochdichte Karten erzeugen, was die Genomassemblierung erleichtert. Es umfasst in der Regel vier Schritte: die Vorbereitung einer BAC-Klonbibliothek, die Erstellung eines Klonfingerabdrucks, die Sequenzierung der BAC-Klone und die Sequenzassemblierung. Allerdings ist dieses Verfahren zeitaufwendig und kostspielig, weshalb es gegenwärtig selten verwendet wird.

Figure 1. Steps involved in the clone-by-clone sequencing.Abbildung 1. Schritte, die am Klon-für-Klon-Sequenzieren beteiligt sind.

Whole-Genome-Shotgun-Sequenzierung (WGS)

WGS umfasst im Allgemeinen sechs Schritte: die Isolierung von genomischer DNA, die zufällige Fragmentierung von genomischer DNA, die Größenauswahl mittels Elektrophorese, den Bibliotheksaufbau, das Paar-End-Sequencing (PE-Sequencing) und die Genomassemblierung. Zwei verschiedene Größen von DNA-Fragmenten, einschließlich längerer Einsätze (2-2,5 kb) und kurzer Einsätze (0,5-1,2 kb), werden aus dem Agarosegel ausgewählt. Während die langen Einsätze in Phagen- oder Socmid-Vektoren kloniert werden, werden die kurzen Einsätze in Plasmidvektoren kloniert. Die Klonbibliothek mit kurzen Einsätzen wird verwendet, um von beiden Enden zu sequenzieren. Da eine große Anzahl von Klonen sequenziert wird, wird jedes der Genome mehr als 10 Mal abgedeckt. Lange Klon-Einsätze können verwendet werden, um die Effizienz der Genomassemblierung zu erhöhen.

Figure 2. Steps involved in the whole genome shotgun sequencing.Abbildung 2. Schritte, die an der Ganzgenom-Shotgun-Sequenzierung beteiligt sind.

Vorteile:

  • Benötigt keine Genomkarten.
  • Weniger zeitaufwendig
  • Geld gespart

Nachteile:

  • Die Genomassemblierung für eukaryotische Genome ist aufgrund der zahlreichen repetitiven Sequenzen schwierig.
  • Die Genomsequenzierung mit dieser Methode ist nicht genau.

NGS beschleunigt WGS

Im Gegensatz zu klonbasierten Bibliotheksansätzen nutzen Next-Generation-Sequencing-Plattformen eine drastisch vereinfachte Methode zur Bibliothekskonstruktion, die das gesamte Genom-Shotgun-Sequencing vereinfacht und beschleunigt hat. Im Allgemeinen wird genomische DNA zunächst zufällig fragmentiert, entweder durch Sonikation oder Nebelbildung, und dann mit einem plattformspezifischen Satz von doppelsträngigen Adaptern ligiert, um eine Shotgun-Bibliothek zu erzeugen. Anschließend können diese Bibliotheksfragmente in situ durch Hybridisierung und Verlängerung von komplementären Adaptern amplifiziert werden, die kovalent an der Oberfläche einer Glas-Mikrofluidikzelle oder einem kleinen Kügelchen (je nach Sequenzierungsplattform) befestigt sind. Alle NGS-Geräte verwenden ein mikrofluidisches Gerät, um die amplifizierten Fragmente der Shotgun-Bibliothek zu enthalten, gefolgt von einem Bildgebungsprozess, der Daten von den aktiv sequenzierten Fragmenten sammelt.

Figure 3. Major steps in employing high-throughput DNA-sequencing methodologiesAbbildung 3. Wichtige Schritte bei der Anwendung von Hochdurchsatz-DNA-Sequenzierungsmethoden (Ginsburg & Willard 2008).

WGS-Prozess

Wir werden den Illumina-Sequenzer als Beispiel verwenden, um den Workflow der WGS basierend auf Hochdurchsatz-Sequenzierung zu veranschaulichen.

  • Bau einer Sequenzierungsbibliothek

Das Genom wird zunächst vorbereitet, und dann wird die DNA zufällig in Hunderte von Basen oder kürzere Fragmente mit spezifischen Adaptern an beiden Enden fragmentiert. Wenn die Transkriptionsgruppe sequenziert wird, ist die Bibliothekskonstruktion etwas komplizierter. Nach der RNA-Fragmentierung muss sie in cDNA umgewandelt werden, dann wird der Connector hinzugefügt, oder die RNA wird zuerst in cDNA umgewandelt, dann fragmentiert und das Joint hinzugefügt. Die Größe des Fragments (Insertgröße) hat Einfluss auf die anschließende Datenanalyse und kann je nach Bedarf ausgewählt werden. Für die Genomsequenzierung werden in der Regel mehrere unterschiedliche Insertgrößen gewählt, um beim Zusammenfügen mehr Informationen zu erhalten.

  • Oberflächenanbindung und Brückenverstärkung

Die Reaktion der Solexa-Sequenzierung wird in einem Glasrohr durchgeführt, das als Flusszelle bezeichnet wird, und die Flusszelle ist in 8 Bahnen unterteilt, von denen jede eine Anzahl fester Einzelstrangverbindungen auf der Innenseite jeder Bahn aufweist. Das DNA-Fragment der Verbindung wurde in einen Einzelstrang umgewandelt und mit den Primern im Sequenzierungskanal kombiniert, um eine brückenartige Struktur für die anschließende Preamplifikation zu bilden.

  • Denaturierung und vollständige Amplifikation

Die unmarkierten dNTPs und das gängige Taq-Enzym wurden zur Amplifikation der festen Phasen-Brücken-PCR hinzugefügt, und die einzelsträngige Brückprobe wurde in ein doppelsträngiges Brückenfragment amplifiziert. Durch Denaturierung wird ein komplementärer Einzelstrang freigesetzt und an der nahegelegenen festen Oberfläche verankert. Durch kontinuierliches Zyklen werden Millionen von Clustern doppelsträngiger Analytmoleküle auf der festen Oberfläche der Flusszelle erhalten.

  • Einzelbasisverlängerung und Sequenzierung

Vier fluoreszenzmarkierte dNTPs, DNA-Polymerasen und Linker-Primer wurden zu den sequenzierten Flusszellen zur Amplifikation hinzugefügt. Wenn jeder Sequenzierungscluster den komplementären Strang verlängert, wird jeder fluoreszenzmarkierte dNTP hinzugefügt, um die entsprechende Fluoreszenz freizusetzen. Der Sequencer erhält die Sequenzinformationen des zu testenden Fragmentes, indem er ein fluoreszentes Signal erfasst und das optische Signal mithilfe von Computer-Software in einen Sequenzierungsgipfel umwandelt. Die Leselänge wird von einer Reihe von Faktoren beeinflusst, die zu einer Signalabschwächung führen, wie z.B. unvollständiges Schneiden der fluoreszierenden Marker. Mit zunehmender Leselänge wird auch die Fehlerquote steigen.

  • Datenanalyse

Dieser Schritt ist nicht strikt Teil des Sequenzierungsprozesses, macht jedoch nur im Zusammenhang mit der Arbeit vor diesem Schritt Sinn. Die durch Sequenzierung gewonnenen Rohdaten bestehen aus einer Sequenz von nur wenigen Dutzend Basenlängen, und die Contigs, die diese kurzen Sequenzen mithilfe bioinformatischer Werkzeuge zusammenfügen, bilden sogar das Gerüst des gesamten Genoms. Alternativ werden diese Sequenzen an ein bestehendes Genom oder eine ähnliche Arten-Genomsequenz ausgerichtet und weiter analysiert, um biologisch sinnvolle Ergebnisse zu erhalten.

Figure 4. The WGS ProcessAbbildung 4. Der WGS-Prozess

WGS-Sequenzierungsmetriken

  • Tiefe

Die Sequenzierungstiefe, eine der wichtigsten Kennzahlen zur Bewertung des Volumens in der Genomik, wird definiert als das Verhältnis der insgesamt aufgezeichneten Basenpaare (bp) zur Größe des Genoms. Es besteht eine direkte Korrelation zwischen der Sequenzierungstiefe und dem Niveau der Genomabdeckung, sodass eine Erhöhung der erstgenannten zu einer Verringerung von falsch-positiven Ergebnissen oder Sequenzierungsfehlern beiträgt. Im Kontext der individuellen Sequenzierung können eine effektive Genomabdeckung und Fehlerkontrolle erreicht werden, wenn doppelseitige oder Mate-Pair-Sequenzierungsstrategien eingesetzt werden, vorausgesetzt, die Sequenzierungstiefe liegt im Bereich von 50X-100X. Diese erhebliche Tiefe erleichtert folglich die anschließende Zusammenstellung von Sequenzen zu Chromosomen, was den Prozess effizienter und genauer macht.

  • Abdeckung

Inzwischen bezieht sich das Maß für die Sequenzierungsabdeckung auf den Anteil des gesamten Genoms, der erfolgreich sequenziert wurde. Dieses Maß ist ein bedeutender Indikator für die Zufälligkeit, die mit der Sequenzierung verbunden ist. Die Beziehung zwischen Sequenzierungstiefe und Abdeckung kann effektiv durch das renommierte Lander-Waterman-Modell (1988) bestimmt werden. Laut diesem Modell entspricht eine Sequenzierungstiefe von 5X ungefähr einer Abdeckung von 99,4 % des gesamten Genoms.

Anwendung von WGS

WGS findet Anwendung in verschiedenen Bereichen, einschließlich der Bestimmung der Mutationsrate, genomweite Assoziationsstudienmedizinische Diagnostik, Studien zu seltenen Variationen, Onkologie, epidemiologische Untersuchungen und medizinische Genetik, unter anderem.

Medizinische Diagnostik

Im Bereich der medizinischen Diagnostik führte Illumina, das führende Unternehmen im Bereich Genomik, im Jahr 2009 seinen ersten Whole-Genome-Sequencer ein. Dies stellte einen bedeutenden Übergang dar, da er für die klinische Nutzung genehmigt wurde, anstatt ausschließlich für Forschungszwecke verwendet zu werden. Im selben Jahr interpretierte ein Team unter der Leitung von Euan Ashley an der Stanford University das vollständige menschliche Genom des Bioingenieurs Stephen Quake klinisch, was die praktische Etablierung dieser Technologie im Bereich der medizinischen Diagnostik symbolisierte.

Medizinische Genetik

Der Bereich der medizinischen Genetik hat auch stark von der kosteneffizienten Natur profitiert. Whole-Genome-SequenzierungWGS wird zunehmend eingesetzt, um die genetischen Grundlagen sowohl von Mendelschen als auch von komplexen Krankheiten zu entschlüsseln, neuartige Krankheitsbiologien zu beleuchten und erhebliche Unterstützung bei klinischen Diagnosen und Behandlungsstrategien zu bieten.

Mutationsfrequenzen

WGS erleichtert die Identifizierung der Mutationsrate des gesamten menschlichen Genoms. Die Mutationsrate über verschiedene menschliche Generationen (von Eltern zu Nachkommen) liegt bei etwa 70 neuen Mutationen pro Generation.

Onkologie

Im Bereich der Onkologie umfasst die umfassende WGS die Rekonstruktion von Subklonen basierend auf zirkulierender Tumor-DNA.ctDNA) im Plasma. Dies ebnet den Weg für umfassende epigenomische und genomische Analysen, die die dynamische Expression von zirkulierender Tumor-DNA in jeder Situation offenbaren.

Epidemiologische Untersuchungen

In epidemiologischen Untersuchungen verbessert die WGS, die über die letztendliche diskriminierende Fähigkeit verfügt, eng verwandte pathogene Stämme zu unterscheiden, erheblich die traditionellen epidemiologischen Untersuchungen von Ausbrüchen von Infektionskrankheiten. Durch die Kombination von WGS mit einer eingehenden epidemiologischen Analyse wurden neuartige Erkenntnisse über verschiedene Aspekte gewonnen. Dazu gehören die Ursprünge und Ausbreitungsdynamiken umfangreicher Ausbrüche, die durch Escherichia coli und Vibrio cholerae verursacht wurden. Auch Krankenhausausbrüche, die durch Methicillin-resistenten Staphylococcus aureus (MRSA), Klebsiella pneumoniae und Abscessus-Bazillen induziert wurden, wurden untersucht. Gemeinschaftsorientierte Ausbrüche durch Mycobacterium tuberculosis und umweltbedingte Pilzausbrüche, die mit Naturkatastrophen in Verbindung stehen, haben aufgrund der Integration von WGS umfassende Analysen erhalten.

Wenn Sie an unseren Genomik-Dienstleistungen interessiert sind, zögern Sie bitte nicht, unsere Wissenschaftler zu kontaktieren. Wir helfen Ihnen gerne weiter. Neben Genomsequenzierung, bieten wir auch Dienstleistungen an, einschließlich Transkriptomik, Epigenomik, mikrobielle Genomikund PacBio SMRT-Sequenzierung.

Referenzen:

  1. Bentley D R. Whole-Genome-Re-Sequenzierung. Aktuelle Meinungen in Genetik & Entwicklung, 2006, 16(6):545-552.
  2. Fuentespardo A P, Ruzzante D E. Ansätze zur Ganzgenomsequenzierung in der Naturschutzbiologie: Vorteile, Einschränkungen und praktische Empfehlungen. Molekulare Ökologie, 2017, 26(20):5369.
  3. Batzoglou S, Berger B, Mesirov J, et al. Sequenzierung eines Genoms durch das Gehen mit Klon-Endsequenzen (Abstract): eine mathematische Analyse// Internationale Konferenz über Computational Molecular Biology. DBLP, 2000:45.
  4. Sanger F, Coulson A R, Hong G F, et al. Nukleotidsequenz der DNA des Bakteriophagen Lambda. Journal für Molekularbiologie, 1982, 162(4):729-73.
  5. Kawarabayasi Y, Sawada M, Horikawa H, et al. Vollständige Sequenz und Genorganisation des Genoms eines hyperthermophilen Archaebakteriums, Pyrococcus horikoshii OT3. DNA-Forschung, 1998, 5(2):55.
  6. Kaneko T, Sato S, Kotani H, et al. Sequenzanalyse des Genoms des einzelligen Cyanobakteriums Synechocystis sp. Stamm PCC6803. II. Bestimmung der gesamten Sequenz des Genoms und Zuordnung potenzieller protein-kodierender Regionen. DNA-Forschung, 1996, 3(3):185-209.
  7. Myers E W, Sutton G G, Delcher A L, et al. Eine Ganzgenomassemblierung von. Wissenschaft, 2014.
  8. Siegel A F, Engh G V D, Hood L, et al. Modellierung der Machbarkeit von Whole Genome Shotgun-Sequenzierung unter Verwendung einer Pairwise-End-Strategie. Genomik, 2000, 68(3):237.
  9. Weiß O, Fraser C M. Genomsequenz des strahlenresistenten Bakteriums Deinococcus radiodurans R1. Wissenschaft, 1999, 286(5444):1571-1577.
  10. May B J, Zhang Q, Li L L, et al. Vollständige genomische Sequenz von Pasteurella multocida, Pm70. Sitzungsberichte der Nationalen Akademie der Wissenschaften der Vereinigten Staaten von Amerika, 2001, 98(6):3460-3465.
  11. Ginsburg G S, Willard H F. Genomische und personalisierte Medizin. Akademischer Verlag, 2008.
  12. Ormond K E, Wheeler M T, Hudgins L, et al. Herausforderungen bei der klinischen Anwendung von Whole-Genome-Sequenzierung. Der Lancet, 2010, 375(9727): 1749-1751.
  13. Le V T M, Diep B A. Ausgewählte Erkenntnisse aus der Anwendung von Whole-Genome-Sequenzierung für Ausbruchsuntersuchungen. Aktuelle Meinungen in der Intensivmedizin, 2013, 19(5): 432-439.
  14. Wu J, Wu M, Chen T, et al. Whole-Genome-Sequenzierung und ihre Anwendungen in der medizinischen Genetik. Quantitative Biologie, 2016, 4(2): 115-128.
  15. Ashley E A, Butte A J, Wheeler M T, et al. Klinische Bewertung unter Einbeziehung eines persönlichen Genoms. Die Lancet, 2010, 375(9725): 1525-1535.
  16. Roach JC, Glusman G, Smit AF, et al. Analyse der genetischen Vererbung in einem Familienquartett durch Whole-Genome-Sequenzierung. Wissenschaft, 2010, 328 (5978): 636–9.
  17. Campbell CD, Chong JX, Malig M; et al. Schätzung der menschlichen Mutationsrate unter Verwendung von Autozygotie in einer Gründerpopulation. Nat. Genet., 2012, 44 (11): 1277–81.
  18. Herberts Cameron, Annala Matti, Sipola Joonatan u.a. Tiefe Ganzgenom-ctDNA-Chronologie von behandlungsresistentem Prostatakrebs. Natur, 2022, 608 (7921): 199–208.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
Sprechen Sie mit unseren Wissenschaftlern
Was möchten Sie besprechen?
Mit wem werden wir sprechen?

* ist ein erforderlicher Artikel.

Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben