Niedrigabdeckende Ganzgenomsequenzierung

Was ist eine Niedrigabdeckungs-Genomsequenzierung?

Genotypen, die mit hochauflösenden Nachsequenzierungsmethoden erkannt werden, sind zweifellos die umfassendsten, aber derzeit zu kostspielig, um sie in der Pflanzen- und Tierzucht anzuwenden, insbesondere bei Arten mit komplexen, großen Genomen. Niedrigabdeckungs- Genomsequenzierung (lcWGS) entwickelt sich zu einer effektiven Alternative, indem es Sequenzierungstiefe zugunsten einer größeren Genomabdeckung und einer größeren Stichprobengröße opfert, unterstützt durch probabilistische statistische Strategien.

Die LcWGS-Strategie kombiniert die Vorteile von RAD-seq, während die Nachteile vermieden werden. Es kann das gesamte Genom auf Bevölkerungsebene untersuchen (unter Berücksichtigung sowohl der Genomtiefe als auch der -breite), während die Informationen der Individuen erhalten bleiben, und die Kosten sind vergleichbar mit beiden. Daher ist die Gewinnung genomweiter Genotypen durch lcWGS in Kombination mit Algorithmen in den letzten Jahren eine gängige Praxis geworden.

Merkmale der Niedrigabdeckungs-Whole-Genome-Sequenzierungstechnologie

LcWGS WGS Array RAD-seq
Sequenzierungstiefe niedrig hoch - hoch
Anzahl der Varianten mehr mehr weniger weniger
Neue Variantenentdeckung ja ja nein nein
Genauigkeit moderat hoch hoch hoch
Referenzgenom ja ja ja ja/nein
Kosten niedrig hoch niedrig niedrig

Welche Probleme kann LcWGS lösen?

Low-Coverage-Genomsequenzierung (lcWGS) führt zuerst durch Ganzgenom-Niedertiefen-Resequenzierung und die Variantenerkennung für alle Individuen in einer Population, und verwendet dann Algorithmen, um die fehlenden Genotypen basierend auf dem Linkage-Disequilibrium (LD) zwischen den Varianten zu inferieren und zu imputieren, und schließlich hochdichte genetische Marker auf dem gesamten Genomniveau für großangelegte Proben zu erhalten.

In den letzten Jahren wurde theoretisch nachgewiesen, dass LcWGS für große Proben genomsweite hochdichte SNP-Marker zu sehr geringen Kosten erhalten kann, was wiederum die Genauigkeit der QTL-Lokalisierung erhöht und die genetischen Mechanismen verschiedener Krankheiten besser erforscht. LcWGS wurde auch für Assoziationsanalysen und populationgenetische Studien verwendet. Der Vorteil, niedrigdichte Daten auf das Niveau der Ganzgenomsequenzierung für die Zuchtwertschätzung zu bringen, erwies sich als stark abhängig von der Häufigkeitsverteilung der ursächlichen Mutationen. Die Überlegenheit der angereicherten Daten unter einem neutralen Modell war gering, und die Genauigkeit der genetischen Bewertung unter Verwendung angereicherter Daten konnte um 30 % verbessert werden, wenn alle minimalen Allelfrequenzen der ursächlichen Mutationen niedrig waren.

Workflow der LcWGS-Analyse

Der lcWGS-Vorverarbeitungsprozess ähnelt dem WGS, aber ein wichtiger Unterschied besteht darin, dass genotypische Wahrscheinlichkeiten verwendet werden müssen, um die Wahrscheinlichkeit der genotypischen Unsicherheit zu erklären, wie z.B. bei der nachgelagerten Analyse unter Verwendung des Allelfrequenzspektrums (SFS). Der lcWGS-Datenanalyseprozess nutzt genotypische Wahrscheinlichkeiten, um einen probabilistischen Rahmen für Unsicherheit zu erklären. Vom Allelfrequenzspektrum (SFS) bis hin zu Diversitätsstatistiken und FST ist dies der Analyseprozess der ANGSD-Software. Andere Werkzeuge (z.B. ATLAS) können diese Statistiken direkt aus GLs ableiten, ohne zuvor SFS zu verwenden.

Workflow of lcWGS.Workflow von lcWGS. (Lou et al., 2021)

Wie man Experimente für die Niedrigabdeckung der gesamten Genomsequenzierung entwirft?

Es gibt keinen einheitlichen Satz von experimentellen Designs für Low-Depth-Resequenzierung, der für alle Studienzwecke geeignet ist. Stattdessen hängt das optimale Design von den Zielen der Studie, dem System und dem Budget ab. Bei einem gegebenen Budget sind die Hauptkompromisse bei der Low-Depth-Resequenzierung die Stichprobengröße und die Sequenzierungstiefe. Zum Beispiel können die Schätzung der Allelfrequenz, die Analyse der Populationsstruktur und die genetische Differenzierung zwischen Populationen mit mehr Proben sequenziert werden, um genaue Ergebnisse zu erzielen; Allelfrequenzspektren (SFS), demografische Inferenz unter Verwendung von δaδi, Tajima'D oder absoluten Werten von LD erfordern die Berücksichtigung höherer Sequenzierungstiefen. Daher müssen Forscher sorgfältig abwägen, welche Art von Analyse für die Studienziele am wichtigsten ist, und das geeignete Gleichgewicht finden. Durch die Synthese der Ergebnisse unserer und früherer Studien bieten wir einige allgemeine Richtlinien für das Design von Low-Depth-Resequenzierungsexperimenten.

Was sind die Vorteile der Niedrigabdeckungs-Genomsequenzierung?

Die Niedrigabdeckungs-Genomsequenzierung bezieht sich auf die Sequenzierung eines Genoms mit einer relativ geringen Tiefe, was typischerweise zu einer unvollständigen Abdeckung des gesamten Genoms führt. Während die Niedrigabdeckungssequenzierung einige Vorteile hat, bringt sie auch bestimmte Einschränkungen mit sich.

Vorteile der Niedrigabdeckungs-Genomsequenzierung:

  • Kosteneffektiv: Niedrigabdeckungs-Sequenzierung benötigt weniger Sequenzierungsressourcen, was sie kosteneffizienter macht im Vergleich zur Hochdurchsatz-Sequenzierung. Dies ermöglicht es Forschern, eine größere Anzahl von Proben innerhalb eines bestimmten Budgets zu sequenzieren.
  • Effizient für Populationsstudien: In Populationsstudien, in denen Forscher genetische Variationen bei einer großen Anzahl von Individuen analysieren möchten, kann die Niedrigdurchsatz-Sequenzierung eine angemessene Darstellung genetischer Variation zu einem Bruchteil der Kosten einer Tiefensequenzierung bieten. Sie ermöglicht eine effiziente Identifizierung häufiger genetischer Varianten und die Untersuchung von Mustern auf Populationsebene.
  • Identifizierung häufiger genetischer Varianten: Die Niedrigabdeckung-Sequenzierung kann effektiv häufige genetische Varianten identifizieren, die in der Bevölkerung mit höherer Frequenz auftreten. Dies ist besonders nützlich in genomweiten Assoziationsstudien (GWAS), in denen Forscher die Beziehung zwischen genetischen Variationen und Merkmalen oder Krankheiten untersuchen.

Wie sieht es mit den Einschränkungen und Herausforderungen der Niedrigabdeckungs-Genomsequenzierung aus?

Trotz der vielen Vorteile von LcWGS gibt es immer noch Mängel in den folgenden Bereichen:

  • Komplexer Prozess und Mangel an benutzerfreundlicher Softwareoberfläche und Dokumentation: LcWGS umfasst mehrere Schritte, einschließlich Bibliotheksvorbereitung, Sequenzierung und Datenanalyse. Der Prozess kann technisch herausfordernd sein und erfordert Fachwissen in Genomik und Bioinformatik. Darüber hinaus kann die Verfügbarkeit von benutzerfreundlichen Softwareoberflächen und umfassender Dokumentation für die LcWGS-Analyse begrenzt sein, was es für Forscher, die mit diesen Techniken nicht gut vertraut sind, weniger zugänglich macht.
  • Rechenanforderungen für Phasenfixierung und Padding: Um die Phase genetischer Varianten (d.h. die Anordnung der Varianten auf jedem Chromosom) genau zu bestimmen, sind zusätzliche Rechenressourcen und Algorithmen erforderlich. Phasenfixierung und Padding beinhalten rechenintensive Prozesse zur Auflösung von Haplotyp-Ambiguität und zur Reduzierung der Anzahl möglicher Haplotypkombinationen, was in Bezug auf Zeit und Rechenleistung anspruchsvoll ist.
  • Inkonsistente Genotypinterpretation aufgrund von Softwarebeschränkungen: Die für die LcWGS-Analyse verwendete Software kann bestimmte Einschränkungen aufweisen, wie algorithmische Verzerrungen oder Fehler bei der Genotypbestimmung. Dies kann zu Inkonsistenzen in der Genotypinterpretation führen, die die Genauigkeit und Zuverlässigkeit der Ergebnisse beeinträchtigen.
  • Nicht geeignet für die Analyse bekannter Genotypen und anfällig für Batch-Effekte: LcWGS ist möglicherweise nicht ideal für die Analyse bekannter Genotypen, wie z.B. gezielte Genotypisierung oder Validierungsstudien. Die begrenzte Abdeckung und Tiefe kann zu verpassten oder ungenauen Genotypisierungsaufrufen führen, was die Zuverlässigkeit solcher Analysen beeinträchtigt. Darüber hinaus kann LcWGS anfällig für Batch-Effekte sein, bei denen technische Variationen, die während der Probenverarbeitung oder Sequenzierung eingeführt werden, die Ergebnisse beeinflussen können, was den Vergleich von Proben über verschiedene Chargen oder Studien hinweg erschwert.
  • Unfähigkeit zur genauen Phasierung ohne ein Referenzpanel: Die genaue Phasierung genetischer Varianten erfordert ein Referenzpanel von Haplotypen aus einer vielfältigen Population. Ohne ein geeignetes Referenzpanel kann LcWGS Schwierigkeiten haben, Haplotypen genau zu bestimmen, was seine Fähigkeit einschränkt, detaillierte Informationen über die Anordnung der Varianten auf jedem Chromosom bereitzustellen.
  • Ungeeignetheit für kleine Stichprobengrößen und komplexe Genome: LcWGS ist möglicherweise nicht gut geeignet für kleine Stichprobengrößen, da die begrenzte Abdeckung und Tiefe zu einer verringerten Sensitivität bei der Erkennung genetischer Varianten führen kann, insbesondere bei seltenen oder niedrigfrequenten Varianten. Darüber hinaus können komplexe Genome mit repetitiven Regionen oder strukturellen Variationen Herausforderungen für die genaue Variantenbestimmung und Assemblierung unter Verwendung von LcWGS-Daten darstellen.

Referenz:

  1. Lou, Runyang Nicolas, et al. "Ein Anfängerleitfaden zur Ganzgenomsequenzierung mit niedriger Abdeckung für die Populationsgenomik." Molekulare Ökologie 30.23 (2021): 5966-5993.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben