Genotypen, die mit hochauflösenden Nachsequenzierungsmethoden erkannt werden, sind zweifellos die umfassendsten, aber derzeit zu kostspielig, um sie in der Pflanzen- und Tierzucht anzuwenden, insbesondere bei Arten mit komplexen, großen Genomen. Niedrigabdeckungs- Genomsequenzierung (lcWGS) entwickelt sich zu einer effektiven Alternative, indem es Sequenzierungstiefe zugunsten einer größeren Genomabdeckung und einer größeren Stichprobengröße opfert, unterstützt durch probabilistische statistische Strategien.
Die LcWGS-Strategie kombiniert die Vorteile von RAD-seq, während die Nachteile vermieden werden. Es kann das gesamte Genom auf Bevölkerungsebene untersuchen (unter Berücksichtigung sowohl der Genomtiefe als auch der -breite), während die Informationen der Individuen erhalten bleiben, und die Kosten sind vergleichbar mit beiden. Daher ist die Gewinnung genomweiter Genotypen durch lcWGS in Kombination mit Algorithmen in den letzten Jahren eine gängige Praxis geworden.
Merkmale der Niedrigabdeckungs-Whole-Genome-Sequenzierungstechnologie
| LcWGS | WGS | Array | RAD-seq | |
| Sequenzierungstiefe | niedrig | hoch | - | hoch |
| Anzahl der Varianten | mehr | mehr | weniger | weniger |
| Neue Variantenentdeckung | ja | ja | nein | nein |
| Genauigkeit | moderat | hoch | hoch | hoch |
| Referenzgenom | ja | ja | ja | ja/nein |
| Kosten | niedrig | hoch | niedrig | niedrig |
Low-Coverage-Genomsequenzierung (lcWGS) führt zuerst durch Ganzgenom-Niedertiefen-Resequenzierung und die Variantenerkennung für alle Individuen in einer Population, und verwendet dann Algorithmen, um die fehlenden Genotypen basierend auf dem Linkage-Disequilibrium (LD) zwischen den Varianten zu inferieren und zu imputieren, und schließlich hochdichte genetische Marker auf dem gesamten Genomniveau für großangelegte Proben zu erhalten.
In den letzten Jahren wurde theoretisch nachgewiesen, dass LcWGS für große Proben genomsweite hochdichte SNP-Marker zu sehr geringen Kosten erhalten kann, was wiederum die Genauigkeit der QTL-Lokalisierung erhöht und die genetischen Mechanismen verschiedener Krankheiten besser erforscht. LcWGS wurde auch für Assoziationsanalysen und populationgenetische Studien verwendet. Der Vorteil, niedrigdichte Daten auf das Niveau der Ganzgenomsequenzierung für die Zuchtwertschätzung zu bringen, erwies sich als stark abhängig von der Häufigkeitsverteilung der ursächlichen Mutationen. Die Überlegenheit der angereicherten Daten unter einem neutralen Modell war gering, und die Genauigkeit der genetischen Bewertung unter Verwendung angereicherter Daten konnte um 30 % verbessert werden, wenn alle minimalen Allelfrequenzen der ursächlichen Mutationen niedrig waren.
Der lcWGS-Vorverarbeitungsprozess ähnelt dem WGS, aber ein wichtiger Unterschied besteht darin, dass genotypische Wahrscheinlichkeiten verwendet werden müssen, um die Wahrscheinlichkeit der genotypischen Unsicherheit zu erklären, wie z.B. bei der nachgelagerten Analyse unter Verwendung des Allelfrequenzspektrums (SFS). Der lcWGS-Datenanalyseprozess nutzt genotypische Wahrscheinlichkeiten, um einen probabilistischen Rahmen für Unsicherheit zu erklären. Vom Allelfrequenzspektrum (SFS) bis hin zu Diversitätsstatistiken und FST ist dies der Analyseprozess der ANGSD-Software. Andere Werkzeuge (z.B. ATLAS) können diese Statistiken direkt aus GLs ableiten, ohne zuvor SFS zu verwenden.
Workflow von lcWGS. (Lou et al., 2021)
Es gibt keinen einheitlichen Satz von experimentellen Designs für Low-Depth-Resequenzierung, der für alle Studienzwecke geeignet ist. Stattdessen hängt das optimale Design von den Zielen der Studie, dem System und dem Budget ab. Bei einem gegebenen Budget sind die Hauptkompromisse bei der Low-Depth-Resequenzierung die Stichprobengröße und die Sequenzierungstiefe. Zum Beispiel können die Schätzung der Allelfrequenz, die Analyse der Populationsstruktur und die genetische Differenzierung zwischen Populationen mit mehr Proben sequenziert werden, um genaue Ergebnisse zu erzielen; Allelfrequenzspektren (SFS), demografische Inferenz unter Verwendung von δaδi, Tajima'D oder absoluten Werten von LD erfordern die Berücksichtigung höherer Sequenzierungstiefen. Daher müssen Forscher sorgfältig abwägen, welche Art von Analyse für die Studienziele am wichtigsten ist, und das geeignete Gleichgewicht finden. Durch die Synthese der Ergebnisse unserer und früherer Studien bieten wir einige allgemeine Richtlinien für das Design von Low-Depth-Resequenzierungsexperimenten.
Die Niedrigabdeckungs-Genomsequenzierung bezieht sich auf die Sequenzierung eines Genoms mit einer relativ geringen Tiefe, was typischerweise zu einer unvollständigen Abdeckung des gesamten Genoms führt. Während die Niedrigabdeckungssequenzierung einige Vorteile hat, bringt sie auch bestimmte Einschränkungen mit sich.
Vorteile der Niedrigabdeckungs-Genomsequenzierung:
Trotz der vielen Vorteile von LcWGS gibt es immer noch Mängel in den folgenden Bereichen:
Referenz: