26. März 2021 | Christie Rizk

NEW YORK – Eine internationale Gruppe von Forschern hat gezeigt, dass die Sequenzierung mit niedriger Abdeckung effektiv neuartige Varianten in den Genomen von Individuen aus derzeit unterrepräsentierten Populationen in genomischen Datenbanken identifizieren kann und dabei hilft, die Herausforderungen zu überwinden, die durch gängige Genotypisierungsarrays entstehen.
In einer am Donnerstag im American Journal of Human Genetics veröffentlichten Studie stellten die Forscher fest, dass die meisten genetischen Studien Genotypisierungsarrays und sequenzierte Referenzpanels verwenden, die die am häufigsten vorkommende Variation in europäischen Abstammungspopulationen am besten erfassen. Um daher Datenproduktionsansätze zu vergleichen, die am besten für unterrepräsentierte Populationen geeignet sind, sequenzierten die Forscher die gesamten Genome von 91 Individuen im Rahmen der Studie zur neuropsychiatrischen Genetik der afrikanischen Bevölkerung-Psychose (NeuroGAP-Psychose) mit Teilnehmern aus Äthiopien, Kenia, Südafrika und Uganda.
Sie sequenzierten diese Genome mit hoher Abdeckung und verwendeten dann einen Downsampling-Ansatz, um die Qualität von genomanalytischen Assoziationsstudien (GWAS) Arrays im Vergleich zu Sequenzierungen mit niedriger Abdeckung zu bewerten, indem sie die Übereinstimmung der imputierten Varianten aus diesen Technologien mit denen aus tiefen Ganzgenom-Sequenzierungsdaten berechneten. Dabei stellten die Forscher fest, dass Sequenzierungen mit niedriger Abdeckung bei einer Tiefe von 4x oder mehr Varianten aller Frequenzen genauer erfassten als alle gängigen GWAS-Arrays, die sie untersuchten, und dies zu vergleichbaren Kosten. Darüber hinaus bemerkten sie, dass die niedrigeren Sequenzierungstiefen von 0,5x bis 1x vergleichbar mit den häufig verwendeten GWAS-Arrays mit niedriger Dichte abschnitten.
Die Forscher fanden auch heraus, dass die Niedrigabdeckung-Sequenzierung empfindlich auf neuartige Variationen reagierte: Die 4-fache Sequenzierung entdeckte 45 Prozent der Einzelvarianten und 95 Prozent der häufigen Varianten, die zuvor in hochabgedeckten afrikanischen Vollgenomen identifiziert worden waren.
„Unsere Arbeit zeigt, dass es höchste Zeit ist, von Mikroarrays auf Low-Coverage-Ganzgenomsequenzierung für Studien zu komplexen Krankheiten umzusteigen. Dies gilt insbesondere für Bevölkerungsgruppen, die in genetischen Studien unterrepräsentiert sind, aus zwei großen Gründen“, sagte die Erstautorin und Forscherin am Broad Institute, Alicia Martin.
„Zunächst können wir die Lücke zwischen kostspieligen Studien zu seltenen Varianten, die normalerweise in Familien durchgeführt werden, und günstigeren Studien zu häufigen Varianten überbrücken, um die genetische Architektur häufiger Krankheiten besser zu verstehen“, sagte Martin. „Zweitens bietet das Low-Coverage-Sequencing im Gegensatz zu Mikroarrays die Möglichkeit, dauerhafte genomische Ressourcen aufzubauen, die zukünftige Studien in Populationen erleichtern werden, die derzeit über keine guten Referenzdatensätze verfügen.“
Aus ihren verschiedenen Analysen stellten die Forscher fest, dass das 4x-Sequencing alle von ihnen bewerteten GWAS-Arrays übertraf, einschließlich dichter Arrays wie dem H3Africa-Array, das entwickelt wurde, um afrikanische Variationen zu erfassen. Das 4x-Sequencing war auch preislich mit Hochdichte-Arrays vergleichbar, die Millionen von SNPs und Indels über das Allelfrequenzspektrum hinweg untersuchten.
Sie fanden außerdem heraus, dass 1x-Sequenzierung zu den erschwinglicheren Optionen gehörte, kostengünstiger war und ähnlich oder besser abschnitt als häufig verwendete Arrays mit niedrigerer Dichte wie das Illumina GSA. Sie bemerkten auch, dass das GSA aus Varianten besteht, die in europäischen Populationen am häufigsten vorkommen, und es daher nicht die geeignetste Technologie für Studien mit Teilnehmern nicht-europäischer Abstammung ist.
Abgesehen von den Kosten hatte die Niedrigabdeckungs-Sequenzierung mehrere deutliche Vorteile im Vergleich zu GWAS-Arrays, insbesondere eine genauere Identifizierung genetischer Variationen über das Allelfrequenzspektrum in unterrepräsentierten Populationen. In den NeuroGAP-Psychose-Daten stellten die Forscher fest, dass 38 Prozent der häufigen Varianten nicht aus den 1000 Genomes Phase III-Daten imputiert werden konnten, höchstwahrscheinlich aufgrund eines Mangels an östlicher und südlicher afrikanischer Vielfalt in diesem Panel.
Unter den seltenen Varianten war die Tatsache, dass die 4x-Sequenzierung fast die Hälfte aller Einzelvarianten entdeckte, besonders ansprechend für Krankheitsstudien. Frühere Arbeiten in der psychiatrischen Genetik haben gezeigt, dass während häufige Varianten den Großteil der SNP-Heredität für Schizophrenie erklären, beispielsweise Exomstudien auch teilweise konvergierende genetische Signaturen offenbaren, die für schwere psychiatrische Störungen informativ sind, sagten sie. Sequenzierungstechnologien, die die Lücke zwischen seltenen und häufigen Varianten überbrücken können, werden daher entscheidend sein, um ihre genetischen Architekturen vollständig zu erhellen, indem sie kausale Varianten verfeinern, angereicherte Variation erkennen und seltene Varianten mit großen Effekten identifizieren.
Die Forscher wiesen darauf hin, dass methodische Fortschritte nach GWAS mit Daten aus Niedrigabdeckung-Sequenzierung diese Analysen erleichtern können.
„Wir werden in wichtigen laufenden Studien eine Niedrigabdeckungs-Sequenzierung verwenden, einschließlich der NeuroGAP-Psychose-Studie mit 40.000 Studienteilnehmern aus Äthiopien, Kenia, Südafrika und Uganda sowie dem übergreifenden Projekt Populations Underrepresented in Mental illness Association Studies (PUMAS), das 120.000 sequenzierte lateinamerikanische und afrikanische Populationen umfassen wird“, fügte Martin hinzu.
Mehr Informationen unter: https://www.genomeweb.com/sequencing/low-coverage-sequencing-effectively-ids-novel-variants-underrepresented-populations#.YGKSBa8zY2w