Die umfassendste GWAS-Datenbank

Genomweite Assoziationsstudien (GWAS) decken die genetischen Grundlagen komplexer Merkmale und Krankheiten auf, indem sie Assoziationen zwischen genomischen Variationen und phänotypischen Eigenschaften analysieren. GWAS-Datenbanken dienen als wesentliche Ressourcen, die genetische und phänotypische Daten integrieren, um großangelegte genomische Analysen zu unterstützen. Dieser Artikel fasst die Merkmale, Datentypen und Zugangsanforderungen gängiger GWAS-Datenbanken wie GWAS-Katalog, OpenGWAS und UK Biobank zusammen. Er bietet auch detaillierte Anleitungen zum Herunterladen und zur Nutzung von Daten, um Forschern zu ermöglichen, diese Ressourcen effizient zu nutzen und die genetische Forschung voranzutreiben.

Was ist eine GWAS-Datenbank?

Eine GWAS-Datenbank dient als Repository für genetische und phänotypische Daten, die aus verschiedenen Studien gesammelt wurden, und ermöglicht es Forschern, umfassende Datensätze für Analysen zuzugreifen. Diese Datenbanken enthalten typischerweise Genotypdaten (z. B. SNPs, Insertionen) und phänotypische Daten (beobachtbare Merkmale), die großangelegte Analysen erleichtern und die Fähigkeit zur Entdeckung genetischer Assoziationen erhöhen.

Die GWAS-Daten, über die wir oft sprechen, beziehen sich im Allgemeinen auf die GWAS-Zusammenfassung, die die Informationen zu SNP-Stellen einzeln aufzeichnet, einschließlich der Stellen, P-Werte und anderer Informationen.

GWAS summary table.Abbildung 1. GWAS-Zusammenfassungsdaten.

Liste der GWAS-Datenbanken

Die folgenden sind einige häufig verwendete GWAS-Datenbanken:

GWAS-Katalog

Diese von dem Europäischen Institut für Bioinformatik (EMBL-EBI) gepflegte Datenbank sammelt und organisiert Ergebnisse aus genomweiten Assoziationsstudien (GWAS), die weltweit durchgeführt werden. Sie bietet umfassende Daten zu Gen-Phänotyp-Assoziationen, einschließlich der Standorte genetischer Varianten, assoziierter Phänotypen, Effektgrößen und statistischer Signifikanz. Die Datenbank ist vollständig im offenen Zugang, sodass Benutzer die Daten frei durchsuchen und herunterladen können.

OpenGWAS

Die von der MRC Integrative Epidemiology Unit an der Universität Bristol gepflegte Datenbank bietet umfangreiche Optionen zum Herunterladen von Daten und API-Zugriff, einschließlich einiger unveröffentlichter GWAS-Ergebnisse. Forscher, die diese Ressource nutzen, sollten regelmäßig nach Aktualisierungen suchen, um auf die neuesten Daten zuzugreifen, die Nutzungsbedingungen und Zitieranforderungen sorgfältig überprüfen und auf Informationen zur Qualitätskontrolle sowie die Bevölkerungsquellen der Daten achten.

GIANT (Genetische Untersuchung anthropometrischer Merkmale)

Ein internationales Kooperationsprojekt, das sich mit der Untersuchung der genetischen Faktoren beschäftigt, die die Körpergröße und -form des Menschen beeinflussen, wie zum Beispiel Größe, Body-Mass-Index (BMI) und Adipositaslevels.

UK Biobank

Eine groß angelegte Datenbank biologischer Proben und Gesundheitsinformationen, die häufig in GWAS-Forschung verwendet wird. Sie bietet umfangreiche genetische und phänotypische Daten, die für Mendelsche Randomisierungsanalysen im Zusammenhang mit verschiedenen Gesundheits- und Krankheitsausgängen geeignet sind. Der Zugriff auf die Daten erfordert einen Antrag, eine ethische Überprüfung und eine Zahlung.

EGA (Europäisches Genom-Phänotyp-Archiv)

Eine Datenbank, die speziell für die Speicherung und Verteilung genetischer und phänotypischer Daten im Zusammenhang mit biomedizinischer Forschung entwickelt wurde. Sie legt besonderen Wert auf Datenschutz und Datensicherheit, insbesondere für sensible menschliche genetische Informationen. EGA enthält Daten aus GWAS, Sequenzierungsprojekten und anderen großangelegten genetischen Studien, die mit Krankheiten und normalen phänotypischen Merkmalen verbunden sind. Der Zugriff auf EGA-Daten erfordert einen strengen Prozess, bei dem Forscher einen Antrag einreichen müssen, der den Verwendungszweck detailliert beschreibt, der genehmigt werden muss, bevor der Datenzugriff gewährt wird.

dbGaP (Datenbank von Genotypen und Phänotypen)

Verwaltet vom National Center for Biotechnology Information (NCBI) archiviert, kuratiert und verbreitet diese Datenbank Forschungsdaten, die die Interaktion zwischen Genotypen und Phänotypen untersuchen. Die Daten stammen typischerweise aus GWAS, medizinischen Sequenzierungsprojekten, molekularen Diagnosestudien und anderen genetischen sowie klinischen Forschungsbereichen. Der Zugang erfordert einen detaillierten Antragsprozess, einschließlich der Einreichung eines Forschungsplans, des Verwendungszwecks und oft der Genehmigung durch ein Institutional Review Board (IRB) oder eine Ethikkommission. Genehmigte Forscher erhalten Zugang zu spezifischen Datensätzen für ihre Projekte.

FinnGen

Eine finnische genetische Datenbank, die umfangreiche genetische Daten der finnischen Bevölkerung enthält. Aufgrund der hohen genetischen Homogenität der Bevölkerung ist sie besonders wertvoll für die Identifizierung der genetischen Grundlagen komplexer Krankheiten. Die Daten sind öffentlich für Forschungszwecke verfügbar, der Zugang kann jedoch die Einhaltung bestimmter Richtlinien oder Kooperationsvereinbarungen erfordern.

IEU (Instrumentvariablen-Schätzung in der Epidemiologie-Einheit)

Diese Datenbank und Ressourcenplattform bietet instrumentelle Variablen (typischerweise Einzel-Nukleotid-Polymorphismen, SNPs) und methodologische Unterstützung für Mendelische Randomisierungsanalysen. Viele der methodologischen Ressourcen und einige Daten zu instrumentellen Variablen sind kostenlos verfügbar.

PGC (Psychiatrisches Genomik-Konsortium)

Ein Konsortium, das sich auf genetische Forschung im Zusammenhang mit psychiatrischen Störungen konzentriert. Es stellt GWAS-Daten bereit, die entscheidend für das Studium der ursächlichen Mechanismen hinter psychischen Gesundheitsproblemen sind.

CKD Gen

Eine Datenbank, die sich auf die genetische Untersuchung von chronischen Nierenerkrankungen und verwandten Merkmalen, wie der geschätzten glomerulären Filtrationsrate (eGFR), spezialisiert hat. Sie unterstützt Mendelsche Randomisierungsanalysen in der Nierenerforschung.

GEFOS (Genetische Faktoren für Osteoporose)

Eine Allianz, die sich auf die Genetik von Osteoporose konzentriert und GWAS-Daten zu Knochengesundheit und Osteoporose bereitstellt.

GLGC (Global Lipids Genetics Consortium)

Bietet genetische Daten zu Blutfettwerten und dient als wertvolle Ressource für Mendelsche Randomisierungsstudien im Bereich der Herz-Kreislauf-Erkrankungen und verwandten Bereichen.

SSGAC (Sozialwissenschaftlicher Genetischer Assoziationskonsortium)

Konzentriert sich auf genetische Forschung in sozialwissenschaftlichen Bereichen wie sozioökonomischem Status und Bildungsniveau.

Daten, die von Konsortien (z. B. PGC, CKD Gen, GEFOS, GLGC, SSGAC) oder Projekten generiert werden, werden oft nach der Veröffentlichung kostenlos mit der Forschungsgemeinschaft über wissenschaftliche Publikationen oder öffentliche Datenbanken geteilt.

Wie man GWAS-Daten herunterlädt

Suche nach Artikeln in PubMed

LiteratursucheBeginnen Sie mit der Suche in PubMed unter Verwendung von Schlüsselwörtern wie "GWAS", "genomweite Assoziationsstudie" sowie dem Namen der spezifischen Krankheit oder Eigenschaft von Interesse. Dies wird helfen, relevante Forschungsartikel zu identifizieren.

Zusammenfassende ÜberprüfungDie Überprüfung der Abstracts kann eine erste Einschätzung der Relevanz der Studien und der Anwendbarkeit der Daten liefern.

Identifizierende Daten Quellen: Viele GWAS-Studien erwähnen die Datensätze, die sie verwendet haben, oder geben die öffentlichen Datenbanken an, in denen die Daten gespeichert sind, wie das GWAS-Katalog, EGA (European Genome-Phenome Archive) oder dbGaP (Datenbank für Genotypen und Phänotypen).

Zugriff auf GWAS-Datenbanken und -RessourcenBefolgen Sie die Hinweise in der Literatur und greifen Sie direkt auf Datenbanken wie das GWAS-Katalog zu. Diese Datenbanken bieten häufig Optionen zum Herunterladen von Daten, die eine Kontoanmeldung und die Zustimmung zu bestimmten Nutzungsbedingungen erfordern können.

Download in der OpenGWAS-Datenbank

Nach dem Betreten der offiziellen Website sieht die Benutzeroberfläche wie folgt aus: Führen Sie eine Suche in der Suchleiste durch, geben Sie den Namen einer Krankheit oder eines Merkmals ein, zum Beispiel "Fett".

OpenGWAS database home page.Abbildung 2. Startseite der OpenGWAS-Datenbank.

Die Suchergebnisse sind einige grundlegende Informationen, hauptsächlich in Bezug auf die ID, da wir diese ID verwenden können, um das TwoSampleMR-Paket direkt zu analysieren. Der erste Buchstabe der ID gibt an, zu welcher Datenbank sie gehört.

OpenGWAS database search page.Abbildung 3. OpenGWAS-Datenbank-Suchseite.

Klicken Sie auf die Daten im roten Feld, um eine detaillierte Beschreibung der Daten zu erhalten. Wenn Sie sehen, dass dieser Datensatz ein Download-VCF-Flag hat, ist dieser Datensatz in der Regel herunterladbar. Allgemein gesagt, wenn es kein solches Flag gibt, deutet dies darauf hin, dass die Daten möglicherweise nicht offen oder nicht herunterladbar sind, aber das ist nicht absolut.

OpenGWAS database download page.Abbildung 4. Download-Seite der OpenGWAS-Datenbank.

Herunterladen in der GWAS-Katalogdatenbank

Dies ist eine häufig verwendete Datenbank, aber diese Datenbank enthält oft unvollständige Daten, daher müssen wir beim Suchen darauf achten. Gehen Sie zum nächsten Bildschirm von den Zusammenfassungsstatistiken.

GWAS Catalog database home page.Abbildung 5. Startseite der GWAS-Katalogdatenbank.

Gehe zum nächsten Suchbildschirm von Verfügbaren Studien.

GWAS Catalog database summary statistics page.Abbildung 6. Zusammenfassende Statistiken der GWAS-Katalogdatenbank.

Die Option "Traits" ermöglicht es den Nutzern, die benötigten Daten zu suchen und zu finden. Beim Zugriff auf herunterladbare Dateien über FTP-Download ist es wichtig, die Dateigröße zu überprüfen; Dateien mit etwa 400 MB oder mehr enthalten typischerweise vollständige Datensätze, während kleinere Dateien möglicherweise nicht genügend SNP-Loci für die GWAS-Analyse enthalten. Darüber hinaus sind einige Datensätze mit GCST-präfixierten IDs auch in der openGWAS-Datenbank zu finden.

GWAS Catalog database search page.Abbildung 7. Suchseite der GWAS-Katalogdatenbank.

Zusammenfassend spielen GWAS-Datenbanken eine entscheidende Rolle bei der Förderung der genetischen Forschung, indem sie wesentliche Ressourcen bereitstellen, die die Erforschung genetischer Faktoren zugrunde liegender komplexer Merkmale und Krankheiten erleichtern. Mit einer Vielzahl von öffentlich zugänglichen und spezialisierten Datenbanken wie dem GWAS-Katalog, OpenGWAS und der UK Biobank können Forscher effizient auf große Mengen genetischer und phänotypischer Daten zugreifen.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben