Zusammenfassung gängiger Datenbanken für die Next-Generation-Sequenzierung

Die Rolle der NGS-Sequenzierungsdatenbank

Angesichts der beschleunigten Fortschritte in der Technologie, insbesondere der rasanten Entwicklung im Bereich der Bioinformatik, ist die Bedeutung von Next-Generation Sequencing (NGS) Die Technologien als essentielles Instrument in der biowissenschaftlichen Forschung haben deutlich zugenommen. Ausgezeichnet durch ihren hohen Durchsatz, ihre Effizienz und unfehlbare Genauigkeit bietet NGS unvergleichliche Perspektiven zur Erforschung der Komplexität der Lebenswissenschaften. Vor diesem Hintergrund hat die Rolle der NGS-Sequenzdatenbanken zunehmend eine zentrale Bedeutung angenommen. Diese Repositories haben sich zu einem unersetzlichen Grundpfeiler im Bereich der Lebenswissenschaften entwickelt und prägen und erweitern fortlaufend unser umfassendes Verständnis des komplexen Gefüges biologischer Systeme.

Die NGS-Datenbank fungiert als umfassendes Repository, das eine riesige Bandbreite von SequenzierungsdatenInnerhalb seiner Grenzen vereint es die fleißigen Bemühungen und Forschungsergebnisse von Wissenschaftlern weltweit und bietet Forschern eine reiche und unschätzbare Sammlung experimenteller Datenressourcen. Ermöglicht durch die NGS Durch die Sequenzierungsdatenbank erhalten Forscher einfachen Zugang zu Sequenzierungsdaten aus verschiedenen biologischen Proben, was es ermöglicht, die zugrunde liegenden biologischen Prinzipien und Geheimnisse, die in den Daten verborgen sind, zu entschlüsseln.

Software and databases used for NGS analysisAnalyse der Next-Generation-Sequenzierung. a Funktionen von Software und Datenbanken, die für die NGS-Analyse verwendet werden. b Pipeline der Analyse genomischer Varianten. (Andrés López-Cortés et al., 2020)

Die Rolle von NGS-Datenbanken zeigt sich in mehreren Dimensionen:

Datenlagerung und -verwaltung:

NGS Sequenzierungsdatenbanken verfügen über robuste Fähigkeiten zur Datenspeicherung und -verwaltung. Sie organisieren effizient große Mengen von Sequenzierungsdaten auf effiziente und strukturierte Weise, bieten eine Vielzahl von praktischen Abfrage- und Abrufwerkzeugen, die es Forschern ermöglichen, die gewünschten Daten schnell zu finden. Darüber hinaus verfügen diese Datenbanken über Mechanismen zur Datensicherung und -wiederherstellung, die die Sicherheit und Zuverlässigkeit der Daten gewährleisten.

Datenanalyse und -erkundung:

Neben der Bereitstellung umfangreicher Datenressourcen, NGS Datenbanken sind mit leistungsstarken Datenanalysetools ausgestattet. Forscher nutzen diese Werkzeuge, um eine eingehende Analyse und Erkundung von Sequenzierungsdaten, die biologische Phänomene wie Genvariationen und die Regulierung der Genexpression enthüllen. Diese Erkenntnisse bieten wissenschaftliche Grundlagen für die Krankheitsdiagnose, die Arzneimittelentwicklung und personalisierte Therapien.

Datenfreigabe und -austausch:

Datenfreigabe und -austausch sind entscheidend im Bereich von NGS Datenbanken, die als umfangreiche Plattformen für kollaborative Bestrebungen unter Forschern fungieren. Hier haben Wissenschaftler die Möglichkeit, ihre eigenen Beiträge zu leisten. Sequenzierungsdaten, wodurch die Verbreitung ihrer Forschungsergebnisse an Kollegen innerhalb der wissenschaftlichen Gemeinschaft erleichtert wird. Gleichzeitig erhalten Forscher Zugang zu von anderen bereitgestellten Daten, was ihre Forschungshorizonte effektiv erweitert und interdisziplinäre Zusammenarbeit fördert. Dieses kollaborative Modell des Datenaustauschs ist entscheidend für die raschen Fortschritte in der Lebenswissenschaftsforschung und treibt die akademische Zusammenarbeit und Innovation voran.

Entscheidungsunterstützung und -hilfe:

NGS Datenbanken spielen eine entscheidende Rolle bei der Entscheidungsunterstützung und -hilfe. Sie bieten politischen Entscheidungsträgern, Klinikern und Forschern Datenunterstützung in Bezug auf Krankheitsmechanismen, Arzneimittelentwicklung und Behandlungseffizienz, was ihnen hilft, wissenschaftlich fundiertere und rationalere Entscheidungen zu treffen.

Zusammenfassend sind NGS-Sequenzierungsdatenbanken in der Lebenswissenschaftsforschung unverzichtbar. Sie bieten nicht nur umfangreiche Sequenzierungsdatenressourcen, sondern umfassen auch verschiedene Funktionen wie Datenspeicherung und -verwaltung, Datenanalyse und -exploration, Datenaustausch und -verteilung sowie Entscheidungsunterstützung und -hilfe. Mit dem kontinuierlichen Fortschritt und der Verfeinerung der NGS-Technologie wird die Bedeutung von NGS-Sequenzierungsdatenbanken weiter hervorgehoben, was zu größeren Beiträgen zum Fortschritt und zur Innovation in der Lebenswissenschaftsforschung führt. Ziel dieses Papiers ist es, die häufig verwendeten Datenbankressourcen zur Interpretation von NGS-Sequenzierungsberichten systematisch darzustellen und zu erläutern.

Bevölkerungsdatenbanken

RefSeqGene-Datenbank

Die RefSeqGene-Datenbank, zugänglich unter http://www.ncbi.nlm.nih.gov/refseq/rsg, ist ein öffentlich verfügbares Repository, das Nukleotidsequenzen (DNA, RNA) sowie deren entsprechende Proteinprodukte beherbergt. Sie wurde 2000 vom National Center for Biotechnology Information (NCBI) konzipiert und entwickelt und ist verantwortlich für die Kuratierung und Pflege dieses wertvollen Ressourcen.

Ausgezeichnet durch seine taxonomische Vielfalt, Non-Redundanz, sorgfältige Annotationen und nahtlose Integration, ist die RefSeq-Datenbank ein Grundpfeiler in der molekularen Forschung. Sie bedient ein Spektrum wissenschaftlicher Fragestellungen, die Genomik, Genexpressionsanalysen, funktionale Annotationen und zahlreiche andere Untersuchungen umfassen, und bietet ein Kompendium von Referenzsequenzen, die aus einer breiten Palette von Organismen stammen. Dieser umfassende Umfang schließt, ist jedoch nicht beschränkt auf, Bakterien, Archaeen, Pflanzen, Tiere, Pilze und Viren ein.

RefSeq ist ein umfassendes Repository, das Referenzsequenzen von Genomen, Transkripten und Proteinen beherbergt. Innerhalb der RefSeq-Datenbank werden strenge Managementmethoden implementiert, um die Genauigkeit der Gensequenzen aufrechtzuerhalten. Jede Sequenz wird von sorgfältigen Annotationen begleitet, die detaillierte Einblicke in Genpositionen, Exon/Intron-Grenzen, alternative Splicing-Isoformen, posttranslationalen Modifikationen und funktionale Domänen bieten. Basierend auf einer Vielzahl von Ressourcen, einschließlich empirischer Beobachtungen, computergestützter Vorhersagen und wissenschaftlicher Zitationen, integriert RefSeq Daten, um zuverlässige Annotationen für Referenzsequenzen anzubieten.

Regelmäßige Updates der RefSeq-Datenbank integrieren nahtlos aufkommende genomische, transkriptomische und proteomische Erkenntnisse und gewährleisten Wissenschaftlern den Zugang zu den aktuellsten Referenzsequenzen. Diese dynamische Datenbank fördert die Querverweise mit anderen NCBI-Ressourcen, wie GenBank und PubMed, und ermöglicht es den Nutzern, ergänzende Informationen und zugehörige Datensätze eingehender zu erkunden.

UCSC-Genombrowser-Datenbank

Die UCSC Genome Browser-Datenbank (https://genome.ucsc.edu/) ist eine der am häufigsten genutzten Ressourcen im Bereich der Biologie. Sie wurde von der University of California, Santa Cruz, eingerichtet und wird auch gepflegt. Sie umfasst eine Fülle von genomischen Daten, einschließlich Informationen zur Genannotation (ENCODE), Genom-Ausrichtungen, repetitiven Sequenzen, homologen Sequenzen, Referenzsequenzen (mRNA, EST), Phänotypen, Expressionsprofilen, regulatorischen Informationen, Erhaltungsdaten, Variationen und repetitiven Regionen, unter anderem. UCSC umfasst genomische Informationen für verschiedene gängige Organismen, darunter Menschen, Mäuse, Fruchtfliegen, Zebrafische, Nematoden, Hefen und andere.

Darüber hinaus bietet es eine Reihe von Analysetools, um Benutzern beim Durchsuchen von Geninformationen, dem Zugriff auf vorhandene Genomannotationen und dem Herunterladen von Gensequenzen zu helfen. Im Bereich der bioinformatischen Analyse ist der Bedarf an Daten-Dateien in Formaten wie fasta, GTF oder BED allgegenwärtig, und UCSC dient als primäre Quelle für den Zugriff auf diese Dateien. Besonders hervorzuheben ist, dass Hg19 als weit verbreitete Referenzsequenz für das menschliche Genom im Repertoire von UCSC dient.

ExAC-Datenbank

(http://gnomad.broadinstitute.org)

Die Exome Aggregation Consortium (ExAC) Datenbank, die unter http://gnomad.broadinstitute.org zu finden ist, nimmt eine zentrale Stellung im Bereich der Genomik ein. Als grundlegende Version der gnomAD-Datenbank ist ExAC ausschließlich der Exom-SequenzierungsdatenDas Hauptziel besteht darin, Exom-Sequenzierungsdaten aus verschiedenen großangelegten Sequenzierungsprojekten zu konsolidieren und zu standardisieren, um der wissenschaftlichen Gemeinschaft eine umfassende Sammlung von Zusammenfassungsdaten bereitzustellen. Es ist bemerkenswert, dass ExAC nahtlos in die gnomAD-Datenbank integriert wurde, was einen bedeutenden Fortschritt bei der Verbesserung des Zugangs zu genomischen Daten und der Förderung gemeinschaftlicher Forschungsanstrengungen darstellt.

dbSNP-Datenbank

(https://www.ncbi.nlm.nih.gov/snp/)

Die dbSNP-Datenbank, offiziell bekannt als die Datenbank für Einzelne Nukleotid-Polymorphismen, und zugänglich unter https://www.ncbi.nlm.nih.gov/snp/, nimmt eine zentrale Rolle als grundlegende Ressource ein, die vom National Center for Biotechnology Information (NCBI) kuratiert wird. Sie fungiert als umfassendes Repository für Daten zu einzelnen Nukleotid-Polymorphismen (SNPs), die menschliche Genome und bestimmte andere Organismen umfassen. SNPs stellen die häufigste Form genetischer Variation innerhalb von Genomen dar, die oft aus einzelnen Nukleotidveränderungen resultieren, die potenziell zur interindividuellen genetischen Vielfalt beitragen.

Basierend auf einem breiten Spektrum an Forschungsliteratur, unzähligen Datenbanken und interdisziplinären Initiativen sammelt und synthetisiert die dbSNP-Datenbank systematisch SNP-Daten und bietet ein umfassendes Repository für genetische Variationsparameter. Dazu gehören wichtige Details wie SNP-Loci, Allelfrequenzen, Arten genetischer Variation und Informationen, die für die Zusammenhänge zwischen menschlicher Gesundheit und Pathologie relevant sind. Forscher nutzen die Funktionen der dbSNP-Datenbank, um detaillierte SNP-Daten zu erhalten, SNP-Inzidenzen zu bestätigen und Beziehungen zwischen SNPs und bestimmten phänotypischen Merkmalen oder Pathologien zu erläutern.

Die in dbSNP gespeicherten Daten sind hauptsächlich in zwei verschiedene Typen kategorisiert: von Benutzern eingereichte Daten, die durch "submitted SNP" (ss) Identifikatoren gekennzeichnet sind, und Daten, die aus verschiedenen Einreichungen und zusätzlichen Quellen zusammengestellt wurden, die durch "reference SNP" (rs) Identifikatoren identifiziert werden.

gnomAD

Die Genome Aggregation Database (gnomAD), erreichbar unter http://gnomad.broadinstitute.org, stellt eine gemeinsame Anstrengung von Forschern dar, die darauf abzielt, Exom- und Genomsequenzierungsdaten aus verschiedenen großangelegten Sequenzierungsprojekten und bietet damit konsolidierte Daten für die breitere wissenschaftliche Gemeinschaft. gnomAD ist eines der umfassendsten Repositorien für genomische Variationsdaten bis heute und umfasst Varianten aus verschiedenen Populationen weltweit.

Eine wesentliche Unterscheidung zwischen gnomAD und der langjährigen dbSNP-Datenbank liegt in ihren jeweiligen Methoden zur Katalogisierung genomischer Variationen. Während dbSNP Variationen aggregiert, die durch verschiedene Forschungsmethoden entdeckt wurden, und diesen Variationen Identifikatoren zuweist, verwendet gnomAD einheitliche Standards für die Analyse von Next-Generation-Sequenzierungsdaten Von den enthaltenen Proben, um Allelfrequenzen genau zu berechnen. Diese Harmonisierung der Datenverarbeitung ist ein Schlüsselmerkmal von gnomAD. Darüber hinaus bietet gnomAD hochwertige Daten für genomische strukturelle Variationen, die 50 Basenpaare überschreiten.

gnomAD (v3.1.1), basierend auf der GRCh38-Referenzgenom-Assemblierung, umfasst einen Datensatz kurzer Varianten, der genomische Sequenzierungsdaten von 76.156 nicht verwandten Individuen enthält. Diese Ressource ist ein wesentlicher Bestandteil von krankheitsspezifischen Untersuchungen und Forschungsprojekten zur Populationsgenetik.

gnomAD (v2.1.1), basierend auf dem Referenzgenom-Assembly GRCh37, umfasst einen Datensatz für kurze Varianten, der 125.748 Exome und 15.708 Genome umfasst. Diese genomischen Sequenzen stammen von nicht verwandten Individuen und bilden insgesamt 141.456 Proben, die einen integralen Bestandteil von krankheitsspezifischen Untersuchungen und Forschungsanstrengungen in der Populationsgenetik darstellen.

1000 Genom-Projekt

(https://www.internationalgenome.org/)

Das Ziel des 1000-Genom-Projekts ist es, Varianten mit einer Häufigkeit von mehr als 1 % innerhalb menschlicher Populationen zu identifizieren. Durch die Sequenzierung einer Vielzahl von Proben aus verschiedenen Populationen hat das Projekt zahlreiche Variantenstandorte identifiziert und bietet damit eine umfassende Ressource für das Studium der menschlichen genetischen Variation.

Krankheitsdatenbanken

HGMD-Datenbank

(http://www.hgmd.org)

Die Human Gene Mutation Database (HGMD) gilt als das Goldstandard-Repository für genetische Varianten, die mit menschlichen erblichen Krankheiten in Verbindung stehen. Sie wird sorgfältig durch die umfassende Überprüfung hochwertiger Literatur von Experten für genetische Beratung kuratiert. Diese Datenbank sammelt und organisiert Informationen zu relevanten Mutationsstellen.

HGMD bietet eine Fülle von Daten zu Mutationsstellen, einschließlich entsprechender Transkripte, Mutationstypen, Bewertungen der Pathogenität, verwandter Phänotypen, Referenzliteratur, Populationshäufigkeiten, funktionalen Vorhersagen und strukturellen Domänen.

Darüber hinaus bietet die professionelle Edition von HGMD zusätzliche Details wie HGVS-Nomenklatur für Mutationsstellen, Proteinveränderungen, Klassifizierungsgrade, genomische Koordinaten in den Hg19- und Hg38-Assemblies, proteinstrukturelle Domänen, Populationshäufigkeiten und Softwarevorhersageergebnisse.

OMIM-Datenbank

(https://www.ncbi.nlm.nih.gov/omim/)

Die Online Mendelian Inheritance in Man (OMIM) Datenbank ist eine umfassende und autoritative Ressource, die die Beziehung zwischen menschlichen Phänotypen und Genotypen erläutert. Sie katalogisiert alle bekannten Mendel'schen Erkrankungen und bietet Informationen über mehr als 16.000 Gene, die einen erheblichen Teil des menschlichen Genoms abdecken.

OMIM dient als sorgfältiger Kurator und Integrator veröffentlichter Forschungsergebnisse und bietet eine systematische Organisation sowie tägliche Updates kostenlos an. Eine typische Seite innerhalb von OMIM, die einer bestimmten Krankheit gewidmet ist, ähnelt einem Übersichtsartikel und umfasst ein Spektrum an Inhalten, darunter die Beziehung zwischen Phänotyp und Genotyp, klinische Zusammenfassungen, wesentliche Informationen und Beschreibungen zur Krankheit, klinische Merkmale, Diagnosen, klinische Behandlung, Pathogenese, molekulare Genetik, Populationsgenetik, Tiermodelle, historische Hintergründe, Forschungsfortschritte und Literaturverzeichnisse.

Die ClinVar-Datenbank

(https://www.ncbi.nlm.nih.gov/clinvar/)

ClinVar dient als öffentlich zugängliches Repository, das Daten zu menschlichen genetischen Variationen und deren Zusammenhängen mit Krankheiten speichert. Es umfasst eine Vielzahl genetischer Veränderungen, darunter Einzel-Nukleotid-Polymorphismen (SNPs), Insertionen, Deletionen (Indels) und andere. ClinVar hat sich als die führende autoritative und umfassende öffentliche Datenbank etabliert, die die Zusammenhänge zwischen menschlichen genetischen Variationen und Krankheitsphänotypen erläutert. Es stellt einen entscheidenden Bestandteil im Bereich der Informationsressourcen zum menschlichen Genom dar.

Die Hauptmerkmale dieser Datenbank sind wie folgt:

1. Datenquellen: Die ClinVar-Datenbank bezieht ihre Daten hauptsächlich aus einer Vielzahl von Literaturquellen, einschließlich wissenschaftlicher Forschungsarbeiten, klinischen Diagnosereports und kuratierten Datenbanken.

2. Datenformat: ClinVar verwendet eine nicht-relationale Datenbankstruktur und speichert Daten im XML-Format. Die Daten sind in mehrere Dimensionen kategorisiert, wie z. B. Varianten-Genotypen, Zusammenhänge zwischen Krankheiten und genetischen Variationen, Eigenschaften von Varianten, die Auswirkungen von Varianten auf Wirtsgene und Beweise.

3. Datenqualität: ClinVar hält strenge Kriterien für die Aufnahme genetischer Variationen ein, die eine standardisierte Darstellung, robuste Evidenzunterstützung und transparente Nachverfolgbarkeit der Beweise erfordern. Diese Maßnahmen gewährleisten die Genauigkeit und Autorität der Daten.

InterVar-Datenbank

(http://wintervar.WGlab.org/)

Die InterVar-Datenbank dient als Plattform für die automatisierte Bewertung der Pathogenität an Variantenloci. Sie ermöglicht die automatisierte Bewertung von 18 der 28 Kriterien, die in den Richtlinien des American College of Medical Genetics and Genomics (ACMG) aufgeführt sind. Die verbleibenden 10 Kriterien erfordern zusätzliche Evidenzeingaben oder Parameteranpassungen, wie z.B. Validierungsergebnisse aus der Sanger-Sequenzierung oder familiäre Validierung.

ClinGen-Datenbank

(https://www.clinicalgenome.org/)

ClinGen, gefördert von den National Institutes of Health (NIH), stellt eine zentrale Datenbankressource in der Präzisionsmedizin dar, die die Erforschung der klinischen Relevanz von Genen und Variationen erleichtert. Sie bietet Einblicke in die Dosierungsempfindlichkeit von Variationen und unterstützt die Identifizierung von Mutationssichtbarkeit und rezessiven abnormalen Mustern. Darüber hinaus integriert ClinGen klinische, genetische, populationäre, funktionale Beweise und Expertenbewertungen, um die Pathogenität von Variationen basierend auf den ACMG/AMP-Richtlinien zu klassifizieren, wobei die Ergebnisse in ClinVar archiviert werden. Labore und klinische Praktiker können die Variantencuration-Tools von ClinGen nutzen, um die Beweise für die Pathogenität von Variationen zu bewerten, die noch nicht einer Expertenbewertung unterzogen wurden.

Umfassende Krebsdatenbank

OncoKB

(https://www.oncokb.org/)

Entwickelt und gepflegt vom Memorial Sloan Kettering Cancer Center, dient OncoKB als umfassende Onkologie-Datenbank, die sich auf genetische Mutationen bei Krebspatienten konzentriert. Sie umfasst Informationen zur Verwendung gezielter Medikamente, biologischen und onkologischen Auswirkungen von Mutationen sowie zur Verbreitungsfrequenz und klinischen prognostischen Eigenschaften von Mutationen in Populationen. OncoKB bezieht seine Daten aus verschiedenen Quellen, darunter die FDA, NCCN, ASCO, ESMO-Konferenzberichte, Konsens unter Onkologie-Experten, wissenschaftliche Literatur sowie öffentliche Datenbanken wie cBioPortal und COSMI. Jedes Informationsstück wird regelmäßig vom Clinical Genomics Annotation Committee (CGAC) überprüft und überarbeitet.

Beim Besuch der Homepage von OncoKB kategorisiert die Datenbank Informationen über genetische Mutationen in Tumoren in vier Datenebenen, basierend auf unterschiedlichen Evidenzlevels:

Stufe-1-Daten bestehen aus Mutationen, die von der FDA als Biomarker für die Wirksamkeit von von der FDA zugelassenen Medikamenten zur Tumorbehandlung empfohlen werden.

Daten der Stufe 2 umfassen Mutationen, die von der NCCN oder anderen Expertenkonsens als Biomarker für die Wirksamkeit von von der FDA zugelassenen Medikamenten zur Standardbehandlung von Tumoren anerkannt sind.

Level 3A-Daten repräsentieren Mutationen, die durch überzeugende Beweise aus klinischen Studien als potenzielle Ziele für die Wirksamkeit von Arzneimittelbehandlungen bei Tumoren unterstützt werden.

Die Daten der Stufe 3B umfassen Mutationen, die durch Untersuchungen identifiziert wurden, die Biomarker für die Wirksamkeit von Medikamenten in der Standardtumorbehandlung anzeigen, entweder von der FDA genehmigt oder nicht genehmigt, jedoch noch nicht durch Expertenkonsens unterstützt.

Stufe 4-Daten umfassen Mutationen, die in hochwertiger experimenteller Literatur zu Zellen oder Tieren als potenzielle Ziele für die Wirksamkeit von Arzneimittelbehandlungen in Tumoren identifiziert wurden.

Zusätzlich beziehen sich R1/R2-Daten auf Informationen zu Mutationen, die mit Tumorresistenz in Verbindung stehen: R1 bezeichnet Mutationen, die als Biomarker für von der FDA genehmigte Indikatoren für Arzneimittelresistenz in der Standardtumorbehandlung dienen, während R2 Mutationen betrifft, die mit Belegen für die Behandlung von arzneimittelresistenten Tumoren in klinischen Studien assoziiert sind.

COSMIC-Datenbank

(https://cancer.sanger.ac.uk/cosmic)

Die COSMIC-Datenbank ist das weltweit größte und umfassendste Repository somatischer Mutationen bei Krebs und deren Auswirkungen. Diese Ressource dient als Online-Katalog somatischer Mutationen, die in menschlichen Krebserkrankungen erworben wurden – Mutationen, die in nicht-keimbahnverwandten Zellen auftreten und somit nicht von den Eltern vererbt werden. Das Akronym COSMIC steht für Catalogue Of Somatic Mutations In Cancer und wurde aus einer Vielzahl wissenschaftlicher Literatur und großangelegter experimenteller Screenings, die vom Sanger Institute Cancer Genome Project durchgeführt wurden, zusammengestellt.

COSMIC ist kostenlos für akademische Forscher verfügbar und kann von anderen für kommerzielle Zwecke lizenziert werden. Derzeit hat COSMIC über 50.000 globale Nutzer. Es beherbergt ein Repository von über 23.000.000 protein-kodierenden und nicht-kodierenden Punktmutationen, 1.207.190 Genkopienvariationen, 19.422 Fusionsgenen und 7.930.489 differentiellen Methylierungsstellen. Darüber hinaus wird die Datenbank vierteljährlich aktualisiert, um Relevanz und Genauigkeit sicherzustellen.

COSMIC umfasst Tausende von somatischen Mutationen, die mit der Krebsentwicklung in Verbindung stehen, und sammelt Daten aus zwei Hauptquellen:

1. Bekannte Krebsgenmutationen, die aus der Literatur gesammelt wurden: Gene, die einer manuellen Kuratierung unterzogen wurden, werden anhand ihrer Präsenz in den Auflistungen des Krebsgenzensus identifiziert.

2.Daten, die aus Whole-Genome-Resequenzierungsstudien von Krebsproben stammen, die von Krebsgenomprojekten durchgeführt wurden.

TCGA

(https://www.cancer.gov/ccg/research/genome-sequencing/tcga)

Das Cancer Genome Atlas (TCGA), das 2006 gemeinsam vom National Cancer Institute (NCI) und dem National Human Genome Research Institute (NHGRI) ins Leben gerufen wurde, dient als umfassendes Repository klinischer Daten, genomischer Variationen, mRNA-Expression, miRNA-Expression, Methylierung und mehr für verschiedene menschliche Krebserkrankungen, einschließlich Subtypen. Es ist eine entscheidende Ressource für Krebsforscher weltweit.

TCGA beherbergt eine Vielzahl von Daten, einschließlich einzelner Nukleotidvarianten (SNVs), Transkriptomanalysen, Informationen zu Bioproben, Rohsequenzierungsdaten, Kopienzahlvariationen (CNVs), DNA-Methylierung, klinischen Daten und anderen. Diese Daten sind in drei Ebenen kategorisiert:

Stufe 1: Rohsequenzierungsdaten (z. B. fasta, fastq-Dateien).

Stufe 2: Ausgerichtete BAM-Dateien.

Stufe 3: Verarbeitete und standardisierte Daten.

Datentyp Beschreibung
Klinisch Grundlegende Patienteninformationen, Diagnose, TNM-Staging, Tumorpathologie, Überlebensstatus und mehr
mRNA mRNA-Expressionsdaten, die aus mRNA-Mikroarrays oder RNA-Seq gewonnen wurden
MikroRNA microRNA-Expressionsdaten, die aus microRNA-Mikroarrays oder RNA-Seq gewonnen wurden
Kopiennummer Kopienzahlvariationen von Tumorsegmenten im Vergleich zu normalem Gewebe, das von SNP-Mikroarrays gewonnen wurde.
Mutation Nukleotidänderungen in Tumorsequenzierungsdaten im Vergleich zur Referenzgenomsequenz, einschließlich Insertionen, Deletionen usw.
Protein Expressionsniveaus von über 200 krebsbezogenen Proteinen, die aus Protein-Mikroarrays gewonnen wurden.
Methylierung DNA-Methylierungsniveaus, die aus Methylierungs-Mikroarray-Analysen gewonnen wurden

PharmGKB

(https://www.pharmgkb.org/)

Die PharmGKB-Datenbank, bekannt als die Wissensbasis für Pharmakogenetik und Pharmakogenomik, verkörpert Autorität und umfassende Informationen im Bereich der pharmakogenomischen Datenbanken. Sie wurde unter der Schirmherrschaft der National Institutes of Health (NIH) gegründet und fungiert als Reservoir für Erkenntnisse darüber, wie menschliche genetische Variationen die Reaktionen auf Medikamente beeinflussen.

Pharmakogenomik (PGx) untersucht die komplexen Mechanismen, durch die genetische Variationen zu unterschiedlichen Reaktionen auf pharmakologische Wirkstoffe beitragen. In einer Ära, die von postgenomischen technologischen Fortschritten geprägt ist, birgt die pharmakogenomische Forschung das Potenzial, die Wirksamkeit von Medikamenten zu verbessern und gleichzeitig das Risiko von Toxizität zu verringern. Als wichtige Verbindung zwischen wissenschaftlicher Erforschung und klinischer Praxis hat die Pharmakogenomik enormes Potenzial, die Grenzen der Präzisionsmedizin voranzutreiben.

Gegründet im Jahr 2000, hat sich PharmGKB zum Ziel gesetzt, pharmakogenomisches Wissen aus verschiedenen Quellen zu kuratieren, zu organisieren und zu verbreiten, einschließlich wissenschaftlicher Literatur, Arzneimittelkennzeichnungen und klinischer Richtlinien. Es nimmt eine zentrale Rolle als primäres Repository für pharmakogenomische Erkenntnisse ein, das Richtlinien zur Arzneimitteldosierung, Anmerkungen zu Arzneimittelkennzeichnungen, klinische und Variantenanmerkungen, arzneimittelzentrierte Wege, pharmakogenomische Zusammenfassungen und Erklärungen zu den Wechselwirkungen zwischen Genen, Arzneimitteln und Krankheiten umfasst.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben