So reichen Sie Sequenzdaten bei GenBank ein

Einreichung von Sequenzdaten in die NCBI-Archive

Next-Generation-Sequenzierung, PacBio SMRT-Sequenzierung, und Nanoporen-Sequenzierung, kann in einem einzigen Durchlauf zahlreiche Sequenzdaten generieren. Rohdaten oder assemblierte Sequenzen müssen in ein öffentliches Sequenzarchiv (DDBJ/ENA/GenBank - INSDC) eingereicht werden, was von der überwiegenden Mehrheit der Fachzeitschriften gefordert wird, da die Zugangsnummern dieser Sequenzdaten in den veröffentlichten Artikeln angegeben werden müssen. Das Einreichungsportal (https://submit.ncbi.nlm.nih.gov/) ist eine programmgesteuerte Schnittstelle für Benutzer, um Sequenzdaten einzureichen und die Sequenzdaten anderer herunterzuladen. Neben Rohsequenzdaten können Sie auch rechnerisch assemblierte Sequenzen, Genome, funktionelle Genomikdaten, Mikroarraydaten, klinische Daten, Genomvariationen und andere Datentypen wie PacBio-Methylierungsdaten einreichen. Die Einreichung an SRA, GEO oder dbGap oder GenBank wird als akzeptable Einreichung betrachtet. In diesem Artikel werden wir erläutern, wie man Sequenzdaten an GenBank einreicht.

GenBank-Einreichung

GenBank (https://submit.ncbi.nlm.nih.gov/subs/genbank/) akzeptiert monatlich Tausende neuer Sequenzübermittlungen von Forschern weltweit. Zu den häufig eingereichten Sequenzen gehören mRNA-Sequenzen mit kodierenden Regionen, ribosomale RNA-Gencluster, Fragmente von genomischer DNA und ein vollständiges virales oder Organellen-Genom. Sie können eine einzelne Sequenz oder Sequenzsätze einreichen. Wenn ein Teil der Sequenz ein Protein kodiert, sollte ein kodierendes Sequenz- (CDS) Merkmal und die resultierende konzeptionelle Translation annotiert werden. Jeder eingereichten Sequenz wird eine Zugangsnummer für die Sequenzaufzeichnungen zugewiesen, normalerweise innerhalb von zwei Arbeitstagen. Einreicher und Benutzer können jede Sequenz oder einen Satz von Sequenzen einsehen, die basierend auf biologischer Verwandtschaft klassifiziert sind. Jeder Satz ist in Entrez PopSet (https://www.ncbi.nlm.nih.gov/popset/) enthalten, was Forschern ermöglicht, die Beziehung innerhalb des Satzes durch eine Ausrichtung zu betrachten.

Sie können ribosomale RNA (rRNA), rRNA-ITS oder Influenza-Sequenzen direkt bei GenBank einreichen. Andere Sequenztypen sollten mit einem der alternativen Tools eingereicht werden. Für nicht assemblierte Rohsequenzlesungen können Sie diese im Sequence Read Archive (SRA) einreichen.

  • BankIt

BankIt (https://www.ncbi.nlm.nih.gov/WebSub/?tool=genbank), ein webbasiertes Einreichungswerkzeug, akzeptiert alle Standard-GenBank-Einreichungen mit Ausnahme von: (i) Sequenzen mit einer Ausrichtung (Sie können Sequin verwenden), (ii) Rohdaten (Sie können das Submission Portal-SRA verwenden), (iii) Transkriptom-Shotgun-Assemblierungsdaten (Sie können Submission-TSA verwenden) und Genomdaten (Sie können das Submission Portal-Genomes verwenden), sowie (iv) rRNA, rRNA-ITS oder Influenza-Sequenzen (Sie können das Submission Portal verwenden).

  • Tbl2asn

Tbl2asn (https://www.ncbi.nlm.nih.gov/genbank/tbl2asn2/) ist ein Befehlszeilenprogramm, das Eingabesequenzen und Tabellen kombiniert, um Dateien zu erstellen, die für die Einreichung bei GenBank geeignet sind. Die Eingabedateien umfassen Sequenzen im FASTA-Format, Organismeninformationen und Merkmalsannotationen. Einreichungen, die mit Tbl2asn erstellt wurden, sollten an gb-sub@ncbi.nlm.nih.gov gesendet werden.

  • Pailletten

Sequin (https://www.ncbi.nlm.nih.gov/Sequin/) ist eine eigenständige Anwendung, die Benutzer durch die Einreichungsprozesse führt. Sequin kann verwendet werden, um Sequenzen oder kleine vollständige Genome einzureichen. Mit diesem Tool können Annotation und Analyse von Nukleotidsequenzen durchgeführt werden. Wenn Sie grafische Anzeige- und Bearbeitungsoptionen wie die Bearbeitung von Ausrichtungen wünschen, ist Sequin eine gute Wahl. Einreichungen, die mit Sequin vorgenommen werden, sollten an gb-sub@ncbi.nlm.nih.gov gesendet werden.

Beim Einreichen mehrerer verwandter Sequenzen können sowohl Tbl2asn als auch Sequin die Ausgaben beliebter Sequenzalignierungsprogramme wie PHYLIP, NEXUS und FASTA + GAP akzeptieren. Die Alignierungen tragen zur Sequenzannotation im Set bei.

Nach der Einreichung 

Nach der Einreichung bei GenBank wird das Annotationsteam von GenBank die folgenden Punkte überprüfen:

(i) Die Sequenzlänge und der Molekültyp (einzelner Molekültyp oder eine Mischung aus mRNA und genomischer DNA).
(ii) Biologische Validität.
(iii) Ist die Sequenz frei von Vektorverunreinigung?
(iv) Wenn die Sequenz veröffentlicht wird, kann eine PubMed-ID zum Datensatz hinzugefügt werden, damit die Sequenz und die Veröffentlichung verknüpft werden können.
(v) Formatierung und Rechtschreibung.

Falls es Probleme gibt, wird der Annotator den Einreicher per E-Mail zur Korrektur kontaktieren.

CD Genomics verfügt über ein Team von Bioinformatikern, die sich mit der Qualitätskontrolle von Rohdaten, der Sequenzanpassung, der Genomassemblierung, dem Genom-Mining und vergleichenden genomischen Studien befassen. Wenn Sie Fragen zur Datenverarbeitung haben, können Sie sich gerne an uns wenden.

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Sprechen Sie mit unseren Wissenschaftlern
Was möchten Sie besprechen?
Mit wem werden wir sprechen?

* ist ein erforderlicher Artikel.

Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben