What is the difference between DNA barcoding and DNA metabarcoding?

DNA barcoding identifies a single species from a single specimen (one organism → one barcode → one species ID). DNA metabarcoding identifies many species simultaneously from a mixed sample (e.g., soil, water, feces) using high-throughput sequencing and the same barcode primers. Barcoding uses Sanger sequencing or low-pass NGS per specimen; metabarcoding uses deep NGS per sample.

How reliable is COI for species identification?

For vertebrates and most arthropods, COI correctly identifies >95% of species when a reference sequence exists in BOLD or GenBank. For cnidarians, some amphibians, and certain marine invertebrates with slow mitochondrial evolution, COI resolution is lower and supplementary markers are recommended.

Can DNA barcoding identify species from cooked or processed food?

Yes, with modifications. Standard COI barcoding recovers species identity from cooked, smoked, canned, and dried animal products using mini-barcode primer sets targeting 100–300 bp amplicons. DNA degradation from heat and processing limits amplicon length but does not prevent identification when short-target primers are used.

Why can't I use COI for plants?

Plant mitochondrial genes evolve too slowly for species-level discrimination. COI sequences differ by <1% between most plant species — insufficient for reliable identification. The rbcL + matK combination from the chloroplast genome is the plant barcoding standard.

What should I do if my barcode returns "no match" in BOLD?

A "no match" result — where the query sequence shares <98% identity with any reference — may indicate one of three things: (a) your specimen belongs to a species not yet represented in BOLD, and you may have discovered a new record or new species; (b) your sequence quality is poor (check for ambiguous base calls); or (c) your PCR amplified a non-target region (verify the expected amplicon size). Submit clean sequences to GenBank — they contribute to filling database gaps for your taxonomic group.

How many specimens can be barcoded in a single project?

There is no upper limit. Sanger barcoding is practical for tens to a few hundred specimens. For projects with hundreds to tens of thousands of specimens, NGS-based barcoding with dual-indexed 96-well plate PCR is the cost-effective approach, reducing per-specimen costs below $1.

Does CD Genomics provide DNA extraction from difficult samples?

Yes. We accept fresh tissue, museum specimens, processed food products, herbal powders, timber samples, swabs, and environmental samples. Extraction protocols are optimized for each matrix — silica-column extraction for fresh tissue, inhibitor-removal protocols for processed and plant-derived samples, and low-elution-volume extraction for trace samples.

How do I choose between Sanger and NGS for my barcoding project?

For fewer than 100 specimens and clean single-species samples, Sanger sequencing at $3–6 per specimen is the most economical choice. For more than 500 specimens, mixed-species samples, or samples where intra-specimen variation needs to be assessed, NGS barcoding provides lower per-specimen costs and higher information content. Between 100 and 500 specimens, the choice depends on turnaround time requirements and budget.

DNA-Barcoding-Dienste zur Artenidentifikation: COI, rbcL, matK und mehr

Q: What should I do if my barcode returns "no match" in BOLD?

A "no match" result — where the query sequence shares <98% identity with any reference — may indicate one of three things: (a) your specimen belongs to a species not yet represented in BOLD, and you may have discovered a new record or new species; (b) your sequence quality is poor (check for ambiguous base calls); or (c) your PCR amplified a non-target region (verify the expected amplicon size). Submit clean sequences to GenBank — they contribute to filling database gaps for your taxonomic group.

Q: How many specimens can be barcoded in a single project?

There is no upper limit. Sanger barcoding is practical for tens to a few hundred specimens. For projects with hundreds to tens of thousands of specimens, NGS-based barcoding with dual-indexed 96-well plate PCR is the cost-effective approach, reducing per-specimen costs below $1.

Q: Does CD Genomics provide DNA extraction from difficult samples?

Yes. We accept fresh tissue, museum specimens, processed food products, herbal powders, timber samples, swabs, and environmental samples. Extraction protocols are optimized for each matrix — silica-column extraction for fresh tissue, inhibitor-removal protocols for processed and plant-derived samples, and low-elution-volume extraction for trace samples.

Q: How do I choose between Sanger and NGS for my barcoding project?

For fewer than 100 specimens and clean single-species samples, Sanger sequencing at $3–6 per specimen is the most economical choice. For more than 500 specimens, mixed-species samples, or samples where intra-specimen variation needs to be assessed, NGS barcoding provides lower per-specimen costs and higher information content. Between 100 and 500 specimens, the choice depends on turnaround time requirements and budget.

Ein Zollbeamter beschlagnahmt eine Sendung mit der Aufschrift "getrocknete Meeresfrüchte" – keine Art angegeben, kein CITES-Zertifikat. Ein Lebensmittelsicherheitslabor findet Pferde- und SchweinedNA in "100% Rindfleisch"-Würstchen. Ein Feldbiologe fängt einen Schmetterling, der wie eine bekannte Art aussieht, sich aber anders verhält. Diese Szenarien teilen eine Lösung: DNA-Barcoding – die Identifizierung von Arten mithilfe kurzer, standardisierter Genabschnitte, die zwischen den Arten variieren, innerhalb dieser jedoch konstant bleiben.

Im Gegensatz zur Amplicon-Community-Profilierung, die die Frage stellt: "Welche Gemeinschaftsmitglieder sind in dieser Mischprobe vorhanden?", fragt das DNA-Barcoding: "Welche Art ist dieses individuelle Exemplar?" Es funktioniert bei verarbeiteten Lebensmitteln, degradierten Museumsproben, Larvenstadien und Gewebestücken, bei denen eine visuelle Identifizierung unmöglich ist. CD Genomics bietet DNA-Barcoding-Dienste Abdeckung der vier standardisierten Barcode-Regionen (COI, rbcL, matK, ITS) mit Sanger- und NGS-basierten Arbeitsabläufen für Projekte von der Identifizierung einzelner Proben bis hin zu Biodiversitätsuntersuchungen mit mehreren Tausend Proben.

Dieser Artikel ist ein praktischer Leitfaden zur Auswahl des richtigen Barcode-Markierers, zum Verständnis dessen, was jeder Marker identifizieren kann und was nicht, sowie zur Auswahl der geeigneten Sequenzierungsstrategie. Wir behandeln Anwendungen des Barcodings für Tiere, Pflanzen, Pilze und maßgeschneiderte Lösungen und bieten einen Entscheidungsrahmen, um Ihre Identifikationsfrage mit dem richtigen molekularen Werkzeug abzugleichen.

Was ist DNA-Barcoding?

DNA-Barcoding ist die Identifizierung von Arten durch die Analyse eines kurzen, standardisierten Segments des Genoms – typischerweise 400-800 Basenpaare – das ausreichend interspezifische Variation aufweist, um zwischen Taxa zu unterscheiden, jedoch genug intraspezifische Erhaltung bietet, um Mitglieder derselben Art zusammenzufassen. Das Konzept wurde 2003 von Paul Hebert an der University of Guelph formalisiert, der das Cytochrom c Oxidase-Untereinheit I (COI) als den universellen Tierbarcode vorschlug. Die Idee war trügerisch einfach: Sequenziere einen Genbereich von jeder Tierart auf der Erde, und die Identifizierung wird zu einer Frage des Abgleichs einer unbekannten Sequenz mit einer Referenzbibliothek.

Die globale Barcode-Infrastruktur basiert auf zwei Institutionen. Das Consortium for the Barcode of Life (CBOL), das 2004 gegründet wurde, legte die technischen Standards fest. Das Barcode of Life Data System (BOLD), das an der Universität Guelph untergebracht ist, ist die primäre Referenzdatenbank und enthält über 11 Millionen Barcode-Sequenzen von etwa 500.000 beschriebenen Arten. Das International Barcode of Life (iBOL) Konsortium koordiniert großangelegte Initiativen, wobei das BIOSCAN-Programm Barcodes für 2 Millionen Arten anvisiert.

Wie sich Barcoding von der Gemeinschaftsprofilierung unterscheidet

Forscher, die neu in der DNA-basierten Identifizierung sind, verwechseln manchmal Barcoding mit Amplicon-Metabarcoding. Sie dienen unterschiedlichen Zwecken. Amplicon-Community-Profiling sequenziert ein Marker-Gen (16S, ITS, 18S) aus einem gemischten DNA-Extrakt, um die taxonomische Zusammensetzung einer gesamten mikrobiellen Gemeinschaft zu charakterisieren. Das Ergebnis ist eine Tabelle mit relativer Häufigkeit — "Probe A enthält 23% Bacteroides, 15% Prevotella und 8% Faecalibacterium." DNA-Barcoding sequenziert ein Marker-Gen aus einem einzelnen Exemplar, um dessen Artenidentität zu bestimmen — "Diese Probe ist Panthera tigris altaica, der Amur-Tiger." Die Unterscheidung ist wichtig, da sich die Laborabläufe, Sequenzierungsstrategien und bioinformatischen Analysen erheblich unterscheiden. Das Community-Profiling verwendet typischerweise Hochdurchsatz-NGS mit Kosten von unter 30 $ pro Probe; Barcoding verwendet oft Sanger-Sequenzierung zu Kosten von 3-6 $ pro Exemplar, aber NGS-basiertes Barcoding in großem Maßstab senkt die Kosten pro Exemplar für große Projekte auf deutlich unter einen Dollar.

Für einen umfassenderen Entscheidungsrahmen, wann man die Amplicon-Community-Profilierung im Vergleich zu anderen Sequenzierungsansätzen wählen sollte, siehe unser Amplicon-Sequenzierungsdienste-Hub.

DNA Barcoding Concept Overview — Four standard barcode markers comparison chart Abbildung 1: Übersicht des DNA-Barcoding-Konzepts – Seitenvergleich der vier Standard-Barcodemarker (COI: tierische Mitochondrien, ~658 bp; rbcL+matK: pflanzliches Chloroplast, ~550+770 bp; ITS: pilzliche rDNA, ~450-700 bp), die genomische Quelle, Amplicongröße und Zielorganismengruppen zeigen. Dargestellt als sauberes horizontales Vergleichsdiagramm mit farbcodierten Markerbereichen.

Tier-Barcoding — Der COI-Standard

Cytochrom c oxidase Untereinheit I (COI) ist ein mitochondrialer Gen, das eine zentrale Untereinheit der respiratorischen Elektronentransportkette kodiert. Es wurde aus mehreren praktischen Gründen als Tierbarcode ausgewählt. Mitochondriale Gene sind in Hunderten bis Tausenden von Kopien pro Zelle vorhanden, was die Amplifikation aus degradierten oder spurenhaften DNA-Proben möglich macht. COI entwickelt sich mit einer Rate, die eine Artenauflösung über die meisten Tierphylum hinweg ermöglicht – schnell genug, um eng verwandte Arten zu trennen, und langsam genug, dass konspezifische Individuen zusammengeclustert werden. Ein 658-bp Fragment am 5'-Ende von COI, das mit dem universellen Primerpaar LCO1490/HCO2198 amplifiziert werden kann, ist der globale Standard.

Was COI identifizieren kann und was nicht

COI identifiziert Arten mit hoher Zuverlässigkeit bei Wirbeltieren, den meisten Arthropoden, Mollusken und vielen anderen wirbellosen Tierstämmen. Für gut untersuchte Gruppen – Vögel (über 10.300 Arten in BOLD), Fische (über 18.000 Arten), Lepidoptera (über 120.000 Arten) – löst COI über 95 % der Arten. Für diese Gruppen liefert eine 658-bp COI-Sequenz, die mit der BOLD-Datenbank abgeglichen wird, eine Identifizierung auf Artenebene mit einem Vertrauensscore, der auf Sequenzähnlichkeit und nächstgelegener Nachbardistanz basiert.

Die Einschränkungen des COI sind gruppenspezifisch. Cnidaria (Korallen, Quallen, Seeanemonen) haben eine ungewöhnlich langsame COI-Evolution, was eine Unterscheidung auf Artenebene unzuverlässig macht – für diese Gruppen werden 16S rRNA oder nukleare Marker bevorzugt. Einige Amphibien zeigen COI-Introgression zwischen Arten, und hybride Taxa können mehrdeutige Barcode-Übereinstimmungen zurückgeben. Tiefseeorganismen, die oft eine kryptische Speziation mit subtiler oder keiner COI-Divergenz aufweisen, benötigen möglicherweise Multi-Marker-Ansätze oder die Sequenzierung des gesamten mitochondrialen Genoms. Für Süßwasserschwämme und bestimmte Annelidengruppen ist die COI-Auflösung bestenfalls auf Gattungsebene. Für Gruppen, bei denen COI versagt, besteht die Standardrettungsstrategie darin: Wechsel zu 16S rRNA für Cnidaria und Schwämme; Hinzufügen eines nuklearen Markers wie RAG1 (Wirbeltiere) oder EF-1α (Arthropoden) für hybridisierende oder kürzlich divergierte Artenkomplexe; oder Sequenzierung des gesamten mitochondrialen Genoms für Tiefsee-Taxa – bei etwa 150-300 $ pro Mitogenom liefert dies 15-37 protein-codierende Gene anstelle von einem, was oft Arten auflöst, wo COI allein nicht ausreicht.

Anwendungen: Von Wildtierforensik bis Lebensmittelsicherheit

COI-Barcoding hat sich weit über die akademische Taxonomie hinaus in die praktische Durchsetzung bewegt. Wildtierforensiklabore nutzen COI, um gehandelte Tierprodukte zu identifizieren: Haifischflossen in asiatischen Märkten, Elfenbein von gewilderten Elefanten, Wildfleisch, das an Flughäfen beschlagnahmt wurde, traditionelle Medikamente, die geschützte Arten enthalten. Eine Studie aus dem Jahr 2024, die 5.000 Haifischflossenmuster aus den Märkten von Hongkong barcodierte, identifizierte Flossen von 86 Arten – darunter 21 CITES-gelistete Arten – und ermöglichte Durchsetzungsmaßnahmen gegen illegale Handelsnetzwerke.

In der Lebensmittelauthentifizierung ist das COI-Barcoding mittlerweile ein routinemäßiges Qualitätskontrollinstrument. Eine europäische Umfrage unter 450 kommerziellen Fischprodukten ergab, dass 30 % falsch gekennzeichnet waren – günstigere Arten wurden durch Premium-Arten ersetzt oder gefährdete Arten unter generischen Namen verkauft. Eine Umfrage zu 197 Wildfleischprodukten in Südafrika ergab, dass 76 % Arten enthielten, die nicht auf dem Etikett aufgeführt waren, darunter Giraffe, Zebra und Wasserbock in Verpackungen, die als Antilope gekennzeichnet waren. Für Lebensmittelhersteller, die die Integrität der Lieferkette überprüfen möchten, bietet das COI-Barcoding eine schnelle, rechtlich absicherbare Artenidentifikation zu Kosten von etwa 5-10 US-Dollar pro Probe.

Für Biodiversitätsuntersuchungen von Tiergemeinschaften, bei denen die Identifizierung einzelner Exemplare erforderlich ist, anstatt eine Gemeinschaftsprofilierung durchzuführen — wie die Voucher-Museumsexemplare, die Katalogisierung von Insektenbeifängen aus Malaise-Fallen oder die Inventarisierung von Süßwasser-Makroinvertebraten zur biomonitoring der Wasserqualität — verarbeitet die NGS-basierte COI-Barcoding-Technologie Tausende von Exemplaren pro Durchgang über 96-Well-Platten-PCR und Indizierung, wodurch die Kosten pro Exemplar um das Zehnfache im Vergleich zur Sanger-Sequenzierung gesenkt werden.

COI Barcoding Application Landscape — Three-panel infographic Abbildung 2: Anwendungslandschaft des COI-Barcodings — Dreiteilige Infografik, die die wichtigsten Anwendungsbereiche des COI-Barcodings zeigt: Wildtierforensik (Haifischflossenbeschlagnahmung, Elfenbeinidentifikation), Lebensmittelauthentifizierung (Fischfehlbezeichnung, Wildfleischersatz) und Biodiversitätsumfragen (Malaise-Fallenbeifang, Museumsverifizierung). Jedes Panel enthält eine repräsentative Fallstatistik und einen ikonbasierten Workflow vom Sample zur Artenidentifikation.

Pflanzen-Barcoding — rbcL, matK und ITS2

COI funktioniert nicht bei Pflanzen. Die mitochondrialen Genome von Pflanzen entwickeln sich viel langsamer als die mitochondrialen Genome von Tieren – COI in Pflanzen ist auf Artenebene im Wesentlichen invariant, was es für die Artenunterscheidung nutzlos macht. Die Pflanzen-Barcoding-Community, organisiert durch die CBOL Plant Working Group, einigte sich auf einen Multi-Locus-Ansatz: rbcL und matK als die Kern-Barcodes, mit ITS2 als ergänzendem Marker für Gruppen, bei denen das Kernpaar nicht genügend Auflösung bietet.

rbcL: Einfach zu amplifizieren, breit, aber flach

Ribulose-1,5-bisphosphat-Carboxylase/Oxygenase große Untereinheit (rbcL) ist ein Chloroplastengen, das die große Untereinheit von RuBisCO kodiert, dem Enzym, das Kohlendioxid während der Photosynthese fixiert. rbcL ist der am leichtesten amplifizierbare Pflanzenbarcode — es existieren universelle Primer für Angiospermen, Gymnospermen, Farne und Moose, und die PCR-Erfolgsquote bei Landpflanzen übersteigt 95 %. Allerdings bietet rbcL eine begrenzte Artenauflösung und identifiziert nur etwa 70-75 % der Pflanzenarten korrekt, wenn es allein verwendet wird. Seine Hauptrolle im Rahmen des Pflanzen-Barcodings ist die eines universellen, hochgradig wiederherstellbaren Rückgrats, das ein unbekanntes Exemplar in die korrekte Gattung oder Familie einordnet.

matK: Höhere Auflösung, schwieriger zu amplifizieren

Maturase K (matK) ist ein Chloroplastengen, das an der Spleißung von Gruppe-II-Introns beteiligt ist. Es entwickelt sich schnell — gehört zu den am schnellsten evolvierenden chloroplastischen protein-codierenden Genen — und bietet eine Artenauflösung auf Artenebene für 85-90% der Angiospermen, wenn es in Kombination mit rbcL verwendet wird. Der Nachteil ist die Schwierigkeit der Amplifikation. Es existieren universelle matK-Primer, die jedoch niedrigere Erfolgsraten als rbcL-Primer über die gesamte Breite der Landpflanzen aufweisen, insbesondere in früh divergierenden Angiospermen-Linien und nicht-Angiospermen-Gruppen. Für routinemäßige Pflanzen-Barcoding-Projekte erreichen rbcL + matK zusammen eine Artenauflösung auf Artenebene von 90-95% für häufige Angiospern-Gruppen: Kulturpflanzen, Holzarten, Heilkräuter und blühende Zierpflanzen.

ITS2 als ergänzender Marker

Für Pflanzengruppen, bei denen rbcL + matK noch nicht ausreichen – insbesondere bei Orchideen, die gleichzeitig eine hohe Artenvielfalt, häufige Hybridisierung und ungewöhnlich konservierte Chloroplastensequenzen aufweisen – bietet ITS2 zusätzliche Auflösung. ITS2 unterscheidet etwa 92 % der Pflanzenarten, wenn es allein bei Angiospermen verwendet wird, und übertrifft sowohl rbcL als auch matK einzeln, aber seine Anwendung wird durch unvollständige konzertierte Evolution (mehrere ITS-Kopien innerhalb eines einzelnen Individuums können unterschiedlich sein) und das gelegentliche Vorhandensein von fungalem ITS-Kontaminationsmaterial, das um Amplifikation konkurriert, kompliziert. Der aktuelle Konsens: Verwenden Sie rbcL + matK als die primäre Kombination für Pflanzen-Barcodes und ergänzen Sie sie mit ITS2, wenn die Auflösung auf Artenebene nicht erreicht wird.

Anwendungen: Holzforensik, Kräuteridentifikation und Herbarium-Genomik

Das Übereinkommen über den internationalen Handel mit gefährdeten Arten wildlebender Tiere und Pflanzen (CITES) listet über 600 Holzarten auf, dennoch erhalten Zolllabore Holzstämme, Bretter und Furniere, die visuell nicht zu unterscheiden sind. Eine Studie aus dem Jahr 2023, die 200 beschlagnahmte Holzsendungen an europäischen Häfen mit rbcL + matK barcodierte, identifizierte 42 % als CITES-gelistete Arten, die unter falschen Artenangaben versandt wurden – Informationen, die direkt zu Beschlagnahmungen und Strafverfolgungen führten.

Die Authentifizierung von pflanzlicher Medizin steht vor einem ähnlichen Problem. Getrocknete, pulverisierte oder extrahierte Pflanzenmaterialien können von einem Botaniker nicht identifiziert werden. Eine Umfrage aus dem Jahr 2022, die 120 kommerzielle Kräuterprodukte in Nordamerika barcodierte, ergab, dass 27 % Pflanzenarten enthielten, die nicht auf dem Etikett aufgeführt waren, und 9 % bekannte toxische Verunreinigungen enthielten. Die Kombination rbcL + matK identifizierte die tatsächlichen Pflanzenarten in 97 % der Proben, einschließlich Fällen, in denen der Austausch wirtschaftlich motiviert schien (günstigere Arten wurden gegen teurere ausgetauscht).

Für Herbarium-Genomik verbindet das DNA-Barcoding von Typusproben – den einzelnen Pflanzen, die eine Art definieren – die linneanische Taxonomie mit der molekularen Phylogenetik. Herbariumproben, die bis zu 200 Jahre alt sind, liefern amplifizierbare rbcL- und matK-Fragmente unter Verwendung von Mini-Barcoding-Primer-Sets, die auf 100-200 bp Amplicons abzielen, und ermöglichen so die Integration der historischen morphologischen Taxonomie mit dem modernen molekularen Artidentifikationsrahmen.

Plant Multi-Locus Barcoding Decision Tree — Flowchart Abbildung 3: Entscheidungsbaum für das Multi-Locus-Barcoding von Pflanzen — Ein Flussdiagramm, das die sequenzielle Identifikationslogik zeigt: rbcL als universelles erstes Rückgrat (95% Amplifikationserfolg, 70-75% Artenauflösung) → matK als hochauflösender Marker der zweiten Ebene (85-90% kombinierte Auflösung) → ITS2 als ergänzender Rettungsmarker für schwierige Gruppen (Orchideen, Hybriden). Jeder Knoten ist mit Auflösungsprozentsatz und Beispieltaxa annotiert.

Fungale Barcode — ITS als der universelle Pilz-Barcode

Pilze nehmen eine Zwischenstellung im Barcoding-Landschaft ein. ITS (der interne transkribierte Spacer des ribosomalen RNA-Operons) wurde auf dem Treffen des Fungal Barcoding Consortium 2011 in Amsterdam als universeller Pilzbarcode angenommen. Es unterscheidet Arten innerhalb der Ascomycota, Basidiomycota und der meisten früh divergierenden Pilzlinien, wobei die Auflösung auf Artenebene bei gut untersuchten Gruppen nahezu 90% erreicht.

Fungal-Barcoding unterscheidet sich hauptsächlich in der Quelle der DNA und der Sequenzierungsstrategie von der Profilierung von Pilzgemeinschaften. Die Gemeinschaftsprofilierung amplifiziert ITS aus einem gemischten DNA-Extrakt (Boden, Wasser, klinische Probe) und sequenziert Tausende von Amplicons pro Probe über NGS, um ein Profil der Gemeinschaftszusammensetzung zu erstellen. Barcoding amplifiziert ITS aus einem einzelnen Pilzisolat, Fruchtkörper oder Flechtenthallus und sequenziert das Amplicon über Sanger (oder Low-Pass NGS), um eine saubere Artenidentifikation auf Artenebene zu erzeugen, die für die Ablage in GenBank oder BOLD geeignet ist.

Für Projekte, die sowohl die Profilierung von Gemeinschaften als auch die Identifizierung einzelner Isolate umfassen – zum Beispiel das Kultivieren von Pilzen aus Bodenproben und anschließend das Barcoding der wachsenden Kolonien – ITS- und Fungal-Amplicon-Sequenzierung bietet den Kontext auf Gemeindeebene, während das individuelle Kolonie-Barcoding die Identität der kultivierten Organismen bestätigt. CD Genomics unterstützt beide Arbeitsabläufe mit standardisiertem ITS-PCR, Sequenzierung und Klassifizierung in der UNITE-Datenbank.

Benutzerdefinierte Barcodes für besondere Bedürfnisse

Die vier standardmäßigen Barcodes — COI für Tiere, rbcL + matK für Pflanzen, ITS für Pilze — decken die Mehrheit der Barcode-Anwendungen ab. Aber ein erheblicher Teil der praktischen Artenidentifikationsprobleme erfordert Marker außerhalb des Standardpanels.

16S für Bakterien und Archaeen

Die Identifizierung von Bakterienarten über die Sequenzierung des 16S rRNA-Gens befindet sich an der Schnittstelle zwischen Barcoding und Gemeinschaftsprofilierung. Wenn ein klinisches oder lebensmittelmikrobiologisches Labor eine einzelne Bakterienkolonie isoliert und das Ziel darin besteht, die Art zu identifizieren — nicht die Gemeinschaft zu charakterisieren — ist die 16S Sanger-Sequenzierung des vollständigen 1.500 bp-Gens ein Barcoding-Workflow. Die Standardprimer (27F/1492R) amplifizieren das vollständige Gen, und die Klassifizierung gegen SILVA oder GTDB ermöglicht eine Identifizierung auf Artenebene für die meisten medizinisch relevanten Bakterien. CD Genomics bietet 16S/18S/ITS Amplicon-Sequenzierung Abdeckung sowohl von Community-Profiling als auch von Isolationsidentifizierungs-Workflows.

18S für Protisten und eukaryotische Mikroorganismen

Für Protisten – einzellige eukaryotische Organismen, die weder Tiere, Pflanzen noch Pilze sind – wurde kein universeller Barcode formell angenommen. Die 18S rRNA-Gensequenzierung des V4- oder V9-Bereichs, klassifiziert anhand der PR2-Datenbank, ist der de facto Barcode für die meisten Protistengruppen. Die Herausforderung besteht darin, dass die Kopienzahl von 18S in eukaryotischen Linien um Größenordnungen variiert und die Auflösung auf Artenebene inkonsistent ist. Für gut untersuchte Gruppen wie Kieselalgen, Dinoflagellaten und Wimperntierchen identifiziert 18S zuverlässig Arten. Bei weniger charakterisierten Umwelt-Protisten-Linien endet die Identifizierung auf Gattungs- oder Familienebene.

Spezies-spezifische Marker

Wenn ein universeller Barcode fehlschlägt – weil das Standardgen in der Zielgruppe nicht variabel genug ist oder weil eng verwandte Arten nicht unterschieden werden können – ist ein artspezifischer oder gruppenspezifischer Marker die Lösung. Beispiele hierfür sind der interne transkribierte Spacer 1 (ITS1) zur Unterscheidung von Arten innerhalb des Anopheles gambiae-Mückenkomplexes, das mitochondriale 16S rRNA-Gen zur Identifizierung von Meeresschildkrötenarten aus beschlagnahmten Eiern und die mitochondriale D-Loop-Region zur Unterscheidung von Störarten (Acipenseridae) zur Authentifizierung von Kaviar. Die Entwicklung eines maßgeschneiderten Barcodes erfordert die Identifizierung eines genomischen Bereichs mit angemessener Variation zwischen den Arten und innerhalb der Arten, das Entwerfen von Primern, die in der Zielgruppe amplifizieren, die Validierung der Spezifität anhand bekannter Referenzproben und den Aufbau einer lokalen Referenzdatenbank, wenn die Zielgruppe in BOLD oder GenBank unterrepräsentiert ist.

Gemischte Artenproben

Das Barcode-Verfahren geht typischerweise davon aus, dass ein Exemplar = eine Art ist. Mischartenproben – ein verarbeitetes Lebensmittelprodukt, das mehrere Tierarten enthält, eine Kräutermischung mit mehreren Pflanzenarten, eine Umweltprobe, in der Zielorganismen zusammen mit Nicht-Zielorganismen vorkommen – erfordern einen Metabarcoding-Ansatz. Hierbei verwendet der Laborworkflow dieselben Barcode-Primer, ersetzt jedoch die Sanger-Sequenzierung durch NGS. Jedes Amplicon-Barcode identifiziert seine Quellart. Die bioinformatische Analyse wechselt von der Einzelsequenzzuordnung zur Analyse der Gemeinschaftszusammensetzung, während die taxonomische Präzision auf Barcode-Ebene, die gruppenspezifische Primer bieten, beibehalten wird.

Für Anwendungen, die eine Artenauflösung erfordern, die über das hinausgeht, was Standard-Barcodes bieten, Vollständige 16S/18S/ITS Amplicon-Sequenzierung auf PacBio- oder Nanopore-Plattformen liefert vollständige Genomsequenzen, die die Auflösungsproblematik für taxonomisch schwierige Gruppen schließen.

Arbeitsablauf: Probe zur Artenidentifikation

Ein DNA-Barcoding-Projekt folgt einem standardisierten Labor- und bioinformatischen Ablauf, der für eine hochdurchsatzfähige, reproduzierbare Artenidentifizierung ausgelegt ist.

Schritt 1: Probenvorbereitung und DNA-Extraktion

Das Ausgangsmaterial bestimmt die Extraktionsstrategie. Frisches Gewebe (Muskel, Blatt, Pilzmyzel) liefert mit Standard-Silica-Säulenkits hochqualitative DNA. Verarbeitete Proben (gekochtes Fleisch, getrocknete Kräuter, pulverisierte Medikamente) erfordern Protokolle für degradierte DNA mit längerer Proteinase K-Verdauung. Spurenproben (einzelnes Insektenbein, Haarfollikel, Herbariumfragment unter 10 mg) benötigen eine Extraktion mit niedrigem Elutionsvolumen und können von einer Amplifikation des gesamten Genoms profitieren.

Die entscheidende Kennzahl ist nicht der DNA-Ertrag, sondern die Amplifizierbarkeit. Eine Probe, die 5 ng amplifizierbare DNA liefert, ist besser als eine Probe, die 500 ng degradierte DNA liefert. Für Sanger-Barcoding sind typischerweise 1-10 ng Template-DNA pro PCR-Reaktion ausreichend, wenn Standardprotokolle mit 35 Zyklen verwendet werden. Für NGS-Barcoding dient dieselbe DNA als Template für die indizierte PCR im 96-Well-Format.

Schritt 2: PCR-Amplifikation und Gelverifizierung

Jeder Barcode-Marker erfordert seine eigene PCR-Reaktion mit dem entsprechenden Primer-Set. Für Tierproben: COI (LCO1490/HCO2198, 658 bp). Für Pflanzen: rbcL (rbcLaF/rbcLaR, ~550 bp) und matK (matK472F/matK1248R, ~770 bp, oder Mini-Barcode-Primer für degradiertes DNA). Für Pilze: ITS (ITS1F/ITS4 für vollständiges ITS oder ITS1F/ITS2 nur für ITS1).

Der Erfolg der PCR wird durch Gelelektrophorese überprüft – ein einzelner klarer Band in der erwarteten Größe zeigt eine erfolgreiche Amplifikation an; kein Band weist auf Hemmung, unzureichende Vorlage oder Primerfehlanpassung hin. Fehlgeschlagene Amplifikationen können oft gerettet werden, indem der Extrakt verdünnt wird, um Inhibitoren zu reduzieren, auf alternative Primer gewechselt wird oder Mini-Barcode-Primer (100-300 bp) verwendet werden, wenn die DNA degradiert ist.

Schritt 3: Sequenzierungsstrategie — Sanger oder NGS

Die Sanger-Sequenzierung ist der kosteneffektivste Ansatz für die Barcode-Analyse mit niedrigem bis mittlerem Durchsatz (zehn bis einige hundert Proben) zu Kosten von 3-6 USD pro Probe und erzeugt einen bidirektionalen Konsens aus einem einzelnen gereinigten PCR-Produkt.

Für Projekte mit mehr als 500 Proben wird die NGS-basierte Barcodierung wirtschaftlicher. Proben werden in 96-Well-Platten mit Dual-Index-Primern verarbeitet, die gleichzeitig den Barcode amplifizieren und probe-spezifische Indizes anbringen. Die gepoolten Amplicons werden auf Illumina-Plattformen (MiSeq oder NovaSeq) sequenziert, und die Kosten pro Probe sinken bei Projekten mit mehr als 1.000 Proben unter 1 $.

NGS-Barcoding erkennt auch intragenomische Variationen — Heteroplasmie in mitochondrialen Sequenzen oder divergente ITS-Kopien — die ein einzelnes Sanger-Chromatogramm verschleiert.

Schritt 4: Bioinformatik — BLAST, BOLD und phylogenetische Einordnung

Die einfachste bioinformatische Pipeline für das Barcoding ist eine Sequenzähnlichkeitssuche. Die Abfrage-Barcodesequenz wird mit der BOLD-Datenbank (für COI), der GenBank-Nukleotidsammlung oder einer benutzerdefinierten lokalen Referenzdatenbank unter Verwendung von BLASTn verglichen. Die Artenidentifikation basiert auf dem besten Treffer: Wenn die Abfragesequenz >98% Übereinstimmung mit einer Referenzsequenz einer bekannten Art aufweist, wird diese Art zugewiesen.

Die BOLD-ID-Engine liefert eine strukturiertere Ausgabe als das generische BLAST. Sie berichtet: (a) das nächste artliche Übereinstimmung mit einem Ähnlichkeitswert; (b) die Nachbarentfernung — die genetische Distanz zur am engsten verwandten Art in der Datenbank, die anzeigt, ob die Identifizierung mehrdeutig ist; (c) eine Barcode-Indexnummer (BIN), die Sequenzen in operationale taxonomische Einheiten gruppiert, die grob äquivalent zu Arten sind; und (d) eine baumbasierte Platzierung, die zeigt, wo die Abfrage-Sequenz im breiteren phylogenetischen Kontext sitzt.

Für die Pflanzen-Barcodierung mit rbcL + matK werden die beiden Marker separat und gemeinsam analysiert. Wenn beide Marker derselben Art zugeordnet werden, ist das Vertrauen hoch. Diskrepanzen in den Zuordnungen lösen zusätzliche Analysen aus – Nachsequenzierung, ITS2-Ergänzung oder Expertenbewertung. Für Gruppen, in denen die Referenzdatenbank spärlich ist, ermöglicht die phylogenetische Platzierung gegen einen kuratierten Referenzbaum (z. B. den Pflanzen-rbcL-Baum, den Pilz-ITS-Baum) eine Zuordnung auf Gattung- bis Familie-Ebene, selbst wenn Übereinstimmungen auf Art-Ebene fehlen.

DNA Barcoding Workflow — From Specimen to Species ID Abbildung 4: DNA-Barcoding-Workflow — Vom Probenmaterial zur Artenidentifikation. Ein horizontales Flussdiagramm, das vier Phasen zeigt: (1) Probenvorbereitung — frisches Gewebe, verarbeitete Lebensmittel, Symbole für Spurensammlungen; (2) PCR-Amplifikation — markerspezifische Primer mit Gelverifizierung; (3) Sequenzierung — Sanger ($3-6/Probe) oder NGS (<$1/Probe in großem Maßstab) mit dualem Verzweigungsweg; (4) Bioinformatik — BLAST → BOLD ID Engine → Artenzuweisung mit Vertrauensbewertung.

Wann man Barcoding vs. Vollgenom-Sequenzierung wählen sollte

Das Barcode-Verfahren und die vollständige Genomsequenzierung adressieren verwandte, aber unterschiedliche Fragen, und die Wahl der falschen Methode kostet Geld. Der Entscheidungsbaum ist einfach: Wenn die einzige Information, die Sie von jedem Proben benötigen, die Artzugehörigkeit ist, ist das Barcode-Verfahren das richtige Werkzeug. Wenn Sie eine Typisierung auf Stammebene, die genetische Struktur der Population, adaptive Variation oder funktionelle genomische Inhalte benötigen, liefert die vollständige Genomsequenzierung diese Informationen – jedoch zu Kosten, die typischerweise 50-500 Mal höher pro Probe sind.

Das Barcoding bietet entscheidende Vorteile in Bezug auf Durchsatz, DNA-Qualitätsanforderungen und Kosten. Eine 96-Well-Platte mit COI-Barcodes kann für etwa 300-500 USD über Sanger oder 100-200 USD über NGS verarbeitet werden. Die Niedrigabdeckung der gesamten Genomsequenzierung derselben 96 Proben, mit einer Abdeckung von 5-10X, würde je nach Genomgröße 5.000-20.000 USD kosten. Barcoding toleriert auch degradierte DNA, die bei der Qualitätskontrolle der gesamten Genombibliotheksvorbereitung scheitern würde – ein 100-bp COI-Mini-Barcode amplifiziert aus Proben, bei denen die durchschnittliche DNA-Fragmentlänge unter 500 bp liegt.

Barcoding vs. Full Genome Sequencing — Comparison table Abbildung 5: Barcoding vs. Vollgenom-Sequenzierung — Eine zweispaltige Vergleichstabelle, die Barcoding vs. WGS über sieben Dimensionen zeigt: Kosten pro Probe (3-6 $ vs. 50-200 $), DNA-Qualitätsanforderung (degradationsresistent vs. hohe Integrität erforderlich), Durchsatz (Tausende/Woche vs. Dutzende/Woche), Auflösung (Artenebene vs. Stamm-/Populationsebene), Bioinformatik (BLAST/BOLD vs. Assemblierung + Annotation), funktionale Informationen (keine vs. volles Genom) und beste Anwendung (Artenidentifikation vs. evolutionäre/populationsgenomische Analysen).

Die Situationen, in denen die Barcode-Technologie unzureichend ist, umfassen: (a) das Unterscheiden von Stämmen oder Unterarten innerhalb einer Art — Barcodes sind innerhalb von Arten absichtlich invariant; (b) das Erkennen von Hybridisierung — ein einzelnes mütterlich vererbtes mitochondrialer Locus erfasst nur die mütterliche Linie; (c) die Identifizierung des geografischen Ursprungs — Marker auf Populationsebene (SNPs, Mikrosatelliten) bieten eine phylogeografische Auflösung, die ein Barcode nicht liefern kann; und (d) die Vorhersage funktionaler Merkmale — ein COI-Barcode sagt Ihnen die Art, aber nichts über die metabolischen Fähigkeiten, die für Bioprospektion oder die Bewertung von Pathogenität relevant sind.

Für Projekte, die sowohl Artenidentifikation als auch funktionale oder populationsgenomische Informationen erfordern, Metagenomische Shotgun-Sequenzierung und Nanopore-Amplikon-Sequenzierung repräsentieren alternative Wege, abhängig davon, ob Ihre Proben gemischte Gemeinschaften oder einzelne Exemplare sind.

CD Genomics' Amplicon-Sequenzierungsdienste Unterstützen Sie das gesamte Spektrum der DNA-Barcoding-Workflows: Sanger-basiertes COI, rbcL, matK und ITS-Identifikation; NGS-basiertes Hochdurchsatz-Barcoding im großen Maßstab; Entwicklung benutzerdefinierter Marker; und integriertes Barcoding + Gemeinschaftsprofiling für Projekte, die beide Identifikationsmodi umfassen. Vom einzelnen Exemplar bis zu einer Biodiversitätsuntersuchung mit 10.000 Exemplaren passen sich Workflow, Preisgestaltung und Durchlaufzeit Ihrem Projekt an.

Häufig gestellte Fragen

Was ist der Unterschied zwischen DNA-Barcoding und DNA-Metabarcoding?

DNA-Barcoding identifiziert eine einzelne Art aus einem einzelnen Exemplar (ein Organismus → ein Barcode → eine Arten-ID). DNA-Metabarcoding identifiziert viele Arten gleichzeitig aus einer Mischprobe (z. B. Boden, Wasser, Fäkalien) unter Verwendung von Hochdurchsatz-Sequenzierung und denselben Barcode-Primern. Barcoding verwendet Sanger-Sequenzierung oder Low-Pass-NGS pro Exemplar; Metabarcoding verwendet Deep-NGS pro Probe.

Wie zuverlässig ist COI für die Artenidentifikation?

Für Wirbeltiere und die meisten Arthropoden identifiziert COI korrekt über 95 % der Arten, wenn eine Referenzsequenz in BOLD oder GenBank vorhanden ist. Bei Nesseltieren, einigen Amphibien und bestimmten marinen Wirbellosen mit langsamer mitochondrialer Evolution ist die Auflösung von COI geringer, und ergänzende Marker werden empfohlen.

Kann die DNA-Barcoding-Methode Arten aus gekochten oder verarbeiteten Lebensmitteln identifizieren?

Ja, mit Modifikationen. Das Standard-COI-Barcoding stellt die Artenidentität aus gekochten, geräucherten, konservierten und getrockneten tierischen Produkten mithilfe von Mini-Barcoding-Primer-Sets wieder her, die auf 100-300 bp Amplicons abzielen. Die DNA-Zersetzung durch Hitze und Verarbeitung begrenzt die Ampliconlänge, verhindert jedoch nicht die Identifizierung, wenn Primer für kurze Ziele verwendet werden.

Warum kann ich COI nicht für Pflanzen verwenden?

Pflanzenmitochondriengene entwickeln sich zu langsam, um eine Artenunterscheidung zu ermöglichen. COI-Sequenzen unterscheiden sich bei den meisten Pflanzenarten um weniger als 1 % — was für eine zuverlässige Identifizierung unzureichend ist. Die Kombination rbcL + matK aus dem Chloroplastengenom ist der Standard für das Pflanzen-Barcoding.

Was soll ich tun, wenn mein Barcode in FETT "keine Übereinstimmung" zurückgibt?

Ein "kein Treffer"-Ergebnis – bei dem die Abfrage-Sequenz <98% Übereinstimmung mit einer Referenz aufweist – kann auf eines von drei Dingen hinweisen: (a) Ihr Exemplar gehört zu einer Art, die noch nicht in BOLD vertreten ist, und Sie könnten einen neuen Datensatz oder eine neue Art entdeckt haben; (b) die Qualität Ihrer Sequenz ist schlecht (prüfen Sie auf mehrdeutige Basenaufrufe); oder (c) Ihre PCR hat einen Nicht-Zielbereich amplifiziert (überprüfen Sie die erwartete Amplicongröße). Reichen Sie saubere Sequenzen bei GenBank ein – sie tragen dazu bei, Datenbanklücken für Ihre taxonomische Gruppe zu schließen.

Wie viele Proben können in einem einzelnen Projekt mit Barcodes versehen werden?

Es gibt keine obere Grenze. Sanger-Barcoding ist praktisch für Dutzende bis einige Hundert Proben. Für Projekte mit Hunderten bis Zehntausenden von Proben ist das NGS-basierte Barcoding mit dual-indizierten 96-Well-Platten-PCR der kosteneffiziente Ansatz, der die Kosten pro Probe auf unter 1 $ senkt.

Bietet CD Genomics DNA-Extraktion aus schwierigen Proben an?

Ja. Wir akzeptieren frisches Gewebe, Museumsproben, verarbeitete Lebensmittelprodukte, Kräuterpulver, Holzproben, Abstriche und Umweltproben. Die Extraktionsprotokolle sind für jede Matrix optimiert - Silikagel-Säulenextraktion für frisches Gewebe, Inhibitoren-Entfernungsprotokolle für verarbeitete und pflanzliche Proben sowie Extraktion mit niedrigem Elutionsvolumen für Spurenproben.

Wie wähle ich zwischen Sanger- und NGS-Sequenzierung für mein Barcoding-Projekt?

Für weniger als 100 Proben und saubere Einzelartenproben ist die Sanger-Sequenzierung zu 3-6 $ pro Probe die wirtschaftlichste Wahl. Für mehr als 500 Proben, Mischartenproben oder Proben, bei denen die intra-proben Variabilität bewertet werden muss, bietet das NGS-Barcoding niedrigere Kosten pro Probe und einen höheren Informationsgehalt. Zwischen 100 und 500 Proben hängt die Wahl von den Anforderungen an die Durchlaufzeit und dem Budget ab.

Referenzen:

Hebert PDN, Cywinska A, Ball SL, deWaard JR. Biologische Identifikationen durch DNA-Barcodes. Proceedings of the Royal Society B. 2003;270(1512):313-321. doi:10.1098/rspb.2002.2218
Ratnasingham S, Hebert PDN. Ein DNA-basiertes Register für alle Tierarten: Das Barcode-Indexnummer (BIN)-System. PLoS ONE. 2013;8(7):e66213. doi:10.1371/journal.pone.0066213
CBOL-Pflanzenarbeitsgruppe. Ein DNA-Barcode für Landpflanzen. Proceedings of the National Academy of Sciences. 2009;106(31):12794-12797. doi:10.1073/pnas.0905845106
Schoch CL, Seifert KA, Huhndorf S, et al. Nukleare ribosomale interne transkribierte Spacer (ITS)-Region als universeller DNA-Barcodemarker für Pilze. Proceedings of the National Academy of Sciences. 2012;109(16):6241-6246. doi:10.1073/pnas.1117018109
Porter TM, Hajibabaei M. Automatisierte Hochdurchsatz-Klassifikation von Tier-CO1-Metabarcodes. Scientific Reports. 2018;8:4223. doi:10.1038/s41598-018-22505-4
Hebert PDN, Hollingsworth PM, Hajibabaei M. Vom Schreiben zum Lesen der Enzyklopädie des Lebens. Philosophical Transactions of the Royal Society B. 2016;371:20150321. doi:10.1098/rstb.2015.0321
deWaard JR, Ratnasingham S, Zakharov EV, et al. Eine Referenzbibliothek für kanadische Wirbellose mit 1,5 Millionen Barcodes, Voucher-Proben und DNA-Proben. Scientific Data. 2019;6:308. doi:10.1038/s41597-019-0320-2
Taberlet P, Coissac E, Pompanon F, et al. Macht und Grenzen des Chloroplasten-trnL (UAA) Intron für das DNA-Barcoding von Pflanzen. Nucleic Acids Research. 2007;35(3):e14. doi:10.1093/nar/gkl938

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.