Amplicon-Sequenzierungsdienste für Mikrobiom- und Biodiversitätsforschung: 16S, 18S, ITS und DNA-Barcoding-Lösungen
Im Jahr 2025 erhielt CD Genomics über 50 Anfragen von Forschern aus der ganzen Welt, die nach Informationen über Amplicon-basierte mikrobielle SequenzierungsdiensteDie Fragen kamen von einem peruanischen Tierarzt, der die subgingivale Plaque-Mikrobiota von Katzen untersucht – die erste solche Studie in Peru – von einem spanischen klinischen Versuch, der untersucht, wie der tägliche Verzehr von Erdnüssen das Mikrobiom des Darms bei 188 Stuhlproben umgestaltet, von einem Umweltmikrobiologen in den Vereinigten Staaten, der versucht, Biofouling-Gemeinschaften in zwei Grundwasserbrunnen zu charakterisieren, und von einem kanadischen Studenten im Grundstudium, der ein Sommerprojekt zum Mikrobiom des Bodens mit einem knappen Budget plant.
Diese Anfragen betreffen äußerst unterschiedliche Organismen, Probenarten und Budgets. Dennoch wählte jeder einzelne Forscher Amplicon-Sequenzierung als ihre primäre oder ausschließliche Methode — nicht Shotgun-Metagenomik, nicht Langsequenzierung, nicht Metatranskriptomik. Die gezielte Amplifikation von phylogenetischen Marker-Genen — 16S für Bakterien und Archaeen, ITS für Pilze, 18S für eukaryotische Mikroben und COI/rbcL/matK zur Artenidentifizierung — bleibt der Ansatz, der die meisten Fragen zu Mikrobiomen und Biodiversität mit dem besten Gleichgewicht aus Kosten, Durchsatz, Interpretierbarkeit und Datenbankunterstützung beantwortet.
Die Amplicon-Sequenzierung ist seit über zwei Jahrzehnten die Grundlage der mikrobiellen Ökologie, da sie unter Bedingungen funktioniert, die andere Methoden überfordern. Sie funktioniert mit degradiertem DNA aus formalinfixierten, paraffineingebetteten (FFPE) klinischen Proben, bei denen die DNA-Fragmente unter 200 Basenpaaren liegen. Sie funktioniert mit umweltbezogenen Proben mit niedrigem Biomassegehalt, bei denen die gesamte mikrobielle DNA in Pikogramm und nicht in Nanogramm gemessen wird. Sie funktioniert mit Hunderten von Proben in einem einzigen Sequenzierungslauf, was die biologische Replikation ermöglicht, die Mikrobiomstudien dringend benötigen. Und sie funktioniert innerhalb der Budgetbeschränkungen akademischer Labore, wo eine einzige Shotgun-Metagenomikprobe so viel kosten kann wie die Vorbereitung und Sequenzierung von zehn bis zwanzig Amplicon-Bibliotheken.
Dieser Leitfaden bietet einen praktischen Entscheidungsrahmen für Forscher, die zwischen den vier Hauptansätzen auf Amplicon-Basis wählen müssen — 16S rRNA-Sequenzierung für prokaryotische Gemeinschaften, ITS-Sequenzierung für Pilzgemeinschaften, 18S-rRNA-Sequenzierung für eukaryotische Mikropelagik und DNA-Barcoding für die Identifizierung von Makroorganismenarten. Für jede Methode behandeln wir, wann sie eingesetzt werden sollte, wie man experimentelle Parameter optimiert, welche Tiefe und Sequenzierungsstrategie zu wählen ist, welche Daten zu erwarten sind und wie man häufige Fallstricke vermeidet, die Proben und Budget verschwenden. Die folgenden Empfehlungen basieren auf dem, was wir in tatsächlichen Forschungsprojekten, die an unsere Sequenzierungsanlage eingereicht wurden, tatsächlich gesehen haben, was funktioniert — und was nicht.
Bevor Sie wählen: Die vier Amplicon-Ansätze auf einen Blick
Alle vier in diesem Leitfaden behandelten Amplicon-Methoden — 16S-rRNA-Sequenzierung, ITS-Sequenzierung, 18S-rRNA-Sequenzierung und DNA-Barcoding — teilen eine gemeinsame technische Grundlage: die PCR-Amplifikation eines konservierten Marker-Gens aus extrahierter DNA, gefolgt von der Hochdurchsatz-Sequenzierung des Amplicon-Pools und der bioinformatischen Zuordnung der resultierenden Sequenzen zu taxonomischen Gruppen unter Verwendung kuratierter Referenzdatenbanken. Die Unterschiede zwischen den Methoden liegen darin, welche Organismen sie anvisieren, welche taxonomische Auflösung sie bieten und welche Forschungsfragen sie beantworten können. Die folgenden Abschnitte untersuchen jede Methode im Detail, beginnend mit der am weitesten verbreiteten: der 16S-rRNA-Sequenzierung zur Profilierung prokaryotischer Gemeinschaften.
Abbildung 1: Entscheidungsbaum-Infografik — Auswahl Ihres Amplicon-Markers. Vier Verzweigungspfade von Probenart und Forschungsfrage zum empfohlenen Marker (16S, ITS, 18S, COI/rbcL), farblich kodiert nach Methode.
16S rRNA-Sequenzierung — Der Goldstandard für die Profilierung prokaryotischer Gemeinschaften
Die Architektur des 16S rRNA-Gens und warum sie wichtig ist
Das 16S-ribosomale RNA-Gen ist ungefähr 1.500 Basenpaare lang und enthält eine gut charakterisierte Abwechslung von konservierten und hypervariablen Regionen. Die neun hypervariablen Regionen — V1 bis V9 — werden von Abschnitten hochkonservierter Sequenzen flankiert, die als Bindungsstellen für universelle PCR-Primer dienen, die sowohl Bakterien als auch Archaeen anvisieren. Dieses strukturelle Design ermöglicht die Amplifikation praktisch jedes Prokaryoten mit einem einzigen Primerpaar, während die variablen Regionen genügend phylogenetisches Signal enthalten, um die Taxonomie von Phylum bis hinunter zur Gattung und häufig bis zur Art-Ebene mit vollständiger Sequenzierung zuzuordnen.
Die entscheidende Entscheidung beim Design von 16S-Ampliconen ist, welche hypervariablen Regionen oder Kombinationen von Regionen angestrebt werden sollen. Diese Wahl hat tiefgreifende Auswirkungen auf die taxonomische Auflösung, die Sie erreichen, die Amplifikationsverzerrungen, die Sie einführen, und die Vergleichbarkeit Ihrer Daten mit veröffentlichten Studien.
V3–V4: Der Standard für die meisten Anwendungen
Der V3–V4-Bereich ist das am weitesten verbreitete Ziel in der Forschung zum Mikrobiom von Menschen und Tieren. Sowohl das Human Microbiome Project (HMP) als auch das Earth Microbiome Project (EMP) haben sich auf V3–V4 standardisiert und damit den größten Bestand an öffentlich verfügbaren 16S-Daten für den Vergleich zwischen Studien geschaffen. Die Standardprimer (341F und 805R) erzeugen ~460 bp Amplicons, die gut innerhalb der Illumina-Paired-End-300-bp-Chemie für vollständige Überlappung und hochgradig zuverlässiges Zusammenführen liegen. V3–V4 bietet eine ausgezeichnete Abdeckung von Bakterien und Archaeen – erfasst Firmicutes, Bacteroidetes, Actinobacteria, Proteobacteria und Verrucomicrobia mit minimaler Verzerrung – und zeigt eine konsistente Leistung über Stuhl-, Boden-, Wasser-, Sediment- und klinische Probenarten hinweg. Die taxonomische Auflösung liegt typischerweise auf der Gattungsebene, wobei eine Zuordnung auf Art-Ebene für gut charakterisierte Taxa innerhalb robuster Referenzdatenbanken möglich ist.
V4–V5: Bessere Auflösung für bestimmte Umwelt-Taxa
Die V4–V5-Region (Primers 515F/926R, ~410 bp) bietet eine bessere Abdeckung von Thaumarchaeota und ist daher eine bevorzugte Wahl in Boden- und Meeresstudien, in denen ammoniakoxidierende Archaeen eine entscheidende ökologische Rolle spielen. Allerdings kann V4–V5 Firmicutes im Vergleich zu V3–V4 unterrepräsentieren, weshalb es nicht für Studien zum Mikrobiom des Darms empfohlen wird, es sei denn, spezifische archaeale Gruppen sind das Hauptforschungsziel.
Vollständige 16S-Sequenzierung: Die Revolution auf Artenebene
Die Einführung der PacBio Circular Consensus Sequencing (CCS) und der Oxford Nanopore-Technologien für die vollständige Analyse des 16S-Gens stellt den bedeutendsten methodischen Fortschritt im Bereich der Amplicon-Sequenzierung in den letzten Jahren dar. Durch die Sequenzierung des gesamten ~1.500 bp langen 16S-Gens in einem einzigen Lesevorgang, Vollständige 16S-Sequenzierung erreicht eine taxonomische Auflösung auf Arten- und manchmal sogar auf Stämmebene, wodurch Mehrdeutigkeiten, die bei der Sequenzierung einzelner Regionen auftreten, beseitigt werden. Zwei Bakterienarten, die in V3–V4 nicht unterscheidbar sind, unterscheiden sich oft in V1–V2 oder V6–V8 — die Vollgen-Sequenzierung erfasst all diese Variationen. Die Genome Taxonomy Database (GTDB), die jetzt das Standardreferenzwerk für die prokaryotische Taxonomie ist, basiert auf vollständigen 16S- und genomischen Daten, was bedeutet, dass die Vollgen-Amplikon-Sequenzierung direkt mit dem aktuellsten taxonomischen Rahmen übereinstimmt.
Ein marines Forschungsteam, das die Überlebensrate von Jakobsmuschel-Larven (Argopecten purpuratus) in der chilenischen Aquakultur untersucht, musste feststellen, ob im Brutkasten gezüchtete Spat, die während des Transfers in die Auftriebszone des Humboldtstroms massenhaft sterben, spezifische mikrobielle Taxa fehlen, die eine Toleranz gegenüber Umweltstress verleihen. Die Standard-V3–V4-Sequenzierung unterschied nur die dominierenden Gattungen. Die vollständige PacBio-CCS-Sequenzierung offenbarte die artenebenen Unterschiede, die überlebende von nicht überlebenden Kohorten unterschieden — Informationen, die mit der Kurzlese-Amplicon-Sequenzierung nicht hätten gewonnen werden können.
Der Kompromiss bei der Voll-Längen-16S-Sequenzierung liegt in der Durchsatzrate und den Kosten pro Probe: PacBio HiFi-Sequenzierung kostet pro Probe zwei- bis dreimal so viel wie Illumina bei vergleichbarer Sequenzierungstiefe. Allerdings liefert jede Voll-Längen-Lesung die phylogenetischen Informationen aller neun hypervariablen Regionen gleichzeitig mit vollständiger Verknüpfung zwischen ihnen, wodurch oft die Notwendigkeit für mehrere regionsspezifische Assays entfällt. Für Projekte, bei denen die taxonomische Zuordnung auf Art-Ebene das Hauptziel ist, sind die Kosten pro Probe für die Voll-Längen-16S-Sequenzierung durch die Vermeidung taxonomischer Mehrdeutigkeit gerechtfertigt.
Sequenzierungstiefenanforderungen: Wie viele Reads benötigen Sie tatsächlich?
"Wie viele Reads pro Probe benötige ich?" ist die häufigste Frage, die wir von Forschern erhalten, die ein 16S-Amplicon-Projekt planen. Die Antwort hängt vom Proben-Typ, dem Biomasse-Niveau, der Forschungsfrage und der Toleranz gegenüber unentdeckten seltenen Taxa ab. Es gibt keine universelle Antwort, aber wir haben evidenzbasierte Richtlinien aus unserer Projekterfahrung und der veröffentlichten Literatur entwickelt.
Hochbiomasseproben (Fäkalien, Boden, Sediment, Biofilm)Für die standardmäßige Profilierung der Gemeinschaftszusammensetzung und den Vergleich der Diversitätsmetriken zwischen Gruppen sind in der Regel 50.000 gepaarte Endlesungen pro Probe ausreichend. Die Rarefaktionskurven für die meisten menschlichen und umweltbedingten Mikrobiome nähern sich ihrem Asymptoten zwischen 10.000 und 30.000 Lesungen. Eine Erhöhung der Tiefe über 100.000 Lesungen pro Probe führt zu abnehmenden Erträgen – Sie erfassen zunehmend seltene OTUs, aber die biologische Bedeutung dieser ultra-seltenen Taxa in Analysen auf Gemeinschaftsebene ist oft fraglich. Eine klinische Studie zum Fäkal-Mikrobiom mit 188 Proben, wie die RCT zum Erdnusskonsum in Spanien, erzeugt robuste, veröffentlichungsreife Daten bei 50.000 Lesungen pro Probe. Unser Mikrobielle Ganzgenomsequenzierung Der Service kann 16S-Daten ergänzen für Projekte, die funktionale metagenomische Einblicke erfordern.
Proben mit niedriger Biomasse (Wasser, Abstriche, Biopsiegewebe, Luftfilter)benötigen diese Proben 100.000 bis 300.000 Reads pro Probe, da die gesamte mikrobielle DNA gering ist und die Sequenzierungsbibliotheken möglicherweise von Wirts-DNA oder Reagenzverunreinigungen dominiert werden. Für Studien zum Mikrobiom von Wasser mit niedrigem Biomassegehalt empfehlen wir konsequent ein Pilotexperiment mit 10 Proben bei 100.000 Reads, um die Gemeinschaftsreichhaltigkeit, die Angemessenheit der Tiefe und die Kontaminationsniveaus zu bewerten, bevor wir uns für eine umfassende Sequenzierung entscheiden. Ein Forscher, der die Bioverunreinigung von Grundwasserbrunnen untersuchte, fragte, ob ihre Wasserproben, die nach der Standardextraktion nicht nachweisbare Nukleinsäurewerte ergaben, überhaupt sequenziert werden könnten. Die Antwort war ja, aber nur nach der Optimierung des DNA-Extraktionsprotokolls, um die minimale vorhandene mikrobielle DNA zu konzentrieren und die Sequenzierung in höherer Tiefe durchzuführen, um die Erholung der spärlichen Gemeinschaft zu maximieren. Für solche herausfordernden Proben, Shotgun-Metagenomik-Sequenzierung wäre prohibitively teuer gewesen.
Klinische Proben mit hohem Hintergrund an Wirts-DNAZervikovaginale Abstriche, Hautabstriche und Biopsiegewebe enthalten oft über 90 % Wirts-DNA. Selbst bei der Depletion von Wirts-DNA kann der effektive mikrobielle Anteil nur 1–10 % der Gesamtablesungen betragen. Für solche Proben empfehlen wir mindestens 100.000 Ablesungen pro Probe. Wenn ein erster Sequenzierungslauf weniger als 5.000 mikrobielle Ablesungen pro Probe ergibt, ist eine tiefere Sequenzierung oder eine erneute Extraktion mit verbesserter Entfernung von Wirts-DNA angezeigt.
Die kritische Bedeutung von negativen Kontrollen
Einer der häufigsten und schädlichsten Fehler im Design von 16S-Studien ist das Weglassen geeigneter negativer Kontrollen. DNA-Extraktionskits, PCR-Reagenzien und Laborluft enthalten alle in geringen Mengen bakterielle DNA. In Proben mit niedrigem Biomasseanteil können diese "Kitome" und Laborverunreinigungen die Sequenzierungsergebnisse dominieren, was zu völlig falschen Schlussfolgerungen über die Zusammensetzung der untersuchten mikrobiellen Gemeinschaft führt. Eine stark publizierte Studie, die behauptete, ein distinctes plazentales Mikrobiom entdeckt zu haben, wurde später durch sorgfältige Analysen negativer Kontrollen als primär auf Reagenzienverunreinigungen zurückzuführen entlarvt. Wir verlangen in jedem Projekt mit niedriger Biomasse, das wir sequenzieren, Extraktions-negative und PCR-negative Kontrollen, und wir empfehlen sie dringend für alle Projekte, unabhängig vom Biomasselevel. Diese negativen Kontrollen werden zusammen mit den experimentellen Proben sequenziert und mit Werkzeugen wie dem decontam R-Paket analysiert, um kontaminierende OTUs zu identifizieren und zu entfernen. Dieser Schritt ist für rigorose Mikrobiomstudien mit niedriger Biomasse nicht optional, wird jedoch in Standardprotokollbeschreibungen selten erwähnt.
Für den Forscher, dessen Grundwasserproben undetectable Nukleinsäurewerte aufwiesen: Die negativen Kontrollen waren keine Vorsichtsmaßnahme. Sie waren die einzige Möglichkeit, das tatsächliche mikrobiologische Signal des Grundwassers von der Hintergrundkontamination zu unterscheiden, die während der DNA-Extraktion und der Erstellung der Sequenzierungsbibliothek eingeführt wurde. Das Projekt erzeugte interpretierbare Daten genau deshalb, weil wir die Studie von der ersten Probe an mit negativen Kontrollen entworfen haben – nicht als nachträglichen Gedanken.
Der Übergang von OTU zu ASV in der 16S-Bioinformatik
Die bioinformatische Verarbeitung von 16S-Daten hat sich von der OTU-Klusterung mit 97% Ähnlichkeit hin zur hochauflösenden ASV (Amplicon Sequence Variant)-Analyse unter Verwendung von DADA2 oder Deblur verschoben. ASVs unterscheiden Sequenzen, die sich nur durch ein einzelnes Nukleotid unterscheiden, was eine feinere Auflösung, höhere Reproduzierbarkeit über unabhängige Studien hinweg und die Möglichkeit bietet, einzelne ASVs durch exakte Sequenzübereinstimmung an Referenzgenomsequenzen zu verknüpfen, anstatt auf clusterbasierte Näherungen zurückzugreifen. Die Standardpipeline bei CD Genomics umfasst folgende Schritte: Demultiplexing und Primerentfernung (cutadapt), Qualitätsfilterung und Trimmen (DADA2 erwartete Fehlerfilterung), ASV-Inferenz (DADA2 Kernprobeninferenz), taxonomische Zuordnung (SILVA 138 oder GTDB), Konstruktion des phylogenetischen Baums, Berechnung der Alpha-Diversität und Rarefaction, Beta-Diversitätsordination (PCoA) und Tests auf unterschiedliche Häufigkeit (DESeq2, ANCOM-BC oder MaAsLin2). QIIME 2 ist die am weitesten verbreitete Plattform für die End-to-End-Analyse von 16S. Wir bieten sowohl QIIME 2-Ausgabeartefakte als auch R-kompatible Datenformate in unserem Standardpaket für bioinformatische Lieferungen an.
ITS-Sequenzierung — Das Pilreich entschlüsseln
Warum ein separater Marker für Pilze?
Bakterien dominieren die meisten Diskussionen über die Mikrobiomforschung, aber Pilze sind allgegenwärtig — im Boden, in Pflanzenwurzeln, im Verdauungstrakt von Tieren, auf der menschlichen Haut und in der gebauten Umwelt. Eine 16S-rRNA-Umfrage erfasst nur Prokaryoten und lässt die gesamte Pilzkomponente außen vor. Da Pilze wichtige Treiber des Abbaus organischer Substanzen, direkte Vermittler von Pflanzen-Mikroben-Interaktionen in landwirtschaftlichen Systemen und bedeutende opportunistische Krankheitserreger bei immungeschwächten Patienten sind, bedeutet das Ausschließen von Pilzen aus Mikrobiom-Umfragen, dass man höchstens die Hälfte des mikrobiellen Bildes sieht.
CD Genomics bietet umfassende Profilierung von Pilzgemeinschaften durch ITS-Amplicon-Sequenzierungmit Optionen für sowohl Kurzzeit- (Illumina) als auch Langzeit- (PacBio, Nanopore) Sequenzierung, je nach Ihren Anforderungen an die taxonomische Auflösung.
ITS1 vs. ITS2: Die richtige Region wählen
ITS1 (Primer ITS1f/ITS2)Dieses Primer-Set amplifiziert die ITS1-Region zwischen der 18S SSU und der 5.8S rRNA. Das ITS1f-Primer ist speziell optimiert, um die Co-Amplifikation von pflanzlicher DNA zu vermeiden, wodurch ITS1 die bevorzugte Wahl für pflanzliche Wurzeltissue, Rhizosphärenboden oder jede Probe mit hoher pflanzlicher Biomasse ist. ITS1 bietet eine bessere Abdeckung von Ascomycota und Basidiomycota und ist der Standard für die meisten Umweltpilzuntersuchungen. Die Ampliconlänge reicht von etwa 250 bis über 600 Basenpaaren, abhängig von der Pilzart, wobei die große Längenvariation sowohl analytische Herausforderungen als auch zusätzliche taxonomische Informationen bietet.
ITS2 (Primer ITS3/ITS4)Dieses Primer-Set amplifiziert die ITS2-Region zwischen 5.8S und 28S LSU. ITS2 weist im Vergleich zu ITS1 deutlich weniger Längenvariation zwischen den Pilz-Taxa auf – ein bedeutender Vorteil für bioinformatische Clusteranalysen, da dies die Notwendigkeit für längenbasierte Filter- und Normalisierungsschritte reduziert, die Verzerrungen einführen können. Einige Studien haben gezeigt, dass ITS2 eine bessere Artenauflösung innerhalb taxonomisch schwieriger Gruppen bietet, insbesondere bei der Gattung Fusarium und anderen landwirtschaftlich wichtigen pflanzenpathogenen Pilzen. ITS2 wird empfohlen, wenn der primäre Forschungsschwerpunkt auf klinischer Mykologie oder spezifischer Pathogendetektion liegt, anstatt auf breiter ökologischer Pilzvielfalt.
Vollständige ITS mit LangsequenzierungPacBio CCS kann sowohl ITS1 als auch ITS2 sowie das dazwischenliegende 5.8S-Gen in einem einzelnen Amplicon von etwa 600–800 Basenpaaren für die meisten Pilze erfassen, obwohl einige Gruppen 1.000 Basenpaare überschreiten. CD Genomics bietet Vollständige ITS-Sequenzierung auf den Plattformen von Pacific Biosciences und Oxford Nanopore für Projekte, die maximale phylogenetische Auflösung erfordern.
ITS-Datenanalyse und Datenbanküberlegungen
Die bioinformatische Analyse von Fungal ITS unterscheidet sich in mehreren wichtigen Aspekten von der 16S-Analyse. Die UNITE-Datenbank (unite.ut.ee) ist das Standardreferenzwerk für die Taxonomie von Fungal ITS und bietet eine Veröffentlichung von "Artenhypothesen" (SH), die Sequenzen mit einer Ähnlichkeit von etwa 97 % für standardisierte OTU-Clusterung über unabhängige Studien hinweg gruppiert. Eine kritische praktische Überlegung ist, dass Fungal ITS-Referenzdatenbanken weit weniger vollständig sind als 16S-Datenbanken. Eine typische Studie zur Bodenpilzgemeinschaft, die ITS verwendet, weist nur 60–80 % der Reads bestimmten benannten Pilzgattungen zu, im Vergleich zu über 95 % bei bakteriellen 16S-Studien. Dieser "dunkle Materie"-Anteil uncharakterisierter Pilzsequenzen stellt sowohl eine Einschränkung als auch eine Chance dar: Viele auf ITS basierende Umweltstudien berichten von zuvor unbekannten Pilzlinien, die bedeutende Beiträge zur entdeckungsgetriebenen Mykologie leisten können, jedoch Herausforderungen für die ökologische Interpretation darstellen, wenn die funktionalen Rollen der detektierten Organismen unbekannt sind.
Fallstudien aus Erhebungsdaten
Ein Forscher, der die Zusammensetzung der Pilzgemeinschaft in Pflanzenwurzeln untersucht, hat 18 Proben für die ITS-Amplicon-Sequenzierung eingereicht. Das experimentelle Ziel war es, die mykorrhizalen Pilzgemeinschaften, die das Wurzelsystem kolonisieren — arbuskuläre Mykorrhiza, Ektomykorrhiza und dunkle septierte Endophyten — zu charakterisieren und die Kolonisierungs-muster über verschiedene Bodenbehandlungen hinweg zu vergleichen. Die ITS1-Sequenzierung unter Verwendung des Primer-Sets ITS1f (um die Co-Amplifikation von pflanzlicher Chloroplasten-DNA aus dem Wurzelgewebe zu minimieren) war die richtige methodische Wahl. Wir führten die Bibliotheksvorbereitung und Sequenzierung mit dem Ziel durch, 50.000 Reads pro Probe zu erhalten — ausreichend, um die dominanten mykorrhizalen Taxa zu charakterisieren und seltene, mit Wurzeln assoziierte Arten zu erkennen, die als Indikatortaxa für die Effekte der Bodenbehandlung dienen könnten.
18S rRNA-Sequenzierung — Profilierung der mikrobiellen Eukaryoten
Die übersehene Mehrheit der mikrobiellen Vielfalt
Wenn Forscher eine Mikrobiom-Studie mit 16S und ITS als Sequenzierungsziele entwerfen, erfassen sie die prokaryotischen und pilzlichen Komponenten. Aber eukaryotische Mikroben — Protisten, einzellige Algen, Nematoden und andere mikroskopische Eukaryoten — können in vielen natürlichen und künstlichen Ökosystemen die Mehrheit der Biomasse und der metabolischen Aktivität ausmachen. Fotoautotrophe Protisten (Diatomeen, Dinoflagellaten) sind die Primärproduzenten an der Basis mariner und süßwasserlicher Nahrungsnetze. Phagotrophe Protisten (Ciliaten, Flagellaten) weiden auf bakteriellen Populationen und regulieren die Struktur der mikrobiellen Gemeinschaft. Parasitische Protisten (Plasmodium, Giardia, Cryptosporidium, Toxoplasma, Leishmania) verursachen einige der wichtigsten Infektionskrankheiten weltweit. All diese Organismen sind sowohl für die 16S- als auch für die ITS-Sequenzierung unsichtbar. Das 18S ribosomale RNA-Gen dient als phylogenetischer Marker der Wahl zur Erfassung der eukaryotischen mikrobiellen Gemeinschaft.
Das 18S-Gen und regionale Zielansteuerung
Das 18S rRNA-Gen hat ungefähr 1.800 Basenpaare und neun variable Regionen (V1–V9). Zwei variable Regionen dominieren die veröffentlichten Metabarcoding-Studien an Eukaryoten:
V4-RegionDer am häufigsten angezielte 18S-Bereich für die Profilierung eukaryotischer Gemeinschaften. Amplifiziert mit Primern wie TAReuk454FWD1 und TAReukREV3, erzeugt er ein ~380–430 bp großes Amplifikat mit guter taxonomischer Auflösung über den eukaryotischen Baum des Lebens. Der V4-Bereich wurde vom Tara Oceans-Projekt und der Ocean Sampling Day-Initiative als ihr Standardmarker für die eukaryotische mikrobielle Vielfalt gewählt und erzeugt einen umfangreichen globalen Referenzdatensatz. Für die meisten Anwendungen der eukaryotischen mikrobiellen Ökologie — marine Protisten-Gemeinschaftserhebungen, Überwachung von Süßwasserplankton und Bewertungen der Protistenvielfalt im Boden — ist das 18S V4-Sequencing der empfohlene Ausgangspunkt.
V9-RegionEine kürzere (~130 bp) hypervariable Region am 3'-Ende des 18S-Gens. V9 kann mit kürzeren Reads amplifiziert und sequenziert werden und ist weniger anfällig für Längenvariationsverzerrungen. Es wird für degradierte DNA wie alte Umwelt-DNA aus Sedimentkernen bevorzugt, hat jedoch im Allgemeinen eine geringere taxonomische Auflösung als V4 für die meisten eukaryotischen Gruppen.
Einschränkungen des 18S Metabarcodings
Mehrere Herausforderungen, die einzigartig für die 18S-Amplicon-Sequenzierung sind, erfordern sorgfältige Aufmerksamkeit. Die PR2 (Protist Ribosomal Reference) Datenbank ist die am besten kuratierte Ressource für eukaryotische 18S-Sequenzen, aber die taxonomische Abdeckung ist ungleichmäßig: Alveolaten, Stramenopilen und Rhizarien sind gut vertreten, während weniger erforschte Protisten-Phyla spärliche Referenzsequenzen aufweisen. Die Kopienzahl des 18S-rRNA-Gens variiert um mehr als drei Größenordnungen zwischen eukaryotischen Linien – was bedeutet, dass die Lesezahlen nicht die Zellzahlen widerspiegeln, was quantitative Vergleiche zwischen unterschiedlichen taxonomischen Gruppen unzuverlässig macht. Kontamination durch nicht-mikrobielle eukaryotische DNA ist häufig: Die eigenen Hautzellen des Forschers, das untersuchte Wirbeltier- oder Pflanzengewebe und andere Makroorganismen enthalten alle 18S-Sequenzen, die mit universellen eukaryotischen Primern amplifiziert werden, was die effektive Sequenzierungstiefe für die interessierende Protistengemeinschaft verringert.
18S-Anwendungen aus den Erhebungsdaten
Eine marine Ökologie-Forschungsgruppe reichte Sedimentproben für 18S-Metabarcoding ein, um Veränderungen in der Zusammensetzung der Protisten-Gemeinschaft nach einem saisonalen Phytoplanktonblütenereignis zu bewerten. Der Forscher wählte das 18S V4-Sequencing, da die Analyse der Protisten-Nachfolge nach der Blüte einen Marker erforderte, der die eukaryotische Vielfalt umfassend erfasst, einschließlich sowohl der Primärproduzenten als auch ihrer heterotrophen Konsumenten. Diese Frage konnte nicht mit 16S- oder ITS-Sequencing beantwortet werden, da keines von beiden die Protisten-Gemeinschaft erfassen würde.
DNA-Barcoding — Artenidentifikation für die makroskopische Welt
Von der Gemeinschaftsprofilierung zur präzisen Probenidentifizierung
Amplicon-Metabarcoding beantwortet die Frage: "Welche Mitglieder der mikrobiellen Gemeinschaft sind in dieser Mischprobe vorhanden?" DNA-Barcoding beantwortet eine andere, aber ebenso grundlegende Frage: "Welche Art ist dieser einzelne Organismus?" Ein Forscher, der die Vielfalt der Schmetterlinge untersucht, hat 300 Exemplare — 75 vermutete Arten mit jeweils 4 Individuen — für COI-Barcoding eingereicht. Sie benötigten eine bestätigte Artenidentität für jedes Exemplar und Haplotyp-Sequenzen für die populationsgenetische Analyse, nicht Gemeinschaftsprofile aus gemischten DNA-Extrakten.
Das Konsortium für den Barcode des Lebens (CBOL, barcodeoflife.org) hat standardisierte Marker etabliert:
- COI (Cytochrom c Oxidase Untereinheit I)Ein standardisierter 658 bp langer Fragment des mitochondrialen COI-Gens ist der universelle Tierbarcode, der mit universellen Primern (LCO1490/HCO2198) in den meisten Tierphyla amplifiziert werden kann. Das Barcode of Life Data System (BOLD) archiviert über 11 Millionen Barcode-Sequenzen von etwa 500.000 beschriebenen Arten. CD Genomics bietet DNA-Barcoding-Dienste Abdeckung der COI-, rbcL-, matK- und ITS-Marker.
- rbcL und matKDie Standard-Barcodierungskombination für Landpflanzen. rbcL lässt sich leicht mit universellen Primern amplifizieren, bietet jedoch eine begrenzte Artenauflösung. matK ist variabler, aber schwieriger universell zu amplifizieren. Zusammen erreichen die beiden Marker eine Erfolgsquote von etwa 70–75 % bei der Artenidentifikation über Landpflanzen.
- ITS im Kontext der Barcode-TechnologieDie gleiche ITS-Region, die als Marker für das Metabarcoding von Pilzen dient, fungiert auch als Pilzbarcode, wobei jede Sequenz von einem einzelnen kultivierten Isolat oder Fruchtkörper stammt und eine eindeutige Identifizierung auf Art-Ebene ermöglicht.
Barcode-Generierung im großen Maßstab: Von Sanger zu NGS
Traditionelles Sanger-basiertes Barcoding ist praktisch für Dutzende bis Hunderte von Proben, wird jedoch bei Tausenden von Proben prohibitively teuer. Für große Biodiversitätsinventarprojekte verwenden wir einen NGS-basierten Barcoding-Workflow. Einzelne Proben werden durch DNA-Extraktion und PCR-Amplifikation im 96-Well-Plattenformat verarbeitet, wobei jede Probe einen einzigartigen Barcode-Index erhält. Indizierte Amplicons werden zusammengeführt und in einem einzigen Illumina-Lauf sequenziert, wodurch Barcode-Sequenzen für Tausende von Proben zu Kosten von unter einem US-Dollar pro Probe erzeugt werden.
Auswahl Ihres Amplicon-Ansatzes: Entscheidungsrahmen
Abbildung 2: Schematische Darstellung des Vergleichs von Marker-Genen — Nebeneinander stehende genomische Karten der Gene 16S rRNA (V1–V9), 18S rRNA, ITS (ITS1/5.8S/ITS2) und COI mit hervorgehobenen konservierten und variablen Regionen.
Die folgende Tabelle fasst zusammen, wann jede Methode basierend auf Ihrer Forschungsfrage gewählt werden sollte:
| Forschungsfrage | Empfohlene Methode | Reads pro Probe | Referenzdatenbank |
|---|---|---|---|
| "Welche Bakterien befinden sich in meiner Darm-/Boden-/Wasserprobe?" | 16S V3–V4 oder V4–V5 | 50.000–100.000 | SILVA, GTDB |
| „Welche Pilze besiedeln meine Pflanzenwurzeln?“ | ITS1 oder ITS2 | 30.000–80.000 | VEREINEN |
| „Welche Protisten leben in dieser marinen Probe?“ | 18S V4 oder V9 | 30.000–80.000 | PR2 |
| "Ist dieses Fisch-/Fleischprodukt korrekt gekennzeichnet?" | COI-Barcoding | Sanger- oder Low-Pass-NGS | FETT |
| "Ich benötige bakterielle Identifikationen auf Artenebene." | Vollständiges 16S | 10.000–30.000 | SILVA, GTDB |
| "Gesamtmikrobiom (Bakterien + Pilze)" | 16S + ITS dual | 50.000 + 50.000 | SILVA + VEREINEN |
| "Geld ist knapp – minimale tragfähige Daten" | 16S V3–V4 reduziert | 25.000–50.000 | SILVA |
| "Bestätigen Sie die Artenidentität von 300 Tierproben." | COI-Barcoding (NGS) | Tiefpass-NGS | FETT |
Dual- und Multi-Marker-Strategien
Ein dualer Ansatz mit 16S + ITS erfasst Bakterien, Archaeen und Pilze aus derselben DNA-Extraktion und zeigt interkingliche Interaktionen, die kein Marker allein erkennen kann. Netzwerke der Bakterien-Pilz-Koexistenz werden zunehmend als Treiber der Mikrobiomfunktion in der Bodenqualität, der Unterdrückung von Pflanzenkrankheiten und der menschlichen Darmökologie anerkannt. Durch die Sequenzierung beider Marker aus demselben Satz von Proben können Sie interkingliche Assoziationsnetzwerke konstruieren und potenzielle synergistische oder antagonistische Beziehungen zwischen Mitgliedern der bakteriellen und pilzlichen Gemeinschaft identifizieren.
Für eine umfassende Profilierung der drei Domänen (Prokaryoten + Pilze + Protisten) ist ein 16S + ITS + 18S-Triple-Ansatz in einem einzigen koordinierten Projekt machbar, aber kostspielig. Wir empfehlen ihn nur, wenn eukaryotische mikrobielle Gemeinschaften eine zentrale Forschungsfrage darstellen und nicht nur ein exploratives Ziel sind. Die Kosten steigen grob additiv mit jedem zusätzlichen Marker, aber der DNA-Bedarf pro Probe nicht — eine Extraktion aus jeder Probe liefert ausreichend Template-DNA für alle drei PCR-Reaktionen, und die Bibliotheksvorbereitungen laufen parallel.
16S-Sequenzierung vs. Shotgun-Metagenomik: Ein Entscheidungspunkt
Eine Frage, die in fast jeder Projektberatung aufkommt, ist, wann man von 16S-Amplicon-Sequenzierung auf Shotgun-Metagenom-Sequenzierung umsteigen sollte. Die kurze Antwort ist, dass die 16S-Sequenzierung Antworten liefert. Wer ist da? (taxonomische Zusammensetzung), während Shotgun-Metagenomik Antworten liefert Was sind sie fähig? (Funktionales Potenzial). Wenn Ihre Forschungsfrage Kenntnisse über Stoffwechselwege, Profile von Antibiotikaresistenzgenen oder genomische Variationen auf Stamm-Ebene in der Gemeinschaft erfordert, ist Shotgun-Metagenomik die geeignete Methode – typischerweise zu 5–10 Mal den Kosten pro Probe. Wenn Ihre Frage die Gemeinschaftszusammensetzung, den Vergleich der Diversität zwischen Gruppen oder Veränderungen in der Häufigkeit spezifischer Taxa nach einer Intervention betrifft, liefert die 16S-Amplikon-Sequenzierung die richtigen Informationen zu einem Bruchteil der Kosten. Für viele Studien funktioniert ein gestufter Ansatz am besten: eine 16S-Umfrage über alle Proben, um gemeinschaftliche Muster zu charakterisieren, gefolgt von Shotgun-Metagenomik an einem strategisch ausgewählten Teilset von Proben für funktionale Einblicke.
Abbildung 4: Vergleichsinformation — Amplicon-Sequenzierung vs. Shotgun-Metagenomik. Seiten-by-Seiten-Vergleich hinsichtlich Kosten pro Probe, Datentyp, erforderlicher Sequenzierungstiefe, Flexibilität des Proben Typs und bioinformatischer Komplexität.
Wie CD Genomics Ihr Amplicon-Projekt liefert
Abbildung 3: Prozessflussdiagramm — End-to-End Amplicon-Sequenzierungsdienst. Sechs aufeinanderfolgende Schritte von Probe über Extraktion, Amplifikation, Sequenzierung, Analyse bis zur Datenübermittlung.
Unser Amplicon-Sequenzierungsdienst ist um einen vollständigen Projektlebenszyklus herum gestaltet, von der Designberatung bis zu publikationsbereiten Daten. Während der anfänglichen Besprechung zur Abgrenzung behandeln wir die Stichprobenmatrix und erwartete Herausforderungen, die Anzahl der Proben und experimentellen Gruppen, die Forschungsfrage, das Budget, den Zeitrahmen und alle speziellen Anforderungen, einschließlich maßgeschneiderter Primer-Sets.
Nach dem Erhalt der Proben messen wir die Konzentration (Qubit), die Reinheit (NanoDrop A260/A280, A260/A230) und die Integrität (TapeStation). Für Rohproben passen wir die Extraktionsprotokolle an die spezifische Matrix an – huminsäurereiche Böden erfordern einen anderen Ansatz als routinemäßige Stuhlproben. Wasserproben mit nicht nachweisbaren Nukleinsäuren benötigen Konzentrationsschritte und eine verbesserte Detektion, oft ohne zusätzliche Kosten.
Die Bibliotheksvorbereitung verwendet Dual-Index-Barcoding für die Multiplexierung von bis zu 384 Proben pro NovaSeq S4-Flow-Zellbahn. Standard-Primer-Sets umfassen 16S V3–V4 (341F/805R), ITS1 (ITS1f/ITS2), ITS2 (ITS3/ITS4) und 18S V4 (TAReuk454FWD1/TAReukREV3). Vollständige 16S/18S/ITS Amplicon-Sequenzierung Auf PacBio- oder Nanopore-Plattformen ist eine Auflösung auf Artenebene verfügbar. Angepasste Primer werden für spezialisierte Anwendungen unterstützt, einschließlich cyanobakterienspezifischer und archaenspezifischer 16S-Primer.
Standard-Bioinformatik-Lieferungen umfassen demultiplexierte FASTQ-Dateien, ASV/OTU-Tabellen mit Taxonomie (SILVA oder UNITE), ASV-repräsentative Sequenzen, Alpha-Diversitätsmetriken (Shannon, Simpson, Chao1, Faith's PD), Beta-Diversitätsordnungen (PCoA mit UniFrac, Bray-Curtis, Jaccard), taxonomische Balkendiagramme, Gemeinschafts-Hitzekarten und phylogenetische Bäume. Individuelle Analysen — Tests auf unterschiedliche Häufigkeit (DESeq2, ANCOM-BC, MaAsLin2), funktionale Vorhersage (PICRUSt2), Co-Occurrence-Netzwerkanalyse, veröffentlichungsfertige Abbildungen — sind auf Anfrage erhältlich.
Die Standardbearbeitungszeit beträgt 3–6 Wochen vom Erhalt der Proben bis zur Datenlieferung. Kleine Pilotprojekte (10–30 Proben) können in 2–3 Wochen abgeschlossen werden. Eilservice ist für dringende Projekte verfügbar. Wir stellen für jedes Projekt detaillierte QC-Dokumentationen zur Verfügung, einschließlich der Leseanzahlen pro Probe, Q-Score-Verteilungen und Kontaminationsbewertung. Wenn eine Probe nicht amplifiziert, informieren wir Sie, bevor wir mit der Sequenzierung fortfahren – wir sequenzieren keine nicht amplifizierenden Bibliotheken und berechnen keine Gebühren für fehlgeschlagene Bibliotheksvorbereitungen.
Häufig gestellte Fragen
Q: Meine Wasserproben ergeben nach der DNA-Extraktion nicht nachweisbare Nukleinsäurewerte. Kann man sie trotzdem sequenzieren?
Ja, in den meisten Fällen. Wir können das Extraktionsprotokoll optimieren, um minimale mikrobielle DNA zu konzentrieren und mit höherer Tiefe zu sequenzieren. Dies erfordert negative Kontrollen, die zusammen mit den experimentellen Proben sequenziert werden, um das mikrobielle Signal von der Reagenzkontamination zu unterscheiden – ein Schritt, der für Studien mit niedrigem Biomassegehalt nicht optional ist. Kontaktieren Sie unser wissenschaftliches Team, um Ihre spezifischen Proben vor der Einreichung zu besprechen.
Q: Ist ein Duplikat ausreichend oder benötigen wir dreifache biologische Replikate?
Für jeden Vergleich auf Gemeindeebene sind mindestens drei biologische Replikate pro experimenteller Gruppe erforderlich. Wir empfehlen fünf Replikate für Gemeinschaften mit hoher Variabilität, wie z. B. Boden- oder Hautmikrobiome. Das häufigste unterpowert Studie-Design besteht aus zwei Replikaten mit hoher Sequenzierungstiefe – für die gleichen Gesamtkosten empfehlen wir, fünf Replikate mit niedrigerer Tiefe zu sequenzieren.
F: Kann ich dieselbe DNA für 16S- und ITS-Sequenzierung verwenden?
Ja. Beide Marker werden aus derselben DNA-Extraktion unter Verwendung separater Primer-Sets in unabhängigen PCR-Reaktionen amplifiziert. Wir können Dual-Marker-Projekte koordinieren, um Ihren Probenhandling- und Versandaufwand zu minimieren.
F: Was ist die minimale DNA-Menge, die für die Amplicon-Sequenzierung erforderlich ist?
Wir empfehlen mindestens 10 ng DNA pro Probe für die Standardvorbereitung von Amplicon-Bibliotheken. Bei Proben mit niedrigeren Ausbeuten können wir versuchen, die Amplifikation mit erhöhten Zyklen durchzuführen, jedoch steigt das Risiko von PCR-Bias und Chimärenbildung mit zusätzlichen Zyklen.
F: Wie lange dauert ein typisches Amplicon-Projekt von der Einreichung bis zur Datenlieferung?
Standardprojekte benötigen 3–6 Wochen: Proben-QC und -Extraktion (3–5 Tage), Bibliotheksvorbereitung (3–5 Tage), Sequenzierung (1–7 Tage) und bioinformatische Analyse (5–10 Tage). Kleine Pilotprojekte (10–30 Proben) können in 2–3 Wochen abgeschlossen werden.
Bieten Sie DNA-Extraktion aus Rohproben an, oder muss ich zuerst extrahieren?
Wir bieten DNA-Extraktion aus einer Vielzahl von Probenarten an, darunter Fäkalien, Boden, Wasserfilter, Abstriche, Gewebe und FFPE. Die Extraktion erfolgt mithilfe von Protokollen, die für jede Matrix optimiert sind, einschließlich geeigneter Schritte zur Entfernung von Inhibitoren. Bitte geben Sie an, ob Sie eine Extraktion benötigen, wenn Sie Ihr Angebot anfordern.
Q: Was ist der Unterschied zwischen OTU- und ASV-Analyse?
OTU (Operational Taxonomic Unit) Analyse gruppiert Sequenzen mit 97% Ähnlichkeit und fasst eng verwandte, aber unterschiedliche Sequenzen zusammen. ASV (Amplicon Sequence Variant) Analyse unterscheidet Sequenzen, die sich nur durch ein einzelnes Nukleotid unterscheiden, und bietet eine höhere Auflösung und Reproduzierbarkeit. Wir bieten beide Optionen in unseren Standardlieferungen an.
Q: Unterstützen Sie benutzerdefinierte Primer-Sets?
Ja. Wir können maßgeschneiderte Primer für spezielle Anwendungen synthetisieren und validieren, einschließlich gruppenspezifischer 16S-Primer für bestimmte bakterielle Phyla, archaea-spezifische Primer und maßgeschneiderte Marker für nicht-standardisierte Barcode-Ziele.
Alle unten aufgeführten Referenzen sind unter CC BY 4.0 oder gleichwertigen Open-Access-Lizenzen veröffentlicht.
Referenzen:
- Callahan BJ, Sankaran K, Fukuyama JA, McMurdie PJ, Holmes SP. Bioconductor-Workflow für die Analyse von Mikrobiomdaten: von Rohdaten zu Gemeinschaftsanalysen. F1000Research. 2016;5:1492. doi:10.12688/f1000research.8986.2 (CC BY 4.0)
- Estaki M, Jiang L, Bokulich NA, et al. QIIME 2 ermöglicht eine umfassende End-to-End-Analyse vielfältiger Mikrobiomdaten und vergleichendes maschinelles Lernen. mSystems. 2020;5(1):e00150-20. doi:10.1128/mSystems.00150-20 (CC BY 4.0)
- Quast C, Pruesse E, Yilmaz P, et al. Das SILVA-ribosomale RNA-Gen-Datenbankprojekt: verbesserte Datenverarbeitung und webbasierte Werkzeuge. Nucleic Acids Research. 2013;41(D1):D590–D596. doi:10.1093/nar/gks1219 (Open Access)
- Nilsson RH, Larsson KH, Taylor AFS, et al. Die UNITE-Datenbank zur molekularen Identifizierung von Pilzen: Umgang mit dunklen Taxa und parallelen taxonomischen Klassifikationen. Nucleic Acids Research. 2019;47(D1):D259–D264. doi:10.1093/nar/gky1022 (Open Access)
- Guillou L, Bachar D, Audic S, et al. Die Protisten-Ribosomen-Referenzdatenbank (PR2): ein Katalog von rRNA-Sequenzen der kleinen ribosomalen Untereinheit von einzelligen Eukaryoten mit kuratierter Taxonomie. Nucleic Acids Research. 2013;41(D1):D597–D604. doi:10.1093/nar/gks1160 (Open Access)
- Ratnasingham S, Hebert PDN. Ein DNA-basiertes Register für alle Tierarten: Das Barcode-Indexnummer (BIN)-System. PLOS ONE. 2013;8(7):e66213. doi:10.1371/journal.pone.0066213 (CC BY 4.0)
- Walters W, Hyde ER, Berg-Lyons D, et al. Verbesserte Primer für das bakterielle 16S rRNA-Gen (V4 und V4-5) und das interne transkribierte Spacer-Marker-Gen für Umfragen zur mikrobiellen Gemeinschaft. mSystems. 2016;1(1):e00009-15. doi:10.1128/mSystems.00009-15 (CC BY 4.0)
- Davis NM, Proctor DM, Holmes SP, Relman DA, Callahan BJ. Einfache statistische Identifizierung und Entfernung von Kontaminantensequenzen in Marker-Gen- und Metagenomikdaten. Mikrobiom. 2018;6:226. doi:10.1186/s40168-018-0605-2 (CC BY 4.0)
- Parks DH, Chuvochina M, Rinke C, et al. GTDB: eine laufende Erhebung der bakteriellen und archaealen Vielfalt durch eine phylogenetisch konsistente, rangnormalisierte und vollständige genombasierte Taxonomie. Nucleic Acids Research. 2022;50(D1):D785–D794. doi:10.1093/nar/gkab776 (Open Access)
- Callahan BJ, Wong J, Heiner C, et al. Hochdurchsatz-Amplicon-Sequenzierung des vollständigen 16S rRNA-Gens mit Einzel-Nukleotid-Auflösung. Nucleic Acids Research. 2019;47(18):e103. doi:10.1093/nar/gkz569 (Open Access)