How many reads per sample do I really need for 16S?

50,000-100,000 for most sample types. Human fecal and soil need the high end; mouse gut and low-diversity consortia can work with 30,000-50,000. Run a rarefaction curve to confirm saturation at your chosen depth.

V3-V4 or full-length 16S — which should I choose?

Short-read V3-V4 for genus-level profiling on a budget. Full-length 16S (PacBio or Nanopore) when species-level resolution matters — pathogen discrimination, biomarker discovery, or genera with high species diversity like Pseudomonas and Bifidobacterium.

Can I compare 16S data generated on different sequencing platforms or primer sets?

Only with caution. Platform and primer effects are real and can be larger than the biological effect you are studying. If you must combine datasets, use ComBat or MMUPHin for batch correction, and acknowledge the limitation explicitly. Never pool data from different primer sets without batch-adjusting.

How many biological replicates do I need?

At least 5 per group for animal studies (with cage as a random effect), 20-30 per group for human cross-sectional studies, and 8-12 per treatment for agricultural field plots. These numbers assume medium-to-large effect sizes (2-fold abundance differences). If you are looking for subtle shifts, double them.

What negative controls should I include?

Three types per sequencing run: an extraction blank (no-sample control processed through the entire extraction workflow), a PCR blank (water substituted for DNA template), and a field blank (sterile collection device exposed to the sampling environment). If a taxon appears in a negative control at greater than 1% of its abundance in real samples, exclude it.

Should I use ASVs or OTUs?

ASVs (via DADA2) for most applications — they are reproducible, offer single-nucleotide resolution, and are the current standard. OTUs (via HmmUFOtu or UPARSE) when working with environmental samples where reference databases are sparse and intragenomic 16S variation causes over-splitting.

How reliable is PICRUSt2 functional prediction?

Reliable for human gut samples (NSTI typically below 0.15) where reference genome coverage is excellent. Unreliable for environmental samples (NSTI often above 0.5) and non-model host species. Always report NSTI values and treat predictions from high-NSTI samples as hypothesis-generating, not conclusive.

What is the turnaround time for outsourced 16S sequencing?

Typical CRO timelines range from 2-8 weeks depending on project size, sample type, and bioinformatics deliverables. Factor in an additional 2-3 weeks for sample shipping, customs clearance (if international), and quality control. Communicate the expected timeline before collecting samples.

16S rRNA-Amplikon-Sequenzierung zur Analyse des Mikrobioms im Darm, im Mund und in der Umwelt: Vom Probenahme bis zum Gemeinschaftsprofil

Sie haben Ihre Proben im Gefrierschrank. Sie wissen, dass die 16S rRNA-Amplikon-Sequenzierung das richtige Werkzeug ist – nicht Shotgun-Metagenomik, nicht qPCR, nicht Kulturomik. Aber die Lücke zwischen „Ich weiß, dass ich 16S brauche“ und „meine Daten sind in der Hand und ergeben biologisch Sinn“ ist größer, als die meisten Protokolle zugeben. Welches hypervariable Gebiet? Wie viele Reads? Biologische Replikate oder nur technische? Und was tun Sie, wenn Ihre Bodenprobe 12 ng DNA liefert, von denen die Hälfte Huminsäure ist?

Dieser Artikel erläutert die Entscheidungen, die darüber bestimmen, ob ein 16S-Projekt bedeutungsvolle Gemeinschaftsprofile oder uninterpretierbares Rauschen produziert. Wir gliedern die Diskussion nach Probenarten – Darm, oral und umweltlich – da die richtige Antwort auf nahezu jede methodologische Frage davon abhängt, woher Ihre Proben stammen.

Das 16S rRNA-Gen als molekularer Zeitmesser

Das 16S-ribosomale RNA-Gen ist etwa 1.500 Basenpaare lang und enthält neun hypervariable Regionen (V1 bis V9), die sich zwischen hochkonservierten Abschnitten befinden. Die konservierten Regionen dienen als universelle Primer-Bindungsstellen; die variablen Regionen liefern phylogenetische Signale. Keine einzelne variable Region erfasst die vollständige taxonomische Auflösung, die das Gen bieten kann.

V3-V4 ist der de facto Standard für Studien zum Mikrobiom des Darms. Es umfasst etwa 460 bp und erfasst genügend Variation, um die meisten Gattungen und einige Arten innerhalb der wichtigsten Darmphyla — Firmicutes, Bacteroidota, Actinobacteriota und Proteobacteria — zu unterscheiden. Das Earth Microbiome Project hat sich auf das Primerpaar 515f/806r konzentriert, das V4 anvisiert, und zehntausende öffentlich verfügbarer Datensätze verwenden dieses Amplicon, was es zur am besten vergleichbaren Wahl für Arbeiten zum Mikrobiom des Darms macht.

Für orale Mikrobiomproben schneidet V1-V3 durchgehend besser ab als V3-V4. Die Mundhöhle wird von Streptokokken dominiert, und die Artenebene diskriminiert innerhalb Streptococcus benötigt die Hypervariabilität, die von V1 und V2 erfasst wird. Eine Simulationsstudie aus dem Jahr 2025 über orale Taxa ergab, dass V2V3 allein 135 Arten identifizierte, während das Zusammenfassen mehrerer Ampliconregionen 204 Arten erreichte – jedoch verpasste V3-V4 allein wichtige orale Pathogene. Wenn Ihre Studie subgingivales Plaque, Speichel oder Proben von der Zungenoberfläche umfasst und Sie sich für Artenzuweisungen auf Artenebene interessieren, wählen Sie V1-V3.

Die vollständige 16S-Sequenzierung — die Amplifikation des gesamten ~1.500-bp-Gens über PacBio HiFi oder Oxford Nanopore — erhöht die Klassifikation auf Artenebene von etwa 48 % (Illumina V3-V4) auf 63-76 %. Für Forschungsanwendungen, die eine Unterscheidung von Krankheitserregern auf Artenebene erfordern — wie zum Beispiel die Unterscheidung Staphylococcus aureus von S. epidermidis In Kulturkollektionen oder Forschungsgruppen — dieser Unterschied ist wichtig. Der Kompromiss besteht in den Kosten pro Probe: Die Kurzlese-Amplicon-Sequenzierung kann Hunderte von Proben in einem einzigen MiSeq-Lauf bündeln, während Langleseläufe typischerweise weniger Proben bei höheren Kosten pro Lesevorgang aufnehmen.

16S rRNA gene structure showing V1-V9 hypervariable regions and amplicon coverage of V3-V4, V1-V3, and full-length strategies Abbildung 1: Struktur des 16S rRNA-Gens und Abdeckung der hypervariablen Regionen

End-to-End 16S Sequenzierungs-Workflow

Ein 16S-Projekt durchläuft fünf Phasen: Probenentnahme und -konservierung, DNA-Extraktion, Bibliothekskonstruktion, Sequenzierung und bioinformatische Analyse. Jede Phase bietet Möglichkeiten für Verzerrungen – einige sind ansprechbar, andere muss man akzeptieren und dokumentieren.

Probenentnahme und -konservierung

Die wichtigste Variable ist, wie schnell der mikrobielle Stoffwechsel nach der Entnahme stoppt. Bei Stuhlproben bleibt das sofortige Einfrieren bei -80 °C der Goldstandard, aber DNA/RNA Shield oder 95 % Ethanol bei Raumtemperatur bewahren die Gemeinschaftszusammensetzung für 16S ausreichend, wenn die Kühlkette nicht verfügbar ist. Mundabstriche und subgingivale Plaqueproben degradieren schneller – zielen Sie darauf ab, innerhalb von 30 Minuten nach der Entnahme einzufrieren oder in einem Stabilisierungspuffer zu lagern. Bei Umweltwasserproben filtern Sie sofort vor Ort und frieren die Filter ein; bei Bodenproben sieben Sie auf 2 mm und frieren Sie sie ein oder trocknen Sie sie innerhalb von Stunden.

DNA-Extraktion

Die Extraktionsmethode führt zu mehr kompositorischer Verzerrung als jeder andere Schritt im Labor. Das Bead-Beating lysiert Gram-positive Zellwände effektiver als die enzymatische Lyse allein, aber die Größe der Perlen und die Dauer des Beatens verändern das resultierende Gemeinschaftsprofil. Die praktische Regel: Wählen Sie ein Extraktionskit und verwenden Sie es für jede Probe in Ihrer Studie. Mischen Sie keine Kits und wechseln Sie nicht die Kit-Lotnummern während des Projekts, ohne einen Vergleich nebeneinander an einer Teilmenge von Proben durchzuführen.

Ertragsanforderungen: Die meisten Protokolle zur Bibliotheksvorbereitung verlangen mindestens 1-5 ng/μL DNA bei einem Mindestvolumen von 10-20 μL. Die fluorometrische Quantifizierung (Qubit oder PicoGreen) ist unerlässlich – NanoDrop allein überschätzt die Konzentration in Anwesenheit von RNA, Salzen oder huminsäurehaltigen Stoffen. Bei Umweltproben signalisiert ein OD 260/230 unter 1,5 einen Übertrag von Huminsäure, der die nachgelagerte PCR hemmt. Eine Nachextraktionsreinigung mit SPRI-Perlen oder einem kommerziellen Kit zur Entfernung von Inhibitoren kann grenzwertige Proben retten.

Bibliothekskonstruktion: Einzel- vs. Dual-Index-Barcoding

Die Bibliotheksvorbereitung fügt stichproben-spezifische Barcodes (Indizes) und Sequenzierungsadapter zum Amplicon hinzu. Das Dual-Index-Barcoding, bei dem einzigartige i5- und i7-Indexpaare jede Probe identifizieren, ist mittlerweile der Standard für Projekte, die mehr als 48 Proben in einem Sequenzierungslane zusammenfassen. Single-Index-Schemata erzeugen Indexwechselartefakte – typischerweise werden 0,1-0,5 % der Reads fälschlicherweise der falschen Probe zugeordnet –, was die falschen ASV-Zählungen in Proben mit niedrigem Biomasseanteil, die neben Proben mit hohem Biomasseanteil auf demselben Flusszellen platziert sind, erhöht.

Beim Poolen von Proben für die Sequenzierung gelten zwei zusätzliche Überlegungen. Erstens sollte die gesamte DNA-Eingabe über die Proben hinweg ausgewogen sein — eine 96-Well-Platte, bei der das Well A1 50 ng und das Well H12 2 ng enthält, wird nach der Normalisierung dramatisch ungleiche Lesezahlen erzeugen. Zweitens, bei Proben mit niedrigem Biomassegehalt, sollten Sie in Betracht ziehen, diese auf einem separaten Sequenzierungslane von Proben mit hohem Biomassegehalt zu laufen, oder mindestens, sie physisch auf der Platte zu trennen (z. B. Gruppen von Proben mit niedrigem Biomassegehalt in den Spalten 1-3 anordnen, anstatt sie zu vermischen). Dies begrenzt die Auswirkungen von Indexwechselartefakten auf Ihre Proben mit der niedrigsten Konzentration, die auch am anfälligsten für Kontamination sind.

Sequenzierungsplattform-Optionen

Plattform	Amplicon	Durchsatz pro Durchlauf	Typische Kosten pro Probe (96-plex)	Am besten geeignet für
MiSeq v2 (2×250)	V3-V4, V4	12-15 Millionen Aufrufe	Niedrig-mittel	Klein- bis mittelgroße Projekte, V1-V3
MiSeq v3 (2×300)	V3-V4, V1-V3	22-25 Millionen Aufrufe	Moderat	Überlappende Paar-Ende für längere Amplicons
NovaSeq SP/XP	V3-V4, V4	800M+ Aufrufe	Niedrig (in großem Maßstab)	Große Kohorten, 200+ Proben
Nanopore MinION	Vollständige 16S	Variable (benutzersteuerbar)	Moderat	Artenebene Auflösung, Feldeinsatz
PacBio Sequel II	Vollständiges 16S	4M CCS-Lesungen	Höher	Höchste Genauigkeit bei langen Reads

Für die meisten akademischen Projekte mit 50-200 Proben, die auf V3-V4 oder V1-V3 abzielen, bietet die MiSeq v3 Chemie (2×300 bp) eine angemessene Abdeckungstiefe zu den niedrigsten praktischen Kosten. NovaSeq wird ab etwa 300 Proben wirtschaftlich und ist die bevorzugte Plattform für große Kohortenstudien, erfordert jedoch eine sorgfältige Planung der Lane-Zuweisung, um Batch-Effekte zu vermeiden. Vollständige 16S/18S/ITS Amplicon-Sequenzierung über Nanopore oder PacBio ist die Wahl, wenn eine taxonomische Zuordnung auf Art-Ebene wissenschaftlich notwendig ist — für die Entdeckung von Biomarkern, die Charakterisierung von Forschungsisolaten oder Studien zu Gattungen mit hoher Artenvielfalt wie Bifidobacterium oder Pseudomonas.

End-to-end 16S rRNA amplicon sequencing workflow from sample collection through bioinformatics Abbildung 2: End-to-End 16S rRNA Amplicon-Sequenzierungs-Workflow

Mikrobiom des Darms: Von gesunden Kohorten zu Krankheitsstudien

Das Mikrobiom des Darms ist das am häufigsten sequenzierte Ökosystem auf der Erde. Aufgrund dessen sind die Referenzdatenbanken am reichhaltigsten für Darmtaxa, und die methodologischen Normen sind am ausgereiftesten. Doch die Reife des Feldes hat einen Nachteil: Die Anforderungen an die statistische Power sind gestiegen, und Gutachter erwarten nun Studiendesigns, die viele Projektleiter in der Förderantragsphase unterschätzen.

V4 oder V3-V4 für Stuhlproben

Für menschliche Stuhlproben erzeugen entweder V4 allein (515f/806r, ~250 bp) oder V3-V4 (~460 bp) robuste Genus-Level-Profile. V4 allein hat den Vorteil der perfekten Überlappung mit dem Earth Microbiome Project, was einen direkten Vergleich mit Tausenden von veröffentlichten Proben ermöglicht. V3-V4 bietet eine marginal bessere Artenunterscheidung in den Bacteroidota und Firmicutes. Für Maus-Stuhlproben funktionieren dieselben Primer-Sets, aber beachten Sie, dass die Mikrobiota des Mausdarms weit weniger divers ist als die des Menschen – 50.000 Reads pro Probe sind mehr als ausreichend, während menschliche Proben von 80.000-100.000 profitieren.

Studienentwurf: Replikate, Störfaktoren und longitudinale Stichprobenahme

Der häufigste Designfehler in 16S-Studien zum Mikrobiom ist unzureichende biologische Replikation. Ein einzelnes Mäusekäfig oder ein einzelner Zeitpunkt von einem menschlichen Probanden ist kein Replikat von irgendetwas außer diesem Käfig oder dieser Person. Für humanmedizinische Querschnittsstudien sind mindestens 20-30 Probanden pro Gruppe erforderlich, um Unterschiede in der Genus-Abundanz von 2-fach oder mehr mit 80%iger Power zu erkennen, vorausgesetzt, die Gruppen sind in Bezug auf Ernährung, Alter und Medikationsgeschichte einigermaßen homogen. In der Praxis sind viele veröffentlichte Studien mit n=10 pro Gruppe unterpowert, und die "statistisch signifikanten" Taxa, die sie berichten, sind ebenso wahrscheinlich Rauschen wie Signal.

Längsschnittdesigns — mehrere Zeitpunkte von denselben Probanden — sind statistisch effizienter, da jeder Proband als eigene Kontrolle dient. Eine Studie mit 15 Probanden, die zu drei Zeitpunkten beprobt wurden, kann eine querschnittliche Studie mit 40 Probanden pro Gruppe in der Erkennung von inneren Verschiebungen übertreffen. Der Vorbehalt: Längsschnittdesigns erfordern explizite statistische Modelle für gepaarte Stichproben (gepaarte PERMANOVA, gemischte Effekte-Modelle mit Proband als zufälligem Effekt). Ein standardmäßiger ungepaarter Test auf gepaarten Daten verwirft die statistische Power, die Sie erstellt haben. Praktisch ausgedrückt: Wenn Sie drei Zeitpunkte von denselben 20 Probanden gesammelt haben, haben Sie 60 Proben — aber wenn Sie alle 60 als unabhängig behandeln, erhöht sich Ihre falsch-positive Rate, da Proben von derselben Person korreliert sind. Ein gemischtes Effekte-Modell mit Probanden-ID als zufälligem Intercept berücksichtigt diese Korrelation innerhalb der Probanden.

Für diätetische Interventionsstudien und randomisierte kontrollierte Studien hat sich der praktische Maßstab verschoben. Neuere RCTs mit 16S als primärem Ergebnis rekrutieren routinemäßig 80-200 Probanden und sammeln Stuhlproben zu Beginn, in der Mitte, am Ende und während der Auswaschphase. 16S/18S/ITS Amplicon-Sequenzierung In diesem Maßstab erfordert es sorgfältiges Batchen: Randomisieren Sie die Behandlungs- und Kontrollproben über die Sequenzierungsläufe, sequenzieren Sie niemals alle Kontrollen in einem Lauf und alle Behandlungen in einem anderen. Der Bateffekt ist real und verfälscht den Behandlungseffekt, wenn die Zuteilung nicht über die Platten randomisiert ist.

Wenn 16S nicht genug ist

Wenn Ihre biologische Frage die Übertragung auf Stamm-Ebene, den Gehalt an Genen für antimikrobielle Resistenzen oder die Aktivität von Stoffwechselwegen betrifft, wird die 16S-Taxonomie allein keine Antwort darauf geben. Siehe die Diskussion über ergänzende Dienstleistungen in "Wie Sie Ihr 16S-Projekt planen" unten für eine vollständige Übersicht.

Mikrobiom der Mundhöhle: Über Karies hinaus

Die Mundhöhle enthält mindestens 700 Bakterienarten, die über verschiedene Nischen verteilt sind – subgingivale Taschen, supragingivaler Plaque, Zungenrücken, Wangenschleimhaut und Speichel. Jede Nische hat eine andere Gemeinschaftsstruktur, und die optimale 16S-Strategie variiert je nach Nische.

Warum V1-V3, nicht V4?

Das orale Mikrobiom wird von Streptokokken dominiert, und wie bereits erwähnt, bietet V1-V3 eine weitaus bessere Unterscheidung der Streptokokkenarten als V3-V4 — S. mitis, S. oralis, und S. pneumoniae teilen nahezu identische V4-Sequenzen, werden jedoch durch V1-V2 aufgelöst. Die Wahl der Primer allein ist jedoch nicht ausreichend ohne die richtige Referenzdatenbank. In einer Benchmarking-Studie von 2025 schnitt selbst die optimale V-Region schlecht ab, als sie mit einer generischen Datenbank kombiniert wurde, was uns zu eHOMD bringt.

eHOMD: Die oral-spezifische Datenbank

Für die taxonomische Klassifikation von oralen 16S-Daten bietet die erweiterte Human Oral Microbiome Database (eHOMD) eine Artenauflösung, die SILVA und Greengenes2 nicht erreichen können. eHOMD ist speziell für orale Taxa kuratiert und umfasst vorläufige Artenbezeichnungen für unkultivierte orale Bakterien. Der praktische Workflow: DADA2 ausführen, um ASVs zu generieren, gegen SILVA klassifizieren für eine breite Taxonomie und dann gegen eHOMD für eine orale spezifische Auflösung neu klassifizieren. Dieser zweistufige Ansatz erfasst orale Taxa, die von SILVA falsch klassifiziert oder auf Gattungsebene belassen werden.

Probenarten und -entnahme

Subgingivales Plaque, das mit Papierpunkten gesammelt wird, liefert das klinisch informativste Signal für Studien zur Parodontitis, bringt jedoch die niedrigsten DNA-Mengen hervor – oft 1-5 ng insgesamt. Speichel hat eine hohe Ausbeute, stellt jedoch eine gepoolte Gemeinschaft dar, die niche-spezifische Signale verwischt. Abstriche von der Zungenoberfläche erfassen eine distinct Gemeinschaft, die reich an Anaerobiern ist und überraschend gut mit der Produktion flüchtiger Schwefelverbindungen, die mit Halitosis assoziiert sind, korreliert. Für Studien, die orale Gesundheit mit systemischen Erkrankungen verknüpfen, ist die Probenahme aus mehreren Nischen ideal, aber wenn nur ein Proben-Typ machbar ist, liefert subgingivales Plaque das stärkste Signal für die Krankheitsassoziation.

Eine bevölkerungsbasierte Studie aus dem Jahr 2026 (PAROMIND, n=1.026), die subgingivales 16S-Profiling verwendete, verband Porphyromonas, Fretibacterium, Tannerellaund Dialister Die Häufigkeiten des kognitiven Rückgangs bestätigen, was die parodontalen Studien schon lange vermuteten: Die Mundhöhle ist ein Fenster zur systemischen Entzündung. Studien in diesem Umfang werden zur erwarteten Norm für die Forschung zur Verbindung zwischen Mund und Systematik.

Oral cavity cross-section showing five sampling sites with recommended 16S regions and DNA yields Abbildung 3: Probenahmestellen des oralen Mikrobioms und empfohlene 16S-Strategien

Umwelt 16S: Boden, Wasser und extreme Umgebungen

Umweltproben brechen das Standard-16S-Schema. Referenzdatenbanken sind spärlich, die Diversität der Gemeinschaften ist um ein Vielfaches höher als bei wirtassoziierten Proben, und die physikalische Matrix — Bodenhumine, Sedimentpartikel, Filtermembranen — stört jeden Schritt von der Extraktion bis zur PCR.

Das Niedrig-Biomasse-Problem

Ein Gramm reicher Boden kann Mikrogramm DNA liefern, während ein Liter oligotrophes Meerwasser, das auf eine 0,22 μm Membran gefiltert wird, Nanogramm liefern kann. Proben mit niedriger Biomasse verstärken jede Quelle der Kontamination: Kit-Reagenzien (das "Kitome"), Laborluft, Pipettenspitzen und sogar das sterile Wasser, das für Leerproben verwendet wird. Der minimale Schutz besteht darin, in jedem Sequenzierungsdurchgang mindestens drei Arten von negativen Kontrollen durchzuführen: eine Extraktionsleerprobe (keine Probe, die durch den gesamten Extraktionsworkflow verarbeitet wird), eine PCR-Leerprobe (molekulargradiges Wasser anstelle von Template) und eine Feldleerprobe (ein steriler Tupfer oder Filter, der der Probenumgebung ausgesetzt ist). Wenn ein Taxon in einer negativen Kontrolle in höherer relativer Häufigkeit erscheint als in Ihren Proben, schließen Sie es aus.

Für Studien, die Grundwasser, tiefe marinen Sediment, Gletschereis oder andere extrem niedermassige Matrizen betreffen, Absolute quantitative 16S/18S/ITS Amplicon-Sequenzierung, die Spike-in-Standards hinzufügt, um relative Häufigkeiten in absolute Zellzahlen pro Probe umzuwandeln, bietet eine wichtige Plausibilitätsprüfung, wenn die Gesamtzahl der 16S-Kopien nahe der Nachweisgrenze liegt.

Boden: Huminsäuren und Hemmstoffmanagement

Die DNA-Extraktionen aus Boden sind einzigartig herausfordernd, da huminsäure mit der DNA co-extrahiert und die Taq-Polymerase hemmt. Das sichtbare Zeichen ist eine braun gefärbte Eluat; das unsichtbare Zeichen sind qPCR Cq-Werte, die sich 3-5 Zyklen später als erwartet verschieben. DNeasy PowerSoil Pro bleibt die am weitesten validierte Option. Für humusreiche Böden entfernt eine Nachreinigung nach der Extraktion mit SPRI-Perlen im Verhältnis 0,8x die meisten Hemmstoffe, ohne dass es zu einem erheblichen DNA-Verlust kommt. Verdünnen Sie die DNA nicht, um die Hemmung zu überwinden – Sie verdünnen auch die Vorlage, und Taxa mit niedriger Häufigkeit fallen unter die Nachweisgrenze.

ASV vs. OTU im Umweltkontext

Für Umweltproben kann das Standardfehlermodell von DADA2 echte biologische Mikrodifferenzierung überbewerten – ein einzelnes Genom kann aufgrund von intragenomaler 16S-Kopienvariation mehrere ASVs erzeugen. HmmUFOtu, ein de novo OTU-Klusterwerkzeug, behält 89-93% der Reads im Vergleich zu DADA2s 18-44% in einigen Umweltdatensätzen bei – eine Leistungsdifferenz, die in einer Benchmarking-Studie zum Umweltmikrobiom von 2025 mit einer 227-Stämme-Mock-Community dokumentiert wurde – was es zu einer besseren Wahl macht, wenn die Probenvielfalt hoch und die Referenzabdeckung niedrig ist. Wenn ASVs verwendet werden, ziehen Sie in Betracht, nach dem Clustern bei 97-99% Identität zu konsolidieren, um wahrscheinliche intragenomale Varianten zu reduzieren – der Konsens aus der Benchmarking-Studie zum Umweltmikrobiom von 2025 ist, dass dieser Kompromiss einige biologische Auflösung opfert, aber spurious Taxa erheblich reduziert.

Marine und Süßwasser

Für Wasserproben filtern Sie ein ausreichendes Volumen, um die mikrobielle Biomasse zu erfassen, ohne die Membran zu verstopfen. Sterivex-Filter (0,22 μm) sind der Standard für Meerwasser und große Volumina von Süßwasser. Bei trübem Süßwasser vorfiltern durch eine 5 μm Membran, um Partikel zu entfernen, und dann Mikroben auf einer 0,22 μm Membran sammeln. Das Material der Filtermembran ist wichtig: Polyethersulfon (PES)-Membranen liefern im Allgemeinen eine höhere DNA-Ausbeute als Polycarbonat für Bakterienzellen, aber Polycarbonat wird bevorzugt, wenn auch eukaryotische DNA (18S) von demselben Filter extrahiert werden soll.

Für marine Proben erfasst das Sequenzieren von V6-V8 mehr phylogenetische Vielfalt als V4 in untercharakterisierten aquatischen Kladen, einschließlich SAR11, marinen Actinobakterien und unkultivierten Gammaproteobakterien. Süßwasserproben, insbesondere aus eutrophen Seen, profitieren von V4 für die Vergleichbarkeit mit bestehenden Süßwasserdatensätzen. In beiden Fällen bedeutet die begrenzte Repräsentation aquatischer Taxa in Referenzdatenbanken, dass ein hoher Anteil der ASVs möglicherweise nur auf Familien- oder Ordnungsniveau klassifiziert werden kann – dies ist eine Datenbankbeschränkung und kein Sequenzierungsfehler, und das Filtern dieser unklassifizierten ASVs wird ökologisch bedeutende Mitglieder Ihrer Gemeinschaft ausschließen.

Environmental 16S low-biomass workflow with five QC checkpoints and three negative control types Abbildung 4: Umwelt-16S-Niedrig-Biomasse-Workflow mit QC-Prüfpunkten

Von FASTQ zu Gemeinschaftsprofil

Bioinformatische Analysen wandeln Millionen von kurzen Reads in interpretierbare Gemeinschaftsprofile um. Die Entscheidungen, die Sie hier treffen, sind ebenso entscheidend wie die Entscheidungen im Wet-Lab, die vorher getroffen werden.

ASV vs. OTU

Amplicon-Sequenzvarianten (ASVs), die von DADA2 erzeugt werden, sind jetzt der Standard für die meisten 16S-Studien. ASVs bieten eine Auflösung auf Einzel-Nukleotid-Ebene, sind in verschiedenen Studien reproduzierbar und beseitigen die willkürliche 97%-Clustergrenze traditioneller OTUs. Das Problem der Überteilung ist jedoch real – insbesondere bei Taxa mit mehreren rRNA-Operon-Kopien.Bacillus, Clostridium, und viele Umweltbakterien). Wenn Ihre ASV-Tabelle mehr als 5.000 ASVs aus 30 Stuhlproben zeigt, ist wahrscheinlich etwas nicht in Ordnung. Das Filtern von ASVs, die in weniger als 2-3 Proben oder mit einer durchschnittlichen relativen Häufigkeit von unter 0,01 % vorhanden sind, bereinigt in der Regel Artefakte, ohne ökologisch bedeutende seltene Taxa zu verlieren.

DADA2-Pipeline-Grundlagen

Der Standard-DADA2-Workflow in R verarbeitet gepaarte Endlesungen durch Qualitätsfilterung (filterAndTrim mit maxEE=c(2,2)), Fehler-Modell-Lernen, Stichprobeninferenz, gepaarte Endzusammenführung (minimale Überlappung 12-20 bp), Chimärenentfernung und Taxonomiezuweisung. Zwei Parameter, die mehr Aufmerksamkeit verdienen, als sie erhalten:

1. Minimale Überlappung für das Zusammenführen: Wenn sie zu niedrig eingestellt ist (8-10 bp), erhält man fehlerhafte zusammengeführte Reads; wenn sie zu hoch eingestellt ist (über 30 bp), verliert man Reads aus dem rechten Ende der Amplicon-Längenverteilung. Für V3-V4 mit 2×300 Sequenzierung sind 20 bp ein sicherer Standardwert.

2. Taxonomiezuweisung: SILVA v138.1 bleibt das am weitesten validierte Referenzwerk, aber Greengenes2 und GTDB bieten Vorteile für spezifische Fragestellungen. Greengenes2 ist phylogenetisch konsistent und gut geeignet für Darmtaxa; GTDB bietet genombasierte Taxonomie, die veraltete phänotypische Klassifikationen vermeidet. Für orale Proben ist der oben beschriebene zweistufige SILVA-then-eHOMD-Ansatz die derzeit beste Praxis.

Alpha- und Beta-Diversität: Die richtige Metrik wählen

Beobachtete ASVs und die Shannon-Diversität sind die am häufigsten berichteten Alpha-Diversitätsmetriken, und sie sind oft die falschen für die biologische Fragestellung. Wenn Sie sich für die Artenvielfalt (wie viele Taxa vorhanden sind) interessieren, verwenden Sie Chao1 oder beobachtete ASVs. Wenn Sie sich für die Gleichmäßigkeit (wie gleichmäßig die Taxa verteilt sind) interessieren, verwenden Sie Shannon oder Simpson. Wenn Sie sich für phylogenetische Diversität interessieren, verwenden Sie Faith's PD. Die Verwendung von Shannon, nur weil jede Studie Shannon berichtet, ist eine verpasste Gelegenheit, die Metrik mit der Fragestellung in Einklang zu bringen.

Für die Beta-Diversität berücksichtigt der gewichtete UniFrac sowohl Präsenz/Abwesenheit als auch relative Häufigkeit phylogenetisch verwandter Taxa; der ungewichtete UniFrac betrachtet nur Präsenz/Abwesenheit. Bray-Curtis ist eine nicht-phylogenetische Alternative, die gut abschneidet, wenn Referenzphylogenien unzuverlässig sind – was häufig bei Umweltproben mit schlecht charakterisierten Taxa der Fall ist.

PICRUSt2 und die NSTI-Warnung

PICRUSt2 und Tax4Fun2 sagen den funktionalen Geninhalt aus 16S-Daten voraus, indem sie ASVs den nächstgelegenen sequenzierten Genomen in einer Referenzdatenbank zuordnen. Das wichtigste Qualitätsmerkmal für PICRUSt2 ist der Nearest Sequenced Taxon Index (NSTI) — der durchschnittliche phylogenetische Abstand zwischen jedem ASV in Ihrer Probe und seinem nächstgelegenen sequenzierten Referenzgenom. Der Standard-NSTI-Schwellenwert liegt bei 2,0. NSTI-Werte über 0,15 gelten als hoch für menschliche Darmproben und deuten darauf hin, dass ein erheblicher Teil Ihrer Gemeinschaft enge sequenzierte Verwandte vermisst. Bei Umweltproben überschreiten die NSTI-Werte routinemäßig 0,5, wobei funktionale Vorhersagen bestenfalls als suggestiv betrachtet werden sollten. Bauen Sie die zentrale Schlussfolgerung eines Papiers nicht auf den PICRUSt2-Ausgaben von Proben mit einem NSTI über 0,25 auf.

Wenn funktionelle Inferenz zentral für Ihre Forschungsfrage ist, überspringen Sie PICRUSt2 und investieren Sie in Metagenomische Shotgun-Sequenzierung, das den Geninhalt direkt sequenziert, anstatt ihn aus der Taxonomie vorherzusagen. Der Kostenunterschied hat sich erheblich verringert: Ein flaches Shotgun-Metagenom (5M Reads/Stichprobe) kostet jetzt ungefähr 2-3 Mal so viel wie eine 16S-Amplicon-Bibliothek und bietet eine direkte funktionale Annotation sowie eine verbesserte Taxonomie auf Artenebene. Für Projekte, bei denen funktionale Fragen das Hauptziel sind, ist dies gut investiertes Geld.

Bioinformatics pipeline from FASTQ through DADA2, taxonomy assignment, diversity analysis, and PICRUSt2 functional prediction Abbildung 5: Bioinformatik-Pipeline von FASTQ zu biologischer Einsicht

Wie man sein 16S-Projekt plant

Der Unterschied zwischen einem Projekt, das in 8 Wochen abgeschlossen wird, und einem, das sich über 6 Monate hinzieht, liegt oft in den Entscheidungen, die getroffen werden, bevor die erste Probe entnommen wird.

Betrachten Sie ein Szenario, das wir häufig sehen: Eine Doktorandin hat 48 Stuhlproben aus einer diätetischen Interventionsstudie gesammelt. Sie hat das Budget für einen MiSeq-Lauf. Die Frage ist nicht "Kann ich diese sequenzieren?", sondern "Wie teile ich 48 Proben auf eine 96-Well-Platte auf, welche Kontrollen schließe ich ein und welche Lesetiefe kann ich realistisch erwarten?" Die Antworten bestimmen, ob drei Jahre der Probenahme veröffentlichbare Daten oder eine frustrierende Lektion in experimentellem Design hervorbringen.

Replikate und Sequenzierungstiefe

Biologische Replikate (unabhängige Proben von verschiedenen Probanden oder Feldparzellen) sind unverzichtbar. Technische Replikate (die gleiche Probe, die zweimal sequenziert wird) sind fast nie die Kosten wert – moderne Bibliotheksvorbereitung und Sequenzierung sind so präzise, dass technische Replikation für 16S vernachlässigbare Informationen hinzufügt.

Probenart	Minimale biologische Replikate pro Gruppe	Empfohlene Lektüren pro Probe	Notizen
Menschlicher Stuhl	20-30	80.000-100.000	Mehr für Querschnittsstudien; weniger für Längsschnittstudien
Mauskot.	5-8	50.000	Käfigeffekte; Käfig als zufälligen Effekt behandeln
Subgingivales Plaque	15-25	50.000-80.000	Niedrige Biomasse; negative Kontrollen genau überwachen
Speichel	20-30	50.000-80.000	Pooled Gemeinschaft; höhere Varianz innerhalb der Gruppe
Boden (landwirtschaftlich)	8-12 pro Behandlung	80.000-100.000	Hohe Vielfalt; räumliche Heterogenität
Wasser (gefiltert)	5-8 pro Standort	50.000-80.000	Volumenabhängig; negative Kontrollen sind unerlässlich

Budget- und Plattformlogistik

Die Kosten pro Probe für 16S-Sequenzierung sind dramatisch gesunken, aber versteckte Kosten bleiben. Bibliotheksvorbereitungskits, DNA-Extraktionsreagenzien, Versand und Bioinformatikzeit erhöhen das Angebot für die Sequenzierung um 30-50%. Wenn Sie Angebote von CROs vergleichen, fragen Sie nach einem All-Inclusive-Preis pro Probe, der die Extraktion bis hin zur grundlegenden Bioinformatik (FASTQ + ASV-Tabelle + Taxonomie) abdeckt. Bei Projekten mit mehr als 96 Proben sollte bestätigt werden, dass die CRO die Proben über die Sequenzierungsplatten hinweg randomisiert und nicht nach Gruppen zusammenfasst – dies sollte nicht verhandelbar sein und ausdrücklich im Dienstleistungsvertrag festgehalten werden.

Amplicon-Sequenzierungsdienste Bei CD Genomics decken wir den gesamten 16S-Workflow von der Proben-QC bis zur Datenlieferung ab, einschließlich der Handhabung von Proben mit niedrigem Biomassegehalt und maßgeschneidertem bioinformatischem Support. Für Projekte, bei denen das Budget die Hauptbeschränkung darstellt, skizziert der Artikel "Kosteneffektive Amplicon-Sequenzierung für Studentenprojekte, Pilotstudien und kleine Labore" Strategien zur Kostenreduzierung, ohne die Datenqualität zu beeinträchtigen.

Wenn 16S allein nicht ausreicht

Eine 16S-Umfrage sagt Ihnen, wer da ist. Sie sagt Ihnen nicht, was sie tun, welche Gene sie tragen oder ob sie zum Zeitpunkt der Probenahme lebendig oder tot sind. Wenn Ihre Hypothesen eine funktionale Annotation erfordern, sollten Sie in Erwägung ziehen, 16S mit Metagenomische Shotgun-SequenzierungWenn Sie wissen müssen, welche Mitglieder der Gemeinschaft transkriptionell aktiv sind, Metatranskriptomische Sequenzierung oder RNA-Seq fügt eine Ausdrucksschicht hinzu. Wenn Sie einen bestimmten Bakterienstamm von Interesse isoliert haben und dessen Genom charakterisieren möchten, Bakterielle Whole-Genome de novo Sequenzierung bietet einen vollständigen genomischen Kontext, den 16S nicht bereitstellen kann.

Für die Artenbestimmung ohne Kultivierung, Mikrobielle Identifizierung Dienste integrieren 16S-Profiling mit ergänzenden Ansätzen. Und wenn Sie Taxa an der Grenze der 16S-Auflösung anvisieren, Vollständige 16S/18S/ITS Amplicon-Sequenzierung Die Verwendung von Long-Read-Plattformen schließt die Auflösungsdifferenz.

Für einen umfassenderen Überblick darüber, wie 16S in die Landschaft der Amplicon-Sequenzierung passt – einschließlich 18S, ITS und DNA-Barcoding-Optionen – siehe den Artikel "Amplicon-Sequenzierungsdienste für Mikrobiom- und Biodiversitätsforschung: 16S, 18S, ITS und DNA-Barcoding-Lösungen."

Häufig gestellte Fragen

Wie viele Reads pro Probe benötige ich wirklich für 16S?

50.000-100.000 für die meisten Probenarten. Menschliche Fäkalien und Boden benötigen den oberen Bereich; Mäusedarm und niederdimensionale Konsortien können mit 30.000-50.000 auskommen. Führen Sie eine Rarefaktionskurve durch, um die Sättigung in der von Ihnen gewählten Tiefe zu bestätigen.

V3-V4 oder vollständiges 16S — was sollte ich wählen?

Kurzlese V3-V4 für die Genus-Ebene Profilierung mit einem begrenzten Budget. Vollständige 16S (PacBio oder Nanopore), wenn eine Artenauflösung wichtig ist — Pathogenerkennung, Biomarker-Entdeckung oder Gattungen mit hoher Artenvielfalt wie Pseudomonas und Bifidobacterium.

Kann ich 16S-Daten, die auf verschiedenen Sequenzierungsplattformen oder mit unterschiedlichen Primer-Sets erzeugt wurden, vergleichen?

Nur mit Vorsicht. Plattform- und Primer-Effekte sind real und können größer sein als der biologische Effekt, den Sie untersuchen. Wenn Sie Datensätze kombinieren müssen, verwenden Sie ComBat oder MMUPHin zur Batch-Korrektur und erkennen Sie die Einschränkung ausdrücklich an. Kombinieren Sie niemals Daten aus verschiedenen Primer-Sets, ohne eine Batch-Anpassung vorzunehmen.

Wie viele biologische Replikate benötige ich?

Mindestens 5 pro Gruppe für Tierstudien (mit Käfig als zufälligen Effekt), 20-30 pro Gruppe für humanmedizinische Querschnittsstudien und 8-12 pro Behandlung für landwirtschaftliche Feldversuche. Diese Zahlen setzen mittlere bis große Effektgrößen (2-fache Abundanzunterschiede) voraus. Wenn Sie nach subtilen Verschiebungen suchen, verdoppeln Sie diese.

Welche negativen Kontrollen sollte ich einbeziehen?

Drei Typen pro Sequenzierungslauf: ein Extraktionsblanko (Kontrollprobe ohne Probe, die durch den gesamten Extraktionsworkflow verarbeitet wird), ein PCR-Blanko (Wasser anstelle von DNA-Vorlage) und ein Feldblanko (steriles Sammelgerät, das der Probenumgebung ausgesetzt ist). Wenn ein Taxon in einer negativen Kontrolle mit mehr als 1 % seiner Häufigkeit in echten Proben erscheint, schließe es aus.

Sollte ich ASVs oder OTUs verwenden?

ASVs (über DADA2) für die meisten Anwendungen — sie sind reproduzierbar, bieten eine Auflösung auf Einzel-Nukleotid-Ebene und sind der aktuelle Standard. OTUs (über HmmUFOtu oder UPARSE) bei der Arbeit mit Umweltdaten, wo Referenzdatenbanken spärlich sind und intragenomische 16S-Variationen zu einer Überteilung führen.

Wie zuverlässig ist die funktionale Vorhersage von PICRUSt2?

Zuverlässig für menschliche Darmproben (NSTI typischerweise unter 0,15), wo die Abdeckung des Referenzgenoms ausgezeichnet ist. Unzuverlässig für Umweltproben (NSTI oft über 0,5) und nicht-modellierte W Wirtsarten. Berichten Sie immer NSTI-Werte und behandeln Sie Vorhersagen aus hoch-NSTI-Proben als hypothesengenerierend, nicht als endgültig.

Wie lange dauert es, um ausgelagertes 16S-Sequencing durchzuführen?

Typische CRO-Zeiträume liegen zwischen 2 und 8 Wochen, abhängig von der Projektgröße, dem Proben-Typ und den bioinformatischen Ergebnissen. Berücksichtigen Sie zusätzliche 2-3 Wochen für den Versand der Proben, die Zollabfertigung (falls international) und die Qualitätskontrolle. Kommunizieren Sie den erwarteten Zeitrahmen, bevor Sie Proben entnehmen.

Referenzen:

Quast C, Pruesse E, Yilmaz P, et al. Das SILVA-Ribosomen-RNA-Gen-Datenbankprojekt: verbesserte Datenverarbeitung und webbasierte Werkzeuge. Nukleinsäurenforschung2013;41(D1):D590-D596. doi:10.1093/nar/gks1219
Callahan BJ, McMurdie PJ, Rosen MJ, Han AW, Johnson AJA, Holmes SP. DADA2: Hochauflösende Probeninferenz aus Illumina-Amplicon-Daten. Naturmethoden2016;13(7):581-583. doi:10.1038/nmeth.3869
Wemheuer F, Taylor JA, Daniel R, et al. Tax4Fun2: Vorhersage von habitatspezifischen funktionalen Profilen und funktionaler Redundanz basierend auf 16S rRNA-Gen-Sequenzen. Umweltmikrobiom2020;15:11. doi:10.1186/s40793-020-00358-7
Tabari K, Goyal A, Floyd A, et al. FAVABEAN und FALAPhyl: Open-Source-Pipelines zur skalierbaren Verarbeitung und Visualisierung von 16S rRNA Mikrobiomdaten. PLoS ONE. 2026;21(4):e0331145. doi:10.1371/journal.pone.0331145
Escapa IF, Chen T, Huang Y, Gajare P, Dewhirst FE, Lemon KP. Neue Erkenntnisse über das menschliche Nasenloch-Mikrobiom aus der erweiterten Human Oral Microbiome Database (eHOMD). mSysteme2018;3(6):e00187-18. doi:10.1128/mSystems.00187-18
Chen T, Yu WH, Izard J, Baranova OV, Lakshmanan A, Dewhirst FE. Die Human Oral Microbiome-Datenbank: eine webbasiertes Ressource zur Untersuchung taxonomischer und genomischer Informationen über orale Mikroben. Datenbank2010;2010:baq013. doi:10.1093/database/baq013
Thompson LR, Sanders JG, McDonald D, et al. Ein gemeinsames Katalog zeigt die multiskalare mikrobielle Vielfalt der Erde. Natur. 2017;551(7681):457-463. doi:10.1038/nature24621
Näher an JT, Douglas GM, Hayes MG, et al. Methoden zur Bestimmung der unterschiedlichen Häufigkeit von Mikrobiomen liefern unterschiedliche Ergebnisse in 38 Datensätzen. Naturwissenschaftliche Kommunikation2022;13(1):342. doi:10.1038/s41467-022-28034-z

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung gedacht.