Is virome sequencing the same as shotgun metagenomics?

No. Standard shotgun metagenomics sequences all DNA in a sample, of which viral sequences typically represent less than 1% of reads. Virome sequencing applies viral particle enrichment — filtration, ultracentrifugation or PEG precipitation, and nuclease treatment — before nucleic acid extraction, concentrating viral sequences by roughly 100- to 1,000-fold relative to the unenriched sample.

Do I need a separate virome library if I already run standard metagenomics?

Yes, if the virome is a primary endpoint of your study. A 2025 comparison of VLP-enriched versus bulk metagenomic methods found only 27% overlap in viral genome recovery between the two approaches. Standard metagenomics captures temperate phages and integrated prophages well. Viromics captures lytic phages, low-abundance eukaryotic viruses, and novel viral lineages. They are complementary, not redundant.

Why does MDA introduce bias, and when is it still useful?

φ29 polymerase used in MDA preferentially amplifies small circular single-stranded DNA through rolling-circle amplification. This enriches Microviridae and other ssDNA viruses by 100- to 1,000-fold relative to their true abundance, suppressing the signal from all other viral taxa. MDA is only appropriate when your research question specifically concerns circular ssDNA viruses and nothing else.

Can viromics detect RNA viruses?

Yes. Viral nucleic acid extraction must be performed with a kit that recovers both DNA and RNA. The RNA fraction is then reverse-transcribed to cDNA and sequenced in parallel with the DNA fraction. This dual nucleic acid approach captures both DNA phages and RNA viruses — including enteric RNA viruses (rotavirus, norovirus) and respiratory RNA viruses (SARS-CoV-2, influenza) — from a single sample aliquot.

How deep should I sequence my virome samples?

For comprehensive virome characterization, 4 to 10 Gb per sample (roughly 13 to 33 million 2×150 bp read pairs) is recommended. For shallow surveys of the dominant viral taxa, 2 to 3 million reads per sample is sufficient. For biomarker discovery studies, deep sequence a discovery cohort and validate top candidates with targeted methods in a larger replication cohort.

What sample types work for viromics?

Fecal, respiratory swab, bronchoalveolar lavage, cerebrospinal fluid, blood, tissue homogenate, water, wastewater, soil, and sediment have all been successfully used. The key requirement is sufficient starting biomass for VLP enrichment. Low-biomass samples such as CSF or oligotrophic water may require larger input volumes or deeper sequencing to compensate.

How should I store samples for virome sequencing?

For fecal and tissue samples, immediate freezing at -80°C is ideal. DNA/RNA Shield provides room-temperature stability for up to several weeks and is the pragmatic choice for large multi-site cohort studies. Avoid freeze-thaw cycles — each cycle reduces viral particle integrity. For water samples, filter on site and freeze the filter immediately.

Virale Metagenomik und Virom-Sequenzierung: Erkennung und Charakterisierung viraler Populationen in klinischen und umweltbezogenen Proben

Ein einzelnes Gramm menschlichen Stuhls enthält ungefähr 10⁹ virusähnliche Partikel. Ein Liter Meerwasser enthält etwa 10¹⁰. Phagen übertreffen Bakterien in jedem Ökosystem der Erde im Verhältnis von zehn zu eins und treiben den horizontalen Gentransfer in einem Maß voran, das den mikrobiellen Stoffwechsel täglich umgestaltet. Doch die überwiegende Mehrheit dieser Viren – oft als die "virale dunkle Materie" der Mikrobiologie bezeichnet – wurde nie kultiviert, sequenziert oder klassifiziert. Sie tragen kein 16S rRNA. Sie haben kein universelles Marker-Gen. Jahrzehntelang waren sie absichtlich unsichtbar: Jede gängige Mikrobiom-Methode, von der Amplicon-Sequenzierung bis zur Standard-Shotgun-Metagenomik, wurde um bakterielle Ziele herum entwickelt.

Viral Metagenomik — Viromik — ändert dies. Durch die Anreicherung virusähnlicher Partikel aus einer Probe, die Extraktion sowohl von DNA als auch von RNA und die Sequenzierung ohne den bakteriengroßen Filter, den die Standardmetagenomik implizit anwendet, offenbart die Viromik den viralen Anteil eines Mikrobioms in genomisch bedeutsamer Tiefe. Die technische Kluft zwischen der Standardmetagenomik und der Viromik ist erheblich, aber ein Vergleich im Jahr 2025 zwischen VLP-angereicherten und Bulk-Metagenomik-Methoden zeigte, dass nur etwa 27 % der viralen Genome zwischen den beiden Ansätzen übereinstimmen. Wenn Sie nur die Standard-Shotgun-Metagenomik durchführen, verpassen Sie ungefähr drei Viertel des Viroms.

Dieser Leitfaden behandelt den End-to-End-Workflow der Virom-Sequenzierung: wie man virale Partikel aus klinischen und Umweltproben anreichert, warum bestimmte Amplifikationsentscheidungen (insbesondere MDA) die Gemeinschaftszusammensetzung verzerren können, wie sich die bioinformatische Werkzeugkette zur Virusidentifizierung von der bakteriellen MAG-Pipeline unterscheidet und wo die Viromik umsetzbare Erkenntnisse liefert – von entzündlichen Darmerkrankungen über die Screening von Phagentherapien bis hin zur Abwasser-basierten Biosurveillance.

Abbildung 1: Übersicht des Virom-Sequenzierungsablaufs – von der Probenentnahme über die virale Anreicherung, die Bibliotheksvorbereitung, die Sequenzierung und die bioinformatische Analyse bis hin zu funktionalen Erkenntnissen.

Probenvorbereitung: Trennung von Viren von allem anderen

Die zentrale Herausforderung der Viromik besteht darin, dass Viren klein, selten und chemisch fragil sind. Eine Stuhlprobe besteht zu etwa 99 % aus Bakterien und Wirtszellen in Bezug auf die Biomasse. Ein Atemabstrich kann Pikogramm von viraler Nukleinsäure vorweisen, eingebettet in einem Hintergrund von Mikrogramm menschlicher RNA. Bevor eine Bibliothek vorbereitet wird, muss die virale Fraktion physisch getrennt und konzentriert werden.

Virenpartikelanreicherung

Drei Methoden dominieren, und die Wahl zwischen ihnen bestimmt, welche Viren erfasst werden.

Filtration ist der universelle erste Schritt. Das Durchleiten einer homogenisierten Probe durch sequenzielle Membranfilter aus Polyethersulfon mit 0,8 μm und 0,45 μm oder 0,22 μm entfernt Bakterien, Pilze und Zelltrümmer, während die meisten Viruspartikel hindurchgelassen werden. Bei Proben mit hoher Partikelbelastung — Boden, Sediment, Stuhl — ist eine Vorklärung durch Niedriggeschwindigkeitszentrifugation unerlässlich, um ein sofortiges Verstopfen des Filters zu verhindern. Allein durch Filtration erhält man eine grobe Virusfraktion, die für einige Anwendungen geeignet ist, aber die meisten Protokolle folgen mit einem Konzentrationsschritt.

Die Ultrazentrifugation bei 75.000 bis 100.000 × g für ein bis zwei Stunden pelletiert virale Partikel direkt. Es ist der Goldstandard: Sie erholt sowohl DNA- als auch RNA-Viren, funktioniert über verschiedene Probenarten hinweg und produziert eine saubere virale Fraktion. Der Nachteil sind die Kosten für die Ausrüstung und der Durchsatz – ein Rotor fasst vielleicht sechs bis zwölf Proben pro Durchlauf. Bei Studien mit Hunderten von Proben wird dies zu einem logistischen Engpass.

PEG-Präzipitation verwendet Polyethylenglykol 8000 bei 10% (w/v) mit 1 M Natriumchlorid, inkubiert über Nacht bei 4 °C, gefolgt von einer Zentrifugation bei etwa 1.200 × g. Das Pellet enthält konzentrierte Viruspartikel sowie einige ko-präzipitierte bakterielle Rückstände. PEG-Präzipitation kostet einen Bruchteil der Ultrazentrifugation und lässt sich auf jede Batch-Größe skalieren, was sie zur pragmatischen Wahl für große Kohortenstudien macht. Ein Vergleich im Jahr 2025 ergab, dass PEG-Präzipitation und Ultrazentrifugation im Großen und Ganzen vergleichbare virale Gemeinschaften aus Stuhlproben zurückgewannen, wobei PEG leicht höhere Erträge und Ultrazentrifugation marginal höhere Reinheit zeigte.

In der Praxis folgt die Wahl der Anreicherungsmethode dem Proben-Typ und dem Studienumfang: Ultrazentrifugation für hochreine Viromik von bis zu zwölf Proben, PEG-Präzipitation für große Kohortenstudien, bei denen Durchsatz und Kosten im Vordergrund stehen, und nur Filtration für ressourcenlimitierte Pilotstudien. Für Wasserproben über einem Liter konzentriert die tangentiale Flussfiltration (TFF) mit einer Membran mit einem Molekulargewichtsgrenzwert von 100 kDa Viruspartikel ohne einen Pelletierungsschritt, was sie zur bevorzugten Methode für Seewasser-, Abwasser- und Süßwasser-Viromik macht. TFF konzentriert auch Viruspartikel und entfernt gleichzeitig gelöste PCR-Hemmer wie Huminsäuren, ein doppelter Vorteil, der die nachgelagerte Verarbeitung komplexer Umwelproben vereinfacht.

Unabhängig von der Konzentrationsmethode folgt ein Schritt zur Behandlung mit Nukleasen: DNase I plus RNase A (oder ein kommerzieller Benzonase-Cocktail) verdaut freie Nukleinsäuren, die aus lysierten Bakterien und Wirtszellen freigesetzt werden. Dieser Schritt ist entscheidend – ohne ihn kann die "virale" Fraktion bis zu 40 % bakterieller DNA enthalten, was die Anreicherungsbemühungen zunichte macht. Nach der Nukleasebehandlung müssen die Enzyme selbst inaktiviert oder entfernt werden, bevor die viralen Kapside lysiert werden, um Nukleinsäuren zu extrahieren.

Nukleinsäureextraktion: DNA und RNA zusammen

Die meisten Viren von Interesse in einer Mikrobiomstudie haben DNA-Genome — Bakteriophagen, Adenoviren, Anelloviren — aber RNA-Viren, einschließlich Rotavirus, Norovirus und SARS-CoV-2, sind in klinischen und Abwasser-Kontexten entscheidend. Eine einzelne Extraktion, die beide Nukleinsäuretypen zurückgewinnt, gefolgt von separater DNA- und RNA-Bibliotheksvorbereitung, ist die informativste Strategie.

Spezialisierte virale Extraktionskits — das QIAamp Viral RNA Mini Kit, das PureLink Viral RNA/DNA Mini Kit und das AllPrep PowerViral DNA/RNA Kit — übertreffen konstant standardisierte metagenomische Extraktionskits (die für bakterielle Zellen entwickelt wurden) hinsichtlich der Anreicherung viraler Reads. Ein Vergleich im Jahr 2025 über mehrere Extraktionsmethoden bestätigte, dass Kits, die für die Lyse von Viruspartikeln und die Elution kleiner Volumina optimiert sind, etwa 2- bis 5-mal mehr virale Reads pro Probe zurückgewinnen als bakteriefokussierte Alternativen. Mechanische Lyse ist entscheidend für die Rückgewinnung strukturell robuster viraler Kapsiden. Das Schlagen mit 0,1-mm Silica-Zirkonia-Perlen für 3 bis 5 Minuten ist gängige Praxis für fäkale und Boden-Virome. Für umhüllte RNA-Viren — einschließlich SARS-CoV-2 und Influenza — bewahrt eine sanftere chemische Lyse mit guanidiniumthiocyanatbasierten Puffern die labile lipide Hülle und setzt gleichzeitig das RNA-Genom frei. Für die Rückgewinnung von RNA-Viren sollte spezifisch Träger-RNA von der Extraktion ausgeschlossen werden — sie konkurriert während der reversen Transkription und unterdrückt das virale Signal.

CD Genomics' Virale Metagenomische Sequenzierung Der Service führt die Anreicherung von viralen Partikeln und die gleichzeitige Extraktion von DNA/RNA aus einer Vielzahl von klinischen und umweltbezogenen Proben durch, mit Qualitätskontrolle in jedem Schritt von der Filtration bis zur Nucleasenbehandlung.

Abbildung 2: Ein dreiteiliger Vergleich der VLP-Anreicherungsmethoden — Ultrazentrifugation, PEG-Präzipitation und nur Filtration — mit Ertrags- und Reinheitsmetriken für jeden Ansatz.

Bibliotheksvorbereitung: Die Amplifikationsgabelung im Weg

Die Erträge an viraler Nukleinsäure aus der VLP-Anreicherung liegen häufig im Pikogramm- bis Nanogramm-Bereich – unterhalb der Eingangsgrenze für die standardmäßige ligationsbasierte Bibliotheksvorbereitung. Eine Amplifikation ist notwendig, und die Wahl der Amplifikationsmethode bestimmt, ob die resultierende Bibliothek die wahre virale Gemeinschaft widerspiegelt oder ein Artefakt der Polymerase-Präferenz ist.

Das MDA-Problem

Die multiple Displacement-Amplifikation unter Verwendung der φ29-DNA-Polymerase war über ein Jahrzehnt die Standardmethode zur Amplifikation in der Viromik. φ29 amplifiziert zirkuläre einzelsträngige DNA mit extremer Effizienz – schließlich ist es die Polymerase, die Bakteriophagen verwenden, um ihre eigenen Genome in einem Rolling-Circle-Mechanismus zu replizieren.

Das Problem ist, was dies mit der Zusammensetzung der Gemeinschaft macht. MDA verstärkt bevorzugt kleine zirkuläre einzelsträngige DNA durch denselben Rolling-Circle-Mechanismus, den φ29 für die Replikation seines eigenen Genoms verwendet. Ein Benchmark aus dem Jahr 2024 mit synthetischen viralen Mischungen bestätigte, dass die MDA-Behandlung zirkuläre ssDNA-Viren – insbesondere Microviridae – um Größenordnungen im Vergleich zu ihrer tatsächlichen Häufigkeit anreichert, während ein alternativer Ansatz mit T7-DNA-Polymerase das ursprüngliche Verhältnis von ssDNA zu dsDNA in sowohl synthetischen als auch komplexen fäkalen Virom-Proben bewahrte. Für eine Studie, die an der gesamten viralen Gemeinschaft interessiert ist, macht MDA die Daten uninterpretierbar. Der einzige vertretbare Anwendungsfall für MDA ist, wenn die spezifische Forschungsfrage zirkuläre ssDNA-Viren – Microviridae, Circoviridae, Geminiviridae – betrifft und nichts anderes.

SISPA und zufällige Amplifikation

Sequenzunabhängige Einzelprimer-Amplifikation (SISPA), bei der cDNA oder DNA mit einer definierten Primersequenz markiert und dann PCR-amplifiziert wird, führt zu weniger kompositionellem Bias als MDA, während ähnliche Faltamplifikationen erreicht werden. Ein Benchmark-Protokoll für das Fäkalvirom aus dem Jahr 2025 ergab, dass PCR-SISPA mit 30 Zyklen virale Gemeinschaftsstrukturen wiederherstellte, die gut mit nicht amplifizierten Bibliotheken korrelierten, während MDA-amplifizierte Bibliotheken nahezu null Korrelation mit anderen Methoden zeigten.

Für RNA-Viren ermöglicht die reversen Transkription mit zufälligen Hexameren oder degenerierten 9N-Primern, gefolgt von einem Template-Switching (dem SMART-Ansatz), die Herstellung von cDNA, die sowohl für die Vorbereitung von Short-Read- als auch von Long-Read-Bibliotheken geeignet ist. Die SMART-RNA-Metavirome-Plattform, die 2025 veröffentlicht wurde, zeigte, dass ein Template-Switching-RT-Schritt in Verbindung mit degenerierten 9N-Primern eine Abdeckung des Genoms von etwa 99,9 % für das Dengue-Virus bei niedrigen Titer erreicht, mit dem zusätzlichen Vorteil einer inhärenten rRNA-Depletion – der Template-Switching-Mechanismus erfasst keine gekappte rRNA.

Bibliothekskonstruktion und Sequenzierungstiefe

Für auf Illumina basierende Viromik ist die tagmentationsbasierte Bibliotheksvorbereitung (Illumina DNA Prep) aus etwa 125 ng amplifizierter DNA der aktuelle Standard. Ligation-basierte Protokolle (TruSeq Nano) sind eine Alternative für AT-reiche virale Genome, bei denen Tagmentation Abdeckungs-Lücken verursachen kann.

Die Empfehlungen zur Sequenzierungstiefe ändern sich. Frühe Virom-Studien sequenzierten oft mit 1 bis 2 Millionen Lese-Paaren pro Probe – ausreichend, um die dominanten viralen Taxa zu beschreiben, aber unzureichend für seltene oder niedrig-abundante Viren. Eine Benchmark-Studie mit 882 Virom-Proben empfahl 4 bis 10 Gb pro Probe für eine umfassende Charakterisierung des Viroms, was ungefähr 13 bis 33 Millionen Lese-Paare bei 2×150 bp entspricht. Bei diesen Tiefen werden virale Genome mit einer relativen Abundanz von 0,01 % nachweisbar. Für große Kohortenstudien, bei denen eine tiefe Virom-Sequenzierung jeder Probe kostenintensiv ist, bietet eine gestufte Strategie – flache Sequenzierung aller Proben gefolgt von tiefer Sequenzierung einer Teilmenge – einen Ausgleich zwischen Entdeckungspotenzial und Budget.

Für Studien, die Viromik mit standardmäßiger Metagenomik integrieren, bietet CD Genomics' Metagenomisches Shotgun-Sequencing liefert das bakterielle und archaeale Profil aus derselben Probe, während Virale Metagenomische Sequenzierung stellt den viralen Anteil wieder her – und liefert zusammen die komplementäre Sichtweise, die die Vergleichsstudien von 2025 als entscheidend für eine umfassende Charakterisierung des Mikrobioms gezeigt haben.

Three-column horizontal comparison infographic showing viral community composition outcomes of MDA phi29 polymerase with severe Microviridae bias and red warning triangle, PCR-SISPA with moderate bias and green checkmark, and SMART template-switching with balanced viral family distribution, each column featuring stacked bar charts of recovered viral community composition Abbildung 3: Drei Amplifikationsstrategien im Vergleich — MDA, PCR-SISPA und SMART-Template-Switching — die die Verzerrung der Gemeinschaftszusammensetzung über jede Methode hinweg zeigen, dargestellt durch gestapelte Balkendiagramme der Virusfamilienhäufigkeit.

Bioinformatik für Viromik: Eine eigene Werkzeugkette

Die bioinformatische Pipeline für Viromik weicht an der Klassifikationsstufe von der standardmäßigen metagenomischen Pipeline ab. Die bakterielle metagenomische Klassifikation verwendet k-Mer-Abgleich gegen kuratierte Genomdatenbanken. Die virale Klassifikation steht vor einem grundsätzlich schwierigeren Problem: Die meisten Viren in einer gegebenen Probe haben keinen nahen Verwandten in einer Referenzdatenbank.

Qualitätskontrolle und Host-Entfernung

Die Vorverarbeitungsschritte entsprechen den Standardmetagenomik-Verfahren: Qualitätskürzung mit fastp und Entfernung des Wirtsgenoms mit Bowtie 2 gegen das entsprechende Referenzgenom – hg38 für menschliche klinische Proben, das Wirtsplangenom für Rhizosphäre oder Phyllosphäre Viromik oder eine kombinierte Datenbank für Umweltproben. Bei klinischen Proben sind menschliche Leseanteile von 50 bis 90 % üblich, und das Versäumnis, diese zu reduzieren, überlagert das virale Signal.

Lese-basierte Klassifikation

Kraken 2 mit einer viral-fokussierten Datenbank bietet eine schnelle taxonomische Zuordnung auf der Leseebene, aber die Sensitivität ist vollständig von der Datenbank abhängig. Eine virale Sequenz aus einer nicht charakterisierten Phagenfamilie kann nur bis zur Ebene "Caudoviricetes" klassifiziert werden – oder gar nicht. DIAMOND BLASTX, das übersetzte Nukleotid-Lesungen gegen eine Proteindatenbank ausrichtet, ist empfindlicher für divergente virale Sequenzen, da die Proteinsequenz konservierter ist als die Nukleotidsequenz. Der Nachteil ist die Geschwindigkeit: DIAMOND ist ungefähr zwei Größenordnungen langsamer als Kraken 2 bei demselben Datensatz.

Für klinische Viromik, wo die Frage lautet "Ist Pathogen X vorhanden?", liefert die lesebasierte Klassifikation mit Tools wie SeqScreen oder Centrifuge innerhalb von Stunden nach der Sequenzierung eine Ja/Nein-Antwort. Für ökologische Viromik, wo die Frage lautet "Wie ist die Struktur und Vielfalt der viralen Gemeinschaft?", ist die lesebasierte Klassifikation ein erster Schritt, der von einer Assemblierung gefolgt werden muss.

Zusammenstellung und Identifizierung von viralen Contigs

MEGAHIT und metaSPAdes assemblieren beide virale Genome aus metagenomischen Daten, aber die virale Assemblierung stellt einzigartige Herausforderungen dar: geringe Abdeckung, hohe Variabilität und das Vorhandensein integrierter Prophagen innerhalb bakterieller Contigs. Die Co-Assemblierung von Reads aus mehreren verwandten Proben verbessert die Rekonstruktion von viralen Genomen mit niedriger Häufigkeit durch das Zusammenlegen der Abdeckung.

Viral-Contig-Identifikationstools haben sich schnell weiterentwickelt. VirSorter2 verwendet einen Random-Forest-Klassifikator, der auf viralen Markergenen und genomischen Merkmalen trainiert wurde, um virale von bakteriellen Contigs zu unterscheiden. Es ist das am weitesten verbreitete Tool und erzielt gute Ergebnisse bei doppelsträngigen DNA-Phagen, die die meisten Virome dominieren. CheckV bewertet die Vollständigkeit viraler Genome, identifiziert Wirtskontaminationen an den Enden der Contigs und schätzt die Qualitätsstufe jeder viralen Sequenz – es bietet Qualitätsmetriken, die analog zu CheckM2 für bakterielle MAGs sind. VIBRANT fügt funktionale Annotationen hinzu und identifiziert zusätzliche Stoffwechselgene (AMGs), die von Phagen getragen werden – Gene, die Phagen nutzen, um den Stoffwechsel des Wirts während der Infektion umzuleiten, wie zum Beispiel Photosystemgene in Cyanophagen oder Gene des Nukleotidstoffwechsels in Darmphagen.

Für ein typisches fäkales Virom identifizieren die MEGAHIT-Assemblierung, gefolgt von VirSorter2 und CheckV, etwa 2.000 bis 5.000 virale operationale taxonomische Einheiten (vOTUs) pro Probe, von denen 10 bis 20 % vollständige oder hochqualitative virale Genome sind.

Die taxonomische Klassifikation der validierten viralen Contigs verwendet Werkzeuge wie vConTACT2 oder VPF-Class gegen die IMG/VR-Datenbank, die jetzt über 15 Millionen virale Sequenzen enthält, oder das neuere geNomad-Framework, das Marker-Gen- und maschinelles Lernen kombiniert, um eine gleichzeitige virale Identifizierung und taxonomische Zuordnung zu ermöglichen. Die integrierte Pipeline von geNomad — virale Identifizierung, Taxonomie und Wirtvorhersage in einem einzigen Tool — reduziert den Rechenaufwand, der mit dem sequentiellen Betrieb von drei separaten Tools verbunden ist, und wurde benchmarked, um ungefähr 20 % mehr virale Contigs als VirSorter2 allein in Boden- und marinen Viromen zurückzugewinnen, obwohl die beiden Tools komplementär sind und häufig zusammen verwendet werden.

Prophage- und CRISPR-Analyse

Integrierte Prophagen — Bakteriophagen-Genome, die in bakterielle Chromosomen eingefügt sind — sind für VLP-basierte Viromik unsichtbar, da sie auf dem bakteriengroßen Filter zurückgehalten werden. Ihre Erkennung erfordert die Analyse des gesamten metagenomischen Assemblies. Werkzeuge wie VIBRANT und geNomad kennzeichnen Prophagenregionen innerhalb bakterieller Contigs. Das Abgleichen von CRISPR-Spacern mit Phagen bietet die stärkste Form der Wirts-Virus-Verknüpfung: Wenn ein bakterielles CRISPR-Array einen Spacer enthält, der mit einem viralen Contig übereinstimmt, wurde dieses Bakterium (oder sein Vorfahr) von diesem Phagen infiziert. CRISPR-Arrays fungieren als bakterielle adaptive Immunerinnerung — wenn ein Bakterium eine Phageninfektion überlebt, integriert es ein kurzes Fragment des Phagen-Genoms in sein eigenes CRISPR-Lokus. Das Abgleichen dieser archivierten Spacer mit zusammengesetzten viralen Contigs zeigt somit, welche Phagen historisch welche bakteriellen Wirte infiziert haben, und liefert die stärksten verfügbaren Beweise für die Wirts-Virus-Verknüpfung in metagenomischen Daten. Diese Informationen zur Wirtsvorhersage sind entscheidend für das Verständnis von Phagen-Bakterien-Interaktionsnetzwerken, stehen jedoch nur zur Verfügung, wenn sowohl bulk-metagenomische als auch viromische Daten gemeinsam analysiert werden.

CD Genomics' Virom-Analyse-Pipeline umfasst den vollständigen bioinformatischen Workflow des Viroms: Qualitätskontrolle, Entfernung von Wirtslesungen, Klassifizierung basierend auf Kraken 2 und DIAMOND, MEGAHIT-Assemblierung, Validierung viraler Kontigs mit VirSorter2 und CheckV sowie taxonomische Zuordnung gegen IMG/VR.

Abbildung 4: Virome bioinformatische Pipeline — Qualitätskontrolle → Wirtentfernung → lesebasierte Klassifikation (Kraken 2 / DIAMOND) → Assemblierung (MEGAHIT) → Identifizierung viraler Contigs (VirSorter2 / CheckV) → funktionale Annotation (VIBRANT).

Anwendungen: Vom Darm zur Umwelt

Das intestinale Virom wird von Bakteriophagen dominiert – etwa 90 bis 95 % der viralen Reads in den meisten fecalen Viromen beziehen sich auf Caudoviricetes (Schwanzphagen) und Microviridae. Der verbleibende Anteil umfasst eukaryotische Viren (Anelloviren, Adenoviren, Enteroviren) und Pflanzenviren aus der Nahrung. Im Gegensatz zum bakteriellen Mikrobiom des Erwachsenen, das sich etwa im Alter von drei Jahren stabilisiert, verändert sich das intestinale Virom weiterhin während der Kindheit und Jugend.

Bei entzündlichen Darmerkrankungen haben mehrere unabhängige Kohorten eine erhöhte Caudovirales-Reichtum bei Morbus Crohn und Colitis ulcerosa im Vergleich zu gesunden Kontrollen berichtet – das Gegenteil des Musters der bakteriellen Diversität, bei dem die Krankheit mit reduziertem Reichtum assoziiert ist. Eine Meta-Analyse aus dem Jahr 2025, die 2.066 metagenomische Proben aus 16 Kohorten umfasste, ergab, dass die virale Shannon-Diversität in allen Studien konsistent höher bei IBD war und dass ein Random-Forest-Klassifikator, der auf den 50 besten diskriminierenden vOTUs trainiert wurde, Fälle von Kontrollen mit einer Fläche unter der Kurve von 0,85 bis 0,90 trennte.

Die Phagentherapie – die Verwendung von lytischen Bakteriophagen zur Behandlung von multiresistenten bakteriellen Infektionen – hat das Interesse an der Entdeckung von Umweltphagen neu entfacht. Metagenomische Sequenzierung von Abwasser-, Meerwasser- und Bodenproben identifiziert vollständige Phagen-Genome, die keine bekannten Antibiotikaresistenz- oder Toxingene tragen, die dann gegen klinische bakterielle Isolate getestet werden können. Der oben erwähnte Benchmark-Datensatz mit 882 Proben des Viroms wurde teilweise erstellt, um die Phagenentdeckung für ein Phagentherapieprogramm gegen Klebsiella pneumoniae zu unterstützen.

In der Biosurveillance bietet die Abwasser-Viromik eine bevölkerungsbezogene, pathogenagnostische Überwachungsmöglichkeit. Während und nach der COVID-19-Pandemie ermöglichte das metagenomische Sequenzieren von viralen Konzentraten aus Abwasser nicht nur die Erkennung von SARS-CoV-2-Linien, sondern auch von Enteroviren, Noroviren, Rotaviren und dem Hepatitis-A-Virus – und lieferte frühzeitige Warnungen über die Übertragung in der Gemeinschaft, bevor klinische Fälle gemeldet wurden. Eine Überprüfung aus dem Jahr 2024 über metagenomisches Next-Generation-Sequencing in der Diagnostik von Infektionskrankheiten dokumentierte die wachsende Rolle dieses Ansatzes bei Atemwegs-, Blutbahn-, Zentralnervensystem- und gastrointestinalen Infektionen und bestätigte, dass mNGS klinisch relevante Viren erkennt, die durch Kultur und gezielte PCR übersehen werden. Der gleiche Ansatz, der auf landwirtschaftliche Abflüsse und Aquakulturabwasser angewendet wird, überwacht die Bewegung von viralen Pathogenen an der Schnittstelle zwischen Tieren und Menschen.

Ein Querverweis auf CD Genomics' Metagenomische Sequenzierungsdienste bietet zusätzlichen Kontext darüber, wie Viromik in umfassendere metagenomische Strategien integriert wird, einschließlich der Arbeitsabläufe des Mikrobioms im Darm, die in unserem Leitfaden behandelt werden. Shotgun-Metagenomische Sequenzierung für Studien zum Mikrobiom des Darms.

Abbildung 5: Dysbiose des Darm-Viroms bei IBD – erhöhte Caudoviricetes-Reichtum und Umstrukturierung des Wirt-Virus-Netzwerks bei entzündlichen Darmerkrankungen, mit Violin-Diagrammen der viralen Shannon-Diversität und gestapelten Balkendiagrammen der relativen Häufigkeit viraler Familien im Vergleich zwischen gesunden und IBD-Kohorten.

Herausforderungen und Einschränkungen

Das Problem der viralen Dunklen Materie ist die größte analytische Einschränkung. In der aktuellsten Benchmark-Studie zu Umwelt-Viromen hatten etwa 60 bis 90 % der assemblierten viralen Contigs keinen signifikanten Treffer zu einer Sequenz in IMG/VR oder RefSeq. Diese Sequenzen repräsentieren neuartige virale Linien — ganze Familien oder Ordnungen ohne einen einzigen charakterisierten Vertreter. Die Klassifizierung basierend auf der Proteinstruktur unter Verwendung von Werkzeugen wie AlphaFold-vorhergesagten Strukturen zeigt vielversprechende Ansätze, um diese Sequenzen auf einen viralen Stammbaum des Lebens zu platzieren: charakteristische virale Proteine wie Hauptkapsidproteine, Terminase und Portalproteine behalten über Milliarden von Jahren der Divergenz strukturelle Faltungen, selbst wenn ihre primären Sequenzen keine nachweisbare Ähnlichkeit aufweisen. Allerdings bleibt die Vorhersage von Strukturen für Tausende neuartiger viraler Contigs rechnerisch anspruchsvoll und ist noch nicht routinemäßig in Virom-Analyse-Pipelines.

Die Vollständigkeit der Datenbanken variiert dramatisch je nach Umgebung. Das menschliche Darm-Virom ist am besten charakterisiert, mit Zehntausenden von vOTUs, die über Kohorten katalogisiert sind. Boden- und marine Virome sind weitaus weniger vollständig, und die Virome von Wirbellosen, Protisten und extremen Umgebungen bleiben weitgehend unerforscht. Eine virale Sequenz von einem hydrothermalen Tiefseeventil hat möglicherweise eine 5 bis 10% Chance, mit irgendetwas in der Datenbank übereinzustimmen.

Die Quantifizierung ist die zweite ungelöste Herausforderung. Im Gegensatz zu 16S oder standardmäßiger Metagenomik, bei der interne Standard-Spike-ins jetzt eine absolute Abundanzquantifizierung in Kopien pro Gramm oder Kopien pro Zelle ermöglichen, ist die absolute Quantifizierung von Viren kompliziert durch die variable Beziehung zwischen der Anzahl der Virus-ähnlichen Partikel (VLP) und der Anzahl der Genomkopien – eine einzige infizierte Bakterienzelle kann Hunderte von Phagenpartikeln freisetzen, von denen jeder eine Genomkopie trägt, in einem lyti- schen Ausbruch. Für Studien, die die virale Abundanz unter verschiedenen Bedingungen vergleichen, bleibt die relative Abundanz (Reads pro Million oder Genomkopien pro Million) der Standard, mit dem Verständnis, dass ein relativer Anstieg eines viralen Taxons mathematisch einen Rückgang bei anderen erzwingt.

Die Kosten für die tiefgehende Virom-Sequenzierung — 4 bis 10 Gb pro Probe für eine umfassende Abdeckung — übersteigen die Kosten der flachen Shotgun-Metagenomik für Bakterien. Studien mit großen Kohorten müssen bewusste Kompromisse zwischen der Anzahl der Proben und der Tiefe pro Probe eingehen. Für die Entdeckung von Biomarkern ist die tiefgehende Virom-Sequenzierung einer Entdeckungskohorte, gefolgt von einer gezielten Validierung (qPCR oder digitale PCR der besten Kandidaten vOTUs) in einer größeren Replikationskohorte die praktische Strategie.

CD Genomics unterstützt Virale Metagenomische Sequenzierung bei flexiblen Sequenzierungstiefen, von flachen Virom-Umfragen mit 2 bis 3 Millionen Reads pro Probe bis hin zu tiefgehenden Virom-Charakterisierungen mit über 20 Millionen Reads, mit der Option von Absolute Metagenomische Sequenzierungsdienstleistung für Studien, die quantitative Viruslastschätzungen erfordern.

Abbildung 6: Visualisierung der viralen dunklen Materie — ein Diagramm mit Kreisdiagrammen, das das Verhältnis von klassifizierten zu nicht klassifizierten viralen Contigs in menschlichem Darm, Boden, marinen und extremen Umgebungen zeigt, mit repräsentativen 3D-Icons für bekannte virale Morphologien und Fragezeichen-Silhouetten für vorhergesagte, aber nicht beobachtete virale Formen.

Wie CD Genomics Ihr Virom-Sequenzierungsprojekt durchführt

Ein Virom-Sequenzierungsprojekt bei CD Genomics folgt einem definierten Workflow, der für die virale Rückgewinnung optimiert ist. Proben werden mit Dokumentationen zur Kette der Beweissicherung empfangen und gemäß matrixspezifischen Protokollen verarbeitet: Stuhlproben werden in DNA/RNA Shield homogenisiert, Wasserproben werden durch eine 0,22-μm-Membran gefiltert, und Atemwegs- oder Gewebeproben werden in einem viralen Transportmedium homogenisiert. Die Anreicherung von Viruspartikeln erfolgt durch PEG-Präzipitation oder Ultrazentrifugation, ausgewählt nach Probenart und Studienzielen, gefolgt von einer Nukleasebehandlung und der Extraktion von totaler viraler Nukleinsäure unter Verwendung von Kits, die für die Lyse von Viruspartikeln optimiert sind. Die extrahierte Nukleinsäure wird in parallele DNA- und RNA-Workflows aufgeteilt — PCR-SISPA-Amplifikation und Tagmentierung für DNA-Viren, reverser Transkription und Amplifikation für RNA-Viren — und auf der Illumina NovaSeq-Plattform sequenziert. Die bioinformatische Pipeline umfasst Qualitätsbeschneidung, Entfernung von Wirtslesungen, Kraken 2 und DIAMOND BLASTX-Klassifikation, MEGAHIT-Assemblierung, VirSorter2-Identifizierung viraler Contigs, CheckV-Qualitätsbewertung und taxonomische Zuordnung gegen IMG/VR. Die Ergebnisse umfassen rohe FASTQ-Dateien, QC-Berichte, Tabellen zur viralen taxonomischen Häufigkeit auf Arten- und vOTU-Ebene, assemblierte virale Genome mit CheckV-Qualitätsmetriken, funktionale Annotation viraler AMGs und einen umfassenden Projektbericht. Die Bearbeitungszeit für ein Virom-Projekt mit 50 Proben beträgt etwa sechs bis acht Wochen ab dem Eingang der Proben.

Für Studien, die eine bakterielle taxonomische und funktionale Profilierung neben der viralen Analyse erfordern, bietet CD Genomics' Metagenomisches Shotgun-Sequencing Der Dienst bietet die ergänzende bakterielle Sichtweise. Für Projekte, die aktiv replizierende Viren durch Genexpression untersuchen, Metatranskriptomische Sequenzierung erfasst die RNA-Fraktion sowohl des Wirts als auch des Virus. Für kohortenbasierte Studien, die Viromik, Metagenomik und Metabolomik kombinieren, unser Multi-Omics-Dienstleistung bietet ein integriertes, plattformübergreifendes Studiendesign und Datenintegration. Wenn die Virom-Umfrage Phagenkandidaten für die therapeutische Entwicklung identifiziert, Mikrobielle Gesamte Genomsequenzierung unterstützt die Charakterisierung des bakteriellen Wirtsgenoms, die erforderlich ist, um die Phagen-Wirt-Spezifität zu bestätigen.

Referenzen:

De Chiara L, Romano V, Cerutti F, et al. Ein Vergleich von Methoden zur optimalen Wiederherstellung des menschlichen fäkalen Viroms. medRxiv. 2025. doi:10.1101/2025.05.12.25327428 (CC BY 4.0)
Billaud M, Theodorou I, Lamy-Besnier Q, et al. Die Behandlung mit T7-DNA-Polymerase verbessert die quantitative Sequenzierung sowohl von doppelsträngigen als auch von einzelsträngigen DNA-Viren. Peer Community Journal. 2024;4:e63. doi:10.24072/pcjournal.437 (CC BY 4.0)
Li N, Liu S, Zhang Y, et al. SMART-RNA-Metavirome: eine praktische RNA-Metavirom-Plattform, die mit Hochdurchsatz-Sequenzierung sowohl von kurzen als auch von langen Reads kompatibel ist. Infektiöse Krankheiten der Armut2025;14:101. doi:10.1186/s40249-025-01371-z (CC BY 4.0)
Nayfach S, Camargo AP, Schulz F, et al. CheckV bewertet die Qualität und Vollständigkeit von metagenomisch assemblierten viralen Genomen. Naturwissenschaftliche Biotechnologie. 2021;39:578-585. doi:10.1038/s41587-020-00774-7 (CC BY 4.0)
Guo J, Bolduc B, Zayed AA, et al. VirSorter2: ein Multi-Classifier, expertengeführter Ansatz zur Erkennung verschiedener DNA- und RNA-Viren. Mikrobiom. 2021;9:37. doi:10.1186/s40168-020-00990-y (CC BY 4.0)
Ansari MH, Ebrahimi M, Fattahi MR, et al. Virale metagenomische Analyse von Stuhlproben zeigt ein enterisches Virom-Signatur bei Reizdarmsyndrom. BMC Mikrobiologie. 2020;20:123. doi:10.1186/s12866-020-01817-4.
Moon K, Cho JC. Virom-Datensätze und aus viralen Metagenom-Assemblierungen gewonnene Genome aus aquakulturbeeinflussten Süßwasserumgebungen. Wissenschaftliche Daten2026;13:284. doi:10.1038/s41597-026-07383-0 (CC BY 4.0)
Kieft K, Zhou Z, Anantharaman K. VIBRANT: automatisierte Wiederherstellung, Annotation und Kuratierung von mikrobiellen Viren sowie Bewertung der Funktion viraler Gemeinschaften aus genomischen Sequenzen. Mikrobiom. 2020;8:90. doi:10.1186/s40168-020-00867-0 (CC BY 4.0)
Zhao Y, Zhang W, Wang X, et al. Anwendung der metagenomischen Next-Generation-Sequenzierung bei der Diagnose von Infektionskrankheiten. Grenzen der Zell- und Infektionsmikrobiologie. 2024;14:1458316. doi:10.3389/fcimb.2024.1458316 (CC BY 4.0)

Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.