Metagenomik ist die Wissenschaft, die anwendet Hochdurchsatz-Sequenzierung Technologien und Bioinformatik Werkzeuge, um den genetischen Inhalt einer mikrobiellen Gemeinschaft direkt zu erhalten, ohne die einzelnen mikrobiellen Arten isolieren und kultivieren zu müssen. Metagenomik ermöglicht es Forschern nicht nur, die funktionale Genzusammensetzung mikrobieller Gemeinschaften zu untersuchen, sondern auch evolutionäre Forschung zu betreiben. Metagenomik wurde verwendet, um neuartige Biokatalysatoren oder Enzyme zu identifizieren und neuartige Hypothesen über die mikrobielle Funktion zu generieren, was ein leistungsfähiges und praktisches Werkzeug ist. Im Vergleich zu 16S/18S/ITS Amplicon-SequenzierungMetagenomik kann mehr Informationen über das funktionale Potenzial mikrobieller Gemeinschaften und vollständiger Genomsequenzen liefern. Die rasante Entwicklung und der erhebliche Kostenrückgang bei Hochdurchsatzsequenzierungen haben die Entwicklung von Shotgun-Metagenomik-Sequenzierung.
Dieser Artikel gibt einen Überblick über Metagnomikvon der Probenahme bis zur Datenanalyse. Ein typisches Metagenomik-Projekt umfasst die Probenvorbereitung, Sequenzierung und Datenanalyse (einschließlich Assemblierung, Binning, Annotation, statistische Analyse und Datenübermittlung).
Abbildung 1. Flussdiagramm eines typischen Metagenom-Projekts.
Dienste, an denen Sie interessiert sein könnten
Probenvorbereitung
Die Probenvorbereitung umfasst in der Regel zwei Schritte: die Probenentnahme und die DNA-Extraktion, die beide die Qualität und Genauigkeit beeinflussen können. Metagenomik Experimente. Kommerzielle Kits sind für die Probenentnahme und DNA-Isolation erhältlich. Die Hauptziele sind, genügend mikrobielle Biomasse für die Sequenzierung zu sammeln und Kontamination zu minimieren. Bei der Arbeit mit Proben mit geringer Biomasse sollten ultrasaubere Reagenzien und "Leerkontrollen" für die Sequenzierung verwendet werden, um weniger "echte" Signale zu minimieren.
Bibliotheksvorbereitung und Sequenzierung
Gemeinverständlich Hochdurchsatz-Sequenzierung Plattformen umfassen Illumina-Systeme, Roche 454, Ion Torrent-Geräte und PacBio SMRT Systeme.
Frey et al. (2014) bewerteten die Fähigkeit von drei Next-Generation-Sequenzierung (NGS) Plattformen (Illumina MiSeq, Roche 454 Titanium und Ion Torrent PGM), um einen Pathogen mit niedriger Titer (viral oder bakteriell) in einer klinisch relevanten Blutprobe zu identifizieren. Sie fanden heraus, dass die Ion Torrent PGM- und Illumina-Plattformen bei der Identifizierung seltener Mikrobenarten besser abschneiden, und für bakterielle Proben konnte nur die MiSeq-Plattform Lesungen liefern, die eindeutig als von Bacillus anthracis stammend klassifiziert wurden.
Die Illumina-Plattform hat sich als dominant erwiesen für Shotgun-Metagenomik-Sequenzierung aufgrund ihrer sehr hohen Ausgaben (bis zu 1,5 Tb pro Lauf), hoher Genauigkeit (Fehlerquote zwischen 0,1-1%) und breiter Verfügbarkeit. Ion Torrent-Geräte und PacBio SMRT Instrumente werden zu starken Wettbewerbern auf diesem Gebiet. Die Illumina-Plattformen unterscheiden sich hauptsächlich in der Gesamtleistung und der maximalen Leseweite. Der Illumina HiSeq 2500 (2x250 nt, 180 Gb Ausgabe oder 2x125 nt, 1Tb Ausgabe) ist eine klassische Wahl für Metagenomik. Neuere HiSeq 3000 und 4000 Systeme erhöhen den Durchsatz eines Laufs, sind jedoch auf die Leseweite (150 nt) beschränkt. Die MiSeq-Instrumente erzeugen nur bis zu 15 Gb im 2x300-Modus, sind jedoch dennoch nützlich für Studien zu einzelnen Marker-Gen-Mikrobiomen oder eine begrenzte Anzahl von Proben.
Die Instrumente von Pacific Biosciences (PacBio), die auf der Einzelmolekül-Realzeit (SMRT)-Erkennung in Zero-Mode-Wellenleiter-Wells basieren, bieten deutlich größere Leseweiten (durchschnittliche Leseweiten von bis zu 30 kb) als NGS Instrumente. Die Kurzlese-Sequenzierung (d.h. NGS) hat eine begrenzte Fähigkeit, komplexe oder Regionen mit geringer Abdeckung zusammenzustellen, während Langzeit-Metagenomsequenzierung Durch PacBio SMRT-Sequenzierung ist es möglich, ein hochqualitatives und geschlossenes Genom einer zuvor nicht charakterisierten mikrobiellen Spezies aus metagenomischen Proben zu rekonstruieren.
Datenanalyse
Wenn die Forschung darauf abzielt, vollständige CDS zu erhalten oder wiederherzustellen mikrobielle Genome, dann muss eine Assemblierung durchgeführt werden, um längere genomische Contigs zu erzeugen. Die Assemblierung kann in zwei Strategien unterteilt werden: referenzbasierte Assemblierung und de novo Assemblierung. Die referenzbasierte Assemblierung ist schnell und genau, wenn die Metagenomik Der Datensatz umfasst Sequenzen, für die eng verwandte Referenzgenome verfügbar sind. Die referenzbasierte Assemblierung kann mit Softwarepaketen wie Newbler, AMOS, MIRA durchgeführt werden. Die De-novo-Assemblierung erfordert größere Rechenressourcen. Der De-Bruijn-Graph-Ansatz ist die beliebteste Methode zur De-novo-Assemblierung von Metagenomen.
Wenn die Forschung auf taxonomisches Profiling abzielt, ist keine Assemblierung und Binning erforderlich. Assemblierungsfrei Metagenomik Profilierung kann Versammlungsprobleme mildern und es ermöglichen, Arten mit geringer Häufigkeit zu identifizieren, die nicht de novo assembliert werden können. Der Ansatz ist begrenzt, da zuvor nicht charakterisierte Mikroorganismen schwer zu profilieren sind, aber die Anzahl der Referenzgenome schnell zunimmt.
Metagenomassemblierungen sind nur fragmentierte Contigs. Wir wissen nicht, aus welchem Genom ein Contig stammt. Wir wissen nicht einmal, wie viele Arten es gibt. Binning ist der Prozess, bei dem Contigs in Arten gruppiert werden. Es gibt zwei Strategien für das Binning, einschließlich kompositionsbasierter und ähnlichkeitbasierter Methoden. Zu den Beispielen für kompositionsbasierte Binning-Algorithmen gehören S-GSOM, Phylopythia, PCAHIER und TACAO. Ähnlichkeitbasierte Algorithmen umfassen IMG/M, MG-RAST, MEGAN, CARMA, SOrt-ITEMS, MetaWatt, SCIMM und MetaPhyler. Einige Algorithmen berücksichtigen sowohl Komposition als auch Ähnlichkeit, wie PhymmBL und MetaCluster.
Die Annotation umfasst zwei Schritte: die Genidentifikation und die funktionale Annotation. Datenbanken, die Kombinationen aus manuell annotierten und computergestützt vorhergesagten Proteinfamilien enthalten, können für Gene und Stoffwechselwege aus Metagenomen verwendet werden. Häufige Datenbanken und Werkzeuge sind in der folgenden Tabelle aufgeführt.
Tabelle 1. Häufige Datenbanken und Werkzeuge zur Annotation von metagenomischen Daten.
| Datenbanken/Werkzeuge | Einzelheiten |
| KEGG | KEGG ist eine Datenbankressource, die verwendet wird, um die Funktionen und Nutzen des biologischen Systems zu verstehen. |
| UniProt | UniProt bietet ein Repository für metagenomische Sequenzdaten und ermöglicht Ihnen, taxonomische und funktionale Analysen anzuzeigen. |
| TIGRFAM | TIGRFAMs ist eine Datenbank von Definitionen für Proteinfamilien. |
| eggNOG | eggNOG wird zur Identifizierung orthologer Gengruppen und zur Funktionsannotation verwendet. Weitere Datenbanken für orthologe Gengruppen sind KEGG, COG, M5NR und Metacyc. |
| SILVA | SILVA ist eine Online-Ressource für qualitätsgeprüfte und ausgerichtete ribosomale RNA-Sequenzdaten. |
| Greengenes | Greengenes ist eine Kombination aus einer chimärenüberprüften 16S rRNA-Gen-Datenbank und Werkzeugen. |
| RDP | Das Ribosomal Database Project (RDP) umfasst ausgerichtete und annotierte rRNA-Gen-Sequenzdaten sowie Werkzeuge. |
| HUMAnN-Pipeline | HUMAnN ist eine Pipeline zur genauen Bestimmung der Anwesenheit/Abwesenheit und Häufigkeit mikrobieller Stoffwechselwege aus metagenomischen Daten. |
| CAZy | Die CAZY (Carbohydrate-Active enZYmes) Datenbank kann zur Vorhersage von Genen, die für carbohydrate-aktive Enzyme kodieren, sowie zur Korrelationsanalyse verwendet werden. |
| KARTE | Die umfassende Antibiotikaresistenzdatenbank (CARD) kann zur Vorhersage von Resistenzgenen und zur Korrelationsanalyse verwendet werden. |
| MG-RAST | MG-RAST ist ein Open-Source-Webanwendungsserver für phylogenetische und funktionale Analysen von Metagenomen. |
Seit ganzem DNA-Sequenzierung von Umweltproben wurde erstmals 2004 von Teams unter der Leitung von Banfield und Venter durchgeführt, Shotgun-Metagenomik ist zu einem unverzichtbaren Werkzeug für das Studium mikrobieller Gemeinschaften geworden. Die gesunkenen Kosten für die Sequenzierung und die Entwicklung von Rechenmethoden haben die weitverbreitete Anpassung der Metagenomik gefördert.
Das Reich von Metagenomik bringt zahlreiche Vorteile mit sich, obwohl es nicht ohne bestimmte Nachteile ist. Ein wesentlicher Vorteil ist die Möglichkeit, die Anforderungen an die mikrobielle Kultivierung zu umgehen, was eine direkte Extraktion und Analyse von mikrobieller DNA aus Umweltsamples ermöglicht. Dies umgeht erfolgreich die Einschränkungen und Verzerrungen, die mit traditionellen Kultivierungsmethoden verbunden sind. Eine weitere Stärke von Metagenomik liegt in seiner umfassenden Natur, die gründliche und schnelle Einblicke in die Zusammensetzung und funktionalen Potenziale mikrobieller Gemeinschaften ermöglicht. Dazu gehören weniger kultivierbare Mikroorganismen und Gene mit bislang unbekannten Funktionen. Darüber hinaus bietet es hochauflösende Analysefähigkeiten, um mikrobielle Vielfalt, Struktur und Funktionalitäten von individueller bis hin zur Gemeinschaftsebene zu enthüllen. Zusätzlich, Metagenomik hilft bei der Entdeckung neuer mikrobielle Arten und funktioneller Gene, was die Möglichkeiten für neuartige Nutzungen mikrobieller Ressourcen eröffnet. Schließlich zeigt die Metagenomik breite Perspektiven in Bereichen wie Ökologie, Biomedizin, Industrie und Umwelt und bietet ein effektives Mittel zur Bewältigung vielfältiger Probleme.
Während Metagenomik bietet bemerkenswerte Einblicke, bringt jedoch auch eine Reihe von inhärenten Herausforderungen mit sich. In erster Linie stellt das schiere Volumen und die Komplexität der wachsenden Daten eine erhebliche Herausforderung für deren Interpretation und Analyse dar, was den Einsatz von anspruchsvollen, spezialisierten Methoden und Techniken erfordert. Die Datenanalyse erfordert erhebliche Rechenressourcen, einschließlich professioneller Softwaretools, die häufig mit hohen Kosten und Zeitaufwand verbunden sind. Darüber hinaus kann der Extraktionsprozess von Umweltproben, der mit seiner inhärenten Komplexität und dem Potenzial für Kontamination behaftet ist, zusätzliches Rauschen in die Daten einführen. Dieses Rauschen kann wiederum die Präzision der Ergebnisse beeinträchtigen. Die Bioinformatik Die Landschaft, mit ihrem Sortiment an Herausforderungen, einschließlich Sequenzassemblierung, funktioneller Annotation und Analyse der Artenzusammensetzung, unterstreicht die ständige Notwendigkeit zur Verfeinerung und Verbesserung des Workflows.
Trotz dieser Herausforderungen ist das Gebiet der Metagenomik nichtsdestotrotz enormes Potenzial. Da sich die Technologien im Bereich der Sequenzierung ständig weiterentwickeln und die damit verbundenen Kosten sinken, wird die Anwendung von Shotgun-Metagenomik-Sequenzierung wird voraussichtlich zunehmend verbreitet. Gleichzeitig erwarten wir, dass die Entwicklung von Bioinformatik wird effizientere und genauere Werkzeuge und Algorithmen für die Datenanalyse hervorbringen. Dies würde wiederum eine verbesserte Interpretation und Nutzung von Sequenzierungsdaten erleichtern. Darüber hinaus würde die Verschmelzung von Metagenomik Daten mit anderen Omik-Datensätzen in einer umfassenden Analyse versprechen tiefere Einblicke in die Funktionalität und Wechselwirkungen innerhalb mikrobieller Gemeinschaften. Im Bereich der medizinischen Mikrobiomforschung könnte die Metagenomik als revolutionäres Werkzeug für die Präzisionsmedizin dienen. Sie zielt darauf ab, neue Wege für die verbesserte Diagnose, Behandlung und Prävention von Krankheiten zu eröffnen. In Bezug auf den Umweltschutz und die Biotechnologie wird die erwartete Zukunft der Metagenomik bietet eine Reihe von effektiveren Ansätzen zur Bewertung von Umweltauswirkungen, zur Nutzung biologischer Ressourcen und zur Durchführung von Bioprozessengineering.
Referenzen: