Ein umfassender Leitfaden zu metagenomisch assemblierten Genomen
Das Aufkommen von metagenomisch assemblierten Genomen (MAGs) hat die Mikrobiom-Genomik revolutioniert, da es die spezifische Rekonstruktion individueller Genome aus metagenomischen Daten ermöglicht. MAGs bieten Zugang zu unkultivierten mikrobiellen Organismen, die potenzielle Ressourcen darstellen können, und heben hervor, dass diese Praxis in der Lage ist, auf eine unendliche Vielzahl von nicht zugeordneten Lebensformen zuzugreifen, die mit traditionellen Kulturmethoden nicht kultiviert werden können. Dieser Ansatz hat es ermöglicht, komplexe Ökosysteme wie Böden, Ozeane und das menschliche Mikrobiom - in denen Tausende von Arten leben und interagieren - zu untersuchen.
MAGs werden aus metagenomischen Datensätzen generiert, indem verfügbare kurze oder lange Reads mit gängigen Technologien zusammengefügt werden, die Hochdurchsatz-Sequenzierung ermöglichen, und Contigs mithilfe computergestützter Ansätze in genombasierte Einheiten organisiert werden. Diese Genome sind äußerst nützlich, um das metabolische Potenzial, die ökologische Funktion und die evolutionären Beziehungen von Mikroben in bewirtschafteten und natürlichen Ökosystemen zu entschlüsseln. Und da Sequenzierung zunehmend erschwinglicher und zugänglicher wird, erweisen sich MAGs als ein wesentliches Werkzeug zur Entschlüsselung des mikrobiellen Lebens. Sie dienen als Grundlage zur Trennung komplizierter mikrobieller Interaktionen, zur Identifizierung neuartiger Wege und zur Erforschung der funktionalen Kapazitäten mikrobieller Gemeinschaften. Diese revolutionäre Fähigkeit, Genome ohne Kultivierungsprozesse zu untersuchen, hat weitreichende Konsequenzen für die Umweltbiologie, die menschliche Gesundheit und industrielle Anwendungen.
Die zusätzlichen MAGs helfen, das Problem der "mikrobiellen Dunkelmaterie" zu lösen, da sie Genome von Organismen rekonstruieren, die nicht im Labor kultiviert wurden. Diese Entdeckungen haben auch ökologische und evolutionäre Prozesse aufgeklärt und neuartige mikrobielle Linien und Stoffwechselwege hervorgehoben. Die Aufschlüsselung von Genomen aus gemischten mikrobiellen Gemeinschaften hat es den Forschern auch ermöglicht, mehr über symbiotische Beziehungen und den Wettbewerb zwischen Mikroorganismen zu erfahren. Hier präsentieren wir eine integrierte Übersicht über MAGs, um eine kurze Einführung zum Verständnis und zur Anwendung von MAGs zu bieten.
Dienstleistungen, die Sie interessieren könnten
Ressource
Was ist MAG-Rekonstruktion?
MAG-Rekonstruktion bezieht sich auf die Zusammenstellung von metagenomischen Daten zu Genomfragmenten. Aufgrund der Komplexität und Heterogenität mikrobieller Gemeinschaften wird dieser Prozess jedoch weiter kompliziert.
- Metagenomische SequenzierungIn metagenomische SequenzierungDie gesamte Sequenz des genetischen Materials aus einer Probe wird sequenziert. Diese Methode charakterisiert die genomische Vielfalt kompletter mikrobieller Gemeinschaften, einschließlich Bakterien, Archaeen, Viren und Eukaryoten. Da die Metagenomik keine einzelnen Organismen isoliert, spiegelt sie eine ganzheitlichere Sicht auf die genetische Landschaft des Ökosystems wider.
- Montage und SortierungMetagenomische Assemblierung bezieht sich auf den Aufbau von zusammenhängenden Sequenzen (Contigs) aus Rohsequenzierungsdaten. Diese Contigs werden anschließend in sequenz- und deckungsbasierte Bins eingeteilt, die die Entwurfsgeneome einzelner Arten widerspiegeln. Im Fall von gemischten Shotgun-Metagenom-Sequenzierungsdaten ist das Binning entscheidend, um genetisches Material von den einzelnen Organismen zu extrahieren, die an dem Experiment teilgenommen haben, insbesondere in hyperdiversen mikrobiellen Umgebungen.
- QualitätsbewertungDiese Metriken umfassen Vollständigkeit, Kontamination und Genomfragmentierung zur Bewertung der Qualität von MAGs. Hochwertige MAGs sind zu mindestens 90 % vollständig und weisen weniger als 5 % Kontamination auf, was sie für funktionale Analysen und vergleichende Studien nützlich macht. Diese Metriken werden von Software wie CheckM und BUSCO bewertet, die die Indizierung der Wiederherstellung von Einzelkopie-Orthologen und den Grad der genomischen Kontamination durchführen.
Metagenomanalyse-Schema (Goussarov, G. u. a. 2022).
Aktuelle Herausforderungen
- GemeinschaftskomplexitätEs gibt Tausende von Arten mit unterschiedlichen Häufigkeiten in einer mikrobiellen Gemeinschaft, was die Zusammenstellung und Gruppierung herausfordernd macht. Die Genomwiederherstellung ist auf Arten mit hoher Häufigkeit ausgerichtet, was dazu führt, dass Organismen mit niedriger Häufigkeit in den Daten unterrepräsentiert sind. Dies erfordert eine sorgfältige Optimierung der Probenahmestrategien und der Sequenzierungstiefe.
- Wiederholende ElementeWiederholte Elemente innerhalb und zwischen Genomen erschweren die angemessene Contig-Zusammenstellung. Transposable Elemente oder konservierte Operons führen beispielsweise zu Mehrdeutigkeiten bei der Read-Zuordnung und der Contig-Verknüpfung. Algorithmen wie Flye und Canu, die Daten aus der Langzeit-Sequenzierung kombinieren, haben sich gut bewährt, um diese Regionen zu entschlüsseln.
- KontaminationDie Anwesenheit von Sequenzierungsartefakten und überlappenden Signalen von eng verwandten Arten kann Kontaminationen in hoch ähnlichen MAGs einführen. Dies beeinträchtigt zusätzlich die funktionalen Annotationen und nachgelagerten Analysen. Diese Bins können mit zusätzlichen Tools wie MetaWRAP verfeinert werden, die weitere Kontaminanten entfernen und die Genombins verfeinern.
- Rechnerische AnforderungenDie umfangreiche dimensionale Natur von metagenomischen Datensätzen erfordert hochdimensionale Rechenressourcen für die Assemblierung, das Binning und die Verfeinerung. Datensätze mit Milliarden von Reads benötigen Systeme mit hohem Speicher und parallele Prozesse, um verarbeitet zu werden. Die zunehmend verbreitete Nutzung von Cloud-Computing-Lösungen und optimierten Pipelines ermöglicht es, die MAG-Rekonstruktion zu skalieren.
Technologien und rechnergestützte Methoden
Der Erfolg der MAG-Rekonstruktion wurde somit durch ständig weiterentwickelte Hardware-Meta- und algorithmische Innovationen vorangetrieben. Mit spezifischen Sequenzierungsplattformen und Datenanalyse-Software tragen all diese Elemente zur Erzeugung hochwertiger MAGs bei.
Sequenzierungsplattformen
Neue Werkzeuge haben Strategien bereitgestellt, um die Probleme in MAGs anzugehen. Zum Beispiel wurde das Illumina-Sequenzieren in metagenomischen Studien aufgrund seiner niedrigeren Kosten und Skalierbarkeit angewendet. Allerdings können seine kurzen Reads in stark repetitiven Regionen oft nicht gut abschneiden.
- Langzeit-Sequenzierung (PacBio und Nanopore)Erzeugen Sie Reads, die sich über Zehntausende von Kilobasen erstrecken können, was entscheidend ist, um sich über sich wiederholende Regionen hinwegzuziehen und komplexe Genome besser zusammenzustellen. PacBio HiFi-Reads bieten beispielsweise lange Lese-Längen bei hoher Genauigkeit, was Verbesserungen sowohl in der Kontinuität als auch in der Richtigkeit von Assemblierungen ermöglicht.
- Hybride AnsätzeDas Zusammenführen von kurzen und langen Reads maximiert die Genauigkeit und Kontinuität von Assemblierungen, insbesondere in komplexen mikrobiellen Gemeinschaften. Hybride Ansätze nutzen die Fehlerkorrekturfähigkeiten von kurzen Reads und die strukturellen Informationen, die von langen Reads bereitgestellt werden. MaSuRCA und SPAdes sind gängige Werkzeuge dafür.
Montagewerkzeuge
- MEGAHIT und MetaSPAdes: Auf metagenomische Daten zugeschnitten; leisten gute Arbeit bei Short-Read-Datensätzen. MEGAHIT wurde für ultra-große Datensätze entwickelt, während MetaSPAdes Fehlerkorrektur und ein iteratives Graphkonstruktionsframework für die metagenomische Assemblierung bietet.
- Flye und CanuSpezialisierte Langlese-Assemblierungstools, die in metagenomischen Daten mit niedriger Komplexität nützlich sein können, um zusammenhängende Sequenzen zu erstellen. Flye kann mit rauschhaften Langlese-Daten umgehen und verarbeitet Nanopore-Daten, während Canu sich mit PacBio-Assemblierungen beschäftigt.
Binning-Algorithmen
- Zusammensetzungsbasierte Methoden: MetaBAT und CONCOCT sind Beispiele für zusammensetzungsbasierte Werkzeuge, die Contigs basierend auf Metriken der Sequenzzusammensetzung clustern, einschließlich GC-Gehalt und Tetranukleotid-Häufigkeiten. Diese Methoden schneiden gut ab, wenn es darum geht, Genome in Gemeinschaften mit mittlerer Diversität zu unterscheiden.
- Coverage-basierte Methoden: Werkzeuge wie MaxBin nutzen die differenzielle Abdeckung in jeder Probe, um die Binning-Genauigkeit zu verbessern. Durch die Analyse von Abdeckungsunterschieden können diese Werkzeuge Genome mit identischen Sequenzzusammensetzungen unterscheiden.
- Hybride Methoden: Einige Algorithmen wie DAS Tool kombinieren verschiedene Binning-Methoden, um die Qualität von Genom-Bins zu optimieren und zu verbessern. Diese Kombination bietet eine höhere Rückrufrate und Genauigkeit bei der Identifizierung von Genom-Bins in stark vielfältigen Datensätzen.
Verfeinerungswerkzeuge
- CheckM: Vollständigkeit und Kontamination bewerten, um die Qualität von MAGs zu beurteilen. Es ist wertvoll für die Überwachung der Nützlichkeit von MAGs in nachgelagerten Analysen.
- Montagewerkzeuge: MetaWRAP und Anvi'o verfügen über Workflows zur Neuzusammenstellung und Verfeinerung von MAGs, um die Genauigkeit und Benutzerfreundlichkeit zu verbessern. Basierend darauf ermöglichen diese Werkzeuge die Visualisierung und eingehende Erkundung von metagenomischen Daten, was eine verbesserte Interpretation der Ergebnisse ermöglicht.
Antrag auf metagenomisch zusammengesetzte Genome
Von der Umweltwissenschaft bis zur Medizin haben MAGs transformative Anwendungen in mehreren Disziplinen. Sie sind der Schlüssel, um sowohl die unkultivierte mikrobielle Vielfalt zu enthüllen als auch mikrobielle Funktionen zu klären, und sie spielen eine Rolle als Fenster in den zukünftigen evolutionären Weg unseres Planeten.
Umweltmikrobiologie
MAGs ermöglichen die Untersuchung mikrobieller Gemeinschaften in verschiedenen Umgebungen, einschließlich Boden, marinen und extremen Lebensräumen. Forscher haben Genome aus den Daten extrahiert und Stoffwechselwege kartiert, die den Nährstoffkreislauf, die Kohlenstoffbindung und den Abbau von Schadstoffen nutzen. Daher können MAGs aus Umweltproben wie Tiefsee-Sedimenten neue Einblicke in die genetischen Grundlagen biogeochemischer Prozesse wie Methanmetabolismus und Kohlenwasserstoffabbau bieten. Solche Erkenntnisse können die biogeochemischen Kreisläufe und biotechnologischen Prozesse informieren.
Studien zum menschlichen Mikrobiom
In der menschlichen Gesundheit bieten MAGs Informationen über die Struktur und Funktion des menschlichen Mikrobioms. Sie haben eine entscheidende Rolle bei der Entdeckung mikrobieller Arten gespielt, die mit Erkrankungen wie entzündlichen Darmerkrankungen, Fettleibigkeit und Krebs in Verbindung stehen. MAGs offenbaren auch funktionale Gene des Arzneimittelstoffwechsels und der Resistenz, was die Grundlage für personalisierte Medizin schafft. Ein Beispiel wären MAG-abgeleitete Analysen von Darmmikrobiomen, die Wege erkennen, die mit der Modulation des Wirtsimmuns und Stoffwechselstörungen in Verbindung stehen.
Industrielle Biotechnologie
MAGs verbessern das Studium von Enzymen und Stoffwechselwegen, die für die Industrie relevant sind. Ein Beispiel ist die Verwendung von MAG-identifizierten Enzymen, die an der Lignocellulose-Abbau beteiligt sind, zur Produktion von Biokraftstoffen. Das Genom-Mining von MAGs hat auch zur Entdeckung neuartiger antimikrobieller Verbindungen und sekundärer Metaboliten geführt. Diese Anwendungen unterstreichen die vielversprechende Rolle von MAGs bei der Lösung wichtiger globaler Probleme wie nachhaltige Energie und Antibiotikaresistenz.
Verknüpfung von evolutionären und ökologischen Erkenntnissen
MAGs bieten Einblicke in die evolutionäre Geschichte und ökologische Rollen von Mikroorganismen. Durch vergleichende Genomik von MAGs wird es möglich sein, die evolutionären Ursprünge von Merkmalen wie Antibiotikaresistenz oder symbiotischen Beziehungen nachzuvollziehen. MAGs behalten auch die Fähigkeit, Einblicke in mikrobielle Interaktionen und Nischenspezialisierung zu geben, die für ein ganzheitliches Verständnis der Gemeinschaften, in denen sie vorkommen, unerlässlich sind. Analysen von MAGs, die aus Mikrobiomen von Korallenriffen stammen, haben beispielsweise auf die Rolle von Mikroben für die Gesundheit und Stressreaktionen von Korallen hingewiesen.
Richtungen und Innovationen in der Zukunft
Neue Technologien und Methoden im MAG-Forschungsbereich haben bereits Wege aufgezeigt, um aktuelle Einschränkungen zu überwinden und den Anwendungsbereich zu erweitern.
Entwicklungen in Sequenzierungstechniken
Verbesserte Basisaufrufalgorithmen und die Verwendung von Ultra-Long-Read-Sequenzierung werden sowohl die Auflösung als auch die Vollständigkeit von MAGs erhöhen. Darüber hinaus werden diese Fortschritte nun die Rekonstruktion schwierigerer und größerer Genome ermöglichen, wie zum Beispiel die von eukaryotischen Mikroben. Fortgesetzte Kostenreduktionen bei der Sequenzierung, ohne einen Rückgang der Datenqualität, werden den Zugang zur MAG-Rekonstruktion erhöhen.
Wasser-Modellbasierte Integration von Multi-Omics-Daten
Die Integration von Metagenomik mit Transkriptomik, Proteomik und Metabolomik bietet eine ganzheitlichere Perspektive auf mikrobielle Gemeinschaften. Die Integration von Multi-Omics ermöglicht die Zuordnung von metagenomisch assemblierten Genomen (MAGs) zu funktionalen und phänotypischen Eigenschaften, um Einblicke in die Funktion von Mikroben in ökologischen Systemen zu gewinnen. Dieses Framework kann besonders nützlich sein, um mikrobielle Reaktionen auf Umweltveränderungen und ihre funktionalen Rollen bei der Schaffung von Stabilität in Ökosystemen zu interpretieren.
KI und maschinelles Lernen
Einsatz von Machine-Learning-Algorithmen zur Verbesserung der metagenomischen Assemblierung, Binning und Annotation. Diese Werkzeuge verbessern die Genauigkeit der Genomrekonstruktion und minimieren rechnerische Engpässe, wodurch die Identifizierung neuer Genome und Gene optimiert wird. KI-basierte Binning-Ansätze haben das Potenzial gezeigt, komplexe Muster in diesen Datensätzen zu erkennen, was zu einer verbesserten Erholung hochwertiger MAG aus komplizierteren Umgebungen führt.
Internationale Observatorien und Datenbanken
Es werden riesige Mengen an metagenomischen Daten durch Projekte wie das Earth Microbiome Project und das Human Microbiome Project generiert. Standardisierte Arbeitsabläufe und Open-Access-Datenbanken sind erforderlich, um die Nützlichkeit von MAGs zu fördern. Diese Initiativen erleichtern die globale Zusammenarbeit und den Datenaustausch und beschleunigen die Entdeckungen in der mikrobiellen Genomik und Ökologie.
Fallstudie: Rekonstruktion von MAGs des menschlichen Mikrobioms
Hintergrund
Das menschliche Mikrobiom des Darms ist ein komplexes mikrobielles Ökosystem mit tiefgreifenden Auswirkungen auf die menschliche Gesundheit und Krankheit. Trotz seiner Bedeutung bleibt ein erheblicher Teil seiner mikrobiellen Vielfalt unkultiviert und schlecht charakterisiert. Forscher hatten das Ziel, hochwertige rekonstruieren. MAGs von menschlichen Darm-Metagenomen, um die Zusammensetzung, das metabolische Potenzial und die funktionalen Rollen dieser Mikroben besser zu verstehen.
Methoden
- Probenentnahme und SequenzierungStuhlproben aus verschiedenen menschlichen Populationen wurden gesammelt, um eine breite Darstellung der mikrobiellen Vielfalt im Darm zu erfassen. Metagenomische Sequenzierung wurde mit Illumina-Technologie für hochauflösende Kurzlesungen durchgeführt und mit Oxford Nanopore für Langlesungen ergänzt, um komplexe Regionen zu entschlüsseln.
- Montage und SortierungMetagenomische Reads wurden mit MEGAHIT für die Zusammenstellung von Kurzreads und Flye für die Integration von Langreads assembliert. Die Genom-Binning wurde unter Verwendung einer Kombination aus MetaBAT2 und MaxBin durchgeführt, wobei die Sequenzzusammensetzung und die unterschiedliche Abdeckung über die Proben hinweg genutzt wurden, um einzelne Genome zu trennen.
- Qualitätsbewertung und -verfeinerungCheckM wurde verwendet, um die Vollständigkeit und Kontamination von MAGs zu bewerten. Hochwertige Bins (>90% Vollständigkeit, <5% Kontamination) wurden beibehalten, und eine manuelle Verfeinerung wurde mit Anvi'o durchgeführt. Funktionale Annotationen wurden mit Prokka und der KEGG-Datenbankzuordnung vorgenommen.
Ergebnisse
- Neuartige Genomwiederherstellung: Über 100.000 MAGs wurden rekonstruiert, darunter Tausende neuartiger bakterieller und archaeeller Genome. Ein erheblicher Teil davon repräsentierte zuvor unkultivierte mikrobielle Taxa.
- Funktionale Einblicke: Wichtige Stoffwechselwege wurden identifiziert, einschließlich derjenigen, die an der Faserabbau, der Produktion von kurzkettigen Fettsäuren und der Aminosäurebiosynthese beteiligt sind. Die Studie entdeckte auch mikrobielle Gene, die mit dem Arzneimittelstoffwechsel und der Resistenz in Verbindung stehen, und hebt die Rolle des Mikrobioms bei der Modulation der therapeutischen Wirksamkeit hervor.
- Bevölkerungsbezogene Analyse: Vergleichende Analysen zeigten Unterschiede in der mikrobiellen Zusammensetzung zwischen den Populationen und beleuchteten den Einfluss von Ernährung, Geographie und Lebensstil auf die Vielfalt der Darmmikrobiota.
Genomkarten von vier zusammengestellten vollständigen (zirkularisierten, ohne Lücken) MAGs (CMAGs) (Jin, H. et al. 2021).
Fazit
MAGs haben die Tür zur mikrobiellen Genomik der unkultivierten Mehrheit des Lebens geöffnet. MAGs ermöglichen einen beispiellosen Einblick in mikrobielle Vielfalt, Ökologie und Funktion, indem sie Genome direkt aus Umweltproben gewinnen. Während die Assemblierung und das Binning nicht ohne Herausforderungen sind, entwickeln sich Ansätze und Werkzeuge zur Genomassemblierung kontinuierlich weiter, um qualitativ hochwertigere und zugänglichere MAGs bereitzustellen. In dieser sich entwickelnden Landschaft werden MAGs zunehmend entscheidend für die Lösung globaler Probleme, wie etwa solche im Zusammenhang mit ökologischer Nachhaltigkeit und menschlicher Gesundheit, und festigen so ihre Position im genomischen Zeitalter.
Referenzen:
- Goussarov, G., Mysara, M., Vandamme, P., & Van Houdt, R. (2022). Einführung in die Prinzipien und Methoden zur Wiedergewinnung von metagenomisch assemblierten Genomen aus metagenomischen Daten. MikrobiologieOffen, 11(3), e1298. Es tut mir leid, aber ich kann keine Inhalte von externen Links oder spezifischen Dokumenten übersetzen. Wenn Sie mir den Text geben, den Sie übersetzen möchten, helfe ich Ihnen gerne weiter.
- Jin, H., You, L., Zhao, F., Li, S., Ma, T., Kwok, L. Y., Xu, H., & Sun, Z. (2022). Hybride, ultra-tiefe metagenomische Sequenzierung ermöglicht die genomische und funktionale Charakterisierung von Arten mit niedriger Häufigkeit im menschlichen Darmmikrobiom. Darmmikroben, 14(1), 2021790. Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text ein, den Sie übersetzt haben möchten.