Mikrobielle Diversitätssequenzierung, auch bekannt als Amplicon-Sequenzierungnutzt moderne Hochdurchsatztechnologien, um Gensequenzen wie 16S rRNA/ITS zu sequenzieren. Diese Methode ermöglicht die gleichzeitige Erkennung von dominanten, seltenen und nicht identifizierten Arten in einer Probe. Sie liefert Einblicke in die Zusammensetzung und relative Häufigkeit mikrobieller Gemeinschaften innerhalb der Probe.
Der Transkriptom, die alle von einer bestimmten Art, Gewebe oder Zelltyp transkribierten RNAs umfasst, wird durch Hochdurchsatz-Sequenzierung untersucht. Dieser Ansatz erfasst schnell das gesamte Transkriptom in einer bestimmten Zelle oder einem bestimmten Gewebe und unterstützt die Analyse von Genstruktur und -funktion, variabler Spleißung und die Vorhersage neuer Transkripte. Darüber hinaus ist er besonders gut geeignet, um Transkripte mit geringer Häufigkeit und neuartige Transkripte zu erkennen.
Untersuchungen zu mikrobiellen Zielorganbeziehungen, wie den Gehirn-Darm- und Leber-Darm-Achsen, sind von großer Bedeutung. Die Integration von Mikroben und Zielorganen Organtranskriptome ermöglicht ein umfassendes Verständnis, indem mikrobielle Veränderungen mit transkriptionalen Veränderungen verknüpft werden und wertvolle Einblicke gewonnen werden.
Mikrobielle Vielfalt und Transkriptomik-Multi-Omik-Analysen streben danach, Schlüsselbiomarker identifizieren, schlagen Sie Inter-Sample-Beziehungen vor und enthüllen Sie die biologische Bedeutung, indem Sie sowohl mikrobiologische als auch transkriptionale Daten umfassend berücksichtigen.
Unsere Multi-Omics-Dienstleistungen und -Berichte sind in drei Hauptteile unterteilt. Der erste Teil bewertet Multi-Omics als Ganzes und prüft die Datenqualität. Der zweite Teil konzentriert sich auf die Identifizierung von Schlüsselmarker-Genen, während der dritte Teil Korrelationsanalysen durchführt, um das Maß der Korrelation zwischen verschiedenen Substanzen zu veranschaulichen.
Die ursprünglichen Kohortendaten wurden einer Standardabweichungsnormalisierung (Z-Score-Normalisierung) und einer Quantilsnormalisierung (Quantile Normalization) unterzogen, bevor sie zusammengeführt wurden. Anschließend wurden Techniken zur Dimensionsreduktion und Clusterbildung angewendet, um die Beziehungen zwischen den Proben zu visualisieren, die Gruppierung der Proben zu bewerten und die Reproduzierbarkeit innerhalb der Gruppen zu messen. Zwei Methoden zur Dimensionsreduktion, nämlich PCA (unüberwacht) und LDA (überwacht), wurden ausgewählt. Die Ergebnisse nach der PCA-Dimensionsreduktion wurden weiter für die hierarchische Clusteranalyse verwendet. Schließlich wurde eine lineare Anpassungsprojektion genutzt, um die Variationen zwischen verschiedenen Omics innerhalb der Gruppen zu veranschaulichen.
Um die diskriminative Fähigkeit der Multigrouping-Merkmale bei der Unterscheidung von Stichproben-Gruppierungen weiter zu bewerten, wurde ein Random-Forest-Modell unter Verwendung der normalisierten Multigrouping-Merkmale erstellt. Die Klassifikationsleistung des Modells wurde mithilfe von ROC-Kurven bewertet, um festzustellen, ob die Multigrouping-Merkmale effektiv unterschiedliche Stichproben-Gruppierungen vorhersagen. Dieses Random-Forest-Modell spielte auch eine entscheidende Rolle im nachfolgenden Abschnitt, der der Biomarker-Screening gewidmet ist.
Durch den Einsatz eines Random-Forest-Ansatzes haben wir die Bedeutung jeder Substanz innerhalb von Mikroben und Transkripten in Bezug auf die aktuelle Untergruppe bewertet. Höhere Wichtigkeitsscores deuten darauf hin, dass eine Substanz eher als Biomarker zur Unterscheidung der aktuellen Untergruppe dienen kann. Die Top 30 Biomarker, nach Wichtigkeit sortiert, wurden ausgewählt, um das Random Forest-Modell zu rekonstruieren. ROC-Kurven wurden durch Kreuzvalidierung mit 20 zufälligen Permutationen erstellt.
Jede Permutation beinhaltete die Aufteilung der Daten in ein Trainingsset und ein Validierungsset (1:1-Verhältnis). Ein Random-Forest-Modell wurde unter Verwendung des Trainingssets erstellt und dann angewendet, um das Validierungsset vorherzusagen. In Fällen mit mehr als zwei Stichprobengruppen (>2) wurde die Mikro-Durchschnittsmethode verwendet, um die Ergebnisse der Mehrklassenklassifikation in eine binäre Klassifikation umzuwandeln. Die Effektivität der Klassifikation des Modells wurde durch die Fläche unter der ROC-Kurve bewertet, wobei eine größere Fläche einen überlegenen Klassifikationseffekt anzeigt.
Die Untersuchung materialer Unterschiede zwischen verschiedenen Omics durch Korrelationsanalysen enthüllt interhistologische Assoziationen. Zunächst haben wir unabhängig voneinander untersucht mikrobielle und genetische Daten, wobei der Schwerpunkt auf den 1000 Datensätzen mit dem größten absoluten Wert von log2 (FoldChange) liegt. Diese Auswahl wurde unter Berücksichtigung der Signifikanzkriterien aus der ursprünglichen Single-Omics-Analyse der Unterschiede getroffen. In Fällen, in denen der Datensatz weniger als 1000 Einträge umfasste, wurden alle Einträge einbezogen.
Es ist bemerkenswert, dass der Screening-Prozess bei dem Vergleich über mehrere Gruppen hinweg dem Signifikanzniveau (p-Wert) aus der ursprünglichen Differenzanalyse entsprach. Anschließend wurden paarweise Korrelationskoeffizienten für alle Dateneinträge von Mikroorganismen und Genen berechnet.