Anwendungen des Pan-Genoms in Pflanzen

Pan-Genom-Analyse stellt einen Paradigmenwechsel in der Pflanzenwissenschaft dar Genomik, was eine umfassende Charakterisierung der genetischen Vielfalt auf Artenebene ermöglicht. Durch die Kombination von Kern- und variablen genomischen Regionen überwinden wir die Einschränkungen einzelner Referenzgenome. Wir diskutieren die Pan-Genom-Methodik und ihre Anwendungen zur Untersuchung der genetischen Variation bei Pflanzen, der Domestikationsgeschichte, der Züchtungsverbesserung und der funktionellen Genomik.

Was ist das Pan-Genom?

Das Pan-Genom stellt das vollständige genomische Repertoire einer Art dar, das sowohl konservierte Kernsequenzen (universell in allen Zugängen vorhanden) als auch variable accessory Komponenten (in spezifischen Linien vorhanden) umfasst. Ursprünglich für die prokaryotische Genomik entwickelt, wurde dieses Framework erfolgreich auf eukaryotische Systeme angepasst, wobei bahnbrechende Studien zum Pflanzen-Pan-Genom aus der Sojabohnenforschung hervorgingen. Nachfolgende Untersuchungen haben die pan-genomischen Analysen auf wichtige Nutzpflanzen wie Oryza sativa, Solanum lycopersicum und Triticum aestivum ausgeweitet. Dieser Ansatz erweist sich als besonders wertvoll für Pflanzensysteme, angesichts ihrer umfangreichen strukturellen Variationen, häufigen Polyploidisierungsereignisse und reichlich vorhandenen repetitiven Elemente - Merkmale, die herkömmliche Einzelreferenzgenome oft nicht angemessen darstellen können.

Pangenome graph.Abbildung 1. Pangenom-Modelle und Konstruktion eines Pangenom-Graphs. (Ze-Zhen Du et al., 2025)

Prinzipien des Pan-Genoms

Konstruktion des Pan-Genoms

Der Aufbau eines Pan-Genoms erfordert die systematische Integration mehrerer Genomassemblierungen durch zwei Hauptmethoden: referenzgestützte und de novo Strategien. Die referenzbasierte Methode ordnet die einzelnen Genome einer etablierten Referenzsequenz zu und integriert anschließend die erkannten Varianten in die Pan-Genom-Struktur. Dieser Ansatz zeigt eine optimale Nützlichkeit, wenn hochwertige Referenzgenome als organisatorische Gerüste genutzt werden. Alternativ assembliert die de novo Methode die einzelnen Genome unabhängig, bevor sie zu einem umfassenden Pan-Genom konsolidiert werden. Obwohl diese Strategie rechenintensiv ist, erweist sie sich als besonders effektiv für genetisch vielfältige Taxa oder wenn Referenzgenome nicht verfügbar sind. Die Auswahl zwischen diesen Ansätzen erfordert eine sorgfältige Berücksichtigung der vorhandenen genomischen Ressourcen und der verfügbaren Rechenkapazität.

2.2 Graphbasierte Darstellung

Graph-basierte Pan-Genome stellen genetische Variationen als Knoten und Kanten in einer Graphstruktur dar. Dieser Ansatz ermöglicht die effiziente Integration mehrerer Genome und die Darstellung komplexer Variationen, wie strukturelle Varianten (SVs) und Vorhanden-Abwesenheit-Variationen (PAVs). Werkzeuge wie Minigraph und PGGB wurden entwickelt, um graph-basierte Pan-Genome zu konstruieren, was eine genauere Abgleichung von Reads und Variantenaufrufen im Vergleich zu traditionellen linearen Pan-Genomen ermöglicht. Graph-basierte Pan-Genome können mehrere Haplotypen und komplexe genomische Regionen effektiver handhaben, was sie besonders nützlich für Pflanzen-Genome mit hohen Anteilen an repetitiven Sequenzen und strukturellen Variationen macht.

2.3 Variantenaufruf und Genotypisierung

Pan-Genome erleichtert die Erkennung einer Vielzahl genetischer Varianten, einschließlich einzelner Nukleotid-Polymorphismen (SNPs), Insertionen/Löschungen (Indels) und struktureller Varianten (SVs). Variant-Erkennung In Pan-Genomen besteht der Prozess darin, Sequenzierungsreads an den Pan-Genom-Graphen auszurichten und Unterschiede zwischen den Reads und den Referenzsequenzen zu identifizieren. Genotypisierung weist bestimmten Allelen Individuen basierend auf den erkannten Varianten zu. Werkzeuge wie vg, GraphTyper und BayesTyper wurden entwickelt, um Variantenaufrufe und Genotypisierungen im Kontext von Pan-Genomen durchzuführen. Diese Werkzeuge können komplexe Variationen verarbeiten und liefern genauere Genotypisierungsresultate, insbesondere in Regionen mit hoher genetischer Vielfalt und repetitiven Sequenzen.

Anwendungen des Pan-Genoms in Pflanzen

Fallstudie: Pan-Genom-Analyse in Reis

In einer bahnbrechenden Studie, die in Genome Biology veröffentlicht wurde, entwickelten Wang et al. (2023) eine neuartige Pangenom-Analyse-Pipeline namens PSVCP (Presence/Absence Variation Calling Pipeline), um ein hochwertiges Reis-Pangenom zu erstellen und dessen Anwendungen in der funktionalen Genidentifikation zu erkunden. Diese Fallstudie hebt das Potenzial der Pangenomanalyse zur Aufdeckung genetischer Vielfalt und zur Verbesserung der Pflanzenzüchtung hervor.

Hintergrund

Reis (Oryza sativa L.) ist ein Grundnahrungsmittel für nahezu die Hälfte der Weltbevölkerung. Um der steigenden Nachfrage nach Nahrungsmittelproduktion angesichts des Klimawandels gerecht zu werden, ist es entscheidend, die Reisproduktivität durch genomikgestützte Züchtung zu erhöhen. Traditionelle genetische Analysen, die ein einzelnes Referenzgenom verwenden, führen oft zu Verzerrungen, insbesondere im Umgang mit signifikanten strukturellen Variationen (SVs) zwischen Individuen. Pan-Genome, die die vollständige genetische Vielfalt innerhalb einer Art repräsentieren, bieten einen umfassenderen Ansatz zur Erfassung genomischer Variationen.

Pangenome graph of rice.Abbildung 2. Merkmal des Reis-Pangenoms. (Jian Wang et al., 2023)

Methoden

Die Forscher verwendeten eine iterative Ausrichtungsstrategie, um ein linearisiertes Reis-Pangenom mit 12 repräsentativen Reisgenomen zu erstellen. Anschließend kartierten sie Sequenzierungsdaten mit kurzen Reads von 413 verschiedenen Reiszugängen auf dieses Pangenom, um Vorhandenheits-/Abwesenheitsvariationen (PAVs), Translokationen und Inversionen zu erkennen. Die Pipeline umfasste drei Hauptschritte: (1) Identifizierung neuer Segmente und deren Integration in das Referenzgenom, (2) Kartierung der Sequenzierungsreads auf das Pangenom zur Erkennung von PAVs und (3) Aufruf von SVs basierend auf dem Pangenom.

Ergebnisse

Das konstruierte Reis-Pangenom umfasste 24.585 neuartige Sequenzen, darunter 1.250 potenzielle Translokationen und 3.326 Inversionen. Die durchschnittliche Mapping-Rate zum Pangenom betrug 97,84 %, was deutlich höher ist als die Mapping-Rate von 93,05 % zum Nipponbare-Referenzgenom. Dies deutete darauf hin, dass das Pangenom mehr genetische Vielfalt erfasste als ein einzelnes Referenzgenom. Die Studie identifizierte 11.617 dispensable Gene in den 413 Reis-Zugängen, deren Funktionen mit Photosynthese, Abwehrreaktionen und Pathogenese in Zusammenhang standen.

Funktionale Genidentifikation

Die Forscher führten eine genomweite Assoziationsstudie (GWAS) unter Verwendung von sowohl SNPs als auch PAVs durch. Für das Tausendkorngewicht (TGW) identifizierte die SNP-GWAS 354 signifikante Assoziationen, während die PAV-GWAS die kausalen Variationen direkt feststellte. Ähnlich identifizierte die PAV-GWAS für die Pflanzenhöhe (PH) ein neuartiges Locus (qPH8-1), das von der SNP-GWAS nicht erkannt wurde. Dieses Locus enthielt eine 13-kb-Insertion, die mit signifikanten Unterschieden in der Pflanzenhöhe assoziiert war.

Schlussfolgerungen

Die PSVCP-Pipeline demonstrierte die Leistungsfähigkeit der Pan-Genom-Analyse zur Erfassung genetischer Vielfalt und Identifizierung funktioneller Gene. Das in dieser Studie konstruierte Reis-Pangenom bietet wertvolle Ressourcen für zukünftige Reisgenomforschungen und Züchtung. Die Fähigkeit, ursächliche PAVs für wichtige agronomische Merkmale zu identifizieren, unterstreicht das Potenzial von Pan-Genom-Ansätzen zur Beschleunigung der Pflanzenverbesserung und zur Bewältigung globaler Herausforderungen der Ernährungssicherheit.

Fallstudie: Evolution und funktionale Analyse der Annexin-Genfamilie im Pan-Genom von Mais

Pan-Genome haben eine entscheidende Rolle bei der Identifizierung funktioneller Loci gespielt, die mit der Domestikation und Züchtung von Nutzpflanzen verbunden sind. So wurde beispielsweise ein 10 kb PAV im Sojabohnen-Genom gefunden, der die Variation von Samenkapseln steuert. Bei Reis haben SV-basierte genomweite Assoziationsstudien (GWAS) potenzielle funktionelle SVs identifiziert, die mit Eigenschaften wie Blattalterung verknüpft sind. Diese Studien zeigen, dass Pan-Genome genetische Variationen erfassen können, die von herkömmlichen Ansätzen übersehen werden, und somit die Züchtungsbemühungen und das Verständnis der genetischen Vielfalt innerhalb von Pflanzenarten verbessern. Durch die Einbeziehung von Pan-Genome-Daten in Züchtungsprogramme können Forscher wünschenswerte Eigenschaften effektiver identifizieren und auswählen, was zu verbesserten Pflanzenvarianten mit höherem Ertrag, Krankheitsresistenz und Stressresistenz führt.

Gene structure of ZmAnn.Abbildung 3. Genstruktur von ZmAnn3 (a) und ZmAnn10 (b) in 26 Maishybridgenomen. (Liu, X, et al., 2025)

Hintergrund

Annexine (Anns) sind eine Familie von calciumabhängigen, phospholipid-bindenden Proteinen, die eine entscheidende Rolle im Pflanzenwachstum, in der Entwicklung und in den Stressreaktionen spielen. Das Verständnis der genetischen Mechanismen, die diesen Funktionen zugrunde liegen, ist entscheidend für die Verbesserung der Ernteproduktivität und der Stressresistenz. Diese Studie nutzt das Pan-Genom von 26 hochqualitativen Maisgenomen, um die Annexin-Genfamilie umfassend zu analysieren, einschließlich ihrer evolutionären Muster, Expressionsprofile und Rollen in Stressreaktionen.

Methoden

Die Forscher verwendeten HMMER und Blastp, um Annexin-Gene im Pan-Genom von Mais zu identifizieren, wobei 12 ZmAnn-Gene identifiziert wurden, darunter 9 Kern-Gene und 3 nahezu Kern-Gene. Eine phylogenetische Analyse wurde unter Verwendung eines Nachbar-Joining-Modells durchgeführt, und die Ka/Ks-Werte wurden berechnet, um selektive Drücke zu bewerten. Die Studie analysierte auch cis-regulatorische Elemente und strukturelle Variationen (SVs) in den Promotorregionen dieser Gene. Transkriptomdaten aus verschiedenen Maisgeweben unter Kältestress wurden für die Expressionsanalyse und den Aufbau eines Co-Expressionsnetzwerks verwendet.

Ergebnisse

Die Studie identifizierte 12 ZmAnn-Gene, wobei 9 Kern-Gene in allen 26 Maislinien und 3 nahezu Kern-Gene in 24–25 Linien vorkamen. Die Ka/Ks-Analyse ergab, dass ZmAnn10 in bestimmten Sorten unter positiver Selektion stand, während die verbleibenden Gene einer purifizierenden Selektion unterlagen. Die phylogenetische Analyse teilte die ZmAnn-Proteine in sechs Gruppen ein, wobei Gruppe VI nur ZmAnn12 enthielt. Strukturelle Variationen wurden festgestellt, die konservierte Domänen veränderten und atypische Gene erzeugten. Die Transkriptomanalyse zeigte unterschiedliche Expressionsmuster für verschiedene Ann-Mitglieder in verschiedenen Geweben und unter verschiedenen Stressbehandlungen. Die gewichtete Gen-Koexpressionsnetzwerkanalyse identifizierte vier Ann-Gene (ZmAnn2, ZmAnn6, ZmAnn7, ZmAnn9), die an Koexpressionsmodulen unter Kältestress beteiligt waren.

Schlussfolgerungen

Diese Studie analysiert umfassend die Annexin-Genfamilie in Mais und hebt deren evolutionäre Erhaltung und funktionale Vielfalt hervor. Die Identifizierung von Kern- und Nahe-Kern-Genen sowie Einblicke in deren Expressionsmuster und Rollen in Stressreaktionen unterstreichen die Bedeutung der Pan-Genom-Analyse zur Aufdeckung genetischer Vielfalt und funktionaler Mechanismen. Die Ergebnisse deuten darauf hin, dass bestimmte ZmAnn-Gene, wie ZmAnn2 und ZmAnn7, eine bedeutende Rolle bei der Kältetoleranz spielen und potenziell neue Ziele für die Züchtung von Maisvarianten mit verbesserter Stressresistenz bieten.

Herausforderungen und zukünftige Richtungen

Berechenbarkeit und Komplexität

Der Aufbau und die Analyse von Pan-Genomen erfordern erhebliche Rechenressourcen, insbesondere bei großen und komplexen Pflanzengenomen. Die Entwicklung effizienterer Algorithmen und Werkzeuge, die auf Pflanzengenomen zugeschnitten sind, ist entscheidend, um diese Herausforderung zu bewältigen. Aktuelle Werkzeuge haben oft Schwierigkeiten mit dem hohen Speicherbedarf und den langen Laufzeiten, die für den Aufbau von Pan-Genom-Grafiken sowie für die Variantenbestimmung und Genotypisierung erforderlich sind. Zukünftige Fortschritte in den Rechenmethoden und der Hardware werden entscheidend sein, um die Analysen von Pan-Genomen auf Tausende von Genomen auszuweiten.

Umgang mit strukturellen Variationen

Die genaue Erkennung und Darstellung von SVs in Pan-Genomen bleibt aufgrund ihrer Komplexität und der Anwesenheit repetitiver Sequenzen eine Herausforderung. Die Verbesserung der Auflösung und Genauigkeit der SV-Erkennung wird den Nutzen von Pan-Genomen in der Pflanzen-Genomik erhöhen. Aktuelle Methoden scheitern oft daran, SVs in repetitiven Regionen vollständig zu erfassen, was zu unvollständigen oder ungenauen Darstellungen der genetischen Vielfalt führt. Die Entwicklung neuer bioinformatischer Werkzeuge und Techniken, die besser mit repetitiven Sequenzen und komplexen SVs umgehen können, wird entscheidend sein, um die Studien zu Pan-Genomen in Pflanzen voranzutreiben.

Integration mit anderen Omics-Daten

Integration von Pan-Genom-Daten mit anderen Omics-Daten, wie z. B. Transkriptomik und Epigenomik, wird ein umfassenderes Verständnis der Pflanzenbiologie bieten. Dieser integrative Ansatz wird helfen, die funktionalen Auswirkungen genetischer Variationen und deren Rollen in der Pflanzenentwicklung und den Stressreaktionen zu verdeutlichen. Aktuelle Bemühungen in der Multi-Omics-Integration befinden sich noch in den Kinderschuhen, und es ist weitere Arbeit erforderlich, um robuste Methoden zur Kombination und Analyse dieser vielfältigen Datensätze zu entwickeln. Zukünftige Studien sollten sich darauf konzentrieren, integrative bioinformatische Pipelines zu entwickeln, die das volle Potenzial von Pan-Genom-Daten in Kombination mit anderen Omics-Daten nutzen können.

Fazit

Pan-Genome haben sich als leistungsstarkes Werkzeug in der Pflanzen-Genomik etabliert und bieten eine umfassendere Darstellung der genetischen Vielfalt im Vergleich zu traditionellen Einzelreferenz-Genomen. Sie haben die Entdeckung zuvor verborgener genetischer Variationen erleichtert, Einblicke in die Domestikation und Züchtung von Pflanzen gegeben und die Identifizierung funktioneller Gene ermöglicht. Trotz der Herausforderungen werden laufende Fortschritte in der Sequenzierungstechnologie und in bioinformatischen Werkzeugen weiterhin die Anwendungen von Pan-Genomen in der Pflanzenforschung und -zucht verbessern, was letztendlich zur globalen Ernährungssicherheit und nachhaltigen Landwirtschaft beiträgt. Zukünftige Arbeiten sollten sich auf die Entwicklung effizienterer rechnergestützter Methoden, die Verbesserung der Genauigkeit der SV-Erkennung und die Integration von Pan-Genom-Daten mit anderen Omik-Daten konzentrieren, um ein ganzheitliches Verständnis der Pflanzenbiologie zu erlangen.

Referenzen:

  1. Du, ZZ., He, JB. & Jiao, WB. Pflanzengraph-basierte Pangenomik: Techniken, Anwendungen und Herausforderungen. aBIOTECH (2025). Es tut mir leid, aber ich kann den Inhalt von externen Links nicht abrufen oder übersetzen. Wenn Sie mir den Text zur Verfügung stellen, den Sie übersetzt haben möchten, helfe ich Ihnen gerne weiter.
  2. Liang, W., Zhao, Y., et al. (2019). Nicht-invasive Diagnose von Lungenkrebs im Frühstadium durch hochdurchsatzfähige gezielte DNA-Methylierungssequenzierung von zirkulierender Tumor-DNA (ctDNA). Theranostik, 9(7), 2056–2070. Es tut mir leid, aber ich kann den Inhalt von URLs nicht abrufen oder übersetzen. Wenn Sie den Text hier einfügen, helfe ich Ihnen gerne bei der Übersetzung.
  3. Liu, X., Zhang, M., et al. (2025). Die Evolution, Variation und Expressionsmuster der Annexin-Genfamilie im Maiss-Pan-Genom. Wissenschaftliche Berichte, 15(1), 5711. Es tut mir leid, aber ich kann keine Inhalte von externen Links übersetzen. Bitte geben Sie den Text, den Sie übersetzen möchten, direkt hier ein.
Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Verwandte Dienstleistungen
PDF herunterladen
* E-Mail-Adresse:

CD Genomics benötigt die von Ihnen bereitgestellten Kontaktdaten, um Sie über unsere Produkte und Dienstleistungen sowie andere Inhalte, die für Sie von Interesse sein könnten, zu kontaktieren. Indem Sie unten klicken, stimmen Sie der Speicherung und Verarbeitung der oben angegebenen persönlichen Informationen durch CD Genomics zu, um die von Ihnen angeforderten Inhalte bereitzustellen.

×
Anfrage für ein Angebot
! Nur für Forschungszwecke, nicht zur klinischen Diagnose, Behandlung oder individuellen Gesundheitsbewertung bestimmt.
Kontaktieren Sie CD Genomics
Allgemeine Geschäftsbedingungen | Datenschutzerklärung | Rückmeldung   Urheberrecht © CD Genomics. Alle Rechte vorbehalten.
Oben