Erforschung der Fülle und Verteilung von Wiederholungssequenzen in Insektengenomen
Was ist eine Wiederholungssequenz?
Wiederholungssequenzen spielen eine entscheidende Rolle für die Komplexität und Funktionalität von Genomen und können grob in zwei Typen unterteilt werden: verstreute Wiederholungssequenzen und tandem Wiederholungssequenzen. Verstreute Wiederholungen, wie Transposons, sind im gesamten Genom verteilt, während tandem Wiederholungen, wie Satelliten-DNA-Sequenzen, in zusammenhängender Weise auftreten. Diese Studie untersucht die Analyse von Wiederholungssequenzen innerhalb der Genome von etwa 600 Insektenarten und beleuchtet deren Vielfalt und Verteilung.
Die Landschaft der Wiederholungssequenzen in Insektengenomen
Die Häufigkeit von Wiederholungssequenzen in Insektengenomen ist bemerkenswert und reicht von 1,6 % bis zu beeindruckenden 81,5 %. DNA-Transposons sind die häufigste Art von Wiederholungssequenzen und kommen besonders häufig in den Käfer Bestellung, während Schmetterlinge Arten weisen einen relativ niedrigeren Anteil an DNA-Transposons auf.
Die repetitive Elementlandschaft von Insekten. (Sproul et al., 2023)
Linienartige Transposons - Ein enger Zweiter
Linienartige Transposons, obwohl sie die zweithäufigsten Wiederholungssequenzen sind, zeigen erhebliche Variationen zwischen den Insektenordnungen. Sie sind relativ seltener in Hymenopteraund macht lediglich 1,8 % ± 1,7 % des Genoms aus.
LTR-ähnliche Retrotransposons
Im Gegensatz dazu sind LTR-ähnliche Retrotransposons unter Insekten weniger verbreitet, aber auffällig zahlreich in Drosophila Arten. Es ist wichtig anzuerkennen, dass die Identifizierung von LTR-Transposons aufgrund ihrer größeren und komplexeren Struktur herausfordernd sein kann, was möglicherweise zu einer Unterschätzung ihrer Häufigkeit in anderen Insekten führt.
Statistische Zusammenfassungen der Dynamik repetitiver Elemente bei Insekten, Auswirkungen der Technologie. (Sproul et al., 2023)
Die Größe des Genoms zählt
Interessanterweise zeigt die Studie eine Korrelation zwischen der Genomgröße und dem Vorhandensein von Wiederholungssequenzen bei Insekten. Größere Genome neigen dazu, eine größere Häufigkeit dieser Sequenzen zu beherbergen.
Auswirkungen von Sequenzierungsmethoden
Die Untersuchung bewertet zudem den Einfluss von Sequenzierungsmethoden auf die Identifizierung repetitiver Sequenzen in Genomen. Langzeitbericht Die Sequenzierung übertrifft die Kurzlesesequenzierung, indem sie 36,1 % mehr Wiederholsequenzen identifiziert. Dieser Unterschied ist am ausgeprägtesten bei LTRs, mit einem erstaunlichen Anstieg von 162 % bei langen Leseweiten, gefolgt von einem Anstieg von 47 % bei der Identifizierung von DNA-Transposons.
Gene mit repetitiven Sequenzen
Im Vergleich von Genen, die repetitive Sequenzen enthalten (RE-assoziierte BUSCOs), stellt die Studie eine positive Assoziation zwischen der Präsenz von LINE-Transposons und der Anzahl solcher Gene fest. Zum Beispiel in Insekten wie Käfer und Schnabelkerfekönnen diese Gene bis zu 25 % aller Gene ausmachen, während Hymenoptera und Zweiflügler Arten zeigen einen viel niedrigeren Prozentsatz, der zwischen 1% und 2% liegt.
Insektenrepräsentation in Datenbanken für repetitive Elemente und Auswirkungen auf die RE-Erkennung. (Sproul et al., 2023)
Auswirkungen von Referenzdatenbanken
Die Identifizierung repetitiver Sequenzen ist stark von Referenzdatenbanken wie RepBase und Dfam abhängig. Bemerkenswerterweise zeigt diese Studie, dass die Abweichung der Insektenarten von Drosophila melanogaster mit einer verringerten Fähigkeit zur Identifizierung und Klassifizierung repetitiver Sequenzen verbunden ist. Zum Beispiel, Drosophila Arten zeigen nur 13,1 % unklassifizierter Wiederholungen, während andere Insektenklassen bis zu 40,5 % aufweisen können. Es ist wichtig zu beachten, dass diese unklassifizierten Wiederholungen im Allgemeinen kürzer sind.
Datenbank-Bias
Die Vorherrschaft repetitiver Sequenzen aus Mücken- und Fruchtfliegenfamilien in der RepBase-Datenbank unterstreicht den erheblichen Einfluss von Referenzdatenbankbias auf die Annotation und Identifizierung von Insektengenomen.
Fazit
Diese Studie bietet einen umfassenden Überblick über die Häufigkeit und Verteilung von Wiederholungssequenzen in der Genome verschiedener Insektenarten. Die Ergebnisse betonen die Rolle der Genomgröße, der Sequenzierungsmethoden und der Referenzdatenbanken bei der Gestaltung unseres Verständnisses von Wiederholungssequenzen. Darüber hinaus kann die Erhaltung größerer Genome mit einer höheren Häufigkeit repetitiver Sequenzen bestimmten Insektenarten adaptive Vorteile verschaffen, wie am Steinfalter (Köcherfliegen) beobachtet, wo Kladen mit größeren Genomen tendenziell eine höhere Polymorphie aufweisen und breitere ökologische Nischen besetzen.
Referenz:
- Sproul, John, et al. "600+ Insektengenomen zeigen die Dynamik repetitiver Elemente und heben die Herausforderungen bei der Annotation von Wiederholungen auf Biodiversitätsskala hervor." Genomforschung (2023): gr-277387.