Reduzierte Repräsentationsgenomsequenzierung (RRGS) bezieht sich auf die gezielte Sequenzierung spezifischer Abschnitte des Genoms. Diese hochmoderne Technologie verwendet Restriktionsendonukleasen, um genomisches DNA enzymatisch zu sequenzieren, was eine Hochdurchsatzsequenzierung der enzymatisch sequenzierten Segmente ermöglicht.
Die Bibliothekskonstruktionsmethode klassifiziert RRGS in drei Hauptkategorien: Reduzierte Repräsentationsbibliotheken (RRL), Restriktionsstellen-assoziierte DNA (RAD), und Genotypisierung durch Sequenzierung (GBS)Besonders hervorzuheben sind RAD und GBS als die am weitesten verbreiteten Methoden, mit Varianten wie 2b-RAD, dd-RADund SLAF diese Techniken in verschiedenen Aspekten verfeinert und weiterentwickelt.
Im Bereich der RRGS spielt die RAD-Sequenzierung eine entscheidende Rolle. Im Folgenden werden die Methoden und Schritte erläutert, die an der RAD-Sequenzierung beteiligt sind.
Für optimale Ergebnisse ist es ratsam, ein DNA-Extraktionskit zu verwenden, um DNA von beiden Eltern und Populationen zu extrahieren, und dabei das Standardverfahren zu befolgen. In Fällen, in denen DNA mit der traditionellen SDS- oder CTAB-Methode extrahiert wurde, wird ein zusätzlicher Extraktionsschritt empfohlen, um Proteine und RNA zu entfernen.
Die Einhaltung dieser Richtlinien wird zur Gewinnung von hochwertigen DNA-Proben beitragen, die für nachfolgende Analysen unerlässlich sind.
Um den Prozess zu optimieren Genomsequenzierung Der Prozess für Arten ohne Referenzgenome beginnt mit der sorgfältigen Auswahl eines geeigneten Restriktionsendonukleasen zur Verdauung des Zielgenoms. Diese Wahl kann durch bestehende Literatur oder durch Verweise auf genomische Informationen von eng verwandten Arten mit sequenzierten Genomen informiert werden. Gleichzeitig werden mit der ausgewählten Endonuklease enzymatische Vorversuche am Genom durchgeführt, wobei die anschließende Auswahl der am besten geeigneten Endonuklease für weitere Experimente auf den Ergebnissen der Vorversuche basiert. Im Folgenden sind die Schritte für den Bibliotheksaufbau und die Sequenzierung aufgeführt:
Befestigen Sie Adapter an beiden Enden der verdauten DNA-Fragmente, wobei der Single-Enzym-RAD an einem Ende eine Barcode-Sequenz und am anderen Ende keinen Barcode enthält, und Doppel-Enzym RAD enthält Barcode-Sequenzen an beiden Enden.
Es ist erwähnenswert, dass die sequenzierten Fragmente, die aus der Einzel- und Doppelverdauung von RAD gewonnen werden, unterschiedlich sind. Fragmente von Einzelne Verdauung RAD sind nicht orientiert., die nur auf der Seite mit der Spaltstelle ausgerichtet sind. Im Gegensatz dazu sind Fragmente aus der doppelten Verdauung RAD ausgerichtet und ordnen die Reads auf beiden Seiten an.
(1) Datenqualitätskontrolle
Nach dem Erwerb der anfänglichen sequenzierten Sequenzen (Sequenzierte Reads) folgte ein sorgfältiger Prozess der Qualitätskontrolle. Dies umfasste das Filtern von Spleißsequenzen, PolyN, PolyA und anderen unerwünschten Sequenzen, was zu einem verfeinerten Datensatz führte, der als 'cleandata' bezeichnet wird.
(2) Stichprobenklassifizierung und RAD-Tag-Clustering mit Barcodes
Nach der Qualitätskontrolle wurden die Proben mithilfe von Barcodes klassifiziert. Duplikate, die durch die PCR-Amplifikation entstanden, wurden systematisch entfernt. Anschließend erleichterte das ustacks-Modul der Stack-Software die Zusammenstellung von Clustern. Die Tag-Klusterung, die für die Organisation und Gruppierung ähnlicher Sequenzen entscheidend ist, wurde dann basierend auf den Sequenzähnlichkeiten innerhalb des Datensatzes durchgeführt.
Nach dem Ausschluss von RAD-Tags mit hoher Leselängentiefe (>500) wurden biparentale RAD-Tags einer umfassenden Analyse durch BLAST-Vergleich unterzogen. Dieser Prozess führte zur Identifizierung von SNPs und echten InDels (≥2 bp) aus den Vergleichsergebnissen. Anschließend wurden diese Varianten in segregierenden Populationen überprüft, wobei nur SNPs, die in beiden elterlichen und populationsbezogenen Datensätzen konsistente Polymorphismen aufwiesen, beibehalten wurden.
Im Falle von einzel-enzymschnittige RADsSequenzen von der gegenüberliegenden Seite jedes RAD-Tags wurden sorgfältig zusammengefügt, um Contigs zu erzeugen. Diese Contig-Sequenzen wurden ebenfalls zur Identifizierung von SNPs und InDels verwendet. Darüber hinaus diente eine Contig-Sequenz, die ein einfaches Sequenzwiederholungsmuster (SSR) enthielt, als wertvolle Ressource für die Entwicklung von PCR-Markern.
Die Segregationsverhältnisse aller Marker innerhalb segregierender Populationen wurden einer gründlichen Prüfung mittels des Chi-Quadrat-Tests unterzogen. Nur Marker, die Segregationsverhältnisse aufwiesen, die mit dem Vererbungsmuster eines einzelnen Locus übereinstimmten und bei denen die Löschungsdaten unter 40 % lagen, wurden für den Prozess der Konstruktion des genetischen Karten berücksichtigt. Beispielsweise wurden in der F2-Population, die dem Verhältnis 1:2:1 (reiner Elternteil 1: heterozygot: reiner Elternteil 2) entspricht, und in der RIL-Population mit einem Verhältnis von 1:1 (reiner Elternteil 1: reiner Elternteil 2) Marker ausgewählt, die diese Kriterien erfüllten.
Um voreingenommene segregierende Marker zu berücksichtigen, wurden nur diejenigen mit einer minimalen Allelfrequenz, die einen kritischen Wert in der Population überschreiten, beibehalten, wobei Erkenntnisse aus der Literatur zur Zielart herangezogen wurden. Die Software Joinmap erwies sich als entscheidend für die anschließende Konstruktion des genetischen Karten.
(1) Lokalisierung von Qualitätsmerkmal-Genen
Während RAD-Sequenzierung weniger häufig für die Lokalisierung von Genen für Qualitätsmerkmale verwendet wird, ist es ratsam, phänotypische Daten sowohl aus der F2-Population als auch aus den F2:3-Familienlinien einzubeziehen. Dieser Ansatz ermöglicht die Identifizierung von heterozygoten Genotypen, die mit dem Zielmerkmal innerhalb der F2-Monokultur assoziiert sind. Die phänotypischen Daten aus der F2 können als ein Marker behandelt werden, während die genotypischen Daten der verbleibenden Marker in Joinmap zur Kartierung eingegeben werden. Für optimale Ergebnisse bei der Lokalisierung von Genen für Qualitätsmerkmale ist jedoch die Bulk-Segregationsanalyse (BSA) Eine Strategie wird empfohlen.
(2) QTL-Lokalisierung
RAD-Sequenzierung findet zunehmend Anwendung bei der QTL-Lokalisierung, was robuste phänotypische Daten der Population und eine Population von rekombinanten inbred Linien mit mindestens F6-Generationen erfordert. Eine umfassende Datenerhebung über mindestens zwei Jahre für jede Familienlinie in der Population ist unerlässlich. Dies beinhaltet randomisierte Blockversuche mit drei Wiederholungen pro Punkt und Jahr. Ungenaue Ergebnisse bei der QTL-Lokalisierung können bei weniger Wiederholungen auftreten. Idealerweise sollte das Zielmerkmal eine hohe Erblichkeit aufweisen, und sein Phänotyp sollte minimal von Umweltbedingungen beeinflusst werden. Die Wahl der geeigneten Software zur QTL-Lokalisierung sollte mit den Eigenschaften der Zielpopulation und der Anzahl der für den QTL-Lokalisierungsprozess verfügbaren Marker übereinstimmen.