Die reduzierte Repräsentations-Sequenzierung (RRS) ist ein Ansatz zur Generierung von genomweiten Hochdurchsatz-Sequenzierungsdaten und zur Gewinnung einer großen Anzahl von genetischen Polymorphismus-Tag-Sequenzen, um die gesamten Genominformationen der Art vollständig darzustellen. RRS vereinfacht nicht nur die Sequenzierungsmethode, da nur die verdauten Fragmente sequenziert werden, sondern vereinfacht auch das sequenzierte Genom. Daher wird es häufig in der Entwicklung molekularer Marker, der Analyse der Populationsgenetik, dem Bau genetischer Karten, der QTL-Kartierung, der genomweiten Assoziationsanalyse und in anderen Bereichen der Populationsforschung und der molekularen Züchtung eingesetzt.
Es gibt mehrere verschiedene Methoden der RRS, einschließlich GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, usw. Die Prinzipien dieser Methoden sind im Grunde genommen gleich, die Unterschiede liegen darin, ob Einzel- oder Doppelrestriktionsenzyme verwendet werden, ob zufällige Brüche erforderlich sind, ob ein Barcode benötigt wird, ob ein spezielles Kit erforderlich ist, das Design des Adapters und andere Details. Die detaillierte Einführung in diese Methoden ist wie folgt:
Abbildung 1. Experimenteller Prozess jeder Methode
Die detaillierten Unterschiede in den verwendeten Methoden der RRS bestimmen ihre Unterschiede in der Anwendung. In der folgenden Tabelle werden verschiedene RRS-Methoden verglichen: (siehe Tabelle 1)
Je nach den unterschiedlichen experimentellen Zwecken variiert die Anzahl der benötigten Marker erheblich. Für Studien, die notwendig sind, um Forschung zu funktionalen Intervallscans und funktionalem Gen-Mining im gesamten Genom durchzuführen, wie GWAS und Analysen des Selektionsdrucks, werden Zehntausende von hochdichten Molekülen benötigt. Die Dichte der molekularen Marker für Studien zu phylogenetischen Beziehungen, Kopplungsanalysen, geografischer Populationsstruktur, Genfluss und Abstammungstests muss jedoch nicht so hoch sein; in der Regel genügen einige Hundert bis einige Tausend molekulare Marker, um die Studien abzuschließen. Bei Genkartierungsstudien beeinflussen auch unterschiedliche Forschungsressourcen und Kartierungspopulationen die Anzahl der benötigten Marker. Zum Beispiel hängt die Anzahl der für die genomweite Assoziationsanalyse mit natürlichen Populationen erforderlichen Marker von der LD-Abklingdistanz der Art ab; je schneller der Abfall, desto mehr Marker werden benötigt.
Die Anzahl der Marker, eingestuft nach: RAD≥GBS/SLAF>2b-RAD, sodass die Anzahl der für die Studie benötigten Marker zunächst bewertet werden kann und anschließend die geeignete vereinfachte Genomsequenzierungstechnologie ausgewählt werden kann.
Wenn die Forschungsart kein Referenzgenom hat oder die Qualitätsstufe des Referenzgenoms schlecht ist, kann die RAD-Technologie häufiger verwendet werden, da die RAD-Technologie Fragmente von bis zu 400~500 bp durch partielle Assemblierung erhalten kann, was die Entwicklung von SSR-Molekularmarkern und das anschließende Primerdesign begünstigt; GBS/SLAF kann ebenfalls Clusterverfahren verwenden, um Konsenssequenzen zu erstellen, um SNPs zu detektieren; 2b-RAD ist aufgrund seiner kurzen Fragmente anfällig für Störungen durch repetitive Sequenzen, und es ist nicht förderlich, Primer zu entwerfen, um die durch Sequenzierung erhaltenen SNPs zu überprüfen. Daher erfordert 2b-RAD normalerweise ein Referenzgenom.
Die Wahl des Enzyms wird durch die Anforderungen an die Markerdichte bestimmt. Das ausgewählte Enzym sollte für die untersuchte Art geeignet sein (zum Beispiel sollte die Anzahl der Enzyme in den repetitiven Regionen der Art berücksichtigt werden); einige Enzyme sind für bestimmte Arten geeignet, aber nicht unbedingt für andere Arten; Enzymverdauungsfragmente haben normalerweise klebrige Enden, und unterschiedliche klebrige Enden können unterschiedliche Adapterdesigns erfordern.
Die Effizienz der Verdauung durch Enzyme macht hochwertige DNA-Proben für den gesamten Prozess entscheidend; zudem erfordern verschiedene Methoden unterschiedliche Volumina an DNA-Proben.
Tabelle 1. Vergleich verschiedener Methoden, die von RRS verwendet werden
| Original RAD | 2bRAD | GBS | ddRAD | ddGBS | SALF | |
|---|---|---|---|---|---|---|
| Enzym | einzeln | IIB-Typ einfach | einzeln | doppelt | doppelt | doppelt |
| Enzym (abhängig von Art und Marker-Dichte) | EcoRⅠ、ShfⅠ,usw. | BsaXⅠ、AlfⅠ,usw. | ApekⅠ、MseⅠ,usw. | EcoRⅠ、MseⅠ,usw. | EcoRⅠ、MseⅠ,usw. | MseⅠ、HaeⅢ,usw. |
| Anzahl der Loci pro 1 Mb Genomgröße* | 30–500 | 50–1.000 | 5–40 | 0,3–200 | 0,3–200 | 50-80 |
| Größenauswahl | Ultraschallunterbrechung | Nein | spezifische Selektion durch PCR | Elektrophoretisches Gel schneiden | Elektrophoretisches Gel schneiden | Elektrophoretisches Gel schneiden |
| Länge der Orte | ≤1kb kann erhalten werden; andernfalls ≤300bp | 33–36 bp | <300bp | 300-500 bp | <300bp | 450-500 bp |
| Genom-Erfassungsbereich | 10 % | 1% | 1-3% | 1-3% | 1-3% | 1-3% |
| Identifizierung von PCR-Duplikaten | Mit Paar-End-Sequenzierung | Nein | Mit degenerierten Barcodes | Mit degenerierten Barcodes | Mit degenerierten Barcodes | Mit doppelt degenerierten Barcodes |
| Variation der Anzahl der Tags | nein | ja | ja | ja | ja | ja |
| Anzahl der SNPs | hoch | niedrig | mäßig | mäßig | moderat | mäßig |
| Marker-Typ | SNP, Indel, SSR | SNP,Indel | SNP,Indel | SNP,Indel | SNP,Indel | SNP,Indel |
| Kosten | hoch | niedrig | mäßig | niedrig | niedrig | moderat |
| Referenzgenom erforderlich | beste | schlimmsten | mäßig | mäßig | mäßig | mäßig |
| Komplexes und großes Genom | beste | schlimmste | moderat | mäßig | gut | gut |
| Mustermenge | >1 µg | >1 µg | >200ng | >50ng | >50ng | >200 ng |
| Beispielinhalt | >50ng/µl | >250ng/µl | >10µg/µl | 100 ng/µl | 100 ng/µl | >10µg/µl |
| Spezialausrüstung erforderlich | Sonikator | Keine | Keine | Pippin Vorbereitung | Pippin Prep | Pippin Vorbereitung|| |
| Sequenzierungsstrategie (abhängig von Studienziel und Population) | <1X für das Genom mit vollständigem Referenz; 10-20X für de novo Lokusentdeckung oder Genotypisierung in diploiden Organismen; 5X für mehrere kombinierte de novo Proben; höher für polyploide Organismen. 10X für die Kopplungsanalyse von Elterlinien; 0,8-1,0X für Individuen von F1, F2; 0,6X für Individuen von RIL, DH; 1,5X für Individuen der Populationsgenetik. | 0,4-15X | >100 Tausend Tags/Probe; 10X/Tag; abhängig von der Genomgröße und der erforderlichen Marker-Dichte | <1X für Genom mit vollständigem Referenz; 10-20X für de novo Lokusentdeckung oder Genotypisierung in diploiden Organismen; 5X für mehrere kombinierte de novo Proben; höher für polyploide Organismen. 10X für die Verknüpfungskartierung von Elterlinien; 0,8-1,0X für Individuen von F1, F2; 0,6X für Individuen von RIL, DH; 1,5X für Individuen der Populationsgenetik-Analyse. | <1X für Genome mit vollständigem Referenz; 10-20X für de novo Lokusentdeckung oder Genotypisierung in diploiden; 5X für mehrere kombinierte de novo Proben; höher für polyploide. 10X für Verknüpfungskartierung der Elternlinien; 0,8-1,0X für Individuen von F1, F2; 0,6X für Individuen von RIL, DH; 1,5X für Individuen der populationsgenetischen Analyse. | <1X für Genom mit vollständigem Referenz; 10-20X für de novo Lokusentdeckung oder Genotypisierung in diploiden; 5X für mehrere kombinierte de novo Proben; höher für polyploide. 10X für Kopplungsanalyse der Elternlinien; 0,8-1,0X für Individuen von F1, F2; 0,6X für Individuen von RIL, DH; 1,5X für Individuen der populationsgenetischen Analyse. |
| Vorteile | Eine große Anzahl von Markern und lange Fragmente können für das Primer-Design erreicht werden. | einheitliche Fragmente, einfache Bedienung | einfache Bedienung | gleichmäßige Verteilung von Markern, steuerbare Anzahl von Markern | gleichmäßige Verteilung von Markern, steuerbare Anzahl von Markern | gleichmäßige Verteilung von Markern, steuerbare Anzahl von Markern |
| Nachteile | komplexe Experimentsdurchführung | kürzere Loci, nicht geeignet für komplexe und heterozygote Genome | weniger Loci als RAD, hohe Fehlerrate | weniger Loci als RAD | weniger Loci als RAD | Interferenz der DNA-Abbau, Datenverschwendung |
| Anwendungen | Forschung zu hochdichten Markern und Entwicklung molekularer Marker | einfaches Genom | große Proben und mehrere komplexe Genome mit hohen Wiederholungssequenzen | große Proben und multiple komplexe Genome mit hohen Wiederholungssequenzen | große Proben und multiple komplexe Genome mit hohen Wiederholungssequenzen | große Proben und mehrere komplexe Genome mit hoher Wiederholungssequenz |