Mikroarray ist eine leistungsstarke experimentelle Plattform, die gleichzeitig die Expression von Tausenden von Genen unter verschiedenen experimentellen Bedingungen untersuchen kann. Die gemeinsame Mikroarray-Techniken einschließen SNP-Mikroarray, CGH-Mikroarray, Genexpression mit DNA-Mikroarrays, DNA-Methylierungs-Mikroarray, usw. Das übergeordnete Ziel des Mikroarray Die Datenanalyse umfasst die Generierung von Rohdaten und die Bestimmung ihrer biologischen Bedeutung. Der typische Prozess kann in die folgenden Schritte unterteilt werden (Abbildung 1): Vorverarbeitung, Analyse differentiell exprimierter Gene, Klassenerkennung und -vorhersage sowie Annotation.
Abbildung 1. Der typische Prozess der Mikroarray-Datenanalyse.
Dienste, die Sie interessieren könnten
Vorverarbeitung von Mikroarray Daten umfassen in der Regel Bildanalyse, Qualitätsbewertung und Normalisierung.
Verschiedene Scanneinstellungen können zu unterschiedlichen Bildern führen, die die experimentellen Ergebnisse beeinflussen können. Die erzeugten Bilder werden dann mit Programmen wie Imagene oder GenePix quantifiziert. Die Intensitäten werden in der Regel als Durchschnitts- oder Medianpixelwert in dem gegebenen Bereich gemessen.
Die Qualitätsbewertung beginnt mit der visuellen Untersuchung der Bilder und Diagramme der Rohdaten. Erfahrene Forscher können erkennen, welche Arrays im Set von minderer Qualität sind oder ob einige Bereiche aufgrund von Kratzern usw. ungewöhnlich sind. Räumliche Diagramme können ebenfalls helfen, Regionen mit ungewöhnlichem Signal zu identifizieren.
Ein wichtiger Teil der Datenvorverarbeitung ist die Normalisierung, die die einzelnen Intensitäten anpasst, um Vergleiche sowohl innerhalb eines Arrays als auch zwischen Arrays im Experiment zu ermöglichen. Beispiele für Unterschiede, die angepasst werden müssen, sind ungleiche RNA-Mengen, Unterschiede in der Markierung und systematische Verzerrungen.
Die am häufigsten akzeptierte Form der Anpassung ist derzeit Lowess (lokal gewichtete kleinste Quadrate). Mikroarray Datenanalyse) (Abbildung 2). Obwohl diese Methode Farbstoff- und Intensitätsunterschiede entfernt, beseitigt sie nicht die räumlichen Muster. Bei einigen Arrays, wie z.B. Agilent-Arrays, werden die Druckspitzen während der Herstellung nicht verwendet, sodass es schwierig ist, das Array in Untergitter zu unterteilen, um räumliche Muster zu entfernen. Eine Alternative in dieser Situation ist die Verwendung von zweidimensionaler Glättung.
Abbildung 2. M vs A-Diagramme für rohe, nicht angepasste Daten (links) und nach Lowess-Normalisierung (rechts) (Corporation H P. 2004).
Um eine Gruppe von Folien zu analysieren, gehen die meisten statistischen Methoden davon aus, dass die Folien eine gleichmäßige Verteilung der Intensitätsniveaus aufweisen; andernfalls könnte eine Folie die Ergebnisse unfair beeinflussen. Der einfachste Weg, dieses Problem zu lösen, besteht darin, alle Arrays so zu skalieren, dass sie eine gleiche Varianz aufweisen, oder indem Folienkovariaten in das Modell aufgenommen werden, das zur Analyse der Daten verwendet wird. (Abbildung 3).
Abbildung 3. Boxplots, die die Verteilung der M-Werte in jedem der 6 Arrays zeigen, die im Rahmen desselben Experiments hybridisiert wurden, vor (links) und nach (rechts) der Skalennormalisierung (Corporation H P. 2004).
Ein wichtiges Ziel von Mikroarray Experimente dienen dazu, Gene zu identifizieren, die unter den untersuchten Bedingungen unterschiedlich exprimiert werden. Der Analyseprozess kann typischerweise in zwei Schritte unterteilt werden: 1) Filterung zur Identifizierung der unterschiedlich exprimierten Gene unter Verwendung einer Kombination von Kriterien, einschließlich der Faltung und der statistischen Signifikanz, die durch Vergleichsstatistiken bestimmt wird, und 2) Trennung dieser unterschiedlich exprimierten Gene in diskrete Gruppen oder Cluster basierend auf dem Expressionsmuster.
Unter beiden experimentellen Bedingungen sind der t-Test und der Wilcoxon-Test gängige Standardtestmethoden für die differentielle Expression von Genen zwischen zwei Proben. Unter zwei oder mehr experimentellen Bedingungen können das ANOVA-Modell und das gemischte Effektmodell effektiv angewendet werden. Der S+ Array-Analyzer umfasst mehrere Methoden für den Vergleich von zwei Proben und den Vergleich mehrerer Proben, einschließlich verschiedener Arten von t-Tests und Wilcoxon-Tests, die sowohl auf Verteilungen als auch auf permutationsbasierten Nullverteilungen basieren. Unabhängig von den verwendeten Teststatistiken sind multiple Vergleiche eine wichtige Überlegung angesichts der Anzahl der Gene und Tests.
Nachdem wir eine Liste von Genen mit unterschiedlichen Expressionsniveaus identifiziert haben, müssen wir diese Gene weiter basierend auf den Expressionsmustern klassifizieren. Clusterverfahren sind beschreibende oder explorative Werkzeuge, die verwendet werden können, um Gruppen innerhalb komplexer Datensätze zu identifizieren. Methoden wie die hierarchische Clusteranalyse können helfen, Muster in einem großen Datensatz zu erkennen, während Partitionierungsverfahren wie K-Means-Clusteranalyse verwendet werden können, um Daten in diskrete Gruppen oder Cluster zu unterteilen.
|
|
|
Die Studien zur Klassifizierung und Vorhersage von Klassen haben Auswirkungen auf die Tumorklassifikation und die Personalisierung. Traditionelle Methoden zur Tumorklassifikation basieren hauptsächlich auf morphologischer Analyse, die nicht sehr präzise ist. Mikroarrayen kann ein zuverlässigeres Werkzeug zur Identifizierung von Subklassen bieten, indem es molekulare Marker erkennt.
Die in S-PLUS verfügbaren Klassenvorhersagemethoden umfassen alle standardmäßigen statistischen Modellierungs- und überwachten Lernmethoden, wie Regression, Diskriminanzfunktionen, Bäume (CART und rekursive Partitionierung), neuronale Netze, verallgemeinerte additive Modelle und Support-Vektor-Maschinen.
Es gibt eine Reihe von Annotationsmetadaten, die für ein bestimmtes Gen verfügbar sind. Beispiele sind Unigene, LocusLink, Chromosomenzahl, chromosomale Lage, KEGG-Pfadinformationen und Gene Ontology (GO)-Kategorisierungen. A Mikroarray Datensatz umfasst typischerweise eine Reihe bekannter Identifikatoren, die den verwendeten Proben/Wahrscheinlichkeiten entsprechen. Diese Identifikatoren sind in der Regel einzigartig und können einfach mit der Metadatenquelle verknüpft werden, sodass jede Probe/Jahrgangsgruppe auf dem Mikroarray Chip wird verwendet, um verschiedene Annotationen zu finden. Gene werden mithilfe einiger Online-Datenbanken (wie Unigene, LocusLink, GO/Amigo) annotiert.
Minimale Informationen über ein Mikroarray Die MIAME-Standards beschreiben die minimalen Informationen, die erforderlich sind, um zu interpretieren. Mikroarray Daten und sicherstellen, dass die aus ihrer Analyse abgeleiteten Ergebnisse unabhängig überprüft werden können. Die erforderlichen Informationen umfassen Angaben wie Array-Plattform, experimentelles Design und Probenvorbereitung. Der MIAME-Standard wird als Leitfaden für die Einreichung verwendet. Mikroarray Daten- und Methodeninformationen sind in vielen Fachzeitschriften enthalten, und viele Zeitschriften verlangen von den Autoren, dass sie ihre Daten als Voraussetzung für die Veröffentlichung öffentlich zugänglich machen. Die MIAME-Liste ist verfügbar auf der Mikroarray Gene-Expressionsdaten (MGED) Webseite.
Mikroarray-Technologie bietet bemerkenswerte Vorteile für hochdurchsatzgenomische Studien und ermöglicht die gleichzeitige Analyse zahlreicher Gene. Seine Hauptmerkmale liegen in der Fähigkeit, umfassende Genexpressionsprofile bereitzustellen, unterschiedlich exprimierte Gene zu identifizieren und komplexe biologische Wege zu entwirren. Mikroarrays sich als besonders wertvoll in verschiedenen Anwendungen wie Krankheitsdiagnose, Arzneimittelentdeckung und individualisierter Medizin erweisen, wo Einblicke in Muster der Genexpression entscheidend sind. Die Mikroarray der Datenanalyseprozess umfasst mehrere entscheidende Phasen, um die Datenpräzision und -zuverlässigkeit zu gewährleisten. Im Wesentlichen Mikroarray Die Datenanalyse stellt einen robusten Ansatz zur umfassenden Untersuchung der Genexpression dar. Ihre umfassende Methodik, die von der Datenvorverarbeitung bis hin zu anspruchsvollen statistischen und funktionalen Analysen reicht, macht sie zu einer unverzichtbaren Ressource in Genomik Forschung, die unser Verständnis komplexer biologischer Systeme vorantreibt und den wissenschaftlichen Fortschritt fördert.
Die Prinzipien und der Workflow von SNP-Mikroarrays
Die Anwendungen von SNP-Mikroarray
Referenzen: