GEOquery ist ein großartiges R-Paket, um die im NCBI Gene Expression Omnibus (GEO) Datenbank gespeicherten Genexpressiondaten abzurufen und zu analysieren. Ich habe den folgenden Code verwendet, der vom GEO2R Service der GEO-Datenbank bereitgestellt wurde (der das ursprüngliche R-Skript generiert, um Ihre gewünschten Daten automatisch zu analysieren) um einige GEO-Serien von Experimenten zu extrahieren:
gset <- getGEO("GSE10246", GSEMatrix =TRUE)
if (length(gset) > 1) idx <- grep("GPL1261", attr(gset, "names")) else idx <- 1
gset <- gset[[idx]]
gset # displays a summary of the data stored in this variable
Das Problem ist, dass ich die Bezeichnungen der Proben nicht daraus abrufen kann. Ich habe eine Funktion Columns()
gefunden, die auf GDS-Datensätzen funktioniert und die Probenamen zurückgibt, aber nicht auf GSE-Datensätzen.
Bitte beachten Sie, dass ich nicht an Probe-Zugangs-IDs interessiert bin (z.B. GSM258609 GSM258610, usw.), was ich möchte, sind die menschenlesbaren Bezeichnungen der Proben.
Hat jemand eine Idee? Danke