2012-09-30 66 views
20

Tengo una lista en R con los siguientes elementos:Cómo extraer elementos de una lista con elementos mixtos

[[812]] 
[1] ""    "668"   "12345_s_at" "667"   "4.899777748" 
[6] "49.53333333" "10.10930207" "1.598228663" "5.087437057" 

[[813]] 
[1] ""   "376"   "6789_at" "375"   "4.899655078" 
[6] "136.3333333" "27.82508792" "2.20223398" "5.087437057" 

[[814]] 
[1] ""    "19265"  "12351_s_at" "19264"  "4.897730912" 
[6] "889.3666667" "181.5874908" "1.846451572" "5.087437057" 

Sé que puedo acceder a ellos con algo como list_elem[[814]][3] en caso de que desea extraer el tercer elemento de la posición 814. Necesito extraer el tercer elemento de toda la lista, por ejemplo 12345_s_at, y quiero ponerlos en un vector o lista para poder comparar sus elementos a otra lista más adelante. A continuación se muestra el código:

elem<-(c(listdata)) 
lp<-length(elem) 
for (i in 1:lp) 
{ 
    newlist<-c(listdata[[i]][3]) ###maybe to put in a vector 
    print(newlist) 
} 

Al imprimir los resultados que obtengo el tercer elemento, pero como esto:

[1] "1417365_a_at" 
    [1] "1416336_s_at" 
    [1] "1416044_at" 
    [1] "1451201_s_at" 

por lo que no se puede atravesar con un índice como newlist[3], porque devuelve NA. ¿Dónde está mi error?

Respuesta

33

Si desea extraer el tercer elemento de cada elemento de la lista que puede hacer:

List <- list(c(1:3), c(4:6), c(7:9)) 
lapply(List, '[[', 3) # This returns a list with only the third element 
unlist(lapply(List, '[[', 3)) # This returns a vector with the third element 

Usando su ejemplo y teniendo en cuenta @GSee comentar que puede hacer:

yourList <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333", 
     "10.10930207", "1.598228663","5.087437057"), 
    c("","376", "6789_at", "375", "4.899655078","136.3333333", 
     "27.82508792", "2.20223398", "5.087437057"), 
    c("", "19265", "12351_s_at", "19264", "4.897730912", 
     "889.3666667", "181.5874908","1.846451572","5.087437057")) 

sapply(yourList, '[[', 3) 
[1] "12345_s_at" "6789_at" "12351_s_at" 

La próxima vez puede proporcionar algunos datos usando dput en una parte de su conjunto de datos para que podamos reproducir su problema fácilmente.

+7

Utilice 'sapply' para evitar la parte' unlist'. Además, creo que '[' sería suficiente. +1 – GSee

0

En caso de que quería utilizar el código que ha escrito en su pregunta, a continuación es la solución:

listdata <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333", 
     "10.10930207", "1.598228663","5.087437057"), 
    c("","376", "6789_at", "375", "4.899655078","136.3333333", 
     "27.82508792", "2.20223398", "5.087437057"), 
    c("", "19265", "12351_s_at", "19264", "4.897730912", 
     "889.3666667", "181.5874908","1.846451572","5.087437057")) 

v <- character() #creates empty character vector 
list_len <- length(listdata) 
for(i in 1:list_len) 
    v <- c(v, listdata[[i]][3]) #fills the vector with list elements (not efficient, but works fine) 

print(v) 
[1] "12345_s_at" "6789_at" "12351_s_at" 
6

Con purrr se puede extraer elementos y asegurar el tipo de datos de consistencia:

library(purrr) 

listdata <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333", 
     "10.10930207", "1.598228663","5.087437057"), 
    c("","376", "6789_at", "375", "4.899655078","136.3333333", 
     "27.82508792", "2.20223398", "5.087437057"), 
    c("", "19265", "12351_s_at", "19264", "4.897730912", 
     "889.3666667", "181.5874908","1.846451572","5.087437057")) 

map_chr(listdata, 3) 
## [1] "12345_s_at" "6789_at" "12351_s_at" 

Hay son otras funciones map_ que imponen la coherencia del tipo y un map_df() que finalmente puede ayudar a terminar con la locura do.call(rbind, …).

+0

muerto simple. esta es la respuesta moderna/ordenada a este problema. – Andrew

Cuestiones relacionadas