Estoy usando el paquete R's ff
y tengo algunos objetos ffdf
(dimensiones alrededor de 1.5M x 80) con los que necesito trabajar. Sin embargo, estoy teniendo algunos problemas para entender las operaciones de rebanado/corte en cubitos.Subconjunto de objetos ffdf en R
Por ejemplo Tengo dos columnas de números enteros, "Año" y "edad", y quiero hacer una mesa de edad, cuando el año es 2005.
Uno de los enfoques es la siguiente:
ffwhich <- function(x, expr) {
b <- bit(nrow(x))
for(i in chunk(x)) b[i] <- eval(substitute(expr), x[i,])
b
}
bw <- ffwhich(a.fdf, YEAR==1999)
answer <- table(a.fdf[bw, "AGE"])
La operación table()
es rápida, pero construir el vector de bits es bastante lento. ¿Alguien tiene alguna recomendación para hacer esto mejor?
Si fuera 'ff', que podría hacer algo mucho más simple, como' con (subconjunto (a.fdf, AÑO == 1999), tabla (AGE)) '. 'ff' es la parte que lo hace más complicado. –