Estoy usando la función prcomp
para calcular los dos primeros componentes principales. Sin embargo, mis datos tienen algunos valores NA y, por lo tanto, la función arroja un error. El na.action definido parece no funcionar a pesar de que se menciona en el archivo de ayuda ?prcomp
La función R prcomp falla con los valores de NA, aunque se permiten NA
Aquí está mi ejemplo:
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10))
prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
d$V1[5] <- NA
d$V2[7] <- NA
prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
estoy usando la más nueva versión R 2.15.1 para Mac OS X.
¿Alguien puede ver el motivo mientras prcomp
falla?
Aquí está mi nuevo ejemplo:
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
d$V1[5] <- NA
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
es posible conservar la fila 5 en PC1 y PC2? En mi conjunto de datos reales tengo, por supuesto, más de dos columnas de variables y solo algunas de ellas faltan y no quiero perder la información restante escondida en los otros valores.
Bien fantástico. Gracias por el enfoque de la fórmula! – user969113
Acepto que debe documentarse (soy el autor de la consulta en la lista de desarrollo R); la mejor manera de impulsar esto, si alguien quisiera, sería proponer un cambio en la documentación y enviarla a la lista de desarrollo r (y/o al rastreador de errores R). –