Tengo un marco de datos de 150,000 filas con 2,000 columnas que contienen valores, algunos de los cuales son negativos. Estoy reemplazando esos valores negativos por 0, pero es extremadamente lento hacerlo (~ 60 minutos o más).Valores de sustitución rápida en el marco de datos en R
df[df < 0] = 0
donde df[,1441:1453]
parece (todas las columnas/valores numéricos):
V1441 V1442 V1443 V1444 V1445 V1446 V1447 V1448 V1449 V1450 V1451 V1452 V1453
1 3 1 0 4 4 -2 0 3 12 5 17 34 27
2 0 1 0 7 0 0 0 1 0 0 0 0 0
3 0 2 0 1 2 3 6 1 2 1 -6 3 1
4 1 2 3 6 1 2 1 -6 3 1 -4 1 0
5 1 2 1 -6 3 1 -4 1 0 0 1 0 0
6 1 0 0 1 0 0 0 0 0 0 1 2 2
¿Hay una manera de acelerar dicho proceso, por ejemplo, la manera en que yo estoy haciendo es absolutamente lento, y hay un enfoque más rápido para esto? Gracias.
150.000 filas x 2000 columnas: Esto es correcto –
Puede usted por favor [mostrarnos] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) cómo son tus datos? ¿Son todas las columnas numéricas? – Roland