2011-11-18 16 views

Respuesta

48

Establezca options(stringsAsFactors = FALSE) al comienzo de su sesión R, o en su .RProfile.

Como pueden sugerir los comentarios a continuación, stringsAsFactors es un tema un tanto controvertido dentro de la comunidad R. Lo irritante que encuentre este valor predeterminado puede depender en cierta medida del tiempo que pase usando R para adaptarse a muchos modelos estadísticos "estándar" (lm, glm, etc.). Muchas de las funciones relacionadas y de ajuste del modelo se basan en el uso del tipo de datos factoriales.

Si pasa la mayor parte de su tiempo realizando otros tipos de análisis de datos más "genéricos", es posible que este valor predeterminado sea más irritante.

Se considera ampliamente peligroso establecer globalmente stringsAsFactors = FALSE por los motivos que se mencionan a continuación: puede causar confusión significativa al compartir el código. De hecho, incluso si trabaja principalmente solo, participar en comunidades en línea como StackOverflow puede ser complicado si insiste en ejecutar R con stringsAsFactors = FALSE: su respuesta a una pregunta puede no funcionar para el OP, o es posible que no pueda replicar los errores que otros ¡viendo!

Por supuesto, todos pueden tomar sus propias decisiones sobre la mejor manera de gestionar estos riesgos por sí mismos.

+24

Tener este conjunto en su '.Rprofile' puede ser un poco arriesgado, ya que su código ya no es portátil. Como enseño mucho, decidí que sería muy fácil olvidarme de esta opción al pasar el código. – csgillespie

+11

realmente debería ser el predeterminado. mata mi productividad cuando se producen errores extremadamente extraños y difíciles de eliminar. recién ahora leí los parámetros de trazado de un archivo, lo olvidé y los gráficos estaban equivocados mientras seguía mostrando el título correcto y las descripciones de los ejes ... –

+0

debe ser el valor predeterminado en esa conversión, como as.data.frame(), debe mantener los datos subyacentes estructura de los objetos que están insertando en el marco de datos. –

Cuestiones relacionadas