Me gustaría utilizar el gsub de R para eliminar toda la puntuación de un texto, excepto los apóstrofos. Soy bastante nuevo en Regex, pero estoy aprendiendo.Eliminar toda la puntuación excepto los apóstrofes en R
Ejemplo:
x <- "I like %[email protected]*&, chew;: gum, but don't like|}{[] [email protected]#^)(gum!?"
gsub("[[:punct:]]", "", as.character(x))
Corriente de salida (sin apóstrofe en hacerlo no)
[1] "I like to chew gum but dont like bubble gum"
salida deseada (deseo del apóstrofe en no quedarse)
[1] "I like to chew gum but don't like bubble gum"
Kay su código elimina el apóstrofo. Esto es lo que creo que quiso decir 'gsub (" [^ [: alnum:] [: espacio:] '\ "]", "", x) ' –
Me gusta lo fácil que es esta codificación. –
+1 - La idea aquí apunta a ser la solución más clara posible, en mi opinión. Solo edite la segunda línea para leer 'gsub (" [^ [: alnum:] [: espacio:] '] "," ", x)' y es dorado. (FWIW, la barra invertida no es necesaria dentro de la expresión regular). –