¿Cómo borro los caracteres que no son UTF8 de una cadena de rubíes? Tengo una cadena que tiene, por ejemplo, "xC2" en ella. Quiero eliminar ese carácter de la cadena para que se convierta en un UTF8 válido.¿Eliminar caracteres no UTF de una cadena en Ruby?
Este:
text.gsub!(/\xC2/, '')
devuelve un error:
incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)
que estaba viendo text.unpack ('T *') y string.pack también, pero no llegaron a ninguna parte.
Puede encontrar http://stackoverflow.com/questions/11375342/stringencode-not-fixing-invalid-byte-sequence-in-utf-8-error/ useful –