Me pregunto cómo limpiar los caracteres especiales que MS Word como, como m- y n-guiones y comillas?¿Cómo manejas los caracteres "especiales" que MS Word agrega?
A menudo me encuentro copiando contenido de clientes de Word y pegando en una página HTML estática, pero el contenido termina con caracteres extraños porque los caracteres especiales no se convierten a los códigos ACSII correctos y por lo tanto aparecen como texto ilegible. (Para estos sitios web básicos, estoy usando Dreamweaver.)
He visto muchos problemas similares cuando los clientes copian contenido de Word en campos de solo texto (principalmente textareas). Cuando pongo esto en un PDF (a través de PHP) o aparece en la página, también tiene texto ilegible.
¿Cómo lidiar con esto? ¿Hay algún servicio o programa de limpieza que use?
Para las páginas HTML en especial, todo es UTF-8, por lo que no es el problema. –
Si los personajes se confunden, NO todo es UTF-8. Los culpables comunes son un atributo faltante de juego de caracteres y ciertos navegadores web que no lo interpretan correctamente. –
Bueno, si algún navegador no lo interpreta bien, entonces diría que no funciona. Aquí está mi doctype, etc.:
¿Hay algo? mal allí? –