tenemos una aplicación web donde permitimos a los usuarios ingresar su propio html en un área de texto. Guardamos esos datos en nuestra base de datos.htmlentities() hace que los caracteres chinos sean inutilizables
Cuando cargamos los datos html en el área de texto, por supuesto, usamos htmlentities() antes de arrojar los datos html en el área de texto. De lo contrario, los usuarios podrían guardar dentro del área de texto y nuestra aplicación se rompería al cargar eso en el área de texto.
esto funciona muy bien, excepto cuando se ingresan caracteres chinos (y probablemente otros idiomas como árabe, japonés).
Los htmlentities() hace que el texto chino inservible como esto: èóüçï Cuando quito los htmlentities() antes de cargar el entró en html en el área de texto, los caracteres chinos aparecen bien, pero luego tenemos el problema de que HTML interfiere con nuestro área de texto, especialmente cuando un usuario ingresa dentro del área de texto.
Espero que tenga sentido.
¿Alguien sabe cómo podemos permitir de manera segura y correcta idiomas como el chino, japonés, ... para ser utilizados dentro de nuestra área de texto, mientras que todavía es seguro para cargar cualquier html dentro de nuestra área de texto?
Intente especificar el parámetro 'charset' – Robik
¿Qué codificación de caracteres está utilizando? – GordonM
¿Qué juego de caracteres está definido para tu página? –