Cómo utilizar UTF-8 con tomcat

Tomcat no codifica correctamente los literales de cadena que contienen caracteres Unicode. El problema ocurre en un servidor Linux pero no en mi máquina de desarrollo (Windows). Afecta SOLAMENTE a los literales de cadena (¡no a las cadenas leídas desde la base de datos o desde el archivo!).Cómo utilizar UTF-8 con tomcat

He configurado el URIEncoding="utf-8" en la etiqueta del conector (server.xml).
He utilizado setCharacterEncoding().
He revisado el seguimiento de la pila (no hay filtros que puedan establecer la codificación).
yo he dado la variable de entorno LANG
I cheched las cabeceras HTTP y son correctos (Content-Type = text/plain; charset = UTF-8)
he comprobado la codificación en el navegador y es correcto (UTF-8)

Nada de lo anterior funciona. ¿Alguna idea sobre lo que me podría estar perdiendo?

public class Test extends HttpServlet { 

@Override 
protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { 

    resp.setCharacterEncoding("utf-8"); 
    resp.setContentType("text/plain;"); 

    Writer w = resp.getWriter(); 
    w.write("Μαλακία Latin"); //Some unicode characters 
    w.close(); 
}

Lo anterior muestra esto en el navegador. ii »Î» Î · Î½Î¹ÎºÎ¬ América

Fuente

2012-03-22 idrosid

Asegúrate de que el archivo de origen java tenga un conjunto de codificación utf-8. Uso Notepad ++ para verificar esto. Abra el archivo y verifique el menú "Codificación". Si la codificación no es UTF, corte todo el contenido del archivo fuente, cambie la codificación, pegue los contenidos del portapapeles y guarde el archivo fuente. –

Si ve la respuesta del servidor en un editor hexadecimal, ¿cuál es la secuencia de bytes actual devuelta? ¿Cuál es la codificación de su archivo fuente? – Mikaveli

* "El problema ocurre en un servidor Linux pero no en mi máquina de desarrollo (Windows)." * ¿Cómo se está implementando en Linux? ¿Estás transfiriendo archivos uno por uno? ¿Si es así, cómo? Por FTP? Si es así, ¿estás transfiriéndote en modo binario? – BalusC

Puede forzar la codificación de archivos cuando javac los lee al pasar -encoding 'utf-8' o -encoding 'iso-8859-1' durante la compilación. Solo asegúrate de que coincida con la codificación en la que tus archivos .java están realmente codificados.

http://docs.oracle.com/javase/6/docs/technotes/tools/windows/javac.html

codificación que codifica establecer el archivo de fuente nombre de codificación, tales como EUC-JP y UTF-8. Si no se especifica -codificación, se utiliza el convertidor predeterminado de la plataforma.

Fuente

2012-03-22 13:31:24 benmmurphy

esto, o use secuencias de escape unicode en su código java en lugar de caracteres. – jtahlborn

Pruebe a establecer la propiedad del sistema, por ejemplo file.encoding -Dfile.encoding=utf-8 en la línea de comandos de JVM de Linux

Fuente

2012-03-22 13:22:56

Estás muy cerca. Necesitaba agregar esto cuando ejecutaba javac. Lo que me confundió es que HICE ejecutar javac sin esta opción y funcionó bien. Sin embargo, cuando hormiga llamaba javac, probablemente estaba configurando otra codificación predeterminada. – idrosid

Esto me solucionó un problema donde mi .jsp incluía un fragmento de archivo HTML codificado en UTF-8. Al agregar este parámetro, el archivo se cargó correctamente. – JBCP

Más opciones están dentro de http: // stackoverflow.com/questions/11342884/change-tomcats-charset-defaultcharset-in-windows –

Cómo utilizar UTF-8 con tomcat

Respuesta

Cuestiones relacionadas