2012-09-28 41 views
5

Estoy creando una página HTML estática que muestra texto de cortesía en varios idiomas. Noté que si pego ウェブサイトのメンテナンスの下で en Expression Blend, ese texto aparece igual en el código. Creo que es malo para la compatibilidad y debería ser reemplazado por entidades HTML adecuadas.Codificación HTML de texto en japonés

He intentado http://www.opinionatedgeek.com/DotNet/Tools/HTMLEncode/encode.aspx pero me devuelve el mismo texto en japonés.

  1. ¿Es correcto, desde el punto de vista de la compatibilidad del navegador, pegar ese derecho japonés en el código fuente de una página HTML?
  2. De lo contrario, ¿cuál es la codificación HTML correcta de ese texto? O mejor, ¿hay alguna herramienta que pueda usar para convertir caracteres que no sean ASCII a entidades HTML, posiblemente en línea y posiblemente gratis?
+3

¿Qué le parece codificar y publicar páginas HTML Unicode? De esta forma, no tiene que preocuparse por las entidades HTML. – Andrew

+0

En una nota al margen ... ese texto japonés es un poco extraño. ¿Tal vez algo más como た だ だ す 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只 只? – jkerian

+0

Ni siquiera recuerdo para qué era ese texto y por qué lo pegué en Blend :-) –

Respuesta

2

creo que es malo para la compatibilidad y debe ser sustituido por entidades apropiadas HTML.

Muy por el contrario en realidad, su preferencia debe ser de no usar entidades HTML sino declarar correctamente la codificación del documento como UTF-8 y utilizar los caracteres reales. Hay quite a few compelling reasons to do so, pero la verdadera pregunta es por qué no lo usa, ya que es un estándar bien soportado y ampliamente respaldado.

Algunos de esos puntos have been summarised previously:

UTF-8 codificaciones son más fáciles de leer y editar para aquellos que entienden lo que significa el carácter y saben cómo escribir él.

UTF-8 codificaciones son tan ininteligible como entidad codificaciones HTML para aquellos que no entienden ellos, pero tienen la ventaja de representación como caracteres especiales en lugar de difícil de entender decimales o hexagonales codificaciones.

[Por ejemplo] Wikipedia ... en realidad revisar artículos y convertir entidades de caracteres en sus caracteres reales correspondientes por el bien de facilidad de uso y búsqueda.

1

Siempre que marque su página web como UTF-8, ya sea en los encabezados http o metaetiquetas, tener caracteres foráneos en sus páginas web no debería ser un problema. Alternativamente se podría codificar/decodificar estas cadenas utilizando funciones encodeURI/decodeURI en JavaScript

encodeURI('ウェブサイトのメンテナンスの下で') 
//returns"%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E3%83%A1%E3%83%B3%E3%83%86%E3%83%8A%E3%83%B3%E3%82%B9%E3%81%AE%E4%B8%8B%E3%81%A7" 

decodeURI("%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E3%83%A1%E3%83%B3%E3%83%86%E3%83%8A%E3%83%B3%E3%82%B9%E3%81%AE%E4%B8%8B%E3%81%A7") 
//returns ウェブサイトのメンテナンスの下で 

Si está buscando una herramienta para convertir un montón de cadenas estáticas a los caracteres Unicode, puede simplemente utilizar las funciones encodeURI/decodeURI de una Consola de desarrollador de página web (Firebug para Mozilla/Firefox). ¡Espero que esto ayude!

0

Las entidades HTML solo son útiles si necesita representar un carácter que no se puede representar en la codificación en la que se guarda el documento. Por ejemplo, ASCII no tiene ninguna especificación sobre cómo representar "€". Si desea usar ese carácter en un documento HTML codificado en ASCII, debe codificarlo como € o no usarlo en absoluto.

Si está utilizando una codificación de caracteres para su documento que puede representar todos los caracteres que necesita, como UTF-8, no hay necesidad de entidades HTML. Simplemente debe asegurarse de que el navegador sepa en qué codificación se encuentra el documento para que pueda interpretarlo correctamente. Este es realmente el método preferible, ya que simplemente mantiene el código fuente legible. Realmente no tiene sentido querer trabajar con entidades HTML si simplemente puedes trabajar con los personajes reales.

Para más información, ver http://kunststube.net/frontback.

Cuestiones relacionadas