2012-07-21 23 views
13

en Unicode XML están representados de la siguiente manera:cadena Unicode en XML

por ejemplo:

\ue349 

¿Qué pasa si quiero escribir una cadena se compone de dos caracteres con unicodes E312 E343

¿Cómo puede esto se representa en XML?

+2

Así no se representan los caracteres Unicode en XML. XML usa '& # xE349;' para referencias numéricas. Lo que mostraste se usa en Java (entre otros). –

+0

Solía ​​usarlo en Android ... entonces, ¿cómo lo uso ahora como una cadena? –

Respuesta

17

XML no utiliza \ue349 notación. Character references, comenzando con &#, pueden ser utilizados, pero en su mayoría no son necesarios. XML se usa generalmente con la codificación de caracteres UTF-8, para que cada carácter se pueda escribir como tal. (Al generar XML en un programa, puede usar una notación como \ue349 si es compatible con el lenguaje de programación.)

En Unicode, los números E343 y E312 hacen referencia a los puntos de uso privados, a los que la estándar. Pueden ser utilizados por acuerdos privados como se desee, pero no debe esperar que ningún software o persona los entienda, excepto mediante dichos acuerdos. Teniendo esto en cuenta, los puntos de código U + E343 U + E312 (y, por lo tanto, los caracteres que pueden indicar mediante algún acuerdo) se pueden escribir como .

+0

¿Por qué no funciona cuando el Unicode comienza con D? –

+0

@NohaNhe, ¿qué no funciona en qué contexto? –

+0

por ejemplo xD8E1 –

11

<node>&#xE343;&#xE312;</node>

+0

Gracias, funciona –