2012-06-10 15 views
8

Tengo una pregunta simple: ¿cuál es la diferencia entre UTF-8, UTF-16 y UTF-32? Sé que las cadenas codificadas tienen diferentes tamaños, pero ¿cuál es el UTF-16 y UTF-32 para? No debería ser UTF-8 capaz de manejar todos los idiomas correctamente? ¿Y cómo encaja UTF-7 en esto?¿Diferencia entre las codificaciones UTF?

EDITAR

Ok, relativamente comprender los aspectos técnicos de todo el asunto, pero todavía no ven una razón por la que debería utilizar, por ejemplo, en lugar de UTF-16UTF-8 en mi aplicación. Entonces mi pregunta es: ¿cuál es el uso práctico de otras codificaciones, entonces UTF-8?

+1

Simplemente me gustaría conocer algunos ejemplos prácticos de UTF-32 digamos. ¿Tiene alguna aplicación real? –

Respuesta

2

Este artículo de la famosa Joel Spolsky lo explica perfctly: http://www.joelonsoftware.com/articles/Unicode.html

Cita:

Hay cientos de codificaciones tradicionales que sólo puede almacenar algunos puntos de código correcta y cambiar todos los demás puntos de código en signos de interrogación. Algunas codificaciones populares de texto en inglés son Windows-1252 (el estándar de Windows 9x para los idiomas de Europa occidental) e ISO-8859-1, también conocido como Latin-1 (también es útil para cualquier idioma de Europa occidental). Pero intente almacenar letras rusas o hebreas en estas codificaciones y obtendrá un montón de signos de interrogación. UTF 7, 8, 16 y 32 tienen la agradable propiedad de poder almacenar cualquier punto de código correctamente.

0

¿Quizás el Unicode FAQ ayudaría?

Hay un cuadro de comparación que resume algunas de las diferencias.

Cuestiones relacionadas