Tengo cuatro opciones en Dreamweaver: C, D, KC, KD. ¿Cuál debería elegir y por qué?¿Cuál es la mejor forma de normalización de Unicode?
Respuesta
¿Para qué? Guardando un archivo, usa NFC como lo usa el modelo de personaje web (estrictamente, la normalización W3C insiste en que tanto la secuencia esté en NFC como también cuando las entidades en HTML o XML se conviertan a los caracteres que representan, que aún esté en NFC) Las probabilidades de que alguna vez marquen una diferencia práctica son escasas, aunque podrían evitar algunos problemas bastante oscuros que molestan a alguien más adelante.
La normalización hace que ciertas secuencias equivalentes den como resultado flujos idénticos. Por ejemplo, U + 0065 (e) seguido de U + 0301 (un acento agudo que combina) es equivalente a U + 00E9 (é) por sí mismo.
NFD divide todas esas cadenas en sus componentes (por ejemplo, convertir U + 00E9 en U + 0065 seguido de U + 0301). Si hay dos o más caracteres combinados en una fila, se reordenan de acuerdo con reglas que dan una consistencia (ḉ podría tener la cedilla seguida por el accute o el accute seguido de la cedilla, y necesitamos un orden consistente para tener la misma cuerda producida). En su mayoría, NFD es útil para el procesamiento interno como parte de otra tarea, como pelar acentos o producir NFC.
NFC comienza con NFD y luego combina los caracteres juntos nuevamente donde sea posible, salvo algunas excepciones para garantizar que lo que era una cadena normalizada con una versión de Unicode permanezca así con otro.
NFKD va más allá de NFD al reemplazar ciertos caracteres similares entre sí. ⁵ por ejemplo, se reemplaza por 5. Esto "daña" el texto (un usuario puede elegir razonablemente ⁵ más de 5 por una buena razón) pero es útil para buscar (buscar "pez" en google y arroja resultados para "pez" porque trata las long-s lo mismo que short-s) y como una restricción en ciertos casos para evitar problemas de seguridad con caracteres similares pero diferentes. NKFC primero hace NFKD y luego se combina de la misma manera que NFC.
http://unicode.org/reports/tr15/ para el flaco completo, y "usa NFC pero no te preocupes por eso" para repetir la respuesta corta.
- 1. Normalización de JavaScript Unicode
- 2. Ruby 1.9 no es compatible con la normalización Unicode aún
- 3. Normalización de cadenas Unicode en C/C++
- 4. Expectativas del usuario y normalización Unicode
- 5. ¿Cuál es la mejor forma de distribuir Lua y bibliotecas?
- 6. ¿Cuál es la mejor forma de ejecutar expresiones matemáticas?
- 7. ¿Cuál es la mejor/más segura forma de reinstalar Homebrew?
- 8. ¿Cuál es la mejor forma de usar NLog con MEF?
- 9. ¿Cuál es la mejor forma de analizar cadenas?
- 10. ¿Cuál es la mejor forma de generar rangos en MYSQL?
- 11. ¿Cuál es la mejor forma de precompilar JSP con Ant
- 12. ¿Cuál es la mejor forma de obtener Contexto?
- 13. ¿Cuál es la mejor forma de diseñar una clase C#?
- 14. ¿Cuál es la mejor forma de formatear C# en WordPress?
- 15. ¿Cuál es la mejor forma de distribuir aplicaciones Java?
- 16. ¿Cuál es la mejor forma de organizar el código?
- 17. ¿Cuál es la mejor forma de convertir enum a string?
- 18. ¿Cuál es la mejor forma de convertir ByteString en Int?
- 19. ¿Cuál es la mejor manera de eliminar acentos en una cadena unicode de Python?
- 20. ¿Es esta la mejor forma de deshacer las secuencias de escape unicode en Ruby?
- 21. ¿Cuál es la forma mejor diseñada que jamás haya visto?
- 22. ¿Cuál es la categoría {L} Unicode?
- 23. ¿Cuál es la siguiente cadena Unicode \ xe9?
- 24. ¿Cuál es la forma correcta de redirigir?
- 25. ¿Cuál es la mejor manera de identificar archivos de texto codificados en Unicode en Windows?
- 26. ¿Cuál es la forma correcta de usar los metadatos Unicode en setup.py?
- 27. ¿Cuál es la forma correcta de codificación URL de caracteres Unicode?
- 28. ¿cuál es la forma de representar un unichar en lua
- 29. ¿Cuál es la mejor forma de convertir TBytes (UTF-16) en una cadena?
- 30. ¿Cuál es la forma óptima multiplataforma de manejar cadenas Unicode bajo C++?