El método habitual de codificación URL de un carácter unicode es dividirlo en códigos HH al 2%. (\ u4161 =>% 41% 61)Decodificación de URL Unicode
Pero, ¿cómo es Unicode distingue al decodificar? ¿Cómo sabes que % 41% 61 es \ u4161 contra \ x41 \ x61 ("Aa")?
Son caracteres de 8 bits, que requieren codificación, precedidos por % 00?
¿O es que los caracteres Unicode se deben perder o dividir?
Esto es exactamente lo que se debe utilizar. Los personajes que mencionas pueden parecer extraños, pero ninguno de ellos serán personajes de control (así es como funciona el UTF-8) y esto es realmente bueno. –