No estoy muy seguro de cómo hacer esta pregunta realmente, y no estoy cerca de encontrar una respuesta, así que espero que alguien pueda ayudarme.Tratar con una cadena que contiene codificaciones de caracteres múltiples
Estoy escribiendo una aplicación de Python que se conecta a un host remoto y recibe datos de bytes, que descomprimo utilizando el módulo de estructura integrado de Python. Mi problema es con las cadenas, ya que incluyen codificaciones de caracteres múltiples. He aquí un ejemplo de una cadena como:
"^ L Este es un ejemplo^Gstring con múltiples^codificaciones Jcharacter"
Donde las diferentes aperturas de codificación y termina está marcado usando caracteres de escape especiales:
- ^L - Latin1
- ^E - Europa central
- ^T - turco
- ^B - Báltico
- ^J - Japonés
- ^C - cirílico
- ^G - Griego
Y así sucesivamente ... necesito una manera de convertir este tipo de cadena en Unicode, pero realmente no estoy Seguro cómo hacerlo. He leído sobre los códecs de Python y string.encode/decode, pero en realidad no soy más inteligente. Debo mencionar también que no tengo control sobre cómo el host genera las cadenas.
Espero que alguien me pueda ayudar con la manera de comenzar con esto.
¿Su analizador arroja algún error o le quedan cadenas de Python válidas, pero con codificaciones inutilizables? Si es así, las cosas se pueden arreglar. Proporcione una cadena de ejemplo, por favor. – DzinX
Me refiero a otro ejemplo que el anterior, ya que el ejemplo anterior solo tiene caracteres ASCII. – DzinX