2009-11-30 15 views
5

¿Cómo puedo leer correctamente los archivos en codificaciones que no sean UTF8 en Awk?¿Cómo leer archivos con diferentes codificaciones usando Awk?

Tengo un archivo en hebreo/codificación Windows-1255. Un simple {print $ 0} awk imprime cosas como . ¿cómo puedo leerlo correctamente?

+1

Es muy posible que tenga tanto que ver con su terminal como con awk. –

Respuesta

6

awk en sí no tiene ningún soporte para manejar codificaciones diferentes. Respetará la configuración regional especificada en el entorno, pero la mejor opción es transcodificar la entrada a la codificación adecuada antes de pasarla a awk.

-f es el formato que desea convertir, -t es el formato de destino, y -c omite cualquier carácter no válido que termine prematuramente la operación de iconv. Por supuesto --help dará más detalles.

iconv -c -f cp1255 -t utf8 somefile | awk ... 
+0

genial. Gracias. (caracteres de relleno ....) –

Cuestiones relacionadas