Cómo imprimir el número de caracteres en cada línea de un archivo de texto

Me gustaría imprimir el número de caracteres en cada línea de un archivo de texto usando un comando de Unix. Sé que es simple con powershellCómo imprimir el número de caracteres en cada línea de un archivo de texto

gc abc.txt | % {$_.length}

pero necesito el comando unix.

Fuente

2012-01-09 vikas368

Primera regla del desarrollo de software: "no" significa "no". Use "num" o "número". –

[citación necesitada]. – uprego

Usar Awk.

awk '{ print length($0); }' abc.txt

Fuente

2012-01-09 10:03:49

Creo que 'print length;' es equivalente y POSIX también http://pubs.opengroup.org/onlinepubs/9699919799/utilities/awk.html –

Esto también funciona en mac os. – bdemarest

while read -r line; do echo ${#line}; done < abc.txt

Es POSIX, así que debería funcionar en todas partes.

Editar: Agregado -r como lo sugiere William.

Fuente

2012-01-09 10:05:55

+1, pero ... esto fallará si la entrada contiene '\'. Use read -r –

Prueba esto:

while read line  
do  
    echo -e |wc -m  
done <abc.txt

Fuente

2012-01-09 10:09:24 Rahul

Quiere decir 'echo -e | wc -m', ¿verdad? Es un uso inútil de los comandos; shell puede contar caracteres en una variable. Además, 'echo -e' es totalmente incompatible y funciona en la mitad de las shells mientras se comienza con una secuencia de escape que funciona en otra y nada en el resto. –

Sí, correcto ... error. Gracias por señalarlo. – Rahul

Aquí está utilizando xargs ejemplo:

$ xargs -I% sh -c 'echo % | wc -c' < file

Fuente

2015-02-07 16:31:28 kenorb

Este "echo%" no maneja los caracteres inseguros que deben citarse desde el shell. Además, "xargs" va a dividir el archivo por espacios y líneas nuevas, no solo líneas nuevas, como solicitó el cartel original. – bovine

que he probado las otras respuestas mencionadas anteriormente, pero están muy lejos de las soluciones dignas cuando se trata de archivos de gran tamaño - especialmente una vez que el tamaño de una sola línea ocupa más de ~ 1/4 de RAM disponible.

Tanto bash como awk sorben toda la línea, aunque para este problema no es necesario. Bash errará una vez que una línea sea demasiado larga, incluso si tiene suficiente memoria.

Implementé una secuencia de comandos python extremadamente simple, no optimizada, que cuando se prueba con archivos grandes (~ 4 GB por línea) no gotea y es, con mucho, una solución mejor que las que se ofrecen.

Si este es el código de tiempo crítico para producción, puede volver a escribir las ideas en C o realizar mejores optimizaciones en la lectura (en lugar de leer solo un byte a la vez), después de probar que esto es un cuello de botella.

El código asume que newline es un carácter de salto de línea, que es una buena suposición para Unix, pero YMMV para Mac OS/Windows. Asegúrese de que el archivo finalice con un salto de línea para garantizar que no se pase por alto el último recuento de caracteres de la línea.

from sys import stdin, exit 

counter = 0 
while True: 
    byte = stdin.buffer.read(1) 
    counter += 1 
    if not byte: 
     exit() 
    if byte == b'\x0a': 
     print(counter-1) 
     counter = 0

Fuente

2015-02-11 21:08:35 user13972

Cómo imprimir el número de caracteres en cada línea de un archivo de texto

Respuesta

Cuestiones relacionadas