Me gustaría obtener su consejo/ayuda sobre cómo subconjuntar un archivo grande (millones de filas o líneas).cómo subconjunto de un archivo - seleccione un número de filas o columnas
Por ejemplo,
(1) Tengo archivo grande (millones de filas, delimitado por tabuladores). Quiero un subconjunto de este archivo con solo filas de 10000 a 100000.
(2) Tengo un archivo grande (millones de columnas, delimitadas por tabuladores). Quiero un subconjunto de este archivo con sólo las columnas de 10000 a 100000.
Sé que hay herramientas como la cabeza, cola, cortar, dividir y awk o sed. Puedo usarlos para hacer subconjuntos simples. Pero, no sé cómo hacer este trabajo.
¿Podría dar algún consejo? Gracias por adelantado.
+1 esta es la respuesta más simple que jamás podría pensar of.But el gato no se requiere here.we puede hacer esto sin cat.'awk 'NR> = 10000 && NR <= 100000 {print}' largefile' y 'cut -d '\ t' -f 10000-100000 largefile' – Vijay
@Rahul Dravid: gracias, lo agregaré – Drakosha
Puede acortar el primero a:' awk 'NR> = 10000 && NR <= 100000 'archivo grande', ese es un proceso menos, y la acción predeterminada de awk es imprimir si el rango se evalúa como verdadero. Pero eso arrastra las líneas afters 100000 para nada, así que mejor escríbalo como: 'awk 'NR> 100000 {exit} NR> = 10000 && NR <= 100000' largefile' ya que de esta manera el procesamiento se detendrá en la 100001ª línea. –