2012-07-16 39 views

Respuesta

55

que puede hacer:

wget -r -l1 --no-parent http://www.domain.com/subdirectory/

donde:

-r: recursive retrieving 
-l1: sets the maximum recursion depth to be 1 
--no-parent: does not ascend to the parent; only downloads from the specified subdirectory and downwards hierarchy 
+4

Gracias por desglosar los argumentos del comando. Tuve un problema similar, pero solo necesitaba los comandos -r y --no-parent. – Sofox

+1

Si desea asegurarse de que cada página se pueda cargar correctamente (es decir, descargar imágenes cargadas en las páginas), puede agregar la bandera ** - p ** al comando anterior. – earthmeLon

+0

Además, agregue '-nd' para guardar los archivos directamente en su directorio actual sin el subdirectorio/path/to/the /. – HenriV

5
$ wget -m -p -E -k -K -np {URL Address} 

Puede utilizar la página de manual para más detalles de opciones.

NOTA: con las opciones anteriores, ¡se descargará el índice de archivos!

+0

Loco. Justo lo que estaba buscando. Esta debería ser la respuesta aceptada. –

+1

Esta solución falla en mi caso (GNU Wget 1.13.4 basado en linux-gnu). De hecho, descarga archivos en directorios principales, no el resultado deseado. –

+1

En mi caso, también falla. Parece que mi 'wget' (GNU Wget 1.14) ignora' --no-parent option'. En openSUSE, salto 42.1.20160217 – boczniak767

2

Buena información que pude usar. Probé:

 
wget -r -l1 --no-parent http://www.domain.com/subdirectory/ 

en un sitio que incluye varios archivos de forma name.subname.subname2.etc.htm o .html. Para recogerlos, ejecuté:

 
wget -r --no-parent http://www.domain.com/subdirectory/ 

y funcionó bien.

Cuestiones relacionadas