Me gustaría configurar el rastreador para rastrear un sitio web, por ejemplo, blog, y buscarme solo los enlaces en el sitio web y pegar los enlaces dentro de un archivo de texto. ¿Me puede guiar paso a paso para configurar el rastreador? Estoy usando Eclipse.guía para instalar crawler4j
5
A
Respuesta
0
Jsoup hará todo lo que necesite wrt html parsing. Jsoup es una aplicación Java para manejar código fuente html. Puede obtener
- Tabla, con la que puede analizar cada una de las filas o columnas.
- Lista de todos los enlaces e importaciones de origen con el HTML (importaciones como archivos CSS y JS).
- Datos de una etiqueta en particular.
y más.
Para su propósito, here es el código de ejemplo.
Espero que esto te ayude.
Cuestiones relacionadas
- 1. Guía para principiantes de LINQ
- 2. Guía de estilo para C#?
- 3. Guía de accesibilidad para iOS
- 4. Guía para principiantes a BPEL
- 5. Guía de inicio para ektron
- 6. ¿Una guía para principiantes para aprender JavaScript?
- 7. Guía para organizar grandes proyectos de Django
- 8. sangría plugin de guía para gedit (pitón)
- 9. ¿La mejor guía disponible para Sencha?
- 10. guía para escribir especificaciones en Erlang
- 11. Necesito guía para comenzar con Zend ACL
- 12. ¿Alguna guía para git merge (w squash)?
- 13. Guía de inicio para Apache ServiceMix
- 14. ¿Conoces alguna guía de estilo para VB6?
- 15. Guía para principiantes de OpenGLES en iPhone
- 16. Sigar API para JAVA (necesita una guía)
- 17. Guía para pruebas de scripts Gradle
- 18. Android NDK tutorial/guía para principiantes.
- 19. ¿Hay algún tutorial/guía para usar Firebug?
- 20. guía para rastrear toda la web?
- 21. SQL Server procedimiento almacenado guía para principiantes
- 22. Guía para principiantes de Facebook Apps
- 23. guía para mingw make files mingw32-make
- 24. Guía para principiantes para configurar Qt para C++
- 25. lsof guía de supervivencia
- 26. GUÍA de lectura humana
- 27. Guía secuencial y fragmentación
- 28. ¿Existe una guía entretenida?
- 29. Guía Desconectado Android Dev
- 30. Guía para principiantes para configurar Emacs con gcc/gdb?