Se me ha pedido que escriba una aplicación que rastrea la información de una página web de Intranet y presenta cierta información en un formato fácil de ver. La página web es un verdadero desastre y requiere que el usuario haga clic en media docena de iconos para descubrir si un artículo pedido ha llegado o ha sido recibido. Como se puede imaginar, a los usuarios les resulta irritante, por decir lo menos, y sería bueno tener una aplicación que cualquiera pueda usar que enumere el estado de sus pedidos en una sola pantalla.Screen Scraping desde una página web con mucho Javascript
Sí, sé que una mejor solución sería volver a escribir la aplicación web, pero eso implicaría llamar al proveedor y nos costaría una fortuna pequeña.
De todos modos, al analizar esto, descubrí que la página web que quiero raspar es en su mayoría Javascript (aunque no utiliza ninguna técnica AJAX). ¿Alguien sabe si existe una biblioteca o un programa que podría alimentar con el Javascript y que luego escupiría el DOM de mi aplicación para analizar?
Casi puedo escribir la aplicación en cualquier idioma, pero mi preferencia sería JavaFX solo para poder jugar con ella.
Gracias por su tiempo.
Ian
ahhhhh ... Me encanta el olor de recién HTML pantalla-raspado de la mañana .... –
Comprobar este post selenio http://stackoverflow.com/questions/125177/whats -a-good-tool-to-screen-scrape-with-javascript-support – osager