2012-08-30 13 views
5

Si utilizo esteconseguir la fuente de la página web con el HTML representado desde JavaScript

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://test.net"); 

soy capaz de utilizar el paquete de agilidad para escanear el código HTML y obtener la mayoría de las etiquetas que necesito pero su falta el html que es renderizado por el javascript.

Mi pregunta es, ¿cómo obtengo la fuente de la página representada final usando C#. ¿Hay algo más en el WebClient para obtener la fuente representada final después de ejecutar javascript?

+0

dudo que usted puede hacer esto con C# solos. – ceejayoz

Respuesta

1

El HTML Agility Pack por sí solo no es suficiente para hacer lo que desea, también necesita un motor de JavaScript. Para hacer eso, es posible que desee verificar algo como Geckofx, que le permitirá insertar un navegador web completamente funcional en su aplicación, y que le permitirá acceder mediante programación a los contenidos de la dom después de que la página haya procesado.

http://code.google.com/p/geckofx/

+0

geckofx más nuevos se pueden encontrar aquí: https://bitbucket.org/geckofx/geckofx-14.0/ – Tom

Cuestiones relacionadas