2010-12-05 18 views
7

Quiero saber cómo está codificado el raspador de pantalla Mozenda?Hows Mozenda Screen Scraper codificado?

http://www.mozenda.com/screen-scraper

I muestra un navegador donde el usuario puede seleccionar los campos que quiere como chatarra, y crea un script de rastreo fuera de él.

La parte de generación de scripts de rastreo es clara para mí, quiero saber si registra las acciones del usuario que el usuario está haciendo en el navegador.

Quiero hacer algo similar con C#.

+2

A menos que sea de código abierto, posiblemente no podamos decir, con certeza, cómo funciona su código. Odio hacerlo, pero realmente es tan simple como buscar en Google "raspador de páginas web C#" y encontrarás numerosos ejemplos de lo que estás buscando. –

+0

@mike, sé cómo hacer un raspador en C#, mi pregunta fue cómo están grabando las acciones del usuario. Por favor, eche un vistazo al video en el enlace que compartí y comprenderá mi pregunta. –

+0

Ah, bueno otra vez no podemos saber específicamente cómo lo hacen ya que podría hacerse de muchas maneras, pero al mirar su video comenzaría usando un control de navegador, capturaría el objeto de formulario y los campos, diseñaría un modelo para almacenar acciones , construye una interfaz para especificar acciones ... etc. Es una pregunta tan fuerte que no creo que vayas a obtener una respuesta simple porque no es una pregunta simple. –

Respuesta

2

Supongo que ejecutan algo así como iMacros en el back-end. Incluso me di cuenta del icono del navegador iMacros en algunas de sus capturas de pantalla ;-)

Si desea codificar algo como esto usted mismo en C#, el webbrowser control IE es el mejor punto de partida.

2

@ yc08m, puedo asegurar que no están usando iMacros. Está todo codificado con su propio código propietario.

+0

¿Podría arrojar algo más de luz, por favor? –

2

Me doy cuenta de que esta es una publicación extremadamente desactualizada, pero parecen depender en gran medida de XPath, por lo que lo primero es lo que necesita para cargar la página en un objeto que puede consultar. Recomiendo usar algo como Html Agility Pack para lograr esto.