2011-03-03 50 views
37

La abundancia de analizadores HTML para elegir (y aferrarse a) es alucinante:TagSoup vs Jsoup vs HTML Analizador vs vs HotSax

http://java-source.net/open-source/html-parsers

¿Cómo elijo uno que se adapte mejor a la siguientes requisitos:

  1. maduras (menos errores que el resto)
  2. vivo y la respiración (es decir, siendo mantenido)
  3. rápida y eficiente de los recursos (destinadas a ejecutarse en Android)

En base a su experiencia, que analizador de HTML le recomendaría (para cumplir los requisitos anteriores) y por qué?

+0

@George Bailey Gracias. Este es un gran recurso. Entendiste correctamente que estoy buscando la solución * óptima * para Android. es decir, Jsoup puede ser genial en una computadora de escritorio/servidor, pero tal vez un paquete diferente sería mejor para un teléfono móvil. –

+1

Actualización: gracias al enlace de @George Bailey encontré otro recurso: http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading-java-html-parsers –

+1

¿Has encontrado un analizador html adecuado para Android? Actualmente estoy usando JSoup. Funciona muy bien, pero quiero saber si puede optimizarse más. – Enigma

Respuesta

36

Bueno, he encontrado la respuesta, que fue dada por @BalusC en un different thread:

  1. Si lo que desea es utilizar una herramienta basada en XML a atravesarlo: JTidy.
  2. Si te gusta de probar la unidad el código HTML: HtmlUnit
  3. Si te gusta para extraer datos específicos del HTML: Jsoup

Gracias @BalusC.

Cuestiones relacionadas