Estoy trabajando en una aplicación que raspa los datos de un sitio web y me preguntaba cómo debería obtener los datos. Específicamente necesito datos contenidos en una serie de etiquetas div que utilizan una clase CSS específica - Actualmente (para propósitos de prueba) Sólo estoy comprobandoJava HTML Parsing
div class = "classname"
en cada línea de HTML - Esto funciona, pero no puedo' Ayuda, pero siento que hay una mejor solución por ahí.
¿Hay alguna manera agradable en el que podía dar una clase de una línea de HTML y tener algunos métodos interesantes como:
boolean usesClass(String CSSClassname);
String getText();
String getLink();
Relacionado: [¿Cuáles son los pros y los contras de los principales analizadores de HTML de Java?] (Http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading -java-html-parsers) – BalusC