2011-07-28 15 views

Respuesta

30

Ha intentado:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
String htmlString = doc.toString(); 

Como Documento extiende elemento que también ha conseguido el método html(), que "Recupera HTML interno del elemento", según el API. Así que debería funcionar:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
String htmlString = doc.html(); 

Información adicional:

Cada Documento objeto ha conseguido una referencia a una instancia de la clase interna Document.OutputSettings las que pueda accederse a través del método outputSettings() de Documento. Allí puede activar/desactivar la impresión bonita utilizando el setter prettyPrint (verdadero/falso). Consulte la API para Documento y Document.OutputSettings para furtherinformation

+0

El primer bloque de código me dio '[Ljava.lang.String; @ 383534aa' en lugar del html/contenido. Por cierto, ¿qué pasa si se trata de un 'Documento []'? –

7

doc.toString() obras, al igual que doc.outerHtml().

0
  1. Elementos post = d.select ("div.post-content");
  2. Cadena dd = post.toString();
  3. Documento ddd = Jsoup.parse (dd);

Después de analizar la cadena de documentar entonces se puede utilizar en él funciones documento

  1. Elementos ScriptTag = ddd.getElementsByTag ("script");
  2. System.out.println (scriptTag);
Cuestiones relacionadas