2012-07-06 16 views
7

estoy usando jsoup y es muy agradable para poner en orden algo de HTML, pero tengo un trozo de HTML no válido de la siguiente manera:cómo utilizar jsoup para poner en orden el html

<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss 

Lo que yo quiero llegar es:

<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p> 

¿El jsoup es capaz de poner en orden el html y devolver esta salida?

gracias

Respuesta

9

Sí, intente esto:

String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss"; 
String clean = Jsoup.clean(html, Whitelist.relaxed()); 

Puede utilizar otro Whitelist también.

+1

Tenga en cuenta que JSoup realmente limpia el HTML. Resuelve problemas como '

    ' y se puede configurar para resolver, p. '
    '. – Andrew

    Cuestiones relacionadas