2011-03-04 24 views
9

¿Hay una función "hocus-pocus", adecuada para Android, que convierta HTML a texto sin formato?¿Hay alguna función que convierta HTML a texto sin formato?

Me refiero a una función como la operación de conversión de portapapeles encontrada en navegadores como Internet Explorer, Firefox, etc. Si selecciona todo el HTML renderizado dentro del navegador y lo copia/pega a un editor de texto, recibirá (la mayoría de) el texto, sin etiquetas HTML o encabezados.

En un hilo similar, vi una referencia a html2text pero está en Python. Estoy buscando una función Android/Java.

¿Hay algo como esto disponible o debo hacerlo yo mismo, usando Jsoup o Jtidy?

+0

Utilice esta funciona :) -------------------------- ------------- http://www.codecodex.com/wiki/Convert_HTML_to_plain_text Hace la conversión de mimo de texto/html a texto/plano. –

Respuesta

18

me gustaría probar algo como:

String html = "<b>hola</b>"; 
String plain = Html.fromHtml(html).toString(); 
+0

Gracias, elimina las etiquetas HTML, pero todavía contiene todos los encabezados de respuesta y código de JavaScript en la página ... Estoy buscando la función de "texto del portapapeles" que describí anteriormente. –

+0

Eso no es algo disponible en la API. Es una implementación privada del navegador web ... puede echar un vistazo a su código fuente para ver cómo se implementa. – Cristian

+0

¿Qué tal Jsoup? http://stackoverflow.com/questions/240546/removing-html-from-a-java-string –

Cuestiones relacionadas