2009-11-03 24 views

Respuesta

10

Html2Text parece ser una buena opción

+0

este funciona muy bien –

+0

El sitio ya no es accesible desde Aaron, el autor ya no está. –

+1

pero el código se puede encontrar en https://github.com/aaronsw/html2text –

4

Aquí hay una biblioteca de Python, que hace análisis de HTML:

BeautifulSoup es otra opción.

+2

Para ahorrarle a los demás un poco de tiempo en círculos desde Google hasta SO, aquí hay un Q & A que describe que Beautiful Soup ya no se mantiene realmente: [WebScraping with BeautifulSoup o LXML.HTML] (http://stackoverflow.com/questions/5493514/webscraping-with-beautifulsoup-or-lxml-html). – sage

+1

Beautiful Soup parece mantenerse ahora, creo. – contrebis

Cuestiones relacionadas