Estoy utilizando el siguiente para obtener todo el contenido HTML de una sección para guardar en una base de datosPython, lxml y la eliminación de etiqueta externa del uso de lxml.html.tostring (el)
el = doc.get_element_by_id('productDescription')
lxml.html.tostring(el)
La descripción del producto tiene una etiqueta que tiene este aspecto:
<div id='productDescription'>
<THE HTML CODE I WANT>
</div>
el código funciona muy bien, me da todo el código html pero no cómo quitar la capa externa es decir, el <div id='productDescription'>
y la etiqueta de cierre </div>
?
¿Qué es 'basestring'? – nHaskins