De esta fuente html:Uso BeautifulSoup para extraer el texto antes de que el primer hijo etiqueta
<div class="category_link">
Category:
<a href="/category/personal">Personal</a>
</div>
deseo para extraer el texto Category:
Aquí están mis intentos utilizando Python/BeautifulSoup (con salida como comentario - después del #)
parsed = BeautifulSoup(sample_html)
parsed_div = parsed.findAll('div')[0]
parsed_div.firstText() # <a href="/category/personal">Personal</a>
parsed_div.first() # <a href="/category/personal">Personal</a>
parsed_div.findAll()[0] # <a href="/category/personal">Personal</a>
Espero que un "nodo de texto" esté disponible como el primer hijo. ¿Alguna sugerencia sobre cómo puedo resolver esto?
'parsed_div.contents [0]' – Avaris