estoy usando BeautifulSoup para raspar una URL y que tenía el siguiente código¿podemos usar xpath con BeautifulSoup?
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
req = urllib2.Request(url)
response = urllib2.urlopen(req)
the_page = response.read()
soup = BeautifulSoup(the_page)
soup.findAll('td',attrs={'class':'empformbody'})
Ahora en el código anterior podemos utilizar findAll
para obtener etiquetas e información relacionada con ellos, pero quiero utilizar XPath. ¿Es posible usar xpath con BeautifulSoup? Si es posible, ¿alguien puede proporcionarme un código de ejemplo para que sea más útil?
Muchas gracias Pieters, tengo dos informaciones de tu código, 1. Una aclaración de que no podemos usar xpath con BS 2. Un buen ejemplo de cómo usar lxml. ¿Podemos ver en una documentación particular que "no podemos implementar xpath utilizando BS en forma escrita", porque debemos mostrar algunas pruebas a alguien que pida una aclaración, ¿verdad? –
De todos modos, gracias por tu ayuda. –
Es difícil demostrar una negativa; la [documentación de BeautifulSoup 4] (http://www.crummy.com/software/BeautifulSoup/bs4/doc/) tiene una función de búsqueda y no hay resultados para 'xpath'. –