Esto debería ser fácil pero estoy atascado.Scrapy - Seleccione un enlace específico basado en el texto
<div class="paginationControl">
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text 2</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=3&powerunit=2">Link Text 3</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=4&powerunit=2">Link Text 4</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=5&powerunit=2">Link Text 5</a> |
<!-- Next page link -->
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text Next ></a>
</div>
Estoy intentando utilizar Scrapy (Basespider) para seleccionar un enlace basado en él link text usando:
nextPage = HtmlXPathSelector(response).select("//div[@class='paginationControl']/a/@href").re("(.+)*?Next")
Por ejemplo, quiero seleccionar el siguiente vínculo basado en el hecho que su texto es "Enlace de texto a continuación". ¿Algunas ideas?
Gracias chicos. Usé la sugerencia de @unutbu y funcionó perfectamente. –
Entonces, ¿no hay una forma de selector CSS para hacer esto? – deostroll