Tengo páginas web HTML que estoy rastreando usando xpath. El etree.tostring
de un cierto nodo me da esta cadena:Ejecutando Javascript desde Python
<script>
<!--
function escramble_758(){
var a,b,c
a='+1 '
b='84-'
a+='425-'
b+='7450'
c='9'
document.write(a+c+b)
}
escramble_758()
//-->
</script>
Sólo necesito la salida de escramble_758()
. Puedo escribir una expresión regular para descubrir todo, pero quiero que mi código permanezca ordenado. ¿Cuál es la mejor alternativa?
Estoy revisando las siguientes bibliotecas, pero no vi una solución exacta. La mayoría de ellos están tratando de emular el navegador, haciendo que las cosas se vuelvan más lentas.
- http://code.google.com/p/python-spidermonkey/ (dice claramente
it's not yet possible to call a function defined in Javascript
) - http://code.google.com/p/webscraping/ (no se ve nada de Javascript, puedo estar equivocado)
- http://pypi.python.org/pypi/selenium (navegador Emulando)
Editar: Un ejemplo ser grandioso .. (los barebones lo harán)
Esperar. ¿Esto es un engaño? ¿O era Pajamas lo suficientemente mal como para que alguien borrara su respuesta? –
Puede ser [PhantomJS] (http://code.google.com/p/phantomjs/) puede ayudar o [pyv8] (http://code.google.com/p/pyv8/). – RanRag
@ErikReppen Revisé el pijama, no tiene ejemplos. – jerrymouse