Hice un pequeño analizador usando HTMLparser y me gustaría saber dónde se redirige un enlace. No sé cómo explicar esto, así que vea este ejemplo:Determinación de la URL redirigida en Python
En mi página tengo un enlace a la fuente: http://www.myweb.com?out=147
, que redirige a http://www.mylink.com
. Puedo analizar http://www.myweb.com?out=147
sin ningún problema, pero no sé cómo obtener http://www.mylink.com
.
Una ligera Gotcha con esto es que si un redireccionamiento redirige a otra redirección, sólo obtendrá la última redirección. Por ejemplo, supongamos que tiene un enlace t.co (abreviador de URL de Twitter), que en realidad se refiere a un enlace bit.ly, que hace referencia a un sitio web real, y luego obtendrá el sitio web "real" en lugar del bit.ly enlazar. Esto puede o no ser lo que uno quiere. –
Y en caso de que alguien más busque la respuesta que vea esta pregunta, la biblioteca de Solicitudes (http://docs.python-requests.org/en/latest/index.html) hace esto no solo posible sino también trivial. –