Quiero usar Python para capturar información de algunos sitios web. Quiero que el cliente HTTP para cumplir con estas condiciones:¿Puede recomendar alguna biblioteca de cliente http python?
- soporta https
- no va a usar demasiada memoria, no debe generar una gran cantidad de procesos o hilos.
- tiene una documentación clara y con el apoyo activo
Sé que requests
, tornado
, o la gevent
-httpclient puede terminar mi tarea, pero no sé cuál es el mejor? o hay alguna otra opción?
o si hay algunas otras opciones escritas en C
/c++
.
Gracias!
Leí la información sobre el tornado, alguien lo dijo eficiente, ¿qué tal la eficiencia sobre las solicitudes? – Djvu
Tornado es eficiente si puede beneficiarse del procesamiento asíncrono, es decir, si necesita muchas conexiones en paralelo. Sin embargo, * requests * también admite solicitudes asíncronas: http://docs.python-requests.org/en/latest/user/advanced/#asynchronous-requests, y se ajusta mejor, ya que tornado es más un servidor web que un cliente http. biblioteca. – ThiefMaster
Tenga en cuenta que 'requests' usa' urllib3', que repite automáticamente las solicitudes en ciertos casos. Puede ser crítico evitar repetir. – temoto