Estoy tratando de buscar una página web usando expresiones regulares, pero estoy consiguiendo el error siguiente:Cómo manejar la codificación respuesta de urllib.request.urlopen()
TypeError: can't use a string pattern on a bytes-like object
entiendo por qué, urllib. request.urlopen() devuelve un bytestream y por lo tanto, al menos estoy adivinando, re no sabe qué codificación usar. ¿Qué se supone que debo hacer en esta situación? ¿Hay alguna forma de especificar el método de codificación en una solicitud en línea? ¿Necesitaré volver a codificar la cadena? Si es así, ¿qué estoy buscando hacer, supongo que debería leer la codificación de la información del encabezado o el tipo de codificación si se especifica en el html y luego volver a codificarlo a eso?
Gracias, eso es lo que necesitaba. – kryptobs2000
¿Qué sucede si el juego de caracteres no es utf-8? ¿Sería una mejor idea determinarlo de alguna manera a partir de la respuesta en lugar de codificar esta suposición? –