Voy a buscar this page con this request library en Node.JS, y analizo el cuerpo usando cheerio.Node.JS scrape codificación?
Calling $.html()
en el cuerpo de la respuesta analizada revela que el atributo título de la página es:
<title>Le Relais de l'Entrec?te</title>
... cuando debería ser:
<title>Le Relais de l'Entrecôte</title>
He tratado de establecer las opciones para que la biblioteca de solicitud incluya encoding: 'utf8'
, pero eso no parece cambiar nada.
¿Cómo puedo conservar estos caracteres?
cheerio podría también acaba de presentar [este error] (https://github.com/cheeriojs/cheerio/issues/548), que imprime incorrectamente ciertos caracteres en ciertas situaciones –