¿Cuál es mi mejor opción para analizar HTML si no puedo usar BeautifulSoup o lxml? Tengo un código que usa SGMLlib pero es un poco de bajo nivel y ahora está en desuso.Analizando HTML en Python
Preferiría si pudiera causar un poco de HTML malformado aunque estoy bastante seguro de que la mayoría de las entradas estarán bastante limpias.
Si puedo preguntar, ¿por qué no puedes usar lxml o BS? –
Estaba tratando de evitar que las respuestas se desviaran por completo. Mis razones para evitar BeautifulSoup son muy discutibles, ¡pero estaba guardando eso para otro día! (Mis razones para evitar lxml son simples: una falla completa al instalarlo en Mac OSX o Linux :( –
Aquí se muestra cómo instalar lxml en Linux: 'sudo apt-get install libxml2-dev libxslt-dev python2.7 -dev' ('python2.6-dev' si usa Python 2.6). Luego' sudo pip install lxml'. – Jabba