he instalado lxml2.2.2 en la plataforma de Windows (im utilizando Python versión 2.6.5) .i trató este simple comando:error en función de análisis en lxml
from lxml.html import parse
p= parse(‘http://www.google.com’).getroot()
pero yo estoy recibiendo el siguiente error:
Traceback (most recent call last):
File “”, line 1, in p=parse(‘http://www.google.com’).getroot()
File “C:\Python26\lib\site-packages\lxml-2.2.2-py2.6-win32.egg\lxml\html_init_.py”, line 661, in parse return etree.parse(filenameorurl, parser, baseurl=baseurl, **kw)
File “lxml.etree.pyx”, line 2698, in lxml.etree.parse (src/lxml/lxml.etree.c:49590)
File “parser.pxi”, line 1491, in lxml.etree.parseDocument (src/lxml/lxml.etree.c:71205) File “parser.pxi”, line 1520, in lxml.etree.parseDocumentFromURL (src/lxml/lxml.etree.c:71488)
File “parser.pxi”, line 1420, in lxml.etree.parseDocFromFile (src/lxml/lxml.etree.c:70583)
File “parser.pxi”, line 975, in lxml.etree.BaseParser.parseDocFrom
File (src/lxml/lxml.etree.c:67736)
File “parser.pxi”, line 539, in lxml.etree.ParserContext.handleParseResultDoc (src/lxml/lxml.etree.c:63820)
File “parser.pxi”, line 625, in lxml.etree.handleParseResult (src/lxml/lxml.etree.c:64741)
File “parser.pxi”, line 563, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:64056)
IOError: Error reading file ‘http://www.google.com’: failed to load external entity “http://www.google.com”
no tengo ni idea de qué hacer a continuación, ya que soy un novato de pitón. por favor, guíame para resolver este error. ¡¡gracias por adelantado!! :)
muchas gracias por aclarar !! esto funciona muy bien:) – silentNinJa
¡De nada! – MattH
Lo sentimos, pero lo hace (o al menos debería) obtener URL también. Debe haber alguna otra razón. Tal vez intente actualizar primero a la última versión de lxml. – Steven