Cuando quiero analizar documentos XML en Python usando la biblioteca BeautifulSoup, tuve algunos problemas. El documento XML que quiero analizar:Analizando XML no estándar (etiqueta CDATA)
<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
Como puede ver arriba, la etiqueta es un poco extraña. En mi opinión, esa (etiqueta) no es una forma de soporte XML, ¿verdad? ¿Cómo puedo analizar esta terrible forma?
Wow. Gracias por su cordialidad – user513004
UserWarning: La clase BeautifulStoneSoup está en desuso. En lugar de usarlo, pase features = "xml" en el constructor BeautifulSoup. –
Actualicé mi respuesta para usar BeautifulSoup4. – unutbu