2008-10-22 30 views
8

Estoy tratando de obtener las fechas de las entradas en dos fuentes RSS diferentes a través de feedparser.Analizando formatos de fecha diferentes de feedparser en python?

Esto es lo que estoy haciendo:

import feedparser as fp 
reddit = fp.parse("http://www.reddit.com/.rss") 
cc = fp.parse("http://contentconsumer.com/feed") 
print reddit.entries[0].date 
print cc.entries[0].date 

Y así es como salen:

2008-10-21T22:23:28.033841+00:00 

Wed, 15 Oct 2008 10:06:10 +0000 

quiero llegar al punto en el que puede averiguar qué es más nuevo fácilmente.

He intentado utilizar el módulo de fecha y hora de Python y buscar en la documentación delpanel de alimentación, pero no puedo superar este problema. Cualquier ayuda sería muy apreciada.

Respuesta

14

El análisis de fechas es un problema con las fuentes RSS in-the-wild, y es ahí donde feedparser puede ser de gran ayuda.

Si utiliza las propiedades *_parsed (como updated_parsed), feedparser habrá hecho el trabajo y devolverá una fecha de 9 tupla Python en UTC.

Ver http://packages.python.org/feedparser/date-parsing.html para más detalles sangrientos.

Cuestiones relacionadas