Estoy escribiendo una aplicación que toma datos de una serie de fuentes RSS arbitrarias. Los feeds se sondean de forma asíncrona en segundo plano y se llama a un método cada vez que se agrega un nuevo elemento al feed.Extracción de nuevos elementos de una fuente RSS
Mi problema es identificar los nuevos elementos en el feed. ¿Cuál es la mejor manera de hacerlo? He salido con algunas ideas, pero todas tienen fallas.
Sugerencia: Cada vez que usted sondea, mantener todos los artículos más reciente que la pubDate de el último elemento de la última encuesta Problema : pubDate no es un campo requerido.
Sugerencia: Mantenga un hash del contenido para cada artículo que regrese, y no lo hacen contenido de retorno con el mismo hash Problema: El rápido crece fuera de control en términos de uso de memoria
Recomendaría un resumen del tema y otro para el cuerpo. Además, algunos feeds tienen guías y otros UUID. – sal
¿Por qué mantener hashes separados para el cuerpo y el sujeto? ¿Eso no solo duplica mis gastos de almacenamiento? – Martin