2009-02-06 13 views

Respuesta

6

Busque un enlace al final que diga "Más", "Continúa", "Artículo completo", "..." o similar. A menos que desee seguir todos los enlaces de la página y buscar el texto de la fuente más extra quizás.

4

No creo que hay una manera muy limpia de hacer esto, pero aquí hay dos "hacky":

me gustaría analizar el texto de la RSS, y buscar los enlaces que salen de ella. De acuerdo, podría haber múltiples enlaces allí (algunos a otras publicaciones en el blog), pero si te centras en el último, y tratas de encontrar algunas palabras heurísticas para el título del enlace (es decir, "más", "leer completo" ", etc.), deberías poder obtener muchos de ellos. Para mayor confianza, solo puede mirar los enlaces que apuntan al blog original.

Un método más riguroso le haría seguir todos los enlaces e intentar comparar si el fragmento RSS es un subconjunto de la página que vuelve, o si hay una superposición sustancial. Sin embargo, esto puede no ser útil siempre que el sitio use un resumen verdadero en lugar del fragmento de la publicación completa.

0

¿Por qué no seguir la URL de rss-feed y comprobar si hay más texto en esta página que en rss-feed? Necesitarás tomar un analizador html y poner algunas reglas generales.

+1

Creo que esto podría ralentizar la presentación de la aplicación, ya que estaría esperando un nuevo contenido de red. –

Cuestiones relacionadas