He estado buscando intentando encontrar una respuesta aquí y en google, aunque he encontrado algunos punteros que aún no he encontrado una solución.Mejor estructura de base de datos para almacenar feeds RSS
Si usted tiene un lector de RSS simple con una base de datos, es posible que tenga un par de mesas para el almacenamiento de alimentos (ignorando hacer frente a los suscriptores aquí):
- Feeds (feed-id, feed-título , feed-url)
- artículos (artículo -id, feed-id, tema-título, elemento de contenido)
Esto funciona en la mayoría de los casos pero para muchos sitios web/aplicaciones basadas en web puede tener un feed principal desde la página principal y luego feeds de categoría, si toma ambos en el tipo de sistema anterior habrá una gran cantidad de datos replicados debido a la misma publicación que aparece en varios feeds RSS.
Las dos opciones que he encontrado son ignorarlo y aceptar los duplicados o usar una tabla de enlace entre los feeds y los elementos. Pero esto también parece un desperdicio cuando probablemente el 80% del tipo de feeds que estoy buscando extraer no tendrá múltiples feeds que podrían crear esta replicación.
¿Hay una manera mejor de hacer esto/estoy mirando esto de una manera completamente incorrecta?
actualización
Gracias a ambos por las respuestas, por lo que el consenso parece ser que el ahorro en el espacio no es probablemente lo suficientemente importantes como para preocuparse y no se cumpliría el potencial de problemas desconocidos (como mencionado por dbr).
Agregar una tabla de enlaces o similar probablemente también aumentaría el tiempo de procesamiento, por lo que en general no vale la pena preocuparse por demasiado. Después de leer las respuestas de vincular contenido y eliminar duplicados solo tuve pensamientos después de que la publicación ya no está en RSS feed para ahorrar espacio, pero como dijo Assaf, el ahorro de espacio podría hacer que esto sea una pérdida de tiempo.