Esto es más una cuestión de teoría que de práctica. Estoy trabajando en un proyecto que es un catálogo bastante simple de enlaces. El modelo completo es similar al catálogo de Dmoz o Yahoo, excepto que cada entrada tiene ciertos atributos adicionales.Recomendaciones de búsqueda Recomendaciones
Tengo taxonomía jerárquica trabajando en todas las entradas con relación muchos a muchos, todas las entradas ahora se ordenan en estas categorías, y todo parece funcionar bien. Ahora, ¿de qué sirve un catálogo si no hay una opción de búsqueda?
Aquí hay un poco más de detalle sobre mis modelos: cada entrada tiene un título, descripción, URL y varios perfiles sociales: YouTube, Twitter, Flickr y un par de otros. Cada entrada podría tener un logotipo adjunto y un campo oculto para las etiquetas. Además, el título y la descripción se almacenan en tres idiomas diferentes. Así que básicamente me gustaría los resultados de búsqueda a ser:
- relevantes (incluyendo taxonomía)
- Posiblemente los logotipos con
- Posiblemente los que tienen 100% llenaron perfiles
tengo Intenté con Sphinx y actualmente estoy trabajando con Lucene, pero parece que no estoy obteniendo la búsqueda correcta en teoría. Espero que tenga sentido que las entradas completas aparezcan más altas que las otras, pero no puedo descifrar las puntuaciones. No me gustaría que las entradas irrelevantes aparezcan en la parte superior si solo hay una coincidencia de palabras en toda la descripción, ya que los títulos son más relevantes.
Así que mi pregunta es - ¿hay libros, técnicas o incluso otros motores de búsqueda (si Esfinge y Lucene no son lo suficientemente bueno) que usted recomendaría para este asunto? No solo me gustaría tener un control total sobre los resultados de búsqueda y su clasificación, sino también brindar a los visitantes la información correcta y relevante.
¡También se agradecen los enlaces en artículos geniales!
Y Sin, no estoy tratando de reconstruir Google :)
Gracias :)
P.S. Estoy dispuesto a dar una recompensa por la mejor respuesta. – kovshenin