Me encantaría saber cómo está estructurado el etiquetado y la búsqueda de Stack Overflow, porque parece funcionar bastante bien.Arquitectura de datos óptima para etiquetado, nubes y búsqueda (como StackOverflow)?
¿Qué es un buen modelo de base de datos/búsqueda si quiero hacer todos los siguientes:
- Etiquetas de almacenamiento en diversas entidades, (cómo las tablas es decir Entidad, etiqueta, y Entity_Tag normalizada?)
- Búsqueda de elementos con etiquetas particulares
- la construcción de una nube de etiquetas de todas las etiquetas que se aplican a un resultado de búsqueda en particular conjunto
- cómo mostrar una lista de etiquetas para cada elemento en un resultado de búsqueda?
Tal vez tenga sentido para almacenar las etiquetas en una forma normalizada, sino también como una cadena delimitada por espacios a los efectos del # 2, # 4, # 3 y tal vez. ¿Pensamientos?
He oído decir que Stack Overflow utiliza Lucene para la búsqueda. ¿Es eso cierto? He escuchado un par de podcasts sobre la optimización de SQL, pero nada sobre Lucene. Si usan Lucene, me pregunto qué parte del resultado de la búsqueda proviene de Lucene, y si la nube de etiquetas "drill-down" proviene de Lucene.
no puede upmod este post lo suficientemente – Shawn
el primer eslabón de esta respuesta ("SQL Server 2005 Búsqueda de texto completo") ya no parece funcionar? – Funka
El enlace actualizado probablemente sería: http://meta.stackexchange.com/questions/19548/what-search-engine-stackoverflow-isusing –