¿Alguien puede recomendar un buen libro (s)/papel (s)/artículo (s) en la búsqueda de texto completo (y tal vez la indexación en general). Soy bastante anal sobre tener que entender qué está sucediendo entre bastidores en mis aplicaciones, y tengo problemas para entender por qué Sphinx y otros FTS externos dejan a MySQL/MyISAM en el polvo.Imprimación de búsqueda de texto completo?
Respuesta
Para entender la búsqueda de texto completo de abajo hacia arriba, recomiendo "Gestionar Gigabytes".
Comenzaría con this. Es para SQL Server, pero una lectura no va a doler, ya que muchos conceptos diferentes a los de implementación serán (muy probablemente) los mismos en los DB.
Encontré la página de búsqueda de texto completo de postgres http://www.postgresql.org/docs/8.3/static/textsearch.html muy esclarecedor.
Especialmente: http://www.postgresql.org/docs/8.3/static/textsearch-intro.html
operadores Pruebas de búsqueda en bases de datos han existido durante años. PostgreSQL tiene ~, ~ *, operadores similares, y ILIKE para tipos de datos textual, pero carecen de muchas de las propiedades esenciales requeridos por los modernos sistemas de información:
- no hay apoyo lingüístico, incluso de Inglés. Las expresiones regulares son no suficientes porque no pueden manejar fácilmente palabras derivadas, por ejemplo, satisface y satisface. Es posible que se pierda los documentos que contengan satisfies, , aunque es probable que desee encuéntrelos cuando busque satisfacer. Es posible utilizar O para buscar para múltiples formularios derivados, pero este es tedioso y propenso a errores (algunas palabras pueden tener varios miles de derivados ).
- No proporcionan ningún orden (clasificación) de resultados de búsqueda, lo que los hace ineficaz cuando se encuentran miles de documentos coincidentes.
- Tienden a ser lentos porque hay sin soporte de índice, por lo que deben procesar todos los documentos para cada búsqueda de .
Hay un excelente libro gratis Recuperación de Información (Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze, Introducción a la Recuperación de Información, Cambridge University Press. 2008), incluyendo la búsqueda de texto, disponible gratuitamente (legit) here.
“Una Arquitectura Orientada a Objetos de texto de recuperación”
- 1. RavenDB búsqueda de texto completo
- 2. Sunspot/Solr Búsqueda de texto completo: ¿cómo excluir ciertos campos de la búsqueda de texto completo?
- 3. Búsqueda de texto completo de SQL Server
- 4. Ranking de búsqueda de texto completo
- 5. mongodb estrategia de búsqueda de texto completo
- 6. búsqueda de texto completo en LINQ
- 7. Búsqueda de texto completo en CRM 2011
- 8. Búsqueda de texto completo ignorando los comentarios
- 9. Búsqueda de texto completo: Whoosh Vs SOLR
- 10. Django MySQL búsqueda de texto completo
- 11. búsqueda de texto completo instalado o no
- 12. Búsqueda de texto completo para Rails 3
- 13. MySQL búsqueda de texto completo varias palabras
- 14. Búsqueda de texto completo en SQL Azure
- 15. ¿Microsoft Access tiene búsqueda de texto completo?
- 16. Cassandra búsqueda de texto completo como
- 17. Búsqueda de texto completo como Google
- 18. ¿Búsqueda de texto completo más rápido hoy?
- 19. Búsqueda de texto completo de MySQL Confusión de modo booleano
- 20. Índices de búsqueda de texto completo de SQLite
- 21. Búsqueda de texto completo de Postgres en varias tablas relacionadas
- 22. Catálogo de texto completo/búsqueda de índice% libro%
- 23. Búsqueda de texto completo de PostgreSQL y MySQL
- 24. búsqueda de texto completo de mysql no devolviendo registros
- 25. MySQL búsqueda de texto completo plural/singular de las palabras
- 26. Búsqueda de texto completo de MySQL vs Me gusta %%
- 27. MySQL Resultado de búsqueda de texto completo Explicación
- 28. Postgresql búsqueda de texto completo parte de las palabras
- 29. Búsqueda de texto completo de MySQL en varias tablas
- 30. Motor de búsqueda de texto completo para Python