Estoy implementando la funcionalidad de búsqueda de texto completo en my rap website, y estoy teniendo problemas con los nombres de los rapero y las canciones.Búsqueda de texto completo para nombres de rapero irregulares con Solr
Por ejemplo, alguien podría querer buscar el rapero "Cam'ron" con la consulta "camron" (omitiendo el apóstrofo de palabra intermedia). Del mismo modo, alguien podría buscar la canción "3 Peat" con la consulta "3peat".
"The Notorious B.I.G." es un caso un tanto extraño: "The Notorious BIG" y "The Notorious B.I.G." ambos funcionan (supongo que porque el solr.StandardFilterFactory elimina los puntos de los acrónimos?), pero "The Notorious B.I.G" (es decir, menos el punto final) no lo hace.
Idealmente, todas las variaciones razonables de estos nombres deberían funcionar. Supongo que la respuesta tiene algo que ver con el solr.WordDelimiterFilterFactory, pero no estoy seguro.
Además, estoy usando Sunspot with Rails si es relevante.
Un gran consejo, gracias. Agregué lo siguiente a 'schema.xml':' '. Esto parece resolver todo excepto el caso "B.I.G." ¿Algunas ideas? –
Puede deberse a StandardTokenizer. Yo lo reemplazaría con WhitespaceTokenizer en su lugar.Para analizar cómo funcionan los analizadores, puede usar "Análisis" en su solr si tiene una interfaz web para ello. Ahí puede ver, qué analizador está transformando su texto y cuál es el resultado de su trabajo. – Yurish