2012-07-13 10 views
5

Quiero entender cómo Google no maneja ningún espacio entre 2 palabras. Por ejemplo, hay 2 palabras: palabra1 y palabra2. Escribo en el cuadro de búsqueda 'word1word2', dice que te refieres a 'word1 word2' o simplemente entiende que busca 'word1 word2'. ¿Alguna información que estructura de datos y algoritmo usan? Veo en esta respuesta How to split text without spaces into list of words?, se sugiere usar la estructura de datos trie.¿Cómo reconoce Google 2 palabras sin espacios?

+0

Lo mejor sería preguntarle a un desarrollador de Google. –

+1

esto no se trata de estructuras de datos, sino principalmente de estadísticas y estimaciones de probabilidad – usamec

Respuesta

1

¿Quizás buscan en un diccionario utilizando el prefijo de la palabra ingresada?

1

Asumo que debe tener un guión (usando ajax para exemple http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/)

Básicamente comprobar las palabras en un diccionario. El espacio no debe ser una condición para verificar la palabra, sino solo una posibilidad. Por ejemplo, un simple algo (realmente simple) sería: "varias palabras", verifica la 3 primera letra, ¿nada? Luego de comprobar los 4 primeros ...

Aquí es algunas explicaciones acerca de motor de búsqueda de Google: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search

Tal vez aquí también pueden ayudar: http://tm.durusau.net/?cat=1106

4

En la generación candidato del corrector ortográfico, se permita como una posibilidad la omisión de un espacio, de la misma manera que permite la omisión de otras letras ... Quizás vea la conferencia de corrección ortográfica aquí: http://nlp-class.org/ [lo siento, autopromoción] o la introducción de Peter Norvig: http://norvig.com/spell-correct.html

Cuestiones relacionadas