Quiero entender cómo Google no maneja ningún espacio entre 2 palabras. Por ejemplo, hay 2 palabras: palabra1 y palabra2. Escribo en el cuadro de búsqueda 'word1word2', dice que te refieres a 'word1 word2' o simplemente entiende que busca 'word1 word2'. ¿Alguna información que estructura de datos y algoritmo usan? Veo en esta respuesta How to split text without spaces into list of words?, se sugiere usar la estructura de datos trie.¿Cómo reconoce Google 2 palabras sin espacios?
Respuesta
¿Quizás buscan en un diccionario utilizando el prefijo de la palabra ingresada?
Asumo que debe tener un guión (usando ajax para exemple http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/)
Básicamente comprobar las palabras en un diccionario. El espacio no debe ser una condición para verificar la palabra, sino solo una posibilidad. Por ejemplo, un simple algo (realmente simple) sería: "varias palabras", verifica la 3 primera letra, ¿nada? Luego de comprobar los 4 primeros ...
Aquí es algunas explicaciones acerca de motor de búsqueda de Google: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search
Tal vez aquí también pueden ayudar: http://tm.durusau.net/?cat=1106
En la generación candidato del corrector ortográfico, se permita como una posibilidad la omisión de un espacio, de la misma manera que permite la omisión de otras letras ... Quizás vea la conferencia de corrección ortográfica aquí: http://nlp-class.org/ [lo siento, autopromoción] o la introducción de Peter Norvig: http://norvig.com/spell-correct.html
- 1. Múltiples espacios entre palabras en HTML sin
- 2. ¿Cómo reconoce Google StreetView los planos 3D?
- 3. Detecta las palabras más probables del texto sin espacios/palabras combinadas
- 4. jQuery: $ .trim() espacios entre palabras input.val()
- 5. cómo contar el número exacto de palabras en una cadena que tiene espacios vacíos entre palabras?
- 6. Combinaciones de palabras sin repetición
- 7. ¿Cómo reconoce Google el contenido para adultos con safesearch?
- 8. pocketsphinx cómo determinar sin palabras gramaticales
- 9. PostgreSQL secuencias sin espacios
- 10. PHP utf8_encode() convierte espacios en espacios sin interrupción
- 11. Cómo envolver líneas largas sin espacios en HTML?
- 12. Google API: cómo autenticar sin redirección?
- 13. regex para al menos 2 espacios vacíos?
- 14. palabras separadas delimitados por espacios en una cadena
- 15. PDFBox agregando espacios en blanco dentro de las palabras
- 16. Regex.Split() oraciones a palabras conservando espacios en blanco
- 17. Solr: consulta de búsqueda con espacios entre palabras
- 18. Conversión de espacios sin rupturas a espacios en Ruby
- 19. Regex - coincide con todo sin espacios en blanco
- 20. Lexer que reconoce bloques sangrados
- 21. ¿Cómo se reconocen las palabras en el texto con tokens sin palabras?
- 22. Cómo almacenar los permisos de Google api (OAuth 2)?
- 23. R: Truncar cadena sin partiendo palabras
- 24. Geocodificación sin Google API?
- 25. Cómo agregar programáticamente ImageView en LinearLayout sin espacios adicionales?
- 26. ¿Cómo puedo eliminar espacios sin ruptura de un 'Documento' JSoup?
- 27. Cómo dividir una cadena sin espacios de delimitador continuo
- 28. JAXB: ¿Cómo se puede deserializar XML sin espacios de nombres
- 29. serialización XML, sin espacios en blanco
- 30. Fusión sin conflictos de espacios en blanco
Lo mejor sería preguntarle a un desarrollador de Google. –
esto no se trata de estructuras de datos, sino principalmente de estadísticas y estimaciones de probabilidad – usamec