Estoy escribiendo un corrector ortográfico usando nltk y wordnet, tengo algunas palabras mal escritas que dicen "creer". Lo que quiero hacer es encontrar todas las palabras de wordnet que están separadas por una distancia de edición de leveshtein de 1 o 2 de esta palabra dada. ¿Nltk proporciona algún método para lograr esto? ¿Como hacer esto?Encontrar palabras de Wordnet separadas por una distancia de edición fija de una palabra dada
Puede ser, lo puse mal. el método edit_distance
toma 2 argumentos como edit_distance(word1,word2)
devuelve la distancia de levenshtein entre word1 y word2. Lo que quiero es encontrar la distancia de edición entre la palabra que doy con cada otra palabra en wordnet.
¿Seguro Wordnet es lo que quieres aquí? Parece un exceso. Enchant puede ser mejor: http://packages.python.org/pyenchant/ –