2008-10-22 17 views
7

Necesito un buen algoritmo de derivación para un proyecto en el que estoy trabajando. Se sugirió que mirara al Porter Stemmer. Cuando revisé la página en la lectora de Porter, descubrí que ahora está obsoleto a favor de la letalidad "Bola de nieve".¿Cuál es el mejor algoritmo de derivación "llave en mano"?

Necesito una buena leñadora, pero realmente no puedo pasar mucho tiempo implementando (u optimizando) la mía. ¿Cuál es el mejor "disponible", disponible libremente? ¿Hay algún tipo de tallos no libres disponibles a un precio razonable? O, ¿es la bola de nieve de mi mejor apuesta?

Respuesta

8

La bobinadora Porter2 es la que he decidido usar. Parecía que el portamuestrador era el estándar, pero cuando encontré la página por el autor, me recomendó la leyenda "Bola de nieve (Porter2)". Hay un enlace de puerto C en esta página.

2

Realmente depende de cómo planeas aplicarlo. El kit de herramientas de lenguaje natural (http://nltk.sourceforge.net) tiene implementados una serie de procesadores que deberían poder manejar la mayoría de las aplicaciones. Prefiero la lejía Morphy.

Por supuesto, está disponible en Python, por lo que si está trabajando con otro idioma, siempre puede consultar el código para recoger el algoritmo y transferirlo al idioma de su elección. Python es altamente legible.

Cuestiones relacionadas