2011-02-14 14 views
5

Estoy trabajando en un corpus holandés y quiero saber si NLTK tiene gramática holandesa incrustada en él para que pueda analizar mis oraciones? En general, ¿NLTK solo funciona en inglés? Sé que tiene el copora holandés Alpino, pero no hay ninguna indicación de que las funciones (como el análisis mediante CFG) estén hechas también para holandés. Graciasgramática holandesa en python's NLTK

Respuesta

0

No tengo una respuesta directa, pero al combinar la información proveniente de las dos páginas siguientes, debería poder encontrarla. Here you can find an overview of the high-level parsing interface en NLTK. Los analizadores requieren un modelo, que de estar presente se enumeraría en la página para la documentación del data packages that ships with nltk.

Como ya sabe, Alpino Dutch Treebank se envía junto con NLTK, por lo que en el peor de los casos, usted debe poder aprender un modelo usted mismo (la API del analizador también proporciona recursos de aprendizaje).

Espero que ayude de alguna manera.

2

Esta es una respuesta a mi correo de Steven Bird uno de los autores del libro NLTK:

NLTK puede funcionar para analizar holandesa si proporciona las reglas gramaticales. Consulte el libro NLTK para obtener orientación: http://www.nltk.org/book Puede utilizar el corpus Alpino para desarrollar la gramática (o para entrenar un analizador estadístico). Si su interés principal es es obtener oraciones sintácticas de holandés, le recomiendo que intente encontrar un analizador existente en lugar de desarrollar el suyo propio.

Al final terminé usando el analizador Alpino que es muy fuerte y está escrito en Prolog, pero logré portar (la versión binaria) en python.