Estoy trabajando en un corpus holandés y quiero saber si NLTK tiene gramática holandesa incrustada en él para que pueda analizar mis oraciones? En general, ¿NLTK solo funciona en inglés? Sé que tiene el copora holandés Alpino, pero no hay ninguna indicación de que las funciones (como el análisis mediante CFG) estén hechas también para holandés. Graciasgramática holandesa en python's NLTK
Respuesta
No tengo una respuesta directa, pero al combinar la información proveniente de las dos páginas siguientes, debería poder encontrarla. Here you can find an overview of the high-level parsing interface en NLTK. Los analizadores requieren un modelo, que de estar presente se enumeraría en la página para la documentación del data packages that ships with nltk.
Como ya sabe, Alpino Dutch Treebank se envía junto con NLTK, por lo que en el peor de los casos, usted debe poder aprender un modelo usted mismo (la API del analizador también proporciona recursos de aprendizaje).
Espero que ayude de alguna manera.
Esta es una respuesta a mi correo de Steven Bird uno de los autores del libro NLTK:
NLTK puede funcionar para analizar holandesa si proporciona las reglas gramaticales. Consulte el libro NLTK para obtener orientación: http://www.nltk.org/book Puede utilizar el corpus Alpino para desarrollar la gramática (o para entrenar un analizador estadístico). Si su interés principal es es obtener oraciones sintácticas de holandés, le recomiendo que intente encontrar un analizador existente en lugar de desarrollar el suyo propio.
Al final terminé usando el analizador Alpino que es muy fuerte y está escrito en Prolog, pero logré portar (la versión binaria) en python.
- 1. ¿Cómo se pide Pythons glob.glob?
- 2. ¿Cómo obtengo un conjunto de reglas de gramática de Penn Treebank usando Python y NLTK?
- 3. etiquetado personalizado con nltk
- 4. Gramática Lisp en yacc
- 5. NLTK en IronPython de WPF
- 6. Tweet Classifier Feature-Selection NLTK
- 7. Tokenizing unicode usando nltk
- 8. Gramática AS3: Más precisa
- 9. C# ANTLR gramática?
- 10. Modelado de temas en MALLET vs NLTK
- 11. /fechas como terminales en NLTK analizador
- 12. ¿Qué palabra lectora debo usar en nltk?
- 13. Entrenamiento HMM no supervisado en NLTK
- 14. Algoritmos NLTK MEGAM Max Ent en Windows
- 15. Restricciones de selección de Wordnet en NLTK
- 16. NLTK y detección de idioma
- 17. Analizando una gramática sin contexto en Python
- 18. Gramática C en código fuente GCC
- 19. Gramática en Google Web Speech API
- 20. la conversión de una gramática en LL (1) gramática: algunos problemas
- 21. gramática Cima del bucle infinito
- 22. Sintaxis de Gramática y Lingüística
- 23. API de comprobación de gramática?
- 24. TF-IDF Uso simple - NLTK/Scikit Learn
- 25. Python's NLTK vs. Librerías Java relacionadas?
- 26. Cómo entrenar incrementalmente un clasificador nltk
- 27. Ejemplos prácticos de uso de NLTK
- 28. NLTK - ¿Cuándo se debe normalizar el texto?
- 29. NLTK piensa que los imperativos son sustantivos
- 30. Creando un nuevo corpus con NLTK