2012-08-07 18 views
9

Estoy haciendo una encuesta de diferentes bibliotecas y sistemas para aplicaciones NLP. Estoy buscando los que me he perdido. La lista con la que comencé sigue creciendo, así que estoy seguro de que hay más por ahí. Esto es lo que he encontrado hasta ahora.¿Qué bibliotecas ofrecen métodos NLP básicos o avanzados?

Algunos de ellos son de código abierto y algunos son no. Cada uno tiene compensaciones. Creo que me estoy inclinando por las bibliotecas que me dan más acceso a las funciones básicas de PNL (por ejemplo, querría ver las etiquetas POS reales, por ejemplo).

Entonces, ¿qué es lo que extrañé? ¿Qué estás usando o qué prefieres? ¡Gracias!

+0

Gracias unutbu por los enlaces URL. Debo agregar más ya que son de utilidad general para todos. –

+0

Escuché que había una rama NLTK 3.0 en GitHub pero ya no está. ¿Alguna palabra sobre eso? Utilicé NLTK 2 en muchos proyectos, pero con el retraso en la migración a Python 3.x no puedo recomendarlo para nada más que para la experimentación. –

+0

http://text-processing.com/ – alvas

Respuesta

4

unos cuantos más:

También, comprobar este artículo Wikipedia: List of natural language processing toolkits

+0

Ese artículo de wikipedia fue una puerta de entrada a todo tipo de cosas. Realmente lo aprecio. Y Apache UIMA es un marco excelente, especialmente porque hay formas bien definidas de hacerlo funcionar con Hadoop. –

1

Otro que es un fallo vergonzoso es LinguaSys cual ¡Mi amigo Meta Brown trabajó!

1

Apache UIMA es otra que me perdí en mi primer pase y está en el artículo de Wikipedia. Es bastante bueno tener una certificación OASIS y mil millones de herramientas útiles. No sé con qué dificultad es trabajar. Parece que voy a arrastrarme pataleando y gritando a la programación de Java. Entre él y Stanford y LingPipe veo muchas opciones excelentes en el mundo del código abierto.

1

Si te gustó UIMA entonces encontrarás ClearTK muy útil. Se implementa sobre UIMA y tiene envoltorios para muchas bibliotecas NLP/ML (OpenNLP, Stanford NLP, Mallet, LibSVM, etc.). También tiene buenos ejemplos de clasificación de documentos, etiquetado POS, Reconocimiento de Entidad Nombrada, etc.

Cuestiones relacionadas