Me doy cuenta de que este es un tema amplio, pero estoy buscando un buen manual para analizar el significado del texto, idealmente en Python. Como un ejemplo de lo que estoy tratando de hacer, si un usuario realiza una entrada en el blog como:Analizando Significado del texto
"Manny Ramírez hace su regreso con los Dodgers de hoy en contra de los Astros de Houston",
lo que es un peso ligero/manera fácil de sacar los sustantivos de una oración? Para empezar, creo que lo limitaría a los nombres propios, pero no me gustaría limitarme a eso (y no quiero confiar en una expresión regular simple que asume que el Título limitado es un nombre propio).
Para hacer esta pregunta aún peor, ¿cuáles son las cosas que no estoy pidiendo que deba ser? ¿Necesito un corpus de palabras existentes para comenzar? ¿Qué cosas del análisis léxico necesito saber para que esto funcione? Me encontré con one other question sobre el tema y estoy investigando esos recursos ahora.
Ha, acabo de añadir eso a mi carrito en Amazon antes de volver aquí. ¿Tiene algo de bueno? Me preguntaba sobre la falta de críticas. – Tom
Parece que tiene una descripción bastante decente de NTLK - toolkit mencionado en una de las respuestas – zakovyrya