Tengo un montón de documentos de texto que describen enfermedades. Esos documentos son en la mayoría de los casos bastante cortos y a menudo solo contienen una sola oración. Un ejemplo se da aquí:Enfermedad llamada reconocimiento de entidad
hipertensión pulmonar primaria es una enfermedad progresiva en la que la oclusión generalizada de las arterias pulmonares más pequeñas conduce a un aumento de la resistencia vascular pulmonar e insuficiencia ventricular posteriormente derecha.
Lo que necesito es una herramienta que busca todos los términos de la enfermedad (por ejemplo, "hipertensión pulmonar" en este caso) en las frases y los asigna a un vocabulario controlado, como MeSH.
¡Gracias de antemano por sus respuestas!
Eso suena muy específico y no es un problema de programación * per se *. Al menos no como se expresa aquí. –
Parece que esto es más una cuestión de minería de datos? – Harpal