Estoy usando la asignación de Dirichlet latente con un corpus de datos de noticias de seis fuentes diferentes. Estoy interesado en la evolución del tema, la emergencia, y quiero comparar cómo las fuen
Estoy haciendo análisis latentes de Dirichlet para investigar un poco y seguir teniendo problemas. La mayoría del software lda requiere que los documentos estén en formato doclines, lo que significa u
He leído LDA y entiendo las matemáticas de cómo se generan los temas cuando uno ingresa una colección de documentos. Las referencias dicen que LDA es un algoritmo que, dado un conjunto de documentos y