Al parecer, estudiante de maestría llamado Max Whitney tiene código que implementa una versión actualizada del algoritmo de Yarowsky:
Inicializar un clasificador de un pequeño conjunto de reglas de semillas puede ser visto como la propagación de etiquetas entre ejemplos a través de características compartidas entre ellos. Este artículo presenta una nueva variante del algoritmo Yarowsky basado en esta vista. Es un método de aprendizaje bootstrapping que utiliza un algoritmo de propagación de gráficos con una función objetivo bien definida. Los resultados experimentales muestran que nuestro algoritmo de arranque propuesto logra un rendimiento de vanguardia o mejor en varios conjuntos de datos de lenguaje natural diferentes.
Descripción de: http://www2.cs.sfu.ca/~mwhitney/personal/#yarowsky-propagation-acl2012 Código disponible en: https://github.com/sfu-natlang/yarowsky
Si usted es agradable, se podría intentar pedir Dr. Yarowsky: http://www.cs.jhu.edu/~yarowsky/home.html –
Es una buena idea. thanq –
Solo tenga en cuenta que puede recibir correos electrónicos como este mucho, así que sea amable con el hombre y espere que le tome un tiempo responderle. Además, si obtiene una respuesta, puede publicarla aquí en SO en caso de que alguien más esté buscando también código. –