2011-04-15 14 views
7

Quiero ejecutar el ejemplo de K-Means de Mahout en un clúster de hadoop de 5 máquinas. ¿Qué archivos jar Mahout debería tener en todos los nodos, para que los K-Means se ejecuten de forma distribuida? Gracias.Despliegue de Mahout en el clúster hadoop

-Venkiram

Respuesta

2

Si realmente desea ejecutar los trabajos incorporados en K-medias, o de otro tipo con los conductores estáticos, la respuesta es 'no'. Los frascos de 'trabajo' de mahout son frascos de trabajo de hadoop independientes. Si envía un trabajo al clúster con 'hadoop job', funcionará sin ningún otro jarro.

+0

Gracias. He instalado las jarras Mahout en el nodo maestro, ¿debo replicarlas también en todos los nodos esclavos? – Venkiram

+0

Ahora estás más allá de lo que sé sobre hadoop. – bmargulies

+1

¿No se supone que el controlador del trabajo se ocupa de esto al localizar el .jar en todos los nodos que utiliza? –

Cuestiones relacionadas