asumir un grupo de puntos de datos, tal como uno trazada aquí (este gráfico no es específico de mi problema, pero sólo se utiliza como un ejemplo adecuado):detección Group en conjuntos de datos
Inspección el gráfico de dispersión visualmente, es bastante obvio que los puntos de datos forman dos 'grupos', con algunos puntos aleatorios que obviamente no pertenecen a ninguno de ellos.
Busco un algoritmo, eso me para permitir:
- comienzo con un conjunto de datos de dos o más dimensiones.
- detectar tales grupos del conjunto de datos sin conocimiento previo de cuántos (o si alguno) podría estar allí
- una vez que se hayan detectado los grupos, 'pregunte' el modelo de grupos, si parece que un nuevo punto de muestra cualquiera de los grupos