Quiero realizar una tarea de clasificación en la que asigno una imagen dada de un objeto a una de una lista de constelaciones predefinidas en las que puede estar el objeto (es decir, encontrar la coincidencia más probable). Para obtener los descriptores de la imagen (en la que ejecutaré algoritmos de aprendizaje automático) me sugirieron usar SIFT con la implementación de VLFeat.Descriptores de imagen con SIFT/VLFEAT
Primero de todo, mi pregunta principal: me gustaría ignorar la parte de búsqueda de puntos clave de sift, y solo la uso para sus descriptores. En el tutorial he visto que no es una opción para hacer exactamente eso llamando
[f,d] = vl_sift(I,'frames',fc) ;
donde fc especifica los puntos clave. Mi problema es que quiero especificar explícitamente el cuadro delimitador en el que quiero calcular las descripciones en torno al punto clave, pero parece que solo puedo especificar un parámetro de escala que en este momento es un poco críptico para mí y no lo hace Permítanme especificar explícitamente el cuadro delimitador. ¿Hay una manera de lograr esto?
La segunda pregunta es, ¿tiene sentido establecer manualmente la báscula y obtener los descriptores de esta manera? (es decir, ¿da como resultado un buen descriptor?). ¿Alguna otra sugerencia con respecto a mejores formas de obtener descriptores? (utilizando SIFT con otras implementaciones u otros descriptores que no sean SIFT). Debo mencionar que mi objeto es siempre el único objeto en la imagen, está centrado, tiene iluminación constante y cambia por algunos tipos de rotaciones de sus partes internas. Y es por eso que pensé que SIFT funcionaría como lo entendí, se enfoca en los gradientes de orientación que cambiarían de acuerdo con las rotaciones del objeto.
Gracias