2012-04-24 24 views
5

En su artículo de 2004, "Características distintivas de la imagen desde los puntos clave invariantes de escala", dio muchas cifras de "repetibilidad" como una función de XXX, por ejemplo, la figura 3, 4 y 6, pero no explicó cómo calcular la "repetibilidad".¿Cómo calcula Lowe la "repetibilidad" de su algoritmo SIFT?

Realmente dio una explicación simple de "repetibilidad" en la figura 3 de la página 8, que es "el porcentaje de puntos clave que se detectan repetidamente en la misma ubicación y escala en una imagen transformada".

Sin embargo, 1) ¿cómo podemos saber si se detecta un punto clave en la imagen transformada, simplemente marcando los puntos clave uno por uno? No creo que sea práctico, ya que hay miles de keypints.

2) ¿Qué tan cerca podemos considerar la detección repetible de un punto clave en la MISMA UBICACIÓN? 3 píxeles, 6 píxeles? ¿O no por píxeles en absoluto?

No sé cómo puedo cargar el papel "Características distintivas de la imagen desde los puntos clave invariantes de escala". Aquí está el enlace: http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

+0

Referencias/enlaces por favor. – RBarryYoung

+0

enlace agregado. thx – user1222309

Respuesta

3

Si observa en el primer párrafo en la página 9, el autor explica con más detalle la tolerancia para decir que el punto clave se detecta en la misma ubicación. Primero, se da "la misma escala" dentro de un factor de sqrt(2) de la escala correcta, que debe ser conocida por el operador o etiquetada a mano en el conjunto de datos. En segundo lugar, "la misma ubicación" se define como estar dentro de σ píxeles en las direcciones xey, donde "σ es la escala del punto clave (definida a partir de la ecuación (1) como la desviación estándar del gaussiano más pequeño utilizado en la diferencia- de la función de Gauss) "

En cuanto a su pregunta más general, la respuesta es lamentablemente que uno debe verificar los puntos clave de manera exhaustiva. Reúne todos los pares de ubicación/escala donde su detector dispara en la imagen transformada, y los compara con las ubicaciones verdaderas en la imagen original. Necesita tener ubicaciones de puntos clave grabadas a mano, o ejecutar primero un algoritmo simple (como usar el detector de punto clave KLT básico y simplemente almacenar una lista de las coordenadas de los puntos clave que encuentra y simular que estos son "verdad fundamental" ... Tendrá algo de precisión de esta manera, pero podrá automatizar más el proceso).

El trabajo a gran escala como este (escribir código para comprobar exhaustivamente una tonelada de puntos clave) suele ser lo que se obtiene para los estudiantes de posgrado. Blerg.

+0

"la misma ubicación" se define como estar dentro de σ píxeles en las direcciones xey, donde "σ es la escala del punto clave (definida a partir de la ecuación (1) como la desviación estándar del gaussiano más pequeño utilizado en la diferencia- de la función de Gauss) ". Entonces, el punto clave a gran escala, digamos, 3 σ, tendrá la misma tolerancia con el punto clave con una escala pequeña, digamos 1.5 σ? – user1222309

+0

Esa es una cita directa del artículo, por lo que la ecuación (1) se refiere al documento ... – ely

+0

Entiendo la ecuación (1), lo que no entiendo es que la tolerancia "σ píxeles" es para todos los puntos clave, que significa que el punto clave con una escala grande (3σ) tendrá la misma tolerancia con el punto clave con una escala pequeña (1.5σ), lo cual no es justo, creo. ¿Podrías darme una pista? – user1222309

Cuestiones relacionadas