Esto no es realmente "OCR", ya que no reconoce los caracteres, pero es la misma idea aplicada a las curvas. ¿Alguien sabe de una biblioteca de procesamiento de imágenes o un algoritmo establecido para recuperar los valores de una imagen de trazado (ráster)? Por ejemplo, en este gráfico, es difícil para mí leer valores exactos con los ojos porque no hay tales espacios entre las líneas de división:Digitalización de trazado: raspado de los valores de muestra de una imagen de un gráfico
alt text http://i35.tinypic.com/316airl.jpg
puedo utilizar un borde recto o lo que sea, pero todavía va a ser de error -propenso. Sería genial si hubiera un software que solo pudiera tomar una captura de pantalla de cualquier gráfico antiguo y convertirlo automáticamente en una tabla de valores o una función que pudiera ser consultada.
¿Parece que se llama "reconocimiento de curva"? También podría usarse para extraer datos de las curvas en artículos científicos para los cuales no se publican los datos subyacentes.
Y está bien tener alguna orientación humana. No hay ninguna razón para que un OCR no pueda leer el "100" y hacer coincidirlo con la línea, por ejemplo, pero está bien que un humano dé a las líneas valores numéricos después de que la máquina haya extraído la ruta de la curva relativa a las líneas de la cuadrícula. Lo que más me interesa es la función de trazar la curva con respecto a la cuadrícula, incluso si la cuadrícula está inclinada, girada o warped in a non-affine way.
Actualización:
Ahora hay un artículo de Wikipedia llamada Converting scanned graphs to data con un montón de software en los enlaces. También algunos software on alternativeto.net. Supongo que la teoría pertenece a http://dsp.stackexchange.com ahora, mientras que las soluciones de software pertenecen a http://superuser.com?
He utilizado http://arohatgi.info/WebPlotDigitizer/ requiere alguna anotación manual del gráfico, pero en su caso creo que es la opción más fácil. –
@ RasmusBååth: Sí, eso es lo que he estado usando. Sin embargo, esta es más una cuestión de programación. – endolith