Estoy tratando de extraer los números de un marcador típico que encontraría en un gimnasio de la escuela secundaria. Tengo cada número en una fuente digital "despertador" y han logrado la perspectiva correcta, umbral y extraer un dígito dado de la señal de videoReconocimiento de dígitos en el marcador mediante OpenCV
He aquí una muestra de mi entrada de plantilla
Mi problema es que ningún método de clasificación determinará con precisión todos los dígitos 0-9. He intentado varios métodos
1) Tesseract OCR: este siempre se equivoca en 4 y con frecuencia devuelve resultados extraños. Solo usando la versión de línea de comando. Si realmente trato de entrenarlo en una fuente de "reloj despertador", obtengo un carácter desconocido cada vez.
2) kCerca de OpenCV - Busco una base de datos que contenga las imágenes de mi plantilla (0-9) y vea cuál es la más cercana. Frecuentemente recibo confusión entre 3/1 y 7/1
3) cvMatchShapes - éste es bastante mala, por lo general no puede decir la diferencia entre 2 de los dígitos para cada dígito de entrada
4) Tangente Distancia - Esta es la más cercana, pero la menor distancia de la tangente entre la entrada y mis plantillas termina mapeando "7" a "1" cada vez
Realmente estoy perdido para obtener un algoritmo de clasificación para tal problema simple Siento que he limpiado la entrada bastante bien y es un caso bastante simple para la clasificación, pero no puedo obtener nada lo suficientemente confiable como para usarlo en la práctica. Se agradecerá cualquier idea sobre dónde buscar algoritmos de clasificación o cómo usarlos correctamente. ¿No estoy limpiando la entrada? ¿Qué tal una mejor base de datos de entrada? No sé qué más utilizaría para la entrada, cada dígito y plantilla se ve bien en este momento.
Utilicé una imagen de 3x5 (similar a las filas/columnas en la pantalla digital) y funciona muy bien con kBúsqueda más cercana. Muerto en. ¡Gracias! – pyromanfo
¡Me alegra oír eso! ¡Seguir! – Sam