2010-11-30 41 views
7

Estoy buscando una explicación/API doc/ejemplos de cómo usar (y entrenar?) Tesseract en C++, nada útil en la página de Tesseract de Google, y aún así encontrar algo en la web .Tesseract u otra OCR lib

Cualquier fuente útil, las experiencias serían más que bienvenidas, ya que no tengo idea de cómo empezar.

P.S:

  1. Estoy abierto a sugerencias sobre otros bibliotecas.
  2. Sólo GRATIS bibliotecas

Respuesta

4

tengo algo de experiencia con Tesseract ... un Google sencilla de 'entrenamiento Tesseract' revela esta página: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract en el que debe elegir qué versión de Tesseract desea tren .. Mientras que 3 es la última versión, es completamente nuevo y por lo tanto las personas todavía están resolviendo cualquier problema, todavía estoy usando la versión 2.4. De todos modos, verás que hay 9 pasos para entrenar tesseract para un "idioma" en particular (o lo que se debería haber llamado "fuentes" o "juegos de caracteres"). También puede usar el idioma 'eng' existente, pero depende de su aplicación. Por ejemplo, en mi aplicación tendría que hacer el análisis del documento y tomar una región en particular y querer OCR una cadena de números de 13 caracteres, y necesitaba una gran precisión, y no quería que se lea '5' como ' S 'y' 0 'como' O ', etc., por lo que era lógico crear un' idioma 'particular de mi conjunto de fuentes particular que constaba solo de los caracteres 0..9, mientras que a usted no le importaba si recibía' ruido 'adicional

+0

Gracias, ¿alguna idea de dónde encuentro un tutorial/docs de la API para C++? – snoofkin

0

Tesseract Ocr es una biblioteca de código abierto para detectar caracteres ópticos. Solo necesita incluir los archivos de la biblioteca si está usando Visual Studio. Si está usando el creador de qt, entonces debe construir la biblioteca para trabajar en el QT. Necesita usar CMakelist o Cmake Gui para construir la biblioteca. Puede visitar el enlace Opencv Ocr build for Qt 5.4 mingw

Cuestiones relacionadas