obtener la posición exacta del texto de la imagen en tesseract

Usando el método GetHOCRText (0) en tesseract Puedo recuperar el texto en html y al presentar el html en la vista web puedo obtener el texto pero la posición del texto en la imagen es diferente de la salida. Cualquier idea es de gran ayuda.obtener la posición exacta del texto de la imagen en tesseract

tesseract->SetInputName("word"); 
tesseract->SetOutputName("xyz"); 
tesseract->Recognize(NULL); 


char *utf8Text=tesseract->GetHOCRText(0);

This the image i'm using for tesseract

y salida de imagen método enter image description here

Fuente

2012-09-05 srividya

¿ha tenido éxito con el reconocimiento de posición? –

GetBoxText() volverá posición exacta de cada caracteres en una matriz.

char *boxtext = _tesseract->GetBoxText(0); 
NSString* aBoxText = [NSString stringWithUTF8String:boxtext];

Fuente

2013-04-29 12:19:36

¿Cómo hacer esto con Swift? – Husam

Si tiene la salida hocr, debe tener una etiqueta para cada palabra. Estas etiquetas deben tener class = "ocrx_word" y name = "bbox x1 y1 x2 y2" donde xey son la esquina superior izquierda e inferior derecha del cuadro delimitador alrededor de la palabra. No creo que sea posible utilizar esta información de forma automática para formatear un documento de texto; sería necesario traducir las diferencias de píxeles al número de pestañas/espacios. Sin embargo, debería poder mostrar el texto en la ubicación determinada.

Fuente

2013-07-05 14:50:56 Mongoose1021

obtener la posición exacta del texto de la imagen en tesseract

Respuesta

Cuestiones relacionadas