2009-12-09 17 views
5

Soy un estudiante universitario y es hora de comprar libros de texto nuevamente. Este trimestre hay más de 20 libros que necesito para las clases. Normalmente esto no sería tan importante, ya que simplemente copiaría y pegaría los ISBN en Amazon. Sin embargo, los ISBN se convierten en una imagen en el sitio de libros de mi escuela. Todo lo que quiero hacer es poner los ISBN en una cadena para no tener que escribir cada uno a mano. He usado GOCR para convertir las imágenes en texto, pero quiero usarlo con un script de Ruby para poder automatizar el proceso y hacer lo mismo con mis compañeros de clase.Uso de Ruby y Ubuntu con reconocimiento óptico de caracteres

Puedo navegar hasta el sitio. ¿Cómo puedo guardar la imagen en un archivo en mi computadora (ejecutando UBUNTU), convertir la imagen con GOCR y finalmente guardarla en un archivo para poder acceder a ellos nuevamente con mi script de Ruby?

Respuesta

2

Suena como un proyecto genial, y no debería ser demasiado difícil si las imágenes ISBN se almacenan en archivos individuales.

Este

todo se puede ejecutar en segundo plano:

  • descarga página web (net/http)
  • guardar metadatos + archivo de imagen para cada libro (clip)
  • plazo Gobierno de Costa Rica en todas las imágenes

Todo lo que necesita es una lista de direcciones URL o un rastreador (mechanize) y luego probablemente necesite dedicar unos minutos a escribir un analizador (consulte la publicación de joe) para las páginas html de la universidad.

3

GOCR parece ser una buena opción al principio, pero por lo que puedo decir de mi propia "investigación", la calidad no es suficiente para el uso diario. Tal vez esto podría ocasionar un problema, dependiendo de la entrada de imagen. Si no te funciona, prueba la función "nueva" de Google Docs, que te permite subir imágenes para OCR. A continuación, puede recuperar los resultados utilizando google api (hay toneladas por ahí, estoy usando gdata-ruby-util que requiere un poco de piratería,

También puede usar tesseract-ocr para la parte de OCR, también es de código abierto y en desarrollo activo.

Para la parte de recuperación, me gustaría seguir con hpricot, superpotente y flexible.

Cuestiones relacionadas