2012-01-16 15 views
5

No sé cómo buscar letras griegas en un pdf. ¿Cómo puedo hacer esto? Idealmente, podría hacerlo en un paquete de software de visor de PDF.Búsqueda de caracteres griegos dentro de un documento PDF

Desde las publicaciones del foro que he visto, las letras griegas caen fuera de los caracteres estándar unicode que se incluyen en la especificación pdf.

+0

¿Por qué no puedes verificar si las letras coinciden con [\ u0391- \ u03A9, \ u03B1- \ u03C9]? –

+0

Cuando uso el comando pdftotext desde xpdf, los caracteres griegos aparecen como caracteres latinos. Creo que esto se debe a que las salidas de pdftotext en utf-8 que no incluyen el alfabeto griego [link] (http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues) ¿Qué configuración de salida de pdf2text podría Yo uso eso incluiría caracteres griegos? – Chogg

+0

Preferiblemente, sin embargo, buscaría estos caracteres en un programa como pdf-XChange viewer. Solo puedo ingresar letras que escribo en un cuadro de búsqueda, así que no sé cómo indicar el hecho de que quiero buscar una codificación Unicode en lugar de los caracteres que componen la codificación Unicode (por ejemplo, \ u0391) si ver a qué me refiero – Chogg

Respuesta

2

He descubierto lo que estaba haciendo mal, y fue bastante básico.

Puedo buscar una letra griega simplemente usando el mapa de caracteres o cambiando al teclado del alfabeto griego, por ejemplo, αβγ.

Esto generalmente encuentra los caracteres griegos. Sin embargo, muchos PDF no reconocen correctamente los caracteres griegos y en su lugar tienen una aproximación al personaje con otras formas. Esto, presumiblemente, depende de cómo se hicieron los PDF.

Cuestiones relacionadas