Tengo un archivo de texto largo que usa codificaciones aparentemente diferentes en bloques de texto posteriores (iso o utf-8). Es el resultado de agregar texto usando >> file.bib
y copiar y pegar de diferentes fuentes (páginas web).Corregir la codificación del archivo de texto codificado incoherentemente
Los bloques pueden, en principio, ser distinguidos como son bibtex
entradas
@article{key, author={lastname, firstname}, ...}
me gustaría convertirlo en un archivo coherente UTF-8, ya que parece chocar mi visor bibtex (kbibtex). Sé que puedo usar iconv
para convertir la codificación de archivos completos, pero me gustaría saber si hay una manera de arreglar mi archivo sin corromper algunas de las entradas.
Proporcione más detalles, consulte [Preguntas sobre la conversión de un archivo de codificación mixta a UTF8 en Perl] (http://stackoverflow.com/questions/6897982/questions-about-converting-a-mixed-encoding-file- to-utf8-in-perl) para una comparación de qué información es útil. – daxim
Debe comenzar por dividir el archivo en los documentos HTML individuales. Luego puede verificar cada documento para una lista de materiales y un conjunto de caracteres en el elemento HEAD. – ikegami