2012-07-09 19 views
8

Hice esta función:transliteración cirílico al latino con función javascript

function transliterate(word){ 

    var answer = ""; 

    A = new Array(); 
    A["Ё"]="YO";A["Й"]="I";A["Ц"]="TS";A["У"]="U";A["К"]="K";A["Е"]="E";A["Н"]="N";A["Г"]="G";A["Ш"]="SH";A["Щ"]="SCH";A["З"]="Z";A["Х"]="H";A["Ъ"]="'"; 
    A["ё"]="yo";A["й"]="i";A["ц"]="ts";A["у"]="u";A["к"]="k";A["е"]="e";A["н"]="n";A["г"]="g";A["ш"]="sh";A["щ"]="sch";A["з"]="z";A["х"]="h";A["ъ"]="'"; 
    A["Ф"]="F";A["Ы"]="I";A["В"]="V";A["А"]="A";A["П"]="P";A["Р"]="R";A["О"]="O";A["Л"]="L";A["Д"]="D";A["Ж"]="ZH";A["Э"]="E"; 
    A["ф"]="f";A["ы"]="i";A["в"]="v";A["а"]="a";A["п"]="p";A["р"]="r";A["о"]="o";A["л"]="l";A["д"]="d";A["ж"]="zh";A["э"]="e"; 
    A["Я"]="YA";A["Ч"]="CH";A["С"]="S";A["М"]="M";A["И"]="I";A["Т"]="T";A["Ь"]="'";A["Б"]="B";A["Ю"]="YU"; 
    A["я"]="ya";A["ч"]="ch";A["с"]="s";A["м"]="m";A["и"]="i";A["т"]="t";A["ь"]="'";A["б"]="b";A["ю"]="yu"; 

for (i in word){ 

    if (A[word[i]] === 'undefined'){ 
     answer += word[i]; 
     } 
    else { 
     answer += A[word[i]]; 
     } 

return answer; 
} 
} 

Ahora se debe transcribir el texto cirílico al latino latino y dejar pasar simplemente. Pero solo logra transcribir el primero más tarde y en el caso de latin da como respuesta indefinida. ¿Alguien podría darme una idea, qué estoy haciendo mal?

+0

An ide? Como en un _ entorno de desarrollo integrado_, o un _idea_? – Daedalus

Respuesta

39

par de cosas ...

  1. uso indefinido en lugar de 'indefinido'
  2. No ponga el retorno en el circuito
  3. Uso hasOwnProperty filtrar funciones y propiedades en el prototipo
  4. Use [] en lugar de la nueva matriz()
  5. Use un {} en lugar de un []
  6. Use variables de minúsculas en vez de mayúsculas.Mayúscula está reservado para los constructores

Este es el código

function transliterate(word){ 
    var answer = "" 
     , a = {}; 

    a["Ё"]="YO";a["Й"]="I";a["Ц"]="TS";a["У"]="U";a["К"]="K";a["Е"]="E";a["Н"]="N";a["Г"]="G";a["Ш"]="SH";a["Щ"]="SCH";a["З"]="Z";a["Х"]="H";a["Ъ"]="'"; 
    a["ё"]="yo";a["й"]="i";a["ц"]="ts";a["у"]="u";a["к"]="k";a["е"]="e";a["н"]="n";a["г"]="g";a["ш"]="sh";a["щ"]="sch";a["з"]="z";a["х"]="h";a["ъ"]="'"; 
    a["Ф"]="F";a["Ы"]="I";a["В"]="V";a["А"]="a";a["П"]="P";a["Р"]="R";a["О"]="O";a["Л"]="L";a["Д"]="D";a["Ж"]="ZH";a["Э"]="E"; 
    a["ф"]="f";a["ы"]="i";a["в"]="v";a["а"]="a";a["п"]="p";a["р"]="r";a["о"]="o";a["л"]="l";a["д"]="d";a["ж"]="zh";a["э"]="e"; 
    a["Я"]="Ya";a["Ч"]="CH";a["С"]="S";a["М"]="M";a["И"]="I";a["Т"]="T";a["Ь"]="'";a["Б"]="B";a["Ю"]="YU"; 
    a["я"]="ya";a["ч"]="ch";a["с"]="s";a["м"]="m";a["и"]="i";a["т"]="t";a["ь"]="'";a["б"]="b";a["ю"]="yu"; 

    for (i in word){ 
    if (word.hasOwnProperty(i)) { 
     if (a[word[i]] === undefined){ 
     answer += word[i]; 
     } else { 
     answer += a[word[i]]; 
     } 
    } 
    } 
    return answer; 
} 

uno más funcional es así ...

var a = {"Ё":"YO","Й":"I","Ц":"TS","У":"U","К":"K","Е":"E","Н":"N","Г":"G","Ш":"SH","Щ":"SCH","З":"Z","Х":"H","Ъ":"'","ё":"yo","й":"i","ц":"ts","у":"u","к":"k","е":"e","н":"n","г":"g","ш":"sh","щ":"sch","з":"z","х":"h","ъ":"'","Ф":"F","Ы":"I","В":"V","А":"a","П":"P","Р":"R","О":"O","Л":"L","Д":"D","Ж":"ZH","Э":"E","ф":"f","ы":"i","в":"v","а":"a","п":"p","р":"r","о":"o","л":"l","д":"d","ж":"zh","э":"e","Я":"Ya","Ч":"CH","С":"S","М":"M","И":"I","Т":"T","Ь":"'","Б":"B","Ю":"YU","я":"ya","ч":"ch","с":"s","м":"m","и":"i","т":"t","ь":"'","б":"b","ю":"yu"}; 

function transliterate(word){ 
    return word.split('').map(function (char) { 
    return a[char] || char; 
    }).join(""); 
} 
+0

Me encuentro revisitando esta pregunta de vez en cuando y estoy bastante seguro de que este es el más compacto y código utilizable que aborda este problema, uno lo encontrará allí. ¡Gracias! – tftd

+2

Me gustó el funcional. Compacto y conciso! – Faramarz

+0

Hola, ¿sabes si hay una biblioteca que hace eso? (lo necesitaría para otro alfabeto también) – franck

2

Su problema principal es que el return está en el lugar equivocado. Es dentro de su ciclo, por lo que regresa en la primera iteración. Cámbielo a:

function transliterate(word){ 

    var answer = ""; 

    A = new Array(); 
    A["Ё"]="YO";A["Й"]="I";A["Ц"]="TS";A["У"]="U";A["К"]="K";A["Е"]="E";A["Н"]="N";A["Г"]="G";A["Ш"]="SH";A["Щ"]="SCH";A["З"]="Z";A["Х"]="H";A["Ъ"]="'"; 
    A["ё"]="yo";A["й"]="i";A["ц"]="ts";A["у"]="u";A["к"]="k";A["е"]="e";A["н"]="n";A["г"]="g";A["ш"]="sh";A["щ"]="sch";A["з"]="z";A["х"]="h";A["ъ"]="'"; 
    A["Ф"]="F";A["Ы"]="I";A["В"]="V";A["А"]="A";A["П"]="P";A["Р"]="R";A["О"]="O";A["Л"]="L";A["Д"]="D";A["Ж"]="ZH";A["Э"]="E"; 
    A["ф"]="f";A["ы"]="i";A["в"]="v";A["а"]="a";A["п"]="p";A["р"]="r";A["о"]="o";A["л"]="l";A["д"]="d";A["ж"]="zh";A["э"]="e"; 
    A["Я"]="YA";A["Ч"]="CH";A["С"]="S";A["М"]="M";A["И"]="I";A["Т"]="T";A["Ь"]="'";A["Б"]="B";A["Ю"]="YU"; 
    A["я"]="ya";A["ч"]="ch";A["с"]="s";A["м"]="m";A["и"]="i";A["т"]="t";A["ь"]="'";A["б"]="b";A["ю"]="yu"; 

    for (i in word){ 

     if (A[word[i]] === 'undefined'){ 
      answer += word[i]; 
      } 
     else { 
      answer += A[word[i]]; 
      } 

    } 
    return answer; // <=== Was *above* the } on the previous line 
} 

Tenga en cuenta que he solucionado la sangría. La indentación constante te ayuda a evitar este tipo de errores.


Nota 1: No hay nada sobre su objeto A que utiliza el hecho de que es un Array. Solo lo estás usando como un mapa. En JavaScript, todos los objetos son mapas, así que en vez de A = new Array(); simplemente use A = {};.

Nota 2: A y i nunca se declaran en su función, por lo que caen víctimas de The Horror of Implicit Globals. Para solucionarlo, declarelos con var.

Nota 3: Ni usar for..in para recorrer los caracteres de una cadena, ni usar [] para indexar en la cadena, es confiable en todos los motores de JavaScript. En su lugar, use for (i = 0; i < word.length; ++i) y luego ch = word.charAt(i); para obtener el carácter en esa posición, luego use ch en su código dentro del ciclo.

Nota 4: Se puede utilizar el Curiously powerful || operator para acortar su código, por ejemplo .:

answer += A[ch] || ch; 
3

No utilice una matriz para esta tarea. No use for in para iterar una cadena. No verifique con la cadena "undefined". No haga return dentro del lazo for.

function transliterate(word) { 
    var A = {}; 
    var result = ''; 

    A["Ё"]="YO";A["Й"]="I";A["Ц"]="TS";A["У"]="U";A["К"]="K";A["Е"]="E";A["Н"]="N";A["Г"]="G";A["Ш"]="SH";A["Щ"]="SCH";A["З"]="Z";A["Х"]="H";A["Ъ"]="'"; 
    A["ё"]="yo";A["й"]="i";A["ц"]="ts";A["у"]="u";A["к"]="k";A["е"]="e";A["н"]="n";A["г"]="g";A["ш"]="sh";A["щ"]="sch";A["з"]="z";A["х"]="h";A["ъ"]="'"; 
    A["Ф"]="F";A["Ы"]="I";A["В"]="V";A["А"]="A";A["П"]="P";A["Р"]="R";A["О"]="O";A["Л"]="L";A["Д"]="D";A["Ж"]="ZH";A["Э"]="E"; 
    A["ф"]="f";A["ы"]="i";A["в"]="v";A["а"]="a";A["п"]="p";A["р"]="r";A["о"]="o";A["л"]="l";A["д"]="d";A["ж"]="zh";A["э"]="e"; 
    A["Я"]="YA";A["Ч"]="CH";A["С"]="S";A["М"]="M";A["И"]="I";A["Т"]="T";A["Ь"]="'";A["Б"]="B";A["Ю"]="YU"; 
    A["я"]="ya";A["ч"]="ch";A["с"]="s";A["м"]="m";A["и"]="i";A["т"]="t";A["ь"]="'";A["б"]="b";A["ю"]="yu"; 

    for(var i = 0; i < word.length; i++) { 
     var c = word.charAt(i); 

     result += A[c] || c; 
    } 

    return result; 
} 

Here is a jsFiddle demonstration.

+0

No coloque 'var i' en la construcción del lazo. No coloque 'var c' en el cuerpo del bucle. Por qué: [* Pobre, incomprendido 'var' *] (http://blog.niftysnippets.org/2008/03/poor-misunderstood-var.html) +1 de lo contrario –

+0

@TJCrowder: Sé que los define como un ámbito de función, y estoy muy contento con el hecho. Es simplemente una convención de codificación. Gracias de cualquier forma. –

+0

@ Charmander: una mala. Sin embargo, si quiere engañar activamente a las personas que mantienen su código, continúe. ;-) (Tenga en cuenta que 'let' está llegando a JavaScript, lo que hace que este uso de' var' sea más precario.) –

0

Combinando recomendaciones de Bart Riemens y T. J. Crowder se me ocurrió este código, que parece ser el truco perfecto:

function transliterate(word){ 

    var answer = ""; 
    var a = {} 

    a["Ё"]="YO";a["Й"]="I";a["Ц"]="TS";a["У"]="U";a["К"]="K";a["Е"]="E";a["Н"]="N";a["Г"]="G";a["Ш"]="SH";a["Щ"]="SCH";a["З"]="Z";a["Х"]="H";a["Ъ"]="'"; 
    a["ё"]="yo";a["й"]="i";a["ц"]="ts";a["у"]="u";a["к"]="k";a["е"]="e";a["н"]="n";a["г"]="g";a["ш"]="sh";a["щ"]="sch";a["з"]="z";a["х"]="h";a["ъ"]="'"; 
    a["Ф"]="F";a["Ы"]="I";a["В"]="V";a["А"]="a";a["П"]="P";a["Р"]="R";a["О"]="O";a["Л"]="L";a["Д"]="D";a["Ж"]="ZH";a["Э"]="E"; 
    a["ф"]="f";a["ы"]="i";a["в"]="v";a["а"]="a";a["п"]="p";a["р"]="r";a["о"]="o";a["л"]="l";a["д"]="d";a["ж"]="zh";a["э"]="e"; 
    a["Я"]="Ya";a["Ч"]="CH";a["С"]="S";a["М"]="M";a["И"]="I";a["Т"]="T";a["Ь"]="'";a["Б"]="B";a["Ю"]="YU"; 
    a["я"]="ya";a["ч"]="ch";a["с"]="s";a["м"]="m";a["и"]="i";a["т"]="t";a["ь"]="'";a["б"]="b";a["ю"]="yu"; 

    for (i = 0; i < word.length; ++i){ 

     answer += a[word[i]] === undefined ? word[i] : a[word[i]]; 
    } 
    return answer; 
} 

Than you!

+1

Cool! ¿Has visto mi última versión funcional? :-) –

+0

@Bart Riemens Al principio no se notó, pero es más corto y más universal. – kyng

1

Los símbolos rusos en js no funcionan en absoluto en mi sistema. No sé por qué. Así que uso el siguiente código para esto:

No solo transcribirá pero reemplazará toda la puntuación con '_' y todo en minúsculas.

function translit(str){ 
 
\t var sp = '_'; 
 
\t var text = str.toLowerCase(); 
 
\t var transl = { 
 
\t \t '\u0430': 'a', '\u0431': 'b', '\u0432': 'v', '\u0433': 'g', '\u0434': 'd', '\u0435': 'e', '\u0451': 'e', '\u0436': 'zh', 
 
\t \t '\u0437': 'z', '\u0438': 'i', '\u0439': 'j', '\u043a': 'k', '\u043b': 'l', '\u043c': 'm', '\u043d': 'n', '\u043e': 'o', 
 
\t \t '\u043f': 'p', '\u0440': 'r', '\u0441': 's', '\u0442': 't', '\u0443': 'u', '\u0444': 'f', '\u0445': 'h', '\u0446': 'c', 
 
\t \t '\u0447': 'ch', '\u0448': 'sh', '\u0449': 'shch', '\u044a': '\'', '\u044b': 'y', '\u044c': '', '\u044d': 'e', '\u044e': 'yu', 
 
\t \t '\u044f': 'ya', \t \t 
 
\t \t '\u00AB':'_', '\u00BB':'_', // «» 
 
\t \t ' ': sp, '_': sp, '`': sp, '~': sp, 
 
\t \t '!': sp, '@': sp, '#': sp, '$': sp, 
 
\t \t '%': sp, '^': sp, '&': sp, '*': sp, '(': sp, ')': sp, '-': sp, '\=': sp, 
 
\t \t '+': sp, '[': sp, ']': sp, '\\': sp, '|': sp, '/': sp, '.': sp, ',': sp, 
 
\t \t '{': sp, '}': sp, '\'': sp, '"': sp, ';': sp, ':': sp, '?': sp, '<': sp, 
 
\t \t '>': sp, '№': sp \t \t \t \t \t 
 
\t } 
 
    var result = ''; 
 
\t var curent_sim = ''; 
 
    for(i=0; i < text.length; i++) { 
 
\t \t if(transl[text[i]] != undefined) { \t \t \t 
 
\t \t \t if(curent_sim != transl[text[i]] || curent_sim != sp){ 
 
\t \t \t \t result += transl[text[i]]; 
 
\t \t \t \t curent_sim = transl[text[i]]; \t \t \t \t 
 
\t \t \t } \t \t \t \t \t 
 
\t \t } else { 
 
\t \t \t result += text[i]; 
 
\t \t \t curent_sim = text[i]; 
 
\t \t } \t \t 
 
    } 
 
\t result = result.replace(/^_/, '').replace(/_$/, ''); // trim 
 
\t return result 
 
} 
 

 
var result = translit('Привет Мир!'); 
 
document.getElementById('alias').value = result;
<html> 
 
    <body> 
 
    <input name="name" type="text" id="alias" /> 
 
    </body> 
 
</html>

El código fue tomada originalmente aquí: http://ajaxs.ru/lesson/js/137-transliteracija_stroki_na_javascript.html y luego refactorizado.

3

En mis proyectos que estoy utilizando este método de transliteración:

var transliterate = function(text) { 

    text = text 
     .replace(/\u0401/g, 'YO') 
     .replace(/\u0419/g, 'I') 
     .replace(/\u0426/g, 'TS') 
     .replace(/\u0423/g, 'U') 
     .replace(/\u041A/g, 'K') 
     .replace(/\u0415/g, 'E') 
     .replace(/\u041D/g, 'N') 
     .replace(/\u0413/g, 'G') 
     .replace(/\u0428/g, 'SH') 
     .replace(/\u0429/g, 'SCH') 
     .replace(/\u0417/g, 'Z') 
     .replace(/\u0425/g, 'H') 
     .replace(/\u042A/g, '') 
     .replace(/\u0451/g, 'yo') 
     .replace(/\u0439/g, 'i') 
     .replace(/\u0446/g, 'ts') 
     .replace(/\u0443/g, 'u') 
     .replace(/\u043A/g, 'k') 
     .replace(/\u0435/g, 'e') 
     .replace(/\u043D/g, 'n') 
     .replace(/\u0433/g, 'g') 
     .replace(/\u0448/g, 'sh') 
     .replace(/\u0449/g, 'sch') 
     .replace(/\u0437/g, 'z') 
     .replace(/\u0445/g, 'h') 
     .replace(/\u044A/g, "'") 
     .replace(/\u0424/g, 'F') 
     .replace(/\u042B/g, 'I') 
     .replace(/\u0412/g, 'V') 
     .replace(/\u0410/g, 'a') 
     .replace(/\u041F/g, 'P') 
     .replace(/\u0420/g, 'R') 
     .replace(/\u041E/g, 'O') 
     .replace(/\u041B/g, 'L') 
     .replace(/\u0414/g, 'D') 
     .replace(/\u0416/g, 'ZH') 
     .replace(/\u042D/g, 'E') 
     .replace(/\u0444/g, 'f') 
     .replace(/\u044B/g, 'i') 
     .replace(/\u0432/g, 'v') 
     .replace(/\u0430/g, 'a') 
     .replace(/\u043F/g, 'p') 
     .replace(/\u0440/g, 'r') 
     .replace(/\u043E/g, 'o') 
     .replace(/\u043B/g, 'l') 
     .replace(/\u0434/g, 'd') 
     .replace(/\u0436/g, 'zh') 
     .replace(/\u044D/g, 'e') 
     .replace(/\u042F/g, 'Ya') 
     .replace(/\u0427/g, 'CH') 
     .replace(/\u0421/g, 'S') 
     .replace(/\u041C/g, 'M') 
     .replace(/\u0418/g, 'I') 
     .replace(/\u0422/g, 'T') 
     .replace(/\u042C/g, "'") 
     .replace(/\u0411/g, 'B') 
     .replace(/\u042E/g, 'YU') 
     .replace(/\u044F/g, 'ya') 
     .replace(/\u0447/g, 'ch') 
     .replace(/\u0441/g, 's') 
     .replace(/\u043C/g, 'm') 
     .replace(/\u0438/g, 'i') 
     .replace(/\u0442/g, 't') 
     .replace(/\u044C/g, "'") 
     .replace(/\u0431/g, 'b') 
     .replace(/\u044E/g, 'yu'); 

    return text; 
}; 

ejecutar este ejemplo transliterar:

transliterate('абвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ'); 

he sustituido todas las letras rusas con sus análogos Unicode (cada letra comienza con \ u) para resolver problemas con la codificación en el archivo Javascript.

Para verificar la velocidad de ejecución, tomé la mejor respuesta a esta pregunta y la comparé con mi ejemplo. Mi método parecía ser más rápido en varias ocasiones (0.16 ms en Firebug :-).

speed comparison in firebug

+1

¡Buena solución, gracias! – Kholiavko

Cuestiones relacionadas