Recientemente descubrí, para mi asombro (nunca habiéndolo pensado antes), que los nombres propios japoneses de clasificación de máquinas aparentemente no son posibles.¿Se pueden clasificar las palabras en kanji japonés por programación?
Trabajo en una aplicación que debe permitir al usuario seleccionar un hospital desde una interfaz de 3 menús. El primer menú es Prefectura, el segundo es Nombre de la ciudad y el tercero es Hospital. Cada menú debe ordenarse, como es de esperar, para que el usuario pueda encontrar lo que quiere en el menú.
Permítanme exponer lo que he encontrado, como preámbulo a mi pregunta:
El orden esperado para palabras japonesas se basa en su pronunciación. Los kanji no tienen un orden inherente (hay decenas de miles de kanji en uso), pero los silabarios fonéticos japoneses sí tienen un orden: あ, い, え, お, か, き, き, け, お, か, く, こ, お, か, き, く, え, お, か, く, え, おy para los cincuenta sonidos distintivos tradicionales (algunos de los cuales son obsoletos en el japonés moderno). Este orden de clasificación se llama 五十 音 順 (gojuu on jun, o '50-orden de sonido ').
Por lo tanto, las palabras kanji deben ordenarse en el mismo orden que si estuvieran escritas en hiragana. (Puede representar cualquier palabra kanji en hiragana fonética en japonés.)
El pateador: no hay una forma canónica de determinar la pronunciación de una palabra dada escrita en kanji. Nunca sabes. Algunos kanji tienen diez o más pronunciaciones diferentes, dependiendo de la palabra. Muchas palabras comunes están en el diccionario, y probablemente podría crear una forma de buscarlas desde una de las bases de datos gratuitas del diccionario, pero los nombres propios (por ejemplo, nombres de hospitales) no están en el diccionario.
Entonces, en mi aplicación, tengo una lista de cada prefectura, ciudad y hospital de Japón. Para ordenar estas listas, que es un requisito, necesito una lista coincidente de cada uno de estos nombres en forma fonética (kana).
No puedo pensar en otra cosa que no sea pagarle a alguien con fluidez en japonés (solo soy regular) para transcribirlos manualmente. Antes de hacerlo, aunque:
¿Es posible que estoy totalmente en lo alto de fuego, y que en realidad es una manera de hacer esto de clasificación sin crear mis propias asignaciones de palabras kanji a lecturas fonéticas, que tengo alguna ¿pasado por alto?
¿Hay un mapeo públicamente disponible de nombres de prefecturas/ciudades, del gobierno o algo así? Eso reduciría el mapeo manual que tendría que hacer solo para nombres de hospitales.
¿Alguien tiene algún otro consejo sobre cómo abordar este problema? Cualquier lenguaje de programación está bien, estoy trabajando con Ruby on Rails, pero estaría encantado de poder escribir un programa que tome la entrada de kanji (digamos 40,000 nombres propios) y luego generar las representaciones fonéticas como datos que podría importar en mi aplicación Rails.
宜 し く お 願 い し ま す.
Vaya, eso es cierto acerca del caso de las prefecturas en ventanas emergentes. Gracias. No estoy usando VB, pero ciertamente no me importa usarlo si ayuda a automatizar el kanji → conversión fonética. – Mason