¿Qué enfoque puedo usar para predecir la nacionalidad de una persona a partir del apellido?cómo adivinar la nacionalidad de una persona del apellido?
Tengo una gran lista de textos y apellidos de autores. Me gustaría identificar qué textos han sido escritos por hablantes de lenguas latinas y qué textos han sido escritos por hablantes nativos de inglés, con el fin de estudiar si ciertos patrones de estilo de escritura son diferentes en un grupo en comparación con el otro.
He buscado en google y pubmed una base de datos de apellidos, pero no he podido encontrar ninguno de forma gratuita. Otro enfoque es usar algunas expresiones regulares, por ejemplo, ". * Ez" para identificar algunos apellidos hispanos, como "rodriguez", pero no me lleva muy lejos.
¿Tiene alguna sugerencia? Ya que revisaré manualmente todas las asociaciones después de hacer la predicción, no necesito una gran precisión, pero cualquier ayuda o idea será bienvenida.
Alguien en la TSA podría saberlo. – awm
Wow. Eso parece una gran tarea. Dudo que sea capaz de lograr una gran precisión ya que los apellidos obviamente pueden cambiar de generación en generación y las personas no siempre se consideran de una nacionalidad específica, incluso si su apellido es de esa nación. ¿Qué tipo de precisión necesitarías en esto de todos modos? Supongo que si tuviera acceso a datos como directorios telefónicos/censos de diferentes naciones, ciertamente podría buscar nombres comunes y similitudes con dichos apellidos comunes. Por ejemplo, una diferencia de 1 carácter es básicamente el mismo nombre. – Thor84no
Porque tienes un apellido español no implica que no seas un hablante nativo de inglés, ni funciona en la otra dirección. – bitmask