¿Cómo puedo medir el porcentaje de similitud entre dos secuencias de cadenas?Algoritmo para medir la similitud entre dos secuencias de cadenas
Tengo dos archivos de texto y en los archivos allí secuencias se escriben así
Primer archivo:
AAA BBB DDD CCC GGG MMM AAA MMM
Segundo archivo:
acreditación DDD CCC AAA MMM MMM
¿Cómo se mide la similitud entre estos dos archivos en términos de orden de las cadenas?
Por ejemplo en el ejemplo anterior ambos archivos tienen similitud debido a la orden de cuerdas es igual sin embargo, algunas cadenas no están presentes en el archivo-2. ¿Qué algoritmo es el más adecuado para resolver este problema, de modo que pueda medir qué tan similar es el orden de las cadenas, no la frecuencia de las cadenas en dos?