Tengo dos listas:Cálculo de la similitud de dos listas
por ejemplo. a = [1,8,3,9,4,9,3,8,1,2,3] y b = [1,8,1,3,9,4,9,3,8, 1,2,3]
Ambos contienen enteros. No hay ningún significado detrás de las entradas (por ejemplo, 1 no está 'más cerca' de 3 que 8).
Estoy tratando de diseñar un algoritmo para calcular la similitud entre dos listas ORDERED. Ordenada es la palabra clave aquí (así que no puedo tomar el conjunto de ambas listas y calcular su porcentaje de diferencia de set_). A veces los números se repiten (por ejemplo 3, 8 y 9 arriba, y no puedo ignorar las repeticiones).
En el ejemplo anterior, la función a la que llamaría me diría que a y b son ~ 90% similares, por ejemplo. ¿Cómo puedo hacer eso? Editar distancia fue algo que vino a la mente. Sé cómo usarlo con cadenas, pero no estoy seguro de cómo usarlo con una lista de entradas. ¡Gracias!
Teniendo en cuenta una cadena a ser simplemente una lista de caracteres, no parece estar una asignación bastante simple entre calcular la distancia de edición en cadenas y calcular la distancia de edición en listas de enteros. – Chowlett
tal vez está buscando la [distancia de Hamming] (http://en.wikipedia.org/wiki/Hamming_distance)? –
@Pat B: la distancia de Hamming requiere que las secuencias tengan la misma longitud y no puede tratar con eliminaciones/inserciones. Eche un vistazo al ejemplo de OP ('a' y' b'). – NPE