que tener la estructura siguiente Python 2.7 diccionario de datos (no controlo de datos de origen - viene de otro sistema tal cual):la eliminación de duplicados del diccionario
{112762853378: {'dst': ['10.121.4.136'], 'src': ['1.2.3.4'], 'alias': ['www.example.com'] }, 112762853385: {'dst': ['10.121.4.136'], 'src': ['1.2.3.4'], 'alias': ['www.example.com'] }, 112760496444: {'dst': ['10.121.4.136'], 'src': ['1.2.3.4'] }, 112760496502: {'dst': ['10.122.195.34'], 'src': ['4.3.2.1'] }, 112765083670: ... }
Las claves de un diccionario siempre será única. Dst, src y alias pueden ser duplicados. Todos los registros siempre tendrán un dst y src pero no todos los registros necesariamente tendrán un alias como se ve en el tercer registro.
En la muestra de datos se eliminarán los dos primeros registros (no me importa cuál). El tercer registro se consideraría único, ya que aunque dst y src son lo mismo, falta alias.
Mi objetivo es eliminar todos los registros donde dst, src y alias han sido duplicados, independientemente de la clave.
¿Cómo funciona esto rookie lograr esto?
Además, mi comprensión limitada de Python interpreta la estructura de datos como un diccionario con los valores almacenados en los diccionarios ... un dict de dicts, ¿es correcto?
Este es un buen punto de partida, pero me siento obligado a señalar que será lento para grandes colecciones de datos, porque con cada ciclo, crea una nueva lista de valores y realiza una búsqueda lineal sobre ella. – senderle
Esto funcionó con simplicidad y belleza. –
@senderle: Agradezco su pensamiento y comentario con respecto a la velocidad y tomará en cuenta si es necesario. ¿Te importa ampliar esta respuesta para aumentar el rendimiento? –