Tengo un cliente que está distribuyendo archivos binarios grandes internamente. También están aprobando sumas de comprobación md5 de los archivos y aparentemente verificando los archivos con la suma de comprobación antes de usarlos como parte de su flujo de trabajo.¿Cuán probable es md5 sumas positivas falsas?
Sin embargo, afirman que "a menudo" se encuentran con daños en los archivos donde el md5 todavía dice que el archivo es bueno.
Todo lo que he leído sugiere que esto debería ser muy poco probable.
¿Suena probable? ¿Algún otro algoritmo hash proporcionaría mejores resultados? ¿Debería realmente estar viendo problemas de proceso, como afirmar que comprueban la suma de comprobación, pero que realmente no lo hacen?
NB, todavía no sé qué significa "a menudo" en este contexto. Están procesando cientos de archivos por día. No sé si esto es una ocurrencia diaria, mensual o anual.
Haga que proporcionen un ejemplo de un archivo "corrupto" y el original "bueno". –
¿Es posible que la suma de md5 se haya calculado en un archivo dañado o que la corrupción se haya producido después de calcular la suma? Para estar seguro, tome la sugerencia de Anon y obtenga un ejemplo de dos archivos con la misma suma de comprobación. – BMitch
Entonces, ¿desde entonces, has mirado la idea de sincronización de bittorrent? getsync.com] – dlamblin