Me gustaría calcular un hash de una clase de Python que contiene un conjunto de datos para Machine Learning. El hash está destinado a ser utilizado para el almacenamiento en caché, por lo que estaba pensando en md5
o sha1
. El problema es que la mayoría de los datos se almacenan en matrices NumPy; estos no proporcionan un miembro __hash__()
. Actualmente hago un pickle.dumps()
para cada miembro y calculo un hash basado en estas cadenas. Sin embargo, he encontrado los siguientes enlaces que indica que el mismo objeto podría dar lugar a diferentes cadenas de serialización:Cómo hash un objeto grande (conjunto de datos) en Python?
¿Cuál sería el mejor método para calcular un hash para una clase de Python que contiene matrices Numpy?
No mucho de un programador experto en python pero, ¿sería serializar el objeto y el hash que funciona? – Louis