¿Cómo puedo calcular FLOPS de mi aplicación? Si tengo el número total de instrucciones ejecutadas, puedo dividirlas por el tiempo de ejecución. Pero, ¿cómo contar el número de instrucciones ejecutadas?Cálculo de FLOPS (Operaciones de coma flotante por segundos)
Mi pregunta es general y la respuesta para cualquier idioma es muy apreciada. Pero estoy buscando una solución para mi aplicación desarrollada por C/C++ y CUDA.
No sé si las etiquetas son correctas, corríjanme si me equivoco.
posible duplicado de [Cómo calcular Gflops de un kernel] (http://stackoverflow.com/questions/7875607/how-to-calculate-gflops-of-a-kernel) – talonmies
¡Estoy al tanto de esa pregunta! Mi pregunta es general. Cómo calcular FLOPS? Incluso multi-core. La respuesta también puede ayudar a mi caso 'CUDA'. – ahmad
Publiqué sobre cómo se pueden usar las herramientas de NVIDIA para reunir FLOP en [Cálculo del ancho de banda logrado y FLOPS ...] (http://stackoverflow.com/questions/12539300/calculating-achieved-bandwidth-and-flops-gflops-and -evaluate-cuda-kernel-perfor). Para x86 hay varias bibliotecas de Linux para calcular FLOP. El monitor de rendimiento x86 admite conteo de FLOP, pero deberá leer el manual para comprender los detalles (instrucciones especulativas, lo que se cuenta, ...) –