Estoy tratando de entender el uso de recursos para cada uno de mis hilos CUDA para un kernel escrito a mano. compilé mi archivo kernel.cu a un archivo kernel.o con nvcc -arch=sm_20 -ptxas-options=-v y
De acuerdo con "CUDA C Programming Guide", un acceso a memoria constante se beneficia solo si se golpea un caché de multiprocesador constante (Sección 5.3.2.4) . De lo contrario, puede haber incluso m
No me las puedo imaginar, ¿cuál es la mejor manera de garantizar que la memoria utilizada en mi núcleo sea constante? Hay una pregunta similar en http://stackoverflow...r-pleasant-way. Estoy trabajand