Cuando se invoca un kernel CUDA para una configuración específica de subprocesos, ¿existen reglas estrictas en en las que los parámetros del núcleo de memoria (dispositivo/host) deberían residir y qué tipo deberían ser?Parámetros para núcleos CUDA
Supongamos que lanzar una rejilla de 1-D de hilos con
kernel<<<numblocks, threadsperblock >>> (/*parameters*/)
¿Puedo pasar un parámetro entero int foo
que es una variable -integer anfitrión, directamente al kernel CUDA? ¿O debería cudaMalloc
memoria para un solo entero decir dev_foo
y luego cudaMemcpy
foo
en devfoo
y luego pasar devfoo
como un parámetro de kernel?