He pasado por Cuda programming guide pero aún no estoy seguro de dónde reside el núcleo de cuda en la GPU? En otras palabras, ¿en qué segmento de memoria reside?¿Dónde reside el código del núcleo de Cuda en la GPU nvidia?
Además, ¿cómo sé cuál es el tamaño máximo del kernel compatible con mi dispositivo? Si el tamaño máximo del kernel depende de la cantidad de kernels simultáneos cargados en el dispositivo?
Para que quede claro, ¿existen restricciones si dos núcleos juntos superan las 2 millones de instrucciones? por ejemplo, ¿pueden ejecutarse al mismo tiempo? – jmilloy
Eso, no sé, pero lo dudo. Personalmente, creo que si estás llegando al límite de las instrucciones, debes replantear el diseño de tu kernel para que sea un poco más modular. – tkerwin