La guía de programación CUDA afirma queSignificado de ancho de banda en CUDA y por qué es importante
"Ancho de banda es uno de los factores de compuerta más importantes para el rendimiento. Casi todos los cambios en el código se deben hacer en el contexto de cómo afectan el ancho de banda ".
Continúa para calcular el ancho de banda teórico que es del orden de cientos de gigabytes por segundo. No entiendo por qué la cantidad de bytes que uno puede leer/escribir en la memoria global es un reflejo de cuán optimizado está el kernel.
Si tengo un kernel que hace cálculos intensivos en datos almacenados en memoria compartida y/o registros, con solo una lectura al principio y escriba al final desde y hacia la memoria global, seguramente el ancho de banda efectivo será pequeño, mientras que el kernel mismo puede ser muy eficiente.
¿Podría alguien explicar el ancho de banda en este contexto?
Gracias