Sé que los dispositivos antes de la arquitectura Fermi tenían 8 SP en un único multiprocesador. ¿El conteo es igual en la arquitectura de Fermi?¿Cuántos 'núcleos CUDA' tiene cada multiprocesador de una GPU?
Respuesta
El número de multiprocesadores (MP) y el número de núcleos por MP se puede encontrar mediante la ejecución de DeviceQuery.exe. Se encuentra en el directorio %NVSDKCOMPUTE_ROOT%/C/bin
de la instalación del GPU Computing SDK.
Una mirada al código de DeviceQuery (encontrado en %NVSDKCOMPUTE_ROOT%/C/src/DeviceQuery
) revela que el número de núcleos se calcula haciendo pasar la x.y CUDA Capability números a la función ConvertSMVer2Cores utilidad.
A partir del código de ConvertSMVer2Cores esta relación entre la capacidad y el núcleo recuento se puede ver:
Capability: Cores
10: 8
11: 8
12: 8
13: 8
20: 32
21: 48
La respuesta depende de la propiedad Capacidad de cálculo del dispositivo CUDA. Los números son:
- Compute Capability < = 1,3 -> 8 CUDA Cores/SM
- CC == 2,0 -> 32 núcleos CUDA/SM
- CC == 2,1 -> 48 CUDA núcleos/SM
Consulte el apéndice G del CUDA C Programming Guide.
Actualización de respuesta de @ AshwinNanjappa para CUDA 7.5:
Compute
Capability # Cores
-----------------------
1.x: 8
2.0: 32
2.1: 48
3.x: 192
5.x: 128
Notas:
- CUDA 7.5 ya no es compatible con el dispositivo con cálculo capacidad 1.x.
- Estos no son realmente 'núcleos' en el sentido de núcleos de CPU. Consulte this question aquí en Desbordamiento de pila.
- En las GPU de Maxwell (5.x), el número de 'núcleos' por multiprocesador tiene disminuyó.
- Obtuve la información adicional de
$CUDA_SAMPLES_DIR/common/inc/helper_cuda.h
.
- 1. Lanzamiento simultáneo de Núcleos Múltiples usando CUDA para una GPU
- 2. ¿Cómo se mapean/deforman/hilos CUDA en núcleos CUDA?
- 3. ¿Cuántos núcleos para SSIS?
- 4. Parámetros para núcleos CUDA
- 5. Computación multi-GPU Cuda
- 6. ¿Cuántos bytes tiene una cadena
- 7. ¿Es posible ejecutar CUDA en GPU AMD?
- 8. Ejecución simultánea del kernel CUDA con múltiples núcleos por secuencia
- 9. Cadena tiene cuántos parámetros
- 10. ¿Cuántos métodos predeterminados tiene una clase?
- 11. ¿Cómo ejecutar CUDA sin una GPU usando una implementación de software?
- 12. Restablecer la GPU y el controlador después del error CUDA
- 13. ¿Transfiere eficientemente archivos grandes (hasta 2GB) a la GPU CUDA?
- 14. ¿La manera más fácil de probar la existencia de una GPU compatible con cuda de cmake?
- 15. Determinar cuántos campos tiene un objeto Javascript
- 16. ¿Cuántos ServiceContracts tiene un servicio WCF?
- 17. SLI para múltiples GPU
- 18. ¿Cómo evaluar el rendimiento de CUDA?
- 19. ¿Cuántos argumentos tiene main() en C/C++
- 20. Programación multiprocesador: pilas sin bloqueo
- 21. ¿Cómo puedo hacer que un programa concurrente ya escrito se ejecute en una matriz de GPU?
- 22. ¿Cuántos núcleos de CPU puede utilizar un solo proceso de Java?
- 23. ¿Tiene sentido ejecutar cálculos del nivel de kernel del sistema operativo en una GPU?
- 24. Múltiples hilos de host que inician kernels CUDA individuales
- 25. ¿Cómo se calcula la carga en una tarjeta nvidia (compatible con cuda), gpu?
- 26. ¿elasticsearch tiene el equivalente de 'núcleos' como en solr?
- 27. ¿Cuántos hilos (o elementos de trabajo) se pueden ejecutar al mismo tiempo?
- 28. cpu vs gpu - cuando la CPU es mejor
- 29. ¿Puedo utilizar núcleos en GPU desde C# SIN cambiar al código?
- 30. ¿Qué necesito para programar la GPU Tegra