Tengo una pregunta sobre la predicción de derivación en las GPU. Hasta donde yo sé, en las GPU, sí predican con ramas.Predicación de rama en la GPU
Por ejemplo I tienen un código como este:
if (C)
A
else
B
así que si A toma 40 ciclos y B tarda 50 ciclos para terminar la ejecución, si asumiendo por una urdimbre, tanto A como B son ejecutados, también lo hace toma en total 90 ciclos para terminar esta rama? ¿O se superponen A y B, es decir, cuando se ejecutan algunas instrucciones de A, entonces se espera la solicitud de memoria, luego se ejecutan algunas instrucciones de B, luego se espera la memoria, y así sucesivamente? Gracias
Para aquellos que están tentados a editar más esta cuestión, tenga en cuenta que la predicción de bifurcación y bifurcación son ** no ** lo mismo ...... – talonmies
He encontrado una buena descripción aquí: http: // www.yosefk.com/blog/simd-simt-smt-parallelism-in-nvidia-gpus.html –