|
本帖最后由 xmubingo 于 2012-3-10 10:39 编辑
顶!!!!
CUDA部分:
关于每个block有多少个thread是由具体GPU的计算能力决定的。在CUDA_C_Programming_Guide4.0中的第158页中描述了不同计算能力的芯片,X,Y,Z方向的最大维数以及block中的最大thread数。
另一个,至于一个网格内有多少个block组成这个问题,在第8页中有解释:- The number of thread blocks in a grid is usually dictated by the size of the data being processed or the number of processors in the system, which it can greatly exceed.
复制代码 意思是和GPU内存有关。具体怎么计算你可以研究下,这个计算我目前还没搞清。
最后一个问题,理论上,一个GPU就一个网格,多个GPU就多个网格。如果有多块GPU怎么实现合并,或者分别访问?这也是个问题。比如236服务器上就有5块显卡。 |
|