提交后,下面是输出到log文件中片段:
——————————————————
Domain decomposition grid 2 x 6 x 2, separate PME ranks 0
PME domain decomposition: 2 x 12 x 1
...
Using 24 MPI processes
Using 1 OpenMP thread per MPI process
On host gpu47 4 GPUs selected for this run.
Mapping of GPU IDs to the 24 GPU tasks in the 24 ranks on this node:
PP:0,PP:0,PP:0,PP:0,PP:0,PP:0,PP:1,PP:1,PP:1,PP:1,PP:1,PP:1,PP:2,PP:2,PP:2,PP:2,PP:2,PP:2,PP:3,PP:3,PP:3,PP:3,PP:3,PP:3
PP tasks will do (non-perturbed) short-ranged and most bonded interactions on the GPU
——————————————————
看了此帖中的介绍http://bbs.keinsci.com/thread-13861-1-1.html,有个不明白的地方,想请教大家:我设置的是24个ranks,且短程非键作用、键结作用都放在gpu上计算,而PME放在cpu上计算,从log输出来看,pme的ranks数为0,意思是不是cpu上计算的内容不计入ranks?只有gpu上的才算?