老师好,我设置了一个任务,原子数共一万七千多个,启用GPU加速,电脑有2个CPU,总共64核128线程,有2张显卡。一次是只运算一个任务,计算效率约是750ns/day,显卡利用率20%多;但是当我尝试同时计算两个任务的时候(两个同样的任务),如果是在同一张显卡上,显卡利用率约40%,如果两个任务是分别在两张显卡上做计算,每个显卡的利用率大概20%,但是不论用几张显卡,每个任务的计算效率都只有250ns/day,比起只计算一个任务大大降低了。我对比了log文件,看起来除了末尾的计算效率数值其他都一模一样,请教老师该怎么使同时进行的两个任务的计算效率都到750ns/day呢?
--------------------------------------
每个任务都是:
1 GPU selected for this run.
Mapping of GPU IDs to the 2 GPU tasks in the 1 rank on this node:
PP:0,PME:0
PP tasks will do (non-perturbed) short-ranged interactions on the GPU
PP task will update and constrain coordinates on the CPU
PME tasks will do all aspects on the GPU
Using 1 MPI thread
Using 64 OpenMP threads
Pinning threads with an auto-selected logical core stride of 2
System total charge: 0.000
Will do PME sum in reciprocal space for electrostatic interactions.