第一个用法,你开了HT,B的-pinoffset通常应该是80。具体你装个htop命令,随便跑几个试一下就明白了。注意htop(至少我用的版本)的输出第1列和第3列都是第1块CPU,第2列和第4列都是第2块CPU,而且第1列和第3列对应的位置代表同一个物理核心的两个逻辑核心,这点你可以跑个Gaussian 16任务,然后用%CPU设置内核绑定和用%NProcShared不设定内核绑定来确认。-pinoffset至少在我这边的电脑上是按照htop显示的第1-3-2-4列顺序的,所以绑定到第2块CPU上应该是-pinoffset 80而不是40。考虑到频率上不去,给的核再多效果也有限,很快达到饱和,我估计这里用上超线程给gmx的意义不大。另外注意确认一下哪块CPU和哪块GPU是直连不经过芯片组的,如果交叉了性能会明显下降,实测一下便知。 |
sobereva 发表于 2024-1-3 02:10 谢谢老师,再麻烦您下,如果是4个人使用的话,这样分配可以么? A:gmx mdrun -v -deffnm md -ntmpi 1 -ntomp 40 -pinoffset 0 -pme gpu -nb gpu -gpu_id 0 B:gmx mdrun -v -deffnm md -ntmpi 1 -ntomp 40 -pinoffset 40 -pme gpu -nb gpu -gpu_id 0 C:gmx mdrun -v -deffnm md -ntmpi 1 -ntomp 40 -pinoffset 80 -pme gpu -nb gpu -gpu_id 1 D:gmx mdrun -v -deffnm md -ntmpi 1 -ntomp 40 -pinoffset 120 -pme gpu -nb gpu -gpu_id 1 |
1是得当做法,不要用2 对硬件没损害 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-27 08:59 , Processed in 0.303952 second(s), 26 queries , Gzip On.