计算化学公社

 找回密码 Forget password
 注册 Register
Views: 11582|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 关于gromcas运行效率

[复制链接 Copy URL]

115

帖子

0

威望

3850

eV
积分
3965

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
应该如何优化gromacs的运行效率?

单台服务器上只能调整分给pme的mpi数目吗?
在一台64核服务器上测试了几个任务
好像使用mpi比omp的核效率更高,而且omp有数目限制
pme的核都是自动分配的
mdrun     -ntmpi   N   -ntomp 1   -pin on
用64核运行78ns/day
用16核39ns/day
尝试增加一个16核的任务
结果反而两个任务都被拖慢了  第二个任务显示只有8ns/day

单机运行gromacs是只能跑一个任务吗?  似乎其他任务比如vasp也会影响他的效率
另外的mpi版gromacs也是这样吗?

115

帖子

0

威望

3850

eV
积分
3965

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2016-9-18 18:12:31 | 只看该作者 Only view this author
仔细看了下手册  
两个任务的看起来像是超线程影响
gmx mdrun -nt 6 -pin on -pinoffset 0
gmx mdrun -nt 6 -pin on -pinoffset 3
要再加上一个参数把任务分到别的cpu上
Starts two mdrun processes, each with six total threads. Threads will have their affinities set to particular logical cores, beginning from the logical core with rank 0 or 3, respectively. The above would work well on an Intel CPU with six physical cores and hyper-threading enabled. Use this kind of setup only if restricting mdrun to a subset of cores to share a node with other processes.

例子中6 6 10的体系分解成了9 6 1、9 9 1 损失最小
dd区域分解好像不需要对应上空间

115

帖子

0

威望

3850

eV
积分
3965

Level 5 (御坂)

2#
 楼主 Author| 发表于 Post on 2016-9-5 11:40:18 | 只看该作者 Only view this author
补充下
http://blog.sciencenet.cn/blog-548663-907229 .html

总节点数
-dd
X Y Z
-npme
性能
性能损失(*)
ns/day
hour/n
32
auto
6 4 1
auto
8
5.061
4.742
13.4%
64
auto
(48)
auto
16
错误
8 6 1
16
9.325
2.574
11.6%
7 7 1
15
9.836
2.440
10.2%
9 6 1
10
9.945
2.413
5.3%
96
9 9 1
15
14.470
1.659
5.2%
12 7 1
12
错误

这里的优化是针对多节点
单台机器是否需要用mpi版进行同样优化?

不过最关键的是有其他任务存在时能不能减小这个影响?

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 08:18 , Processed in 0.204353 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list