计算化学公社

 找回密码 Forget password
 注册 Register
Views: 10310|回复 Reply: 27
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] AMD EPYC 7742服务器运行Gaussian 09效率问题求助!

[复制链接 Copy URL]

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
按照Sob大神的推荐,最近配置了一个服务器,2颗AMD EPYC 7742,共128核。16条32G三星DDR4内存。最近运行Gaussian09任务的时候发现很奇怪,每次同时提交4个任务,每个任务32核64G内存,老是发现第一个提交的任务运行很快,第二个很慢,然后第三个又很快,第四个很慢。做测试同时提交4个相同的任务也是这种情况,各位大神有没有遇到过这种情况!!

1237

帖子

1

威望

3499

eV
积分
4756

Level 6 (一方通行)

28#
发表于 Post on 2021-4-28 17:29:09 | 只看该作者 Only view this author
喵星大佬 发表于 2021-4-6 22:20
高斯输入文件本身就可以用%cpu编号钉死

但是G09不支持

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

27#
发表于 Post on 2021-4-28 09:33:09 | 只看该作者 Only view this author
单机上简单搞一个slurm, 直接通过cgroup绑定CPU编号。
然后就踏实了。

openPBS也是支持的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

1633

帖子

4

威望

4097

eV
积分
5810

Level 6 (一方通行)

喵星人

26#
发表于 Post on 2021-4-6 22:20:21 | 只看该作者 Only view this author
beowulf 发表于 2021-4-1 21:40
这货是openmp并行的吧,拿likwid 钉死试试看。likwid是个小工具,自行编译一下就好安装了。
likwid = li ...

高斯输入文件本身就可以用%cpu编号钉死

81

帖子

0

威望

1371

eV
积分
1452

Level 4 (黑子)

25#
发表于 Post on 2021-4-1 21:40:03 | 只看该作者 Only view this author
本帖最后由 beowulf 于 2021-4-1 21:41 编辑
hgp2006 发表于 2021-3-31 22:40
已经安装Gaussian16试过了,还是相同问题!

这货是openmp并行的吧,拿likwid 钉死试试看。likwid是个小工具,自行编译一下就好安装了。
likwid = likely I know what I am doing

200

帖子

0

威望

1501

eV
积分
1701

Level 5 (御坂)

24#
发表于 Post on 2021-4-1 17:04:06 | 只看该作者 Only view this author
beowulf 发表于 2021-3-31 13:01
想办法把任务钉扎在固定的cpu核心上。

这里再测试用户最多的分子动力学程序GROMACS的情况。版本是2016.3,体系是三万六千原子的蛋白质+水体系,跑100ps动力学。GROMACS的mdrun可以通过-pin on来强制要求CPU核心与mdrun线程绑定,类似于%CPU。下面来看测试结果
开HT,用72核:         87.053 ns/day 99.252s
开HT,用36核:         77.363 ns/day 111.684s
开HT,用36核,-pin on:81.582 ns/day 105.908s
关HT,用36核:         83.199 ns/day 103.85s
关HT,用36核,-pin on:83.164 ns/day 103.893s
转自 正确认识超线程(HT)技术对计算化学运算的影响 - 思想家公社的门口:量子化学·分子模拟·二次元  http://sobereva.com/392

200

帖子

0

威望

1501

eV
积分
1701

Level 5 (御坂)

23#
发表于 Post on 2021-4-1 13:05:18 | 只看该作者 Only view this author
hgp2006 发表于 2021-3-31 14:13
是的,如果只提交2个任务是正常的,但是128核的服务器不可能只同时算2个任务,一个任务32核已经足够了, ...

两个任务就正常,那应该就是前面4楼和7楼说的原因,经常切换CPU导致的,所以7楼说的想办法把一个任务固定在一个CPU上,我觉得要是可以实现应该就能解决你的问题

230

帖子

0

威望

2653

eV
积分
2883

Level 5 (御坂)

22#
发表于 Post on 2021-4-1 09:14:24 | 只看该作者 Only view this author
操作系统,各个软件版本,BIOS设置,NUMA设置

你啥都没说……

1237

帖子

1

威望

3499

eV
积分
4756

Level 6 (一方通行)

21#
发表于 Post on 2021-4-1 09:06:13 | 只看该作者 Only view this author
hgp2006 发表于 2021-3-31 22:44
您好!麻烦问一下intel和amd处理器是不是使用的Gaussian 09的版本应该是不一样的?我现在使用的都是ES64L ...

没有,那么老的软件怎么可能有为epyc优化的版本

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

20#
 楼主 Author| 发表于 Post on 2021-3-31 22:44:39 | 只看该作者 Only view this author
biogon 发表于 2021-3-31 11:05
甭在这么新的cpu用g09,效率相当堪忧,而且g09在用了12核以后并行效率急剧降低,根本没必要给那么多核心

您好!麻烦问一下intel和amd处理器是不是使用的Gaussian 09的版本应该是不一样的?我现在使用的都是ES64L-G09RevE.01版本。

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

19#
 楼主 Author| 发表于 Post on 2021-3-31 22:40:08 | 只看该作者 Only view this author
qinzhong605 发表于 2021-3-31 22:26
为啥不换成G16呢,有G09版权不影响用G16呀

已经安装Gaussian16试过了,还是相同问题!

113

帖子

0

威望

3124

eV
积分
3237

Level 5 (御坂)

18#
发表于 Post on 2021-3-31 22:26:32 | 只看该作者 Only view this author
为啥不换成G16呢,有G09版权不影响用G16呀

1237

帖子

1

威望

3499

eV
积分
4756

Level 6 (一方通行)

17#
发表于 Post on 2021-3-31 20:35:13 | 只看该作者 Only view this author
k64_cc 发表于 2021-3-31 16:00
我们组有EPYC 7702,之前测的时候觉得应该真就是内存带宽没分配好。
你们也有128核的intel server可以测试 ...

四路机器效率也不行

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

16#
 楼主 Author| 发表于 Post on 2021-3-31 16:52:16 | 只看该作者 Only view this author
k64_cc 发表于 2021-3-31 16:00
我们组有EPYC 7702,之前测的时候觉得应该真就是内存带宽没分配好。
你们也有128核的intel server可以测试 ...

内存带宽问题是怎么解决的呢?

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

15#
 楼主 Author| 发表于 Post on 2021-3-31 16:50:07 | 只看该作者 Only view this author
k64_cc 发表于 2021-3-31 16:00
我们组有EPYC 7702,之前测的时候觉得应该真就是内存带宽没分配好。
你们也有128核的intel server可以测试 ...

之前是老的服务器,不是测试速度,是说在intel服务器上从来没遇到过提交几个相同任务还有速度差异这么大的问题

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 17:42 , Processed in 0.316769 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list