计算化学公社

 找回密码 Forget password
 注册 Register
Views: 10314|回复 Reply: 27
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] AMD EPYC 7742服务器运行Gaussian 09效率问题求助!

[复制链接 Copy URL]

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
按照Sob大神的推荐,最近配置了一个服务器,2颗AMD EPYC 7742,共128核。16条32G三星DDR4内存。最近运行Gaussian09任务的时候发现很奇怪,每次同时提交4个任务,每个任务32核64G内存,老是发现第一个提交的任务运行很快,第二个很慢,然后第三个又很快,第四个很慢。做测试同时提交4个相同的任务也是这种情况,各位大神有没有遇到过这种情况!!

1237

帖子

1

威望

3501

eV
积分
4758

Level 6 (一方通行)

2#
发表于 Post on 2021-3-31 11:05:52 | 只看该作者 Only view this author
甭在这么新的cpu用g09,效率相当堪忧,而且g09在用了12核以后并行效率急剧降低,根本没必要给那么多核心

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2021-3-31 11:13:48 | 只看该作者 Only view this author
biogon 发表于 2021-3-31 11:05
甭在这么新的cpu用g09,效率相当堪忧,而且g09在用了12核以后并行效率急剧降低,根本没必要给那么多核心

用16核提交任务也是会出现这种情况的!!

1237

帖子

1

威望

3501

eV
积分
4758

Level 6 (一方通行)

4#
发表于 Post on 2021-3-31 11:37:43 | 只看该作者 Only view this author
hgp2006 发表于 2021-3-31 11:13
用16核提交任务也是会出现这种情况的!!

因为是g09的问题,导致经常要切换CCD或者CPU运行,g16没这种问题

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 2021-3-31 11:39:35 | 只看该作者 Only view this author
biogon 发表于 2021-3-31 11:37
因为是g09的问题,导致经常要切换CCD或者CPU运行,g16没这种问题

多谢多谢,但是我之前用INtel服务器从来没有出现过这种问题,这是不同cpu的区别吗?

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

6#
发表于 Post on 2021-3-31 11:52:05 | 只看该作者 Only view this author
G09 请勿超过12个核心。
否则效率不理想。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

81

帖子

0

威望

1371

eV
积分
1452

Level 4 (黑子)

7#
发表于 Post on 2021-3-31 13:01:14 | 只看该作者 Only view this author
想办法把任务钉扎在固定的cpu核心上。

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

8#
 楼主 Author| 发表于 Post on 2021-3-31 13:14:27 | 只看该作者 Only view this author
beowulf 发表于 2021-3-31 13:01
想办法把任务钉扎在固定的cpu核心上。

想不出原因,这个在之前使用intel服务器的时候没有这种问题出现

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

9#
发表于 Post on 2021-3-31 13:32:03 | 只看该作者 Only view this author
或许 可以借助slurm把计算绑定在分配的资源上。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

10#
 楼主 Author| 发表于 Post on 2021-3-31 13:57:50 | 只看该作者 Only view this author
abin 发表于 2021-3-31 13:32
或许 可以借助slurm把计算绑定在分配的资源上。

现在是想知道到底是不是因为amd和intel的区别还是别的缘故,因为intel从来没出现过这种情况

200

帖子

0

威望

1501

eV
积分
1701

Level 5 (御坂)

11#
发表于 Post on 2021-3-31 14:10:24 | 只看该作者 Only view this author
高斯吃主频,不很吃内存带宽。如果你的主力使用软件是高斯,可以选择配备高主频最少2.5GHz,且低核心的CPU,单节点核心数我觉得32左右就可以应对绝大部分场景。另外最好一个节点只跑一个任务。你可以在测试下在你这台机上,交两个任务,每个任务用64核,看下计算效率如何,我猜应该会都挺正常的

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

12#
 楼主 Author| 发表于 Post on 2021-3-31 14:13:41 | 只看该作者 Only view this author
灰飞的旋律 发表于 2021-3-31 14:10
高斯吃主频,不很吃内存带宽。如果你的主力使用软件是高斯,可以选择配备高主频最少2.5GHz,且低核心的CPU ...

是的,如果只提交2个任务是正常的,但是128核的服务器不可能只同时算2个任务,一个任务32核已经足够了,大多时间是16核的任务
关键是我也有intel的服务器,从来没出现这种问题,所以想问问各位大神是不是amd需要特别的设置?

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

13#
 楼主 Author| 发表于 Post on 2021-3-31 15:27:55 | 只看该作者 Only view this author
灰飞的旋律 发表于 2021-3-31 14:10
高斯吃主频,不很吃内存带宽。如果你的主力使用软件是高斯,可以选择配备高主频最少2.5GHz,且低核心的CPU ...

那个换成epyc 7282是不是更好一点,主频2.8G

545

帖子

0

威望

3125

eV
积分
3670

Level 5 (御坂)

14#
发表于 Post on 2021-3-31 16:00:37 | 只看该作者 Only view this author
本帖最后由 k64_cc 于 2021-3-31 16:04 编辑

我们组有EPYC 7702,之前测的时候觉得应该真就是内存带宽没分配好。
你们也有128核的intel server可以测试吗?这个服务器购买策略真有意思……

24

帖子

0

威望

98

eV
积分
122

Level 2 能力者

15#
 楼主 Author| 发表于 Post on 2021-3-31 16:50:07 | 只看该作者 Only view this author
k64_cc 发表于 2021-3-31 16:00
我们组有EPYC 7702,之前测的时候觉得应该真就是内存带宽没分配好。
你们也有128核的intel server可以测试 ...

之前是老的服务器,不是测试速度,是说在intel服务器上从来没遇到过提交几个相同任务还有速度差异这么大的问题

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 19:55 , Processed in 0.178213 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list