计算化学公社

 找回密码 Forget password
 注册 Register
Views: 12042|回复 Reply: 7
打印 Print 上一主题 Last thread 下一主题 Next thread

[新手求助] Gaussian16用理论40核计算速度下降问题

[复制链接 Copy URL]

2

帖子

0

威望

35

eV
积分
37

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
本人刚开始接触高斯计算,用高速运算服务器的一个计算节点(包含20核,但因使用了SMT功能(?)理论可以使用40核)计算。结果同样的初始结构用40核和20核计算,经过时间(elapsed time)分别是7h21min和7h30min,但CPU时间分别是5d11h6min和4d52min。
猜测可能是高斯计算没有使用到40核计算,但高斯起始文件(~.gjf)中分别指定了%noprocshared=40或20。
想问高斯计算有理论上限么?这种情况下怎么提高计算速度?是否需要多节点分别计算?
多谢大神们的指教

3097

帖子

29

威望

1万

eV
积分
17098

Level 6 (一方通行)

2#
发表于 Post on 2018-10-26 10:46:45 | 只看该作者 Only view this author
20核就是20核,hyperthread出来的应该表述为“40线程”,不是啥“理论40核”。有多少物理核心就用多少个高斯线程(你没有描述错的话你有20个),否则每个线程都没有闲着的时候,显然会抢资源。

这和高斯的并行上限无关,计算任务不太小的时候72核并行都仍然有优势(当然你要有包含72个物理核心的机器)

6万

帖子

99

威望

5万

eV
积分
120109

管理员

公社社长

3#
发表于 Post on 2018-10-26 12:06:37 | 只看该作者 Only view this author
仔细看
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392
Gaussian的安装方法及运行时的相关问题
http://sobereva.com/439

别想着跨节点
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

2

帖子

0

威望

35

eV
积分
37

Level 2 能力者

4#
 楼主 Author| 发表于 Post on 2018-10-26 12:44:02 | 只看该作者 Only view this author
sobereva 发表于 2018-10-26 12:06
仔细看
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

多谢社长,好好学习

35

帖子

0

威望

937

eV
积分
972

Level 4 (黑子)

5#
发表于 Post on 2019-4-1 22:52:29 | 只看该作者 Only view this author
多核处理不一定能获得线性加速比(即四十核耗时降到二十核耗时的一半)
比如多个核(线程)抢夺临界资源的时候就会使效率降低

理论上限参考Brent定理(固定工作量下讨论并行算法效率)
提高计算速度:选择支持avx2的,cache比较大的CPU
多节点计算通信开销大

210

帖子

0

威望

1577

eV
积分
1787

Level 5 (御坂)

6#
发表于 Post on 2019-4-29 08:38:08 | 只看该作者 Only view this author
本帖最后由 灰飞的旋律 于 2019-4-29 09:51 编辑
haos314 发表于 2019-4-1 22:52
多核处理不一定能获得线性加速比(即四十核耗时降到二十核耗时的一半)
比如多个核(线程)抢夺临界资源的 ...

请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条)比双路 E5 2680v4(2.4GHz 共28物理核,8根2400MHZ 8G内存条)计算速度反而慢了一大截呢,迭代一次耗时,也就是LOOP,前者21333秒,后者16545秒,那么实际耗时前者5.9小时,后者4.6小时,40核INCAR里NCORE=5, 28核设置的4.,没有开超线程
请问比较有可能会是哪些原因呢

54

帖子

0

威望

591

eV
积分
645

Level 4 (黑子)

7#
发表于 Post on 2021-1-23 14:48:42 | 只看该作者 Only view this author
灰飞的旋律 发表于 2019-4-29 08:38
请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条 ...

很有可能是多通道技术的问题,你后面的那个机器8根内存,不知道是不是插满了,开启了多通道技术,而前面那个机器虽然CPU强悍一些,但是只4根内存,肯定是没开启多通道技术的

2407

帖子

1

威望

5950

eV
积分
8377

Level 6 (一方通行)

8#
发表于 Post on 2021-1-24 15:40:00 | 只看该作者 Only view this author
灰飞的旋律 发表于 2019-4-29 08:38
请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条 ...

开启内存通道呀,
内存容量大不一定有用。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 08:13 , Processed in 0.166369 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list