计算化学公社

标题: Gaussian16用理论40核计算速度下降问题 [打印本页]

作者
Author:
Gaussian18    时间: 2018-10-26 10:13
标题: Gaussian16用理论40核计算速度下降问题
本人刚开始接触高斯计算,用高速运算服务器的一个计算节点(包含20核,但因使用了SMT功能(?)理论可以使用40核)计算。结果同样的初始结构用40核和20核计算,经过时间(elapsed time)分别是7h21min和7h30min,但CPU时间分别是5d11h6min和4d52min。
猜测可能是高斯计算没有使用到40核计算,但高斯起始文件(~.gjf)中分别指定了%noprocshared=40或20。
想问高斯计算有理论上限么?这种情况下怎么提高计算速度?是否需要多节点分别计算?
多谢大神们的指教

作者
Author:
liyuanhe211    时间: 2018-10-26 10:46
20核就是20核,hyperthread出来的应该表述为“40线程”,不是啥“理论40核”。有多少物理核心就用多少个高斯线程(你没有描述错的话你有20个),否则每个线程都没有闲着的时候,显然会抢资源。

这和高斯的并行上限无关,计算任务不太小的时候72核并行都仍然有优势(当然你要有包含72个物理核心的机器)
作者
Author:
sobereva    时间: 2018-10-26 12:06
仔细看
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392
Gaussian的安装方法及运行时的相关问题
http://sobereva.com/439

别想着跨节点

作者
Author:
Gaussian18    时间: 2018-10-26 12:44
sobereva 发表于 2018-10-26 12:06
仔细看
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

多谢社长,好好学习
作者
Author:
haos314    时间: 2019-4-1 22:52
多核处理不一定能获得线性加速比(即四十核耗时降到二十核耗时的一半)
比如多个核(线程)抢夺临界资源的时候就会使效率降低

理论上限参考Brent定理(固定工作量下讨论并行算法效率)
提高计算速度:选择支持avx2的,cache比较大的CPU
多节点计算通信开销大
作者
Author:
灰飞的旋律    时间: 2019-4-29 08:38
本帖最后由 灰飞的旋律 于 2019-4-29 09:51 编辑
haos314 发表于 2019-4-1 22:52
多核处理不一定能获得线性加速比(即四十核耗时降到二十核耗时的一半)
比如多个核(线程)抢夺临界资源的 ...

请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条)比双路 E5 2680v4(2.4GHz 共28物理核,8根2400MHZ 8G内存条)计算速度反而慢了一大截呢,迭代一次耗时,也就是LOOP,前者21333秒,后者16545秒,那么实际耗时前者5.9小时,后者4.6小时,40核INCAR里NCORE=5, 28核设置的4.,没有开超线程
请问比较有可能会是哪些原因呢
作者
Author:
planet5460    时间: 2021-1-23 14:48
灰飞的旋律 发表于 2019-4-29 08:38
请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条 ...

很有可能是多通道技术的问题,你后面的那个机器8根内存,不知道是不是插满了,开启了多通道技术,而前面那个机器虽然CPU强悍一些,但是只4根内存,肯定是没开启多通道技术的
作者
Author:
abin    时间: 2021-1-24 15:40
灰飞的旋律 发表于 2019-4-29 08:38
请问下我做VASP计算,HSE泛函算DOS,可是我的双路E5 2673V4(2.3HGz 共40物理核,4根2400MHZ  32G内存条 ...

开启内存通道呀,
内存容量大不一定有用。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3