计算化学公社

 找回密码 Forget password
 注册 Register
Views: 644|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[Gaussian/gview] G16-A03-AVX2在全电子SCF计算上慢于G09-E01-AVX

[复制链接 Copy URL]

188

帖子

0

威望

486

eV
积分
674

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
最近在做一些重元素的计算时发现,Gaussian-16 A.03 版(AVX2)的SCF速度慢于Gaussian-09 E.01 版(AVX),在全电子计算上尤其明显,虽然两者的计算结果一样。
下表为Xe单原子体系的单点能计算耗时,使用B3LYP泛函,使用CPU单核和2GW内存,Gaussian-16的计算使用g09defaults关键词,计算机处理器为AMD的Ryzen-5950X。其中DKH4对时间的贡献可以忽略(去掉后时间减小很少)。详细的输入输出文件在附件中。
基组 哈密顿 g09-l502-迭代次数 g09-l502-耗时(秒) g16-l502-迭代次数 g16-l502-耗时(秒)
def2-QZVP 非相对论 9 1.1 9 1.9
sapporo-dkh3-tzp-2012 DKH4 9 1.9 9 10.2


Xe_scf.zip

1.13 MB, 下载次数 Times of downloads: 1

Xe_scf.zip

5万

帖子

99

威望

5万

eV
积分
112356

管理员

公社社长

2#
发表于 Post on 2024-2-15 13:39:18 | 只看该作者 Only view this author
监控一下CPU占用率是否差不多,也看看情况更简单的HF的耗时情况
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

188

帖子

0

威望

486

eV
积分
674

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2024-2-15 16:38:39 | 只看该作者 Only view this author
sobereva 发表于 2024-2-15 13:39
监控一下CPU占用率是否差不多,也看看情况更简单的HF的耗时情况

谢谢社长的建议。
对于用g16跑sapporo-dkh3-tzp-2012基组的那组测试,尝试了HF(9轮收敛)以及BLYP(12轮收敛),结果(l502耗时)都是10秒左右。然后尝试读取上一次的初猜重跑,HF和BLYP都是1轮收敛但l502还需要9-10秒。在输出文件里看到了"Keep R1 ints in memory in symmetry-blocked form, NReq="这种内容,意识到双电子积分是预先算好的"in core"模式,而不是每轮都算的direct模式。在使用iop(5/5=4)强制关闭"in core"模式后,读取初猜1轮收敛的HF运算l502耗时降到了1秒以内。以上现象说明这个问题应来自于gaussian16特定版本在"in core"SCF模式下预计算积分时有性能上的BUG。
至于CPU核心的使用情况,我在测试时CPU状况是空闲的,且发现“使用%cpu来绑一个核”和“指定%nproc=1”耗时差异较小,故判断这不是主要矛盾。

5万

帖子

99

威望

5万

eV
积分
112356

管理员

公社社长

4#
发表于 Post on 2024-2-15 20:55:31 | 只看该作者 Only view this author
内存够大的机子用Gaussian算小体系会导致自动开incore,虽然原理上incore比direct快,但我发现此时往往并行效率极低,使得CPU空闲,实际速度反倒可能更慢。这是我建议监控CPU占用率的原因
担心出现这个情况就建议在default.route里写上-#- scf=noincore,这样所有计算总是避免用incore。

这个是我现在自己的机子Default.Route加的设置。由于机子的内存512GB比较大,算小体系很容易被incore捣蛋
-#- IOp(8/117=-99) IOp(7/127=-99) scf=noincore

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 17:41 , Processed in 0.263799 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list