计算化学公社
标题:
双路2696V3跑ORCA是不是有问题&新书讨论
[打印本页]
作者Author:
wbqdssl
时间:
2025-3-8 12:59
标题:
双路2696V3跑ORCA是不是有问题&新书讨论
本帖最后由 wbqdssl 于 2025-3-8 18:19 编辑
今天在tb上租了个双路2696V3的机器,128G内存。突发奇想打算试试windows版ORCA的速度。
用的是win11的系统,装了MSMPI 10.0和ORCA 6.0。任务运行出现了很诡异的情况。用这个输入文件,用%pal nprocs 36,%maxcore 1500可以跑,一圈SCF大概350s左右。看NUMA节点,两个CPU都有大约一半的占用,CPU总占用率在68%左右,内存占用48G。但是把 pal nprocs调到64或者60,任务运行了大概一分钟之后,机器直接自行关机,试了几次都这样。
在Linux上可以正常跑完,所以这种不正常关机是硬件(或是win11的系统?)的缘故吗?
现在这年头,本科生两三千去tb买一台双路2696V3的机子跑量化还有性价比吗?
(, 下载次数 Times of downloads: 1)
上传 Uploaded
点击下载Click to download
目前有一本书,有没有老师读过?作为量化入门书个人看起来感觉还不错
(, 下载次数 Times of downloads: 18)
上传 Uploaded
点击下载Click to download
作者Author:
Stardust0831
时间:
2025-3-8 15:48
orca并行核数到36的时候,对普通体系,基本上计算效率也封顶了,没必要上更多核数;从计算效率出发,我觉得更好的策略是:计算的时候可以同时跑多个任务,并通过绑核等方法来加快计算速度,具体可以看:
《通过设置CPU内核绑定降低ORCA同时做多任务的耗时》
《NUMA策略对Gaussian运算速度影响的小研究》
orca的内存需求还挺大的,通常内存可以再给大点。wB97M-V def2-QZVPD级别算近80原子的体系,每核给1500MB的内存肯定是给少了,此时,应当多给一些内存,物理内存不够用时,宁可少点并行核数。当前级别我能想到的使用场景只有计算偶极矩、多极矩时才可能需要,此时用def2-TZVPD也完全可以接受。算能量时,没必要用+D的方式给弥散函数,局部不显著带负电时,甚至可以直接不用弥散函数。
作者Author:
wbqdssl
时间:
2025-3-8 17:18
Stardust0831 发表于 2025-3-8 15:48
orca并行核数到36的时候,对普通体系,基本上计算效率也封顶了,没必要上更多核数;从计算效率出发,我觉得 ...
哇,谢谢星尘老师!!学到了学到了
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3