计算化学公社

 找回密码 Forget password
 注册 Register
Views: 540|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] ORCA做counterpoise时,因为内存经常报错,请帮忙看看我的核数和内存设置

[复制链接 Copy URL]

8

帖子

0

威望

71

eV
积分
79

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 ktylea 于 2024-3-31 10:22 编辑

用ORCA做counterpoise校正计算27个原子的体系,ORCA的计算关键词由Multiwfn生成(一个inp文件里要计算五个能量,有五个结构)
! DLPNO-CCSD(T) tightPNO RIJK aug-cc-pVTZ aug-cc-pVTZ/JK aug-cc-pVTZ/C tightSCF noautostart miniprint nopop
机子逻辑核心112个
MemTotal:263608308KB
想要并行同时提交2-3个,内存不够结果都失败了,部分单独提交也失败了
单独提交的时候%maxcore 为1000(inp文件第一个结构设置3000)%pal nprocs 为36 ,算完一个提交一个,试了三个文件,两个文件失败了(文件2)。
调整内存,同时提交两个设置分别为 %maxcore 为10000,%pal nprocs 为16, %maxcore 为6000,%pal nprocs 为16,结果也报错了(文件3,4)。
单独提交%maxcore 为10000,%pal nprocs 为16,也报错(文件5),请大佬们帮忙看看我的内存和核数问题。


================
想在尝试改改内存,提交文件结果报错了
[1] 36984
[yueyang@localhost step3]$ [localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file dstore_segment.c at line 207
[localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file dstore_base.c at line 696
[localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file dstore_base.c at line 1857
[localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file dstore_base.c at line 2846
[localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file dstore_base.c at line 2894
[localhost.localdomain:36985] PMIX ERROR: OUT-OF-RESOURCE in file server/pmix_server.c at line 3423
[localhost.localdomain:36994] PMIX ERROR: OUT-OF-RESOURCE in file client/pmix_client.c at line 277
[localhost.localdomain:36994] OPAL ERROR: Error in file pmix3x_client.c at line 112
*** An error occurred in MPI_Init
*** on a NULL communicator
*** MPI_ERRORS_ARE_FATAL (processes in this communicator will now abort,
***    and potentially your MPI job)
[localhost.localdomain:36994] Local abort before MPI_INIT completed completed successfully, but am not able to aggregate error messages, and not able to guarantee that all other processes were killed!
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun detected that one or more processes exited with non-zero status, thus causing
the job to be terminated. The first process to do so was:

  Process name: [[16630,1],1]
  Exit code:    1
--------------------------------------------------------------------------







报错.zip

195.83 KB, 下载次数 Times of downloads: 2

5万

帖子

99

威望

5万

eV
积分
112374

管理员

公社社长

2#
发表于 Post on 2024-3-31 14:57:51 | 只看该作者 Only view this author
DLPNO-CCSD(T)对内存和硬盘都有很高要求,特别是结合大基组时。maxcore给小了、剩余硬盘空间不够肯定完蛋。此外,同时跑多个DLPNO-CCSD(T)任务有可能造成硬盘I/O发生争抢,没绝对必要别同时跑多个
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

8

帖子

0

威望

71

eV
积分
79

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2024-3-31 20:55:58 | 只看该作者 Only view this author
好的,谢谢大神,我把内存调整一个一个跑一跑试一试。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-25 05:44 , Processed in 0.260013 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list