计算化学公社

 找回密码 Forget password
 注册 Register
Views: 775|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] 诡异的ORCA运行问题

[复制链接 Copy URL]

98

帖子

0

威望

2574

eV
积分
2672

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
在集群交单节点并行作业,同样的作业同样的作业脚本文件,有时候能正常运行,有时候会死在“ORCA finished by error termination in GTOInt”,系统会报告“ORTE was unable to reliably start one or more daemons.” 集群上各节点配置应该是一样的,算其他程序从来没遇到问题。。。

1万

帖子

0

威望

7402

eV
积分
18171

Level 6 (一方通行)

2#
发表于 Post on 2023-6-27 14:20:32 | 只看该作者 Only view this author
估计是openmpi安装问题,或者硬件问题
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

98

帖子

0

威望

2574

eV
积分
2672

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2023-6-27 16:23:25 | 只看该作者 Only view this author
本帖最后由 ikea1984 于 2023-6-27 16:39 编辑
wzkchem5 发表于 2023-6-27 14:20
估计是openmpi安装问题,或者硬件问题

我尝试好些不同的openmpi的编译参数,都不太行。而且如果说是openmpi编译的话,应该次次都会错。但是现在是相同的输入、脚本,有可能交上去会死,有可能就能正常算。还有一点是,感觉跟队列中运行了几个orca程序有关,感觉头3个还能算,后面的交上去就会死。。。。

补充:更坑的是,如果我用pbs脚本把节点占住(不然不能登录到后台),到后台计算节点手工提交orca的计算,则非常顺利。。。

129

帖子

0

威望

1154

eV
积分
1283

Level 4 (黑子)

4#
发表于 Post on 2023-6-27 23:31:08 | 只看该作者 Only view this author
使用apptainer吧。只要不是硬件问题,apptainer是肯定能跑的。

1万

帖子

0

威望

7402

eV
积分
18171

Level 6 (一方通行)

5#
发表于 Post on 2023-6-28 00:08:11 | 只看该作者 Only view this author
ikea1984 发表于 2023-6-27 09:23
我尝试好些不同的openmpi的编译参数,都不太行。而且如果说是openmpi编译的话,应该次次都会错。但是现在 ...

那恐怕跟PBS提交脚本也有关系,例如PBS脚本没有正确设置某些环境变量
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 08:27 , Processed in 0.157018 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list