计算化学公社

标题: 诡异的ORCA运行问题 [打印本页]

作者
Author:
ikea1984    时间: 2023-6-27 11:08
标题: 诡异的ORCA运行问题
在集群交单节点并行作业,同样的作业同样的作业脚本文件,有时候能正常运行,有时候会死在“ORCA finished by error termination in GTOInt”,系统会报告“ORTE was unable to reliably start one or more daemons.” 集群上各节点配置应该是一样的,算其他程序从来没遇到问题。。。

作者
Author:
wzkchem5    时间: 2023-6-27 14:20
估计是openmpi安装问题,或者硬件问题
作者
Author:
ikea1984    时间: 2023-6-27 16:23
本帖最后由 ikea1984 于 2023-6-27 16:39 编辑
wzkchem5 发表于 2023-6-27 14:20
估计是openmpi安装问题,或者硬件问题

我尝试好些不同的openmpi的编译参数,都不太行。而且如果说是openmpi编译的话,应该次次都会错。但是现在是相同的输入、脚本,有可能交上去会死,有可能就能正常算。还有一点是,感觉跟队列中运行了几个orca程序有关,感觉头3个还能算,后面的交上去就会死。。。。

补充:更坑的是,如果我用pbs脚本把节点占住(不然不能登录到后台),到后台计算节点手工提交orca的计算,则非常顺利。。。

作者
Author:
flyingchow    时间: 2023-6-27 23:31
使用apptainer吧。只要不是硬件问题,apptainer是肯定能跑的。
作者
Author:
wzkchem5    时间: 2023-6-28 00:08
ikea1984 发表于 2023-6-27 09:23
我尝试好些不同的openmpi的编译参数,都不太行。而且如果说是openmpi编译的话,应该次次都会错。但是现在 ...

那恐怕跟PBS提交脚本也有关系,例如PBS脚本没有正确设置某些环境变量




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3