计算化学公社

 找回密码 Forget password
 注册 Register

ORCA计算无报错异常终止问题求助

查看数: 2657 | 评论数: 12 | 收藏 Add to favorites 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2022-5-18 01:20

正文摘要:

本帖最后由 啊不错的飞过海 于 2022-5-18 19:34 编辑 今天在自己电脑上跑计算任务,发现出现ORCA任务异常终止且没有报错;同时相应的终端会自动关掉,不知道是什么问题。 到目前为止发现两类情况,都出现在算一 ...

回复 Reply

docshen777 发表于 Post on 2023-11-22 13:36:47
啊不错的飞过海 发表于 2023-11-22 12:14
用DFT做吗?那按理说确实不应该有什么问题......我觉得直接换win版问题不大,你希望继续debug也可以。
...

ORCA 5.0.4
OpenMPI 4.1.2
shared 动态库
ubuntu 22.04 LTS
实在是不理解哈哈哈哈哈折腾三天了
啊不错的飞过海 发表于 Post on 2023-11-22 12:14:36
docshen777 发表于 2023-11-22 07:54
30个原子的结构优化,按理说是一个非常简单的任务

用DFT做吗?那按理说确实不应该有什么问题......我觉得直接换win版问题不大,你希望继续debug也可以。
保险起见还是问问:你用的ORCA版本号是多少——是5.0.4吗?
用的MPI是OpenMPI吗?版本号是4.1.x吗?
用的ORCA是动态库(shared)版本还是静态库版本?
WSL里是什么系统?uname -r输出什么?
......我觉着可能出问题的地方就这些了。
docshen777 发表于 Post on 2023-11-22 07:54:42
啊不错的飞过海 发表于 2023-11-21 21:34
呀,好大,那按理来说完全够用了;不过考虑到还有别人在用,可能从WSL的top/htop看更能反映实际情况。
...

30个原子的结构优化,按理说是一个非常简单的任务
啊不错的飞过海 发表于 Post on 2023-11-21 21:34:39
docshen777 发表于 2023-11-21 21:14
我看了一下,我这机子实际内存384GB,虚拟内存显示是200多GB...按理说不应该出现内存爆掉的情况......那 ...

呀,好大,那按理来说完全够用了;不过考虑到还有别人在用,可能从WSL的top/htop看更能反映实际情况。
我一般看任务量1核到16核都有,任务多起来不做任务内并行效率才最高,少就多投几个核减少等待时间,也看任务。你跑的是什么任务?
docshen777 发表于 Post on 2023-11-21 21:14:17
啊不错的飞过海 发表于 2023-11-21 19:58
减并行进程数,缩maxcore,加swap三选一。
我发这个帖子时的任务减并行进程数就够用,后来一些TDDFT就只 ...

我看了一下,我这机子实际内存384GB,虚拟内存显示是200多GB...按理说不应该出现内存爆掉的情况......那么一般的计算您用多少的并行进程数呀?我现用4还是会卡死,一会儿就不动了,能不能算完完全看脸。降到2合理么
啊不错的飞过海 发表于 Post on 2023-11-21 19:58:09
docshen777 发表于 2023-11-21 09:58
请问最后你是如何解决的呀?我也遇到不报错但是任务终止的情况,但是终端还在。谢谢

减并行进程数,缩maxcore,加swap三选一。
我发这个帖子时的任务减并行进程数就够用,后来一些TDDFT就只能缩maxcore让ORCA自己分batch——但这里设的maxcore和实际使用没有半点对应关系,只是撞大运试着让ORCA给一个batch少塞几个vector;最后要算MRCC时候前述两种方法都不管用,一把划了32GB swap凑合用。
docshen777 发表于 Post on 2023-11-21 09:58:24
请问最后你是如何解决的呀?我也遇到不报错但是任务终止的情况,但是终端还在。谢谢
啊不错的飞过海 发表于 Post on 2022-5-18 21:48:26
错误原因大概排查出来了,是内存写满后系统杀死了进程;大概加点虚拟内存就可以解决,一会儿试一下写进主楼里。
yuyangzap 发表于 Post on 2022-5-18 16:26:32
换linux,win一堆问题
啊不错的飞过海 发表于 Post on 2022-5-18 15:54:45
abin 发表于 2022-5-18 10:37
http://bbs.keinsci.com/thread-26418-1-1.html
试试这提到的方案.

无GUI测试的结果已更新在主楼里;Terminal还是自个儿停掉了。一会试试减几个mpi进程再试试?
啊不错的飞过海 发表于 Post on 2022-5-18 11:00:58
abin 发表于 2022-5-18 10:37
http://bbs.keinsci.com/thread-26418-1-1.html
试试这提到的方案.

感谢。一会在命令行条件下再试一次昨天失败了的任务。
按理说应该是只要硬盘能读写就可以正常跑任务的,但实际执行中确实出现了硬盘挂载位置影响任务进行的问题,很奇怪。
自个儿关了Terminal这种低级错误显然不会拿出来问......snap版本终端的事不太了解,我使用的终端是Ubnuntu22.04自带的“终端”;参考https://www.bilibili.com/video/av7188472/,我用的大概就是snap版本,这样推论的话换到非GUI环境可能能解决问题,我一会试完在本帖下汇报好了。
abin 发表于 Post on 2022-5-18 10:37:01
http://bbs.keinsci.com/thread-26418-1-1.html
试试这提到的方案.


另, 因为你是本机运行, 只要对应目录可以读写就没问题, 和硬盘挂载到哪里没有关系.

建议, 关闭GUI, 指令行运行.

当然, 如果你在GUI界面下, 开的Terminal,
而后 orca.exe Input &
然后点击X关闭了Terminal, 计算也可能被断掉.

另外, 如果你的终端是snap版本, 也会莫名其妙的异常.....

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-26 00:54 , Processed in 0.170054 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list