计算化学公社

标题: 求助,运行时间超过24h,请各位大神帮忙看看是任务提交的不正确吗? [打印本页]

作者
Author:
luckyfengfeng    时间: 2024-7-12 11:19
标题: 求助,运行时间超过24h,请各位大神帮忙看看是任务提交的不正确吗?
新手第一次学习dalton,在超算中心装的软件,sob老师在论坛给的例子NH3BF3跑了11分钟跑完了,跑自己的分子时候已经超过24h,实时文件中产生的HALF1.DA和HALF3.DA都超过150G,但实时的.out文件已经12个小时没有动过了(图1),和计算成功的案例对比卡住的地方也不太一样,这里显示 Integral transformation order 4 for inactive+active orbitals.而NH3BF3体系中好像没有这个(图2),我的分子是一个共晶,算的是个双分子dimer体系(图3),具有一定的CT作用,不知道我直接用NH3BF3一样的算法是否合理,各位大神能帮我看看我提交的脚本和命令有什么不对的地方吗?计算时长这么长合理吗?我需要停止还是等它再跑跑看呢,谢谢


作者
Author:
luckyfengfeng    时间: 2024-7-13 19:42
目前已经两天多没动了,HALF1.DA和HALF3.DA文件加起来超过500g了,目前这两个文件没有继续增大了,有一个MOTWOINT文件在增大,不知道这种现象是正确的嘛?还是计算选择机组啥的不对,白白的浪费了计算资源
作者
Author:
yufengerfei    时间: 2024-7-26 02:04
NH3BF3跑了11分钟有点慢,应该没有用上并行,你的out文件中Compilation information下的MPI后面是off的。正常32核的话可能几秒钟就跑完了。
作者
Author:
luckyfengfeng    时间: 2024-7-26 11:57
yufengerfei 发表于 2024-7-26 02:04
NH3BF3跑了11分钟有点慢,应该没有用上并行,你的out文件中Compilation information下的MPI后面是off的。正 ...

谢谢您的回复,我看网上有的体系并行容易出错,因为第一次算所以单线程跑的,现在这个任务已经跑了10几天了还没有报错和停下的趋势,感觉好不正常
还有一个小问题想请教您,我们是在超算中心提交的,并行的话是这里的N改为更大的数值吗?"#SBATCH -N 1",多节点运行排队时间有点长
作者
Author:
yufengerfei    时间: 2024-7-26 19:00
luckyfengfeng 发表于 2024-7-26 11:57
谢谢您的回复,我看网上有的体系并行容易出错,因为第一次算所以单线程跑的,现在这个任务已经跑了10几天 ...

我感觉我用的服务器应该和你是一个,你让技术员给你处理下并行就可以
作者
Author:
luckyfengfeng    时间: 2024-7-26 22:02
yufengerfei 发表于 2024-7-26 19:00
我感觉我用的服务器应该和你是一个,你让技术员给你处理下并行就可以

好的,已经解决了,万分感谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3