计算化学公社

 找回密码 Forget password
 注册 Register
Views: 514|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 求助:重复购买资料中截断能收敛性测试实例时调用MPI并行出错

[复制链接 Copy URL]

37

帖子

0

威望

850

eV
积分
887

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
卢老师和各位大神您们好,我是购买CP2K资料自学,在重复截断能收敛性测试实例(用cutconv.sh 和 relconv.sh两个脚本测试资料文件SP\convtest\SiC_cutconv\下的cutconv.inp时),MPI无法调用,显示:
MPI_ABORT was invoked on rank 0 in communicator MPI_COMM_WORLDwith errorcode 1.

NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.

我用的是Rocky9.3,  最大核数32核,每个任务用8核跑,(nproc_per_calc=8 ;nproc_to_use=32 )这个设置对做K点收敛性(脚本kpconv.sh测试K点输入文件)的时候都没有问题,但是做这个cutoff 收敛性测试就会出这样的错误,没有搜到相关的针对性的解决办法,望老师指点,谢谢!



37

帖子

0

威望

850

eV
积分
887

Level 4 (黑子)

2#
 楼主 Author| 发表于 Post on 2024-5-25 21:53:26 | 只看该作者 Only view this author
老师这个问题解决了,就是把原来输入文件里面的 MAX_SCF 1 改为128就可以,如果用比较小的1 或者2,3 都会出现同样的错误,按道理来说做SCF的轮数不应该对并行核数的调用产生直接影响,但是确实就是不行,想不通是什么逻辑,还望老师能够解惑,谢谢!

290

帖子

7

威望

3187

eV
积分
3617

Level 5 (御坂)

石墨

3#
发表于 Post on 2024-5-25 23:02:50 | 只看该作者 Only view this author
这个纯粹是并行编程的问题,进程间负载不均衡、数据不同步等都有可能造成。SCF计算的任务分解也不止一种方式。对于小任务最简单的办法是减少核数或增加SCF圈数,拉长总计算时间,使各个进程负载均衡、通信一致。
镜像空间计算模拟

5万

帖子

99

威望

5万

eV
积分
112359

管理员

公社社长

4#
发表于 Post on 2024-5-26 04:33:22 | 只看该作者 Only view this author
我这里用的时候没有发现过此问题。看输出文件里其它信息判断。如果并行环境正常、脚本用法正确的话,原理上MAX_SCF不会产生这种影响。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

37

帖子

0

威望

850

eV
积分
887

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2024-5-26 07:49:44 | 只看该作者 Only view this author
Graphite 发表于 2024-5-25 23:02
这个纯粹是并行编程的问题,进程间负载不均衡、数据不同步等都有可能造成。SCF计算的任务分解也不止一种方 ...

谢谢解惑!

37

帖子

0

威望

850

eV
积分
887

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2024-5-26 07:50:32 | 只看该作者 Only view this author
sobereva 发表于 2024-5-26 04:33
我这里用的时候没有发现过此问题。看输出文件里其它信息判断。如果并行环境正常、脚本用法正确的话,原理上 ...

谢谢老师解惑!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 19:11 , Processed in 0.533586 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list