|
本帖最后由 NeedleCandy 于 2024-12-16 10:53 编辑
背景:版本cp2k-2024.3,用openmp编译的时候注释掉了bashrc的intel mpi,编译完成后取消了注释。
slurm提交作业加了source /data/app_install/cp2k-2024.3/tools/toolchain/install/setup来加载openmp,用官网的exercise测试,奇怪的是迭代了两次就中断了,out文件直接中断无报错,err文件显示:prterun noticed that process rank 15 with PID 3037136 on node dell-PowerEdge-R750 exited on signal 11 (Segmentation fault).
尝试直接在命令栏mpirun -np 64 cp2k.popt in.inp |tee cp2k.out以及注释掉slurm文件里的source /data/app_install/cp2k-2024.3/tools/toolchain/install/setup都可以顺利运行,但是err文件也有内容,且out文件每个部分都会被反复打印,很怪,导致文件很大无法作为附件上传。
ps:又试了一些别的test,发现有的测试两种方法都能运行,openmp运行会快很多很多;有的测试只有一种mpirun可以运行 ,用intel mpi运行的输出文件都很大很颠,openmp莫名奇妙中断。
感谢各位的解答,相关文件见附件。
|
|