计算化学公社

 找回密码 Forget password
 注册 Register
Views: 24220|回复 Reply: 19
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 求助-CP2K7.1编译完成且test全部通过却无法正常运行

[复制链接 Copy URL]

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
根据刘博的帖子"超详细CP2K编译过程,GNU9.3+intel MKL+openmpi【含视频】"编译了CP2K-7.1 popt版本(psmp编译报错,就在make那一步去掉了),且test后全部通过:--------------------------------- Summary --------------------------------
Number of FAILED  tests 0
Number of WRONG   tests 0
Number of CORRECT tests 3273
Number of NEW     tests 8
Total number of   tests 3281
GREPME 0 0 3273 8 3281 X

Summary: correct: 3273 / 3281; new: 8; 7min
Status: OK

--------------------------------------------------------------------------
Regtest took 396.00 seconds.
--------------------------------------------------------------------------
Sat Mar 13 20:54:28 CST 2021

然后,用一个270原子的体系进行进一步测试。该inp文件先用官方发布的7.1 ssmp版本测试运行,并无异常,跑一步电子步8.7 s,占用内存10G。然而,用自己编译好的popt运行时却发现187g内存被撑爆了,跑一步电子步需要120 s。同时,从out文件的输出来看,服务器的全部核心(56核)都被分别用来执行一个任务了,即56核同时跑56次,具体对比如下:
类似这种信息“Step     Update method      Time    Convergence         Total energy    Change”,popt运行时同时输出了56次(正常情况下就输出一次)。
我多次更改提交任务的方式(PBS调度或者直接运行)、命令,甚至还重新编译了3次,全都是一样的反常结果,以下是我的提交命令(在source 的那几个intel的命令中已经尝试过各种排列组合,都不行),还请大家帮看下,谢谢!
#!/bin/sh
#PBS -N test
#PBS -l nodes=1:ppn=56
##PBS -q workq
cd $PBS_O_WORKDIR
source ~/opt/cp2k71/3/cp2k-7.1/tools/toolchain/install/setup
#source /opt/intel2018/compilers_and_libraries_2018/linux/mkl/bin/mklvars.sh intel64 ilp64
#source /opt/intel2018/parallel_studio_xe_2018.4.057/bin/psxevars.sh
source /opt/intel2018/mkl/bin/mklvars.sh intel64
export PATH=$PATH:~/opt/cp2k71/3/cp2k-7.1/exe/local
source /opt/intel2018/bin/compilervars.sh intel64
source /opt/intel2018/impi/2018.4.274/bin64/mpivars.sh intel64
mpirun -n 56 cp2k.popt cp2k.inp 1>cp2k.out 2>cp2k.err


说明一下,我按照sob老师的方法(http://bbs.keinsci.com/thread-21608-1-1.html),也成功编译了8.1版本,运行一切正常,但是和超算上同等硬件的节点比较后发现8.1的速度比7.1慢一倍,甚至只有intel编译的7.1的0.4左右,而且组里准备自建服务器不租超算了,故才在服务器上自行编译7.1。



102

帖子

2

威望

1311

eV
积分
1453

Level 4 (黑子)

20#
发表于 Post on 2022-11-10 02:23:46 | 只看该作者 Only view this author
請問最終是怎麼解決的? 謝謝

358

帖子

0

威望

2307

eV
积分
2665

Level 5 (御坂)

19#
发表于 Post on 2021-4-23 11:49:07 | 只看该作者 Only view this author
本帖最后由 gog 于 2021-4-23 13:25 编辑

cp2k.F文件报错,该是软件和硬件的兼容性bug。我试过好几个系统,出现同样的故障。已经有人反馈给cp2k官网google group。
现在cp2k开发组没有解决。

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

18#
发表于 Post on 2021-4-4 09:58:18 | 只看该作者 Only view this author
大胆猜测,
一定是做了/etc/profile或者做个什么乱七八糟的全局设定。

很多朋友喜欢,
777,或者root乱搞。
自己做过啥设定,又不记得。
这怎么救?
抢救用的时间,比重装都久。

如果没啥数据,重装吧。

建议所有的软件均不要采用全局或者默认激活。
用哪一个激活哪一个。
每一个都写一个激活脚本。这不费事。

这也就是,绝大多数Linux平台下的软件,
装完了,
不做激活启用,
和没装是一个效果。

Linux是一个平台,
是多用户。
每个用户的需求可能不同。
就算是一个用户,每个软件的要求和依赖也不同,
搞一刀切式的全局设定,
肯定要倒霉。

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
djjj148 + 5 根据建议解决了,谢谢!

查看全部评分 View all ratings

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

1665

帖子

5

威望

4788

eV
积分
6553

Level 6 (一方通行)

喵星人

17#
发表于 Post on 2021-3-15 01:31:05 | 只看该作者 Only view this author
都是gcc编译的8.1也比7.1慢不少,不知道是啥设置改了还是什么别的原因。

24

帖子

0

威望

796

eV
积分
820

Level 4 (黑子)

16#
发表于 Post on 2021-3-14 23:23:46 | 只看该作者 Only view this author
djjj148 发表于 2021-3-14 22:45
您的这个帖子我看过,是gcc编译的吧,和刘博的帖子中的方法一样吧。您可以说下intel编译CP2K的方法吗?

具体编译过程邮件交流wangtaochem@163.com,几句话讲不清楚。

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

15#
 楼主 Author| 发表于 Post on 2021-3-14 22:45:13 | 只看该作者 Only view this author
wangtaochem 发表于 2021-3-14 21:44
http://bbs.keinsci.com/thread-17324-1-1.html,这个帖子里面的链接可以下载编译所需的文件。

您的这个帖子我看过,是gcc编译的吧,和刘博的帖子中的方法一样吧。您可以说下intel编译CP2K的方法吗?

24

帖子

0

威望

796

eV
积分
820

Level 4 (黑子)

14#
发表于 Post on 2021-3-14 21:44:39 | 只看该作者 Only view this author
djjj148 发表于 2021-3-14 15:56
用Intel版本的cp2k-7.1最好了,麻烦提供下编译文件和编译方法,不胜感激~!

http://bbs.keinsci.com/thread-17324-1-1.html,这个帖子里面的链接可以下载编译所需的文件。

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

13#
发表于 Post on 2021-3-14 18:01:52 | 只看该作者 Only view this author
djjj148 发表于 2021-3-14 15:58
谢谢王老师,试了下还是不行

intel2020u2,
无任何压力。
7.1 8.1均无问题。

老版本没有测试。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

12#
 楼主 Author| 发表于 Post on 2021-3-14 15:58:15 | 只看该作者 Only view this author
abin 发表于 2021-3-14 11:40
看你后文提到, 似乎有采用openMPI?

建议,在执行的脚本中,添加一句,

谢谢王老师,试了下还是不行

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

11#
 楼主 Author| 发表于 Post on 2021-3-14 15:56:45 | 只看该作者 Only view this author
wangtaochem 发表于 2021-3-14 10:52
mpi的问题的话,把.bashrc文件打开,把INTEL编译器注释掉。
另外,如果需要编译Intel版本的cp2k-7.1的话 ...

用Intel版本的cp2k-7.1最好了,麻烦提供下编译文件和编译方法,不胜感激~!

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

10#
发表于 Post on 2021-3-14 11:40:20 | 只看该作者 Only view this author
看你后文提到, 似乎有采用openMPI?

建议,在执行的脚本中,添加一句,
export OMP_NUM_THREADS=1
Or
export OMP_NUM_THREADS=2

看介绍信息:
CP2K is written in Fortran 2008 and can be run efficiently in parallel using a combination of multi-threading, MPI, and CUDA.

明显, cp2k是典型的openMP+MPI混合并行的模式。
对于openMP的程序,
多数情形下,
不指定 OMP_NUM_THREADS=1Or2,内存会爆浆的,
而且奇慢无比。
机器负载会飙升。


或者读读这个:
Conventionally, there are six versions:

Acronym        Meaning
sdbg        OpenMP + debug settings
popt        OpenMP + OMP_NUM_THREADS=1
ssmp        OpenMP
pdbg        MPI + OpenMP + debug settings
popt        MPI + OpenMP + OMP_NUM_THREADS=1
psmp        MPI + OpenMP

可以自行测试,对于一台机器上的多核心并行,
是openMP快还是MPI快?
或者是混合模式快?

不是所有的并行计算,上来都是mpirun -np XXX来搞的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

9#
 楼主 Author| 发表于 Post on 2021-3-14 11:06:40 | 只看该作者 Only view this author
wangtaochem 发表于 2021-3-14 10:52
mpi的问题的话,把.bashrc文件打开,把INTEL编译器注释掉。
另外,如果需要编译Intel版本的cp2k-7.1的话 ...

我并没有在.bashrc激活intel的mpi呢,我装完intel的全家桶后都是在提交任务的脚本里激活intel的组件的。我刚才描述的意思是我也不想用intel的mpi跑CP2K,应该用toolchain编译的openmpi,只是用openmpi上来就报错很尴尬

能装intel版本的cp2k-7.1最好了,麻烦您提供一下方法和编译文件吧,我之前看一位B站up主的帖子试了下没有成功https://www.bilibili.com/read/cv7303152/

24

帖子

0

威望

796

eV
积分
820

Level 4 (黑子)

8#
发表于 Post on 2021-3-14 10:52:49 | 只看该作者 Only view this author
djjj148 发表于 2021-3-14 10:38
是的我看着没问题,应该是我这里的软件问题

mpi的问题的话,把.bashrc文件打开,把INTEL编译器注释掉。
另外,如果需要编译Intel版本的cp2k-7.1的话我可以给你提供编译文件和编译方法。

255

帖子

4

威望

4941

eV
积分
5276

Level 6 (一方通行)

7#
 楼主 Author| 发表于 Post on 2021-3-14 10:38:54 | 只看该作者 Only view this author
wangtaochem 发表于 2021-3-14 09:46
我在自己的机器上运行一回儿就正常结束了,你看看.out文件有没有问题。

是的我看着没问题,应该是我这里的软件问题

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-20 07:10 , Processed in 0.187377 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list