计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: goldNAN
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 离线安装CP2K2024.1

[复制链接 Copy URL]

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

16#
发表于 Post on 2024-3-25 20:31:26 | 只看该作者 Only view this author
Anmmun 发表于 2024-3-25 13:56
收费平台,没做过具体测试,单步SCF在虚拟机4核需要20s,在超算上25核单步需要7s

不好评判速度快慢差异…
如果不是笔误的话,
那么使用25个核心做计算,
也真是很诡异的……
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

11

帖子

0

威望

477

eV
积分
488

Level 3 能力者

17#
发表于 Post on 2024-3-26 10:48:23 | 只看该作者 Only view this author
abin 发表于 2024-3-25 20:31
不好评判速度快慢差异…
如果不是笔误的话,
那么使用25个核心做计算,

不是笔误,如果不用平方数,cp2k会出现一个warning,虽然这个warning不影响结果,但我还是改成了平方数核心

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

18#
发表于 Post on 2024-3-26 11:17:44 | 只看该作者 Only view this author
Anmmun 发表于 2024-3-26 10:48
不是笔误,如果不用平方数,cp2k会出现一个warning,虽然这个warning不影响结果,但我还是改成了平方数核 ...

多核心,一般建议采用2^n
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

11

帖子

0

威望

477

eV
积分
488

Level 3 能力者

19#
发表于 Post on 2024-3-26 12:59:06 | 只看该作者 Only view this author
abin 发表于 2024-3-26 11:17
多核心,一般建议采用2^n

谢谢,我采用module load gcc, module load openmpi, 然后./install_cp2k_toolchain.sh --with-sirius=no --with-openmpi=system --with-plumed=install, 为什么运行长时间任务的时候会直接停止?
slurm报错如下:
"[cn034:1868004] mca_base_component_repository_open: unable to open mca_mtl_ofi: libefa.so.1: cannot open shared object file: No such file or directory (ignored)
[cn034:1867979:0:1867979] ib_mlx5_log.c:174  Remote access on mlx5_0:1/IB (synd 0x13 vend 0x88 hw_synd 0/0)
[cn034:1867979:0:1867979] ib_mlx5_log.c:174  RC QP 0xeef7 wqe[744]: RDMA_READ s-- [rva 0x1f76a3400 rkey 0x217668] [va 0x1efc7e650 len 4016 lkey 0x273680] [rqpn 0xee4c dlid=115 sl=0 port=1 src_path_bits=0]
==== backtrace (tid:1867979) ====
0  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/libucs.so.0(ucs_handle_error+0x254) [0x149f5a8c7b94]
1  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/libucs.so.0(ucs_fatal_error_message+0xb0) [0x149f5a8c4840]
2  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/libucs.so.0(ucs_log_default_handler+0xef9) [0x149f5a8c9669]
3  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/libucs.so.0(ucs_log_dispatch+0xcc) [0x149f5a8c97dc]
4  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/ucx/libuct_ib.so.0(uct_ib_mlx5_completion_with_err+0x265) [0x149f5a00b965]
5  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/ucx/libuct_ib.so.0(+0x35ec5) [0x149f5a01eec5]
6  /opt/ohpc/pub/mpi/ucx-ohpc/1.11.2/lib/libucp.so.0(ucp_worker_progress+0x22) [0x149f5af77832]
7  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libopen-pal.so.40(opal_progress+0x2c) [0x14a12af2d0ac]
8  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libopen-pal.so.40(ompi_sync_wait_mt+0xb5) [0x14a12af33975]
9  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libmpi.so.40(ompi_request_default_wait_all+0x3da) [0x14a12d27334a]
10  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libmpi.so.40(PMPI_Waitall+0x8f) [0x14a12d2b55bf]
11  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libmpi_mpifh.so.40(pmpi_waitall+0x75) [0x14a12cbc6595]
12  /opt/ohpc/pub/mpi/openmpi4-gnu9/4.1.1/lib/libmpi_usempif08.so.40(mpi_waitall_f08_+0x63) [0x14a12d003f33]
13  cp2k.popt() [0x34ba026]
14  cp2k.popt() [0x350f1a1]
15  cp2k.popt() [0x31b4527]
16  cp2k.popt() [0x31229ad]
17  cp2k.popt() [0x13795a4]
18  cp2k.popt() [0x119d425]
19  cp2k.popt() [0xdd4973]
20  cp2k.popt() [0xdd8040]
21  cp2k.popt() [0x1c4c1fa]
22  cp2k.popt() [0x1c5b240]
23  cp2k.popt() [0x1758b5c]
24  cp2k.popt() [0x1949d39]
25  cp2k.popt() [0x1557298]
26  cp2k.popt() [0x7e850b]
27  cp2k.popt() [0x730b23]
28  cp2k.popt() [0x6ee490]
29  cp2k.popt() [0x63522f]
30  cp2k.popt() [0x638582]
31  cp2k.popt() [0x632806]
32  cp2k.popt() [0x59a29d]
33  /lib64/libc.so.6(__libc_start_main+0xf3) [0x14a12b6a3493]
34  cp2k.popt() [0x630c2e]
=================================

Program received signal SIGABRT: Process abort signal.

Backtrace for this error:
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 1 with PID 1867977 on node cn034 exited on signal 9 (Killed).
--------------------------------------------------------------------------"

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

20#
发表于 Post on 2024-3-26 14:09:35 | 只看该作者 Only view this author
Anmmun 发表于 2024-3-26 12:59
谢谢,我采用module load gcc, module load openmpi, 然后./install_cp2k_toolchain.sh --with-sirius=no ...

这玩意不是我编译的.

无法提供协助.

看样子, 你所在的机器具有IB网络.
如果你捣鼓不对, 多机器并行, 计算是跑在IPoIB模式, 会很慢的.

就算是RoCE, 那也是比IB-RDMA慢很多的.

如果不是很明白, 不要瞎折腾.

如果仅仅是单机多核并行, 是否采用RDMA模式, 影响可以忽略.


另, 我提供的cp2k版本, 是开箱即用支持IB-RDMA模式的, 如有需要再联系我.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

32

帖子

0

威望

429

eV
积分
461

Level 3 能力者

21#
发表于 Post on 2024-4-1 20:17:11 | 只看该作者 Only view this author
本帖最后由 love_yy 于 2024-4-1 20:21 编辑

求助各位老师,最近安装的cp2k-2024.1 “ssmp ,psmp”版本在测试http://sobereva.com/586帖子中的测试文件时候发现只有ssmp版可以跑,psmp会有以下mpi并行报错。

我的openmpi版本是4.1.1且在bashrc中配置过环境(orca-504可以并行多核跑),系统为rocky Linux 9

56

帖子

1

威望

1572

eV
积分
1648

Level 5 (御坂)

22#
 楼主 Author| 发表于 Post on 2024-4-1 20:47:42 | 只看该作者 Only view this author
为什么不用toolchain编译

82

帖子

0

威望

589

eV
积分
671

Level 4 (黑子)

23#
发表于 Post on 2024-4-7 11:36:38 | 只看该作者 Only view this author
本帖最后由 jingetiema6112 于 2024-4-7 11:38 编辑

老师你好,按照您的教程,出现以下两个问题。初学折腾好几天了,恳请指教。我是直接安装的linux虚拟机

==================== Installing ELPA ====================
elpa-2023.05.001.tar.gz is found
Installing from scratch into /home/king/cp2k-2024.1/tools/toolchain/install/elpa-2023.05.001/cpu
/usr/bin/env: python3: No such file or directory
Step elpa took 58.00 seconds.
Step ptscotch took 0.00 seconds.
Step superlu took 0.00 seconds.
Step pexsi took 0.00 seconds.
Step quip took 0.00 seconds.



==================== generating arch files ====================
arch files can be found in the /home/king/cp2k-2024.1/tools/toolchain/install/arch subdirectory
/usr/bin/env: python3: No such file or directory
[king@192 toolchain]$

56

帖子

1

威望

1572

eV
积分
1648

Level 5 (御坂)

24#
 楼主 Author| 发表于 Post on 2024-4-7 15:05:57 | 只看该作者 Only view this author
jingetiema6112 发表于 2024-4-7 11:36
老师你好,按照您的教程,出现以下两个问题。初学折腾好几天了,恳请指教。我是直接安装的linux虚拟机

= ...

装个anaconda 就完事了
确保在bash中输入python3 不报错

82

帖子

0

威望

589

eV
积分
671

Level 4 (黑子)

25#
发表于 Post on 2024-4-7 15:18:45 | 只看该作者 Only view this author
goldNAN 发表于 2024-4-7 15:05
装个anaconda 就完事了
确保在bash中输入python3 不报错

感谢老师解答,问题已解决,最后运行了一下cp2k.ssmp -v,显示以下结果,安装算是成功了吧?


55

帖子

0

威望

2359

eV
积分
2414

Level 5 (御坂)

26#
发表于 Post on 2024-4-7 16:36:37 | 只看该作者 Only view this author
大家有没有做过测试,相同的任务,2024.1比2023.2慢~~~~~电子步最大能慢20%。

32

帖子

0

威望

429

eV
积分
461

Level 3 能力者

27#
发表于 Post on 2024-4-7 20:25:48 | 只看该作者 Only view this author
各位老师,在rocky Linux9.3上安装cp2k时用toolchain“./install_cp2k_toolchain.sh --with-sirius=no --with-openmpi=system --with-plumed=install --with-elpa=no --with-scalapack=no --with-mpich=no --math-mode=mkl"成功安装了库文件,但是在编译‘psmp’版本的时候报错:
”No underlying compiler was specified in the wrapper compiler data file (e.g., mpicc-wrapper-data.txt)“
但是编译ssmp版正常,测试sob老师的安装帖子中的测试文件后也可以正常运行。因为里面还装有orca504,所以就用的openmpi-411(已成功安装可以运行),现在一装并行版就报错,也没有发现有合适的解决办法,特此请教一下各位老师,十分感谢!

38

帖子

0

威望

439

eV
积分
477

Level 3 能力者

28#
发表于 Post on 2024-4-15 22:18:27 | 只看该作者 Only view this author
耗时一个多星期试了很多方法,就博主这个让我这个小白成功 泪目 !!!  顺带问下博主大大运行cp2k只能这个命令吗?mpirun -np 32 cp2k.popt X.inp还是可以修改

56

帖子

1

威望

1572

eV
积分
1648

Level 5 (御坂)

29#
 楼主 Author| 发表于 Post on 2024-4-16 08:42:51 | 只看该作者 Only view this author
zhangs 发表于 2024-4-15 22:18
耗时一个多星期试了很多方法,就博主这个让我这个小白成功 泪目 !!!  顺带问下博主大大运行cp2k只能这个 ...

-np 后面是核心数 可改

38

帖子

0

威望

439

eV
积分
477

Level 3 能力者

30#
发表于 Post on 2024-4-16 10:49:34 | 只看该作者 Only view this author
博主,是不是机子必须是python3才能编译成功啊

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 08:47 , Processed in 0.166553 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list