计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: djjj148
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] docker-singularity方法安装可随意移植的cp2k

  [复制链接 Copy URL]

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

121#
发表于 Post on 2022-2-16 12:39:18 | 只看该作者 Only view this author
本帖最后由 乐平 于 2022-2-16 06:43 编辑
ball2006 发表于 2022-2-16 03:06
尝试改成export EXE="singularity exec --bind /public/home/huan/:/opt /public/home/huan/cp2k82-avx51 ...

谢谢您的回复。我按照您的提示修改了提交任务的脚本

  1.     #!/bin/sh

  2.     export EXE="singularity exec --bind /public/home/huan/:/opt /public/home/huan/cp2k82-avx512-1.sif"
  3.     source /public/apps/intel2018/parallel_studio_xe_2018/psxevars.sh

  4.     ## cpu cores
  5.     export cpu_cores=6
  6.     ulimit -s unlimited

  7.     mpirun -np ${cpu_cores} ${EXE} cp2k.popt cp2k.inp 1>cp2k.out 2>cp2k.err
复制代码



但是,提交任务后,cp2k.out 内为空,cp2k.err 内显示
  1. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  2. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  3. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  4. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  5. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  6. FATAL:   "cp2k.popt": executable file not found in $PATH
  7. FATAL:   "cp2k.popt": executable file not found in $PATH
  8. FATAL:   "cp2k.popt": executable file not found in $PATH
  9. FATAL:   "cp2k.popt": executable file not found in $PATH
  10. FATAL:   "cp2k.popt": executable file not found in $PATH
  11. source: open /opt/cp2k-toolchain/install/setup: no such file or directory
  12. FATAL:   "cp2k.popt": executable file not found in $PATH
复制代码


很疑惑…… 这是从楼主的百度网盘里下载的 cp2k82-avx512-1.sif 文件,按理说楼主编译的时候应该添加了 source: open /opt/cp2k-toolchain/install/setup 和环境变量,为什么没有呢?


34

帖子

0

威望

1774

eV
积分
1808

Level 5 (御坂)

122#
发表于 Post on 2022-2-17 10:00:01 | 只看该作者 Only view this author
乐平 发表于 2022-2-16 12:39
谢谢您的回复。我按照您的提示修改了提交任务的脚本

运行的普通用户的根目录实在哪个下面?
还有你可以参考30楼和35楼的做法

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

123#
发表于 Post on 2022-2-17 16:28:44 | 只看该作者 Only view this author
ball2006 发表于 2022-2-17 04:00
运行的普通用户的根目录实在哪个下面?
还有你可以参考30楼和35楼的做法

谢谢回复。

我最初就是在 35楼 下面回复他解决的帖子来提问的,但是他没回复我。只有您回复了我。

我的普通用户就是在 /public/home/huan/

我将下载的 cp2k82-avx512-1.sif 文件放在  /public/home/huan/cp2k82-avx512-1.sif

测试的水 H2O_32.inp 放在 /public/home/huan/H2O_test/ 目录下,并改名为 cp2k.inp
/public/home/huan/H2O_test/cp2k.inp

运行的脚本是楼主提供的,并按照您的提示修改了。为了方便讨论,我再次写在下面

  1. #!/bin/sh

  2. export EXE="singularity exec --bind /public/home/huan/:/opt /public/home/huan/cp2k82-avx512-1.sif"
  3. source /public/apps/intel2018/parallel_studio_xe_2018/psxevars.sh

  4. ## cpu cores
  5. export cpu_cores=6
  6. ulimit -s unlimited

  7. mpirun -np ${cpu_cores} ${EXE} cp2k.popt cp2k.inp 1>cp2k.out 2>cp2k.err
复制代码


mpi 的目录是我本地集群的目录,已经修改。用 6 个核心测试。我实在不清楚为什么不能运行……

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

124#
发表于 Post on 2022-2-17 16:45:25 | 只看该作者 Only view this author
乐平 发表于 2022-2-17 16:28
谢谢回复。

我最初就是在 35楼 下面回复他解决的帖子来提问的,但是他没回复我。只有您回复了我。

当然是路径不对呀。

如果是单节点内运行,
不用搞什么bind ,毕竟都是标准路径。
更换为绝对路径即可。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

34

帖子

0

威望

1774

eV
积分
1808

Level 5 (御坂)

125#
发表于 Post on 2022-2-17 18:26:33 | 只看该作者 Only view this author
乐平 发表于 2022-2-17 16:28
谢谢回复。

我最初就是在 35楼 下面回复他解决的帖子来提问的,但是他没回复我。只有您回复了我。

按照这个命令singularity exec /public/home/huan/cp2k82-avx512-1.sif nohup mpirun -np 6  cp2k.popt cp2k.inp 1>cp2k.out 2>cp2k.err &再试试,不用上面的脚本提交任务

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

126#
发表于 Post on 2022-2-17 21:53:08 | 只看该作者 Only view this author
本帖最后由 乐平 于 2022-2-17 18:58 编辑
ball2006 发表于 2022-2-17 12:26
按照这个命令singularity exec /public/home/huan/cp2k82-avx512-1.sif nohup mpirun -np 6  cp2k.popt c ...

感谢回复。

我用您的命令试了,cp2k.out 和 cp2k.err 里都是空的…… 太奇怪了……

另外,我 top 查看了一下

  1. (base) [huan@login01 H2O_test]$ top
  2. top - 21:59:44 up 26 days, 19:17, 11 users,  load average: 0.96, 0.57, 0.32
  3. Tasks: 649 total,   1 running, 648 sleeping,   0 stopped,   0 zombie
  4. %Cpu(s):  2.9 us,  0.4 sy,  0.0 ni, 96.4 id,  0.3 wa,  0.0 hi,  0.0 si,  0.0 st
  5. KiB Mem : 98431648 total,  7026420 free, 88445376 used,  2959856 buff/cache
  6. KiB Swap:        0 total,        0 free,        0 used.  8427172 avail Mem

  7.    PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
  8. 450627 huan      20   0   82.9g  78.6g   3472 S 100.7 83.8   4:12.50 starter-suid
  9.   1142 polkitd   20   0  571000  15792   2216 S   6.9  0.0   2761:17 polkitd
  10.   1192 dbus      20   0   81620   3876    760 S   2.0  0.0 739:47.49 dbus-daemon
  11.   1251 root      20   0  408792   4488   1292 S   1.3  0.0 640:31.53 accounts-daemon
复制代码


而且运行一段时间后,发现内存用量一直增加。H2O-32.inp (计算前已经改名为 cp2k.inp) 不应该用 70 GB 左右的内存吧……

  1. (base) [huan@login01 H2O_test]$ free -h
  2.               total        used        free      shared  buff/cache   available
  3. Mem:            93G         70G         20G        645M        2.8G         22G
  4. Swap:            0B          0B          0B
  5. (base) [huan@login01 H2O_test]$
复制代码

15

帖子

0

威望

377

eV
积分
392

Level 3 能力者

127#
发表于 Post on 2022-3-4 09:16:47 | 只看该作者 Only view this author
nontons 发表于 2021-12-2 17:48
非常感谢您提出的方法,编译和测试都通过了,但是在使用的时候出现了这种问题,请问怎么解决呢?我是在root ...

我不知道你那边是不是超算集群。这个主要是singularity默认安装到/usr/local/里面,这就导致计算节点找不到这个软件。你需要在./mcconfig的时候指定一个公共的目录让计算节点能找到,例如./mcconfig -p /data/software

15

帖子

0

威望

377

eV
积分
392

Level 3 能力者

128#
发表于 Post on 2022-3-4 09:20:50 | 只看该作者 Only view this author
感谢老师的分享。singularity的作者已经把软件转移至apptainer了。目前apptainer的使用与singularity一致。例如,apptainer exec /home/cp2k82-avx2-1.sif cp2k.psmp

13

帖子

0

威望

758

eV
积分
771

Level 4 (黑子)

129#
发表于 Post on 2022-3-4 11:08:43 | 只看该作者 Only view this author
美式加糖 发表于 2022-3-4 09:16
我不知道你那边是不是超算集群。这个主要是singularity默认安装到/usr/local/里面,这就导致计算节点找不 ...

谢谢您的回复,这里用的是集群。刚刚测试提到的方法,但是我们的集群好像没犯法使用./mcconfig。报错信息为”-bash: ./mcconfig: No such file or directory“。

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

130#
发表于 Post on 2022-4-27 18:17:00 | 只看该作者 Only view this author
美式加糖 发表于 2022-3-4 09:20
感谢老师的分享。singularity的作者已经把软件转移至apptainer了。目前apptainer的使用与singularity一致。 ...

应该是, 目前 社区版本 CE (singularity) 和 Linux基金会版本 Apptainer 并存发展.

https://linuxfoundation.org/pres ... uting-environments/

https://www.reddit.com/r/HPC/com ... _foundation_and_is/
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

131#
发表于 Post on 2022-4-27 18:17:36 | 只看该作者 Only view this author
nontons 发表于 2022-3-4 11:08
谢谢您的回复,这里用的是集群。刚刚测试提到的方法,但是我们的集群好像没犯法使用./mcconfig。报错信息 ...

我就是在集群上跑SIF二进制可执行文件呢.
没有任何问题呀.

你是不是搞错方向了?
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

38

帖子

0

威望

1918

eV
积分
1957

Level 5 (御坂)

132#
发表于 Post on 2022-4-29 12:17:53 | 只看该作者 Only view this author
请问大家,我按照楼主的方法做,为什么err和out文件是空的,但是看到了几个hydra_pmi_proxy进程占用了cpu?
centos8 stream,7742,cp2k9.1,intel 2019update1 全家桶

5

帖子

0

威望

165

eV
积分
170

Level 3 能力者

133#
发表于 Post on 2022-4-29 20:29:19 | 只看该作者 Only view this author
请大家帮帮忙,搞了好久都没解决问题。 我在严格按照楼主的编译方式编译时,没有出现问题,但是在做测试时,出现了如下的报错:
Invalid error code (-2) (error ring index 127 invalid)
INTERNAL ERROR: invalid error code fffffffe (Ring Index out of range) in MPID_nem_tcp_init:373
Fatal error in PMPI_Init_thread: Other MPI error, error stack:
MPIR_Init_thread(586)..............:
MPID_Init(224).....................: channel initialization failed
MPIDI_CH3_Init(105)................:
MPID_nem_init(324).................:
MPID_nem_tcp_init(175).............:
MPID_nem_tcp_get_business_card(401):
MPID_nem_tcp_init(373).............: gethostbyname failed, bogon (errno 1)
请问是什么原因呢?

13

帖子

0

威望

758

eV
积分
771

Level 4 (黑子)

134#
发表于 Post on 2022-5-5 09:47:12 | 只看该作者 Only view this author
abin 发表于 2022-4-27 18:17
我就是在集群上跑SIF二进制可执行文件呢.
没有任何问题呀.

请问您的计算节点安装singularity了吗?
我这边就是提交任务到计算节点然后就提示没有权限,也没找到问题所在

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

135#
发表于 Post on 2022-5-5 09:50:27 | 只看该作者 Only view this author
nontons 发表于 2022-5-5 09:47
请问您的计算节点安装singularity了吗?
我这边就是提交任务到计算节点然后就提示没有权限,也没找到问 ...

让管理员解决……

或者开ssh我去直接上手处理。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 09:37 , Processed in 0.182290 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list