计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1320|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[NAMD] 求助NAMD并行计算在8卡机上跑8个任务无法达到目标效果

[复制链接 Copy URL]

8

帖子

0

威望

35

eV
积分
43

Level 2 能力者

按照博主的最新NAMD编译教程装好了NAMD,和官方提供的稳定版的NAMD3计算速度差异不大。但是问题是我想在8卡机上跑8个任务,好像运行起来无法达到目标效果
  1. /namd3 +p10 +setcpuaffinity +devices 0 step.inp
复制代码
使用slurm系统在同一个节点同一个机器上多次提交任务,比如提交两个任务,但是实际运行两个任务共用10个cpu,GPU运行速度也减半。应该怎么办呢
两次提交slurm脚本,并不能达到想要的并行跑的效果

  1. #SBATCH --cpus-per-task=10
  2. #SBATCH --gres=gpu:1
复制代码



8

帖子

0

威望

35

eV
积分
43

Level 2 能力者

2#
 楼主 Author| 发表于 Post on 2023-8-9 21:04:50 | 只看该作者 Only view this author
求助

2425

帖子

1

威望

6197

eV
积分
8642

Level 6 (一方通行)

3#
发表于 Post on 2023-8-9 21:18:14 | 只看该作者 Only view this author
开ssh
我看看。

电邮联系
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

6万

帖子

99

威望

6万

eV
积分
125181

管理员

公社社长

4#
发表于 Post on 2023-8-9 21:38:24 | 只看该作者 Only view this author

有别人回复之前若需要对帖子进行修改、补充,应直接编辑原帖,不要通过回帖进行补充,这点在置顶的新社员必读贴里明确说了。
下次删帖扣分处理

如置顶的新社员必读贴、论坛首页的公告栏、版头的红色大字非常明确所示,求助帖必须在帖子标题明确体现出此帖内容是求助或提问,并清楚、准确反映出帖子具体内容,避免有任何歧义和含糊性,仔细看http://bbs.keinsci.com/thread-9348-1-1.html。我已把你的不恰当标题 “NAMD并行计算” 改了,以后务必注意,下次将删帖+扣分处理。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

1171

帖子

7

威望

6862

eV
积分
8173

Level 6 (一方通行)

5#
发表于 Post on 2023-8-9 21:44:59 | 只看该作者 Only view this author
既然是你自己的机器,就不要用slurm了,直接
namd3 +p10 +devices 0 step.inp > xxx.log &
namd3 +p10 +devices 1 step.inp > xxx.log &
...
不就完事儿了么

另外如果你用了CUDASOAIntegrate的话是不需要这么多CPU核心的

8

帖子

0

威望

35

eV
积分
43

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2023-8-9 21:45:04 | 只看该作者 Only view this author
abin 发表于 2023-8-9 21:18
开ssh
我看看。

是公司的账号,需要VP;N登录才能ssh上。抱歉,

8

帖子

0

威望

35

eV
积分
43

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2023-8-9 23:48:06 | 只看该作者 Only view this author
感谢,确实用了CUDASOAIntegrate,降低CPU核心数后有收益。因为是公司的电脑,有不同用户提交任务,所以用的slurm。
但是我试过单独提交两个也不行,在同一台机器上运行两个任务 namd3 +p10 +devices 0 step.inp > xxx.log &  。会共用10个CPU,GPU利用率也从95% ——> 50%

1171

帖子

7

威望

6862

eV
积分
8173

Level 6 (一方通行)

8#
发表于 Post on 2023-8-10 09:12:28 | 只看该作者 Only view this author
zinczinc 发表于 2023-8-9 23:48
感谢,确实用了CUDASOAIntegrate,降低CPU核心数后有收益。因为是公司的电脑,有不同用户提交任务,所以用 ...

devices指定的是GPU序号,你每个作业得指定不同的GPU(devices 1,2,3...)

如果你总共只有10个CPU的话当然会共用,每个作业用1个CPU就行了(+p1)

8

帖子

0

威望

35

eV
积分
43

Level 2 能力者

9#
 楼主 Author| 发表于 Post on 2023-8-10 12:02:41 | 只看该作者 Only view this author
fhh2626 发表于 2023-8-10 09:12
devices指定的是GPU序号,你每个作业得指定不同的GPU(devices 1,2,3...)

如果你总共只有10个CPU的话 ...

也指定了,分别用的两个GPU
如图:

1171

帖子

7

威望

6862

eV
积分
8173

Level 6 (一方通行)

10#
发表于 Post on 2023-8-10 18:53:16 | 只看该作者 Only view this author
zinczinc 发表于 2023-8-10 12:02
也指定了,分别用的两个GPU
如图:

看看top, cat /proc/cpuinfo| grep "cpu cores"| uniq 和 cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l的输出

2425

帖子

1

威望

6197

eV
积分
8642

Level 6 (一方通行)

11#
发表于 Post on 2023-8-10 20:04:54 | 只看该作者 Only view this author
开SSH
或者给我登录权限,让我去看看调度配置。

另,无论机器是八个还是十个GPU
通过调度要两个GPU,编号就是0,1。
自己手动编号,死很惨的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

3

帖子

0

威望

69

eV
积分
72

Level 2 能力者

12#
发表于 Post on 2023-10-18 16:05:26 | 只看该作者 Only view this author
你好,请问哪里可以看到新的编译教程啊?我自己想在集群个人账号下编译NAMD3,总是不成功。CUDASOA这个选项一打开就报错,low/high cuda count的错误

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-26 02:57 , Processed in 0.176080 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list