计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1694|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[并行运算] AOCC编译VASP后运行命令问题

[复制链接 Copy URL]

14

帖子

0

威望

852

eV
积分
866

Level 4 (黑子)

本帖最后由 chever 于 2023-5-10 17:29 编辑

抄Sob的作业买的7R32工作站参考VASP | AMD在AMD机器上安装DFT计算软件VASP.6.2.0简明教程 - 第一性原理 (First Principle) - 计算化学公社 (keinsci.com)通过AOCC成功编译VASP

但官方文档中的提交命令有点看不懂
mpirun -np 32 -x OMP_NUM_THREADS=4 --map-by ppr:2:l3cache:pe=4 --bind-to core -x UCX_TLS=self,sm,rc_x $vasp

我尝试改动了一下,但速度都很慢。烦请各路大大帮忙看看

17

帖子

0

威望

587

eV
积分
604

Level 4 (黑子)

2#
发表于 Post on 2023-5-10 18:19:11 | 只看该作者 Only view this author
不如返朴归真,直接
  1. mpirun -np 32 $vasp
复制代码
看看效果如何

14

帖子

0

威望

852

eV
积分
866

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2023-5-11 09:30:24 | 只看该作者 Only view this author
FUcreature 发表于 2023-5-10 18:19
不如返朴归真,直接看看效果如何

感谢,我试了一下啦,应该是调用了很多线程,还是很慢

图片1.png (13.97 KB, 下载次数 Times of downloads: 58)

图片1.png

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2023-5-11 10:55:01 | 只看该作者 Only view this author
chever 发表于 2023-5-11 09:30
感谢,我试了一下啦,应该是调用了很多线程,还是很慢



鄙人仅仅在笔记本上测试过,
应该是AMD 6800H, ThinkBook笔记本.
同样是8核心, 计算速度, 和Intel处理器不相上下.

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

14

帖子

0

威望

852

eV
积分
866

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2023-5-11 12:14:06 | 只看该作者 Only view this author
abin 发表于 2023-5-11 10:55
鄙人仅仅在笔记本上测试过,
应该是AMD 6800H, ThinkBook笔记本.
同样是8核心, 计算速度, 和Intel ...

现在用aocc编译出来的就是比mkl的慢,可能没编译好或者运行有问题吧,哈哈

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
Picardo + 5 谢谢

查看全部评分 View all ratings

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

6#
发表于 Post on 2023-5-11 14:16:36 | 只看该作者 Only view this author
本帖最后由 biogon 于 2023-5-11 14:51 编辑
chever 发表于 2023-5-11 12:14
现在用aocc编译出来的就是比mkl的慢,可能没编译好或者运行有问题吧,哈哈

我看了下那个帖子,用spack编出来的可能就是不太行,不用那个方法编译,改makefile用aocc+aocl编很快可以参考我最新发的帖子

评分 Rate

参与人数
Participants 2
eV +9 收起 理由
Reason
Picardo + 5 谢谢
chever + 4 GJ!

查看全部评分 View all ratings

14

帖子

0

威望

852

eV
积分
866

Level 4 (黑子)

7#
 楼主 Author| 发表于 Post on 2023-5-11 16:20:32 | 只看该作者 Only view this author
biogon 发表于 2023-5-11 14:16
我看了下那个帖子,用spack编出来的可能就是不太行,不用那个方法编译,改makefile用aocc+aocl编很快可以 ...

十分感谢,迫不及待要试试啦

831

帖子

1

威望

7180

eV
积分
8031

Level 6 (一方通行)

8#
发表于 Post on 2023-5-11 18:22:22 | 只看该作者 Only view this author
双路7R32只有96核,你一楼的写法用了128线程,三楼的写法用了32*48个线程,当然慢了……

14

帖子

0

威望

852

eV
积分
866

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2023-5-11 19:25:19 | 只看该作者 Only view this author
hebrewsnabla 发表于 2023-5-11 18:22
双路7R32只有96核,你一楼的写法用了128线程,三楼的写法用了32*48个线程,当然慢了……

是有修改的,4*8, 4*16, 8*4, 8*8, 16*4都有试过

2

帖子

0

威望

9

eV
积分
11

Level 1 能力者

10#
发表于 Post on 2023-7-15 02:10:35 | 只看该作者 Only view this author
amd的fortran compiler是用的基于open source pgfortran的f18项目。目前不是很建议使用非intel和非pgi/nvidia的fortran 编译器。

28

帖子

0

威望

1046

eV
积分
1074

Level 4 (黑子)

11#
发表于 Post on 2024-1-23 19:29:58 | 只看该作者 Only view this author
我用AOCC+AOCL编的vasp6.3.2,纯MPI的版本始终比MPI+openMP的版本快一点,带openMP的版本只要用多线程速度就降,用单线程和纯MPI版本差不多,略慢一点点。
也是不知道为什么,CPU是双路AMD9654

9

帖子

0

威望

79

eV
积分
88

Level 2 能力者

12#
发表于 Post on 2024-5-22 22:42:16 | 只看该作者 Only view this author
ggshining 发表于 2024-1-23 19:29
我用AOCC+AOCL编的vasp6.3.2,纯MPI的版本始终比MPI+openMP的版本快一点,带openMP的版本只要用多线程速度 ...

可以试试绑定插槽提交,我绑定核心跑就巨慢,换成绑定插槽就比较快,无论MPI还是MPI+openMP;机器 7763 ;  

2

帖子

0

威望

97

eV
积分
99

Level 2 能力者

13#
发表于 Post on 2024-9-1 11:39:52 | 只看该作者 Only view this author
糖炒DFT 发表于 2024-5-22 22:42
可以试试绑定插槽提交,我绑定核心跑就巨慢,换成绑定插槽就比较快,无论MPI还是MPI+openMP;机器 7763  ...

请问怎么绑定插槽?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:10 , Processed in 0.230422 second(s), 34 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list