计算化学公社

标题: AOCC编译VASP后运行命令问题 [打印本页]

作者
Author:
chever    时间: 2023-5-10 17:27
标题: AOCC编译VASP后运行命令问题
本帖最后由 chever 于 2023-5-10 17:29 编辑

抄Sob的作业买的7R32工作站参考VASP | AMD在AMD机器上安装DFT计算软件VASP.6.2.0简明教程 - 第一性原理 (First Principle) - 计算化学公社 (keinsci.com)通过AOCC成功编译VASP

但官方文档中的提交命令有点看不懂
mpirun -np 32 -x OMP_NUM_THREADS=4 --map-by ppr:2:l3cache:pe=4 --bind-to core -x UCX_TLS=self,sm,rc_x $vasp

我尝试改动了一下,但速度都很慢。烦请各路大大帮忙看看


作者
Author:
FUcreature    时间: 2023-5-10 18:19
不如返朴归真,直接
  1. mpirun -np 32 $vasp
复制代码
看看效果如何
作者
Author:
chever    时间: 2023-5-11 09:30
FUcreature 发表于 2023-5-10 18:19
不如返朴归真,直接看看效果如何

感谢,我试了一下啦,应该是调用了很多线程,还是很慢
作者
Author:
abin    时间: 2023-5-11 10:55
chever 发表于 2023-5-11 09:30
感谢,我试了一下啦,应该是调用了很多线程,还是很慢

(, 下载次数 Times of downloads: 66)

鄙人仅仅在笔记本上测试过,
应该是AMD 6800H, ThinkBook笔记本.
同样是8核心, 计算速度, 和Intel处理器不相上下.


作者
Author:
chever    时间: 2023-5-11 12:14
abin 发表于 2023-5-11 10:55
鄙人仅仅在笔记本上测试过,
应该是AMD 6800H, ThinkBook笔记本.
同样是8核心, 计算速度, 和Intel ...

现在用aocc编译出来的就是比mkl的慢,可能没编译好或者运行有问题吧,哈哈
作者
Author:
biogon    时间: 2023-5-11 14:16
本帖最后由 biogon 于 2023-5-11 14:51 编辑
chever 发表于 2023-5-11 12:14
现在用aocc编译出来的就是比mkl的慢,可能没编译好或者运行有问题吧,哈哈

我看了下那个帖子,用spack编出来的可能就是不太行,不用那个方法编译,改makefile用aocc+aocl编很快可以参考我最新发的帖子

作者
Author:
chever    时间: 2023-5-11 16:20
biogon 发表于 2023-5-11 14:16
我看了下那个帖子,用spack编出来的可能就是不太行,不用那个方法编译,改makefile用aocc+aocl编很快可以 ...

十分感谢,迫不及待要试试啦
作者
Author:
hebrewsnabla    时间: 2023-5-11 18:22
双路7R32只有96核,你一楼的写法用了128线程,三楼的写法用了32*48个线程,当然慢了……
作者
Author:
chever    时间: 2023-5-11 19:25
hebrewsnabla 发表于 2023-5-11 18:22
双路7R32只有96核,你一楼的写法用了128线程,三楼的写法用了32*48个线程,当然慢了……

是有修改的,4*8, 4*16, 8*4, 8*8, 16*4都有试过
作者
Author:
nicejunjie    时间: 2023-7-15 02:10
amd的fortran compiler是用的基于open source pgfortran的f18项目。目前不是很建议使用非intel和非pgi/nvidia的fortran 编译器。
作者
Author:
ggshining    时间: 2024-1-23 19:29
我用AOCC+AOCL编的vasp6.3.2,纯MPI的版本始终比MPI+openMP的版本快一点,带openMP的版本只要用多线程速度就降,用单线程和纯MPI版本差不多,略慢一点点。
也是不知道为什么,CPU是双路AMD9654
作者
Author:
糖炒DFT    时间: 2024-5-22 22:42
ggshining 发表于 2024-1-23 19:29
我用AOCC+AOCL编的vasp6.3.2,纯MPI的版本始终比MPI+openMP的版本快一点,带openMP的版本只要用多线程速度 ...

可以试试绑定插槽提交,我绑定核心跑就巨慢,换成绑定插槽就比较快,无论MPI还是MPI+openMP;机器 7763 ;  
作者
Author:
xwaaa    时间: 2024-9-1 11:39
糖炒DFT 发表于 2024-5-22 22:42
可以试试绑定插槽提交,我绑定核心跑就巨慢,换成绑定插槽就比较快,无论MPI还是MPI+openMP;机器 7763  ...

请问怎么绑定插槽?




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3