计算化学公社

 找回密码 Forget password
 注册 Register
Views: 453|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[硬件评测] 实验室老设备E5 2696v3 重启vasp计算测速

[复制链接 Copy URL]

4

帖子

0

威望

54

eV
积分
58

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
本人研一,在团队重新接管多年不做计算的老设备,想做点vasp计算。现在导师这一直闲置的12台E5 2696v3 双路机子。
我也刚接触计算的新手小白,不太了解这个并行调度计算的东西,所以只开了一台双路的在计算。只能说这计算速度实在是太慢。投资超算不知是否更划算。
CPU:E5 2696v3 双路,36核72线程。
内存:64G,8个通道只插了4个16g内存,三星ESCC
系统:固态上直接装的linux,编译器Intel2019,vasp5.4.1。
计算内容:168个原子的氧化物,做结构优化
输入文件如下:
INCAR (1.23 KB, 下载次数 Times of downloads: 8)
KPOINTS (77 Bytes, 下载次数 Times of downloads: 7)
POTCAR (316.39 KB, 下载次数 Times of downloads: 7)
POSCAR (20.33 KB, 下载次数 Times of downloads: 8)



存在的问题:
1、就现在这个配置单主机计算这个体系,是不是小牛拉大车了属于,因为我尝试了用32核计算,无论怎么修改NPAR和KPAR的值,都无法提高计算速度。是不是单主机根据这个性能只能达到这个速度了?因为自己不太了解调度系统,没有搞多机并行,不确定多节点会不会大幅提高速度?或者说这些配置主机是不是已经落后了还有必要多节点并行吗,超算是不是更合适?
部分记录如下:
运行命令:mpirun -np 32 vasp
NPAR=2; KPAR=2;  一个电子步要1260.5814s
NPAR=1; KPAR=4;  一个电子步要1554.1342s
NPAR=1; KPAR=1; 没测完一个电子步,这种情况时间肯定是比上面两种长的

2、我也尝试了小体系结构优化,尝试了各种NPAR和KPAR组合单主机一个电子步速度最快也是0.4s左右。个人认为多核并行计算理论应该提高速度才是,但各种NPAR和KPAR组合没有明显提高速度,默认不设置这两个参数,电子步也就1.0s。没有明显提升。

3、是不是vasp版本也是影响并行计算的根本,这个我查了一些资料,不确定是不是版本影响NPAR和KPAR这种并行计算?

4、希望各位老师给点参考建议。

4

帖子

0

威望

54

eV
积分
58

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2024-10-20 10:33:13 | 只看该作者 Only view this author
kkk1167 发表于 2024-10-20 08:01
2696也就这样了,170个原子了,起码得64核才能好些

好的,感谢您的分享

4

帖子

0

威望

54

eV
积分
58

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2024-10-20 10:32:48 | 只看该作者 Only view this author
卡开发发 发表于 2024-10-20 01:14
1、32核心算168原子对VASP来说是有点勉强。多节点不一定能提高速度,看并行机制和硬件,k点并行的情况节点 ...

感谢老师的回复,这些建议让我受益匪浅。NPAR和KPAR有做这方面参考。
后续我再测试降低K点数量、LREA和LPREC精度的测试,不知只做结构优化的计算误差是否可以被接受。
赝势文件这块没做太多了解,感谢老师介绍。我后续再补充下这方面知识。

5

帖子

0

威望

81

eV
积分
86

Level 2 能力者

5#
发表于 Post on 2024-10-20 08:01:25 来自手机 | 只看该作者 Only view this author
2696也就这样了,170个原子了,起码得64核才能好些

3621

帖子

3

威望

1万

eV
积分
18426

Level 6 (一方通行)

第一原理惨品小作坊

4#
发表于 Post on 2024-10-20 01:14:52 | 只看该作者 Only view this author
1、32核心算168原子对VASP来说是有点勉强。多节点不一定能提高速度,看并行机制和硬件,k点并行的情况节点间通信代价没那么大,但能带并行的通信代价可能会大一些。对VASP而言,NPAR在手册上有推荐设置,建议按照这个来,KPAR则得根据你实际硬件情况和不可约K点数目(IBZKPT)进行设置。
2、0.4s和1.0s实际要是跑很长时间这个差异还是不小的,只是体系比较小总时长不是很长这种差异你能够接受而已。
3、版本影响可能有,不过5.x以后应该不会那么大,VASP很多算法应该比较成熟轻易不会太大改动。
4、其他建议,以下设置需要进行测试再决定是否要进行:
(1)对于结构优化而言,或许k网格间距并不需要0.04这么小,严格测试可能需要的k点数会更少。
(2)大体系可以考虑使用LREAL=Auto(或者A)替代默认的LREAL=.False.(或者F)。
(3)PREC或许可以用Normal(或N)替代Accurate(或者A)。
(4)PAW可以考虑使用没有尾缀的替代sv尾缀的,例如你体系中的V_sv用V替代,价电子数从11直接变到5。
你可以找块体原胞和小的表面分别对电子结构和势能面信息(例如对分子的吸附)对上述参数影响进行测试。

日常打哑谜&&探寻更多可能。
原理问题不公开讨论,非商业性质讨论欢迎私聊。
本周忙

4

帖子

0

威望

54

eV
积分
58

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2024-10-19 21:18:20 | 只看该作者 Only view this author
ChemG 发表于 2024-10-19 18:43
双路2696v3可能还没有7950x性能强,不过凑合也能用。首先至少把内存插满吧,否则内存带宽十分受影响。然后 ...

好的,我试试插满内存条,谢谢您的回复。

247

帖子

1

威望

2405

eV
积分
2672

Level 5 (御坂)

2#
发表于 Post on 2024-10-19 18:43:01 | 只看该作者 Only view this author
双路2696v3可能还没有7950x性能强,不过凑合也能用。首先至少把内存插满吧,否则内存带宽十分受影响。然后,想要速度快一些就换cp2k来算吧。
我唯一知道的就是我一无所知,但我是化学小迷弟

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 11:39 , Processed in 0.232635 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list