计算化学公社»论坛首页 › 计算机软硬件 (Software and Hardware) › 高性能计算、集群、并行技术 (HPC, Cluster, Parallel Computing) › RTX3090/Tesla A100/Tesla V100跑gromacs MD的小测试

RTX3090/Tesla A100/Tesla V100跑gromacs MD的小测试

查看数: 6683 | 评论数: 4 | 收藏 Add to favorites 2

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

rugals

发布时间: 2022-12-2 14:07

正文摘要:

在某超算上申请了几个GPU节点，因此顺便就做了三种不同GPU节点的gromacs跑MD的速度测试。节点1: CPU: AMD EPYC 7002 2.6GHz 128核内存: 512G GPU: 8块RTX3090, 每块显存24G 每块最多用16核和60G内存。节点 ...

回复 Reply

rugals 发表于 Post on 2022-12-2 16:40:46

Entropy.S.I 发表于 2022-12-2 16:20
自行对比-bonded gpu -update gpu和-update gpu的速度。

前者是GPU-resident模式，以你的硬件资源和模 ...

谢谢老师指点！

发帖太快忘了写，用的2022.2版本

Entropy.S.I 发表于 Post on 2022-12-2 16:20:20

本帖最后由 Entropy.S.I 于 2022-12-2 16:29 编辑

rugals 发表于 2022-12-2 16:00
谢佬，我也觉得这个速度较坛子里其他的评测慢很多。
模型是1千多个原子数从100-400不等的简单聚乙烯寡聚 ...

自行对比-bonded gpu -update gpu和-update gpu的速度。

前者是GPU-resident模式，以你的硬件资源和模型特点，我预计GPU-resident模式更快。

正确指定-pin on -pinoffset * -pinstride 1 -nt * -gpu_id *以充分利用所有CPU、GPU资源。

最后，你没说用的GMX是哪个版本，反正目前推荐2021.6

rugals 发表于 Post on 2022-12-2 16:00:37

Entropy.S.I 发表于 2022-12-2 14:44
极其不严谨的测试，不同CPU下跑GMX的GPU benchmark没什么意义。仔细看性能翻倍？RTX4090科学计算之经典MD模 ...

谢佬，我也觉得这个速度较坛子里其他的评测慢很多。
模型是1千多个原子数从100-400不等的简单聚乙烯寡聚链，用packmol生成。
cut-off 的rcolumb和rvdw都是1.0

请问您觉得这三个节点都需要用GPU-resident模式吗？-bond和-update用哪个更好些？或者都用？

Entropy.S.I 发表于 Post on 2022-12-2 14:44:03

本帖最后由 Entropy.S.I 于 2022-12-2 14:45 编辑

极其不严谨的测试，不同CPU下跑GMX的GPU benchmark没什么意义。仔细看性能翻倍？RTX4090科学计算之经典MD模拟全面测试

另外，没有说清楚所用模型的具体参数。但是，按你已经给出的参数，以及对应的GPU占用情况，显然没有发挥出GPU最佳性能。AMD Ryzen R9 5950X + NVIDIA GeForce RTX 3080Ti（OC 100MHz，400W）的硬件组合模拟上文中A模型（此模型参数可能与你所用的模型接近）可达到71ns/d。

最后提示一下，你给的mdrun运行命令

gmx mdrun -v -deffnm XXX -ntmpi 1 -ntomp [单卡最大核数] -nb gpu -pme gpu

不是GPU-resident模式，成键项是在CPU上计算的。

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register