Entropy.S.I 发表于 2023-12-21 11:20 不好意思忘了提醒了,多谢指正,我环境变量加了export GMX_FORCE_UPDATE_DEFAULT_GPU=true,就忘了没做的话还要设置-update gpu这件事啦。 |
Entropy.S.I 发表于 2023-12-21 11:22 感谢指导,会继续学习的 |
|
本帖最后由 Entropy.S.I 于 2023-12-21 11:26 编辑 用完全没有调优的简单粗暴的命令提交,只会自取其辱。必须认真学习gmx mdrun的并行调优。2019年的已经过时了。 对于你当前这种单核性能一塌糊涂的CPU,-bonded gpu或许更好,实际自行测试。但再怎么调优,预计最大性能只有13900KF+4090的不到80%,你的4090只能当4080用。 做benchmark必须关闭pme tuning,并通过-nsteps设置较少的步数,前者对结果的影响绝对不可忽视。 |
snljty2 发表于 2023-12-21 10:26 是-bonded cpu -update gpu 而非-bonded cpu -nb gpu -pme gpu |
本帖最后由 snljty2 于 2023-12-21 11:33 编辑 Newbee_Ccc 发表于 2023-12-21 09:51 这种CPU单核频率等因素不行,会明显拖累4090的速度。如果条件允许,建议参考Entropy.S.I的文章《性能翻倍?RTX4090科学计算之经典MD模拟全面测试》和《2023年3月MD benchmark测试中篇 ——W790平台首发测试》,重配一台更合理搭配的服务器。另外追求速度的话,应该用尽量新的稳定版本的Gromacs,建议用不晚于2022.6的版本。 通常编译参数、运行参数等合理而且所用任务支持的话,-pme gpu是默认的。建议使用Linux系统,设定好内核绑定,并且考虑好主板上电路连接方式,让所选用CPU核心和用的对应的GPU是直连的。没有作业系统的话,用-gpu_id参数指定需要的GPU的ID,用-pin on -ntmpi 1 -ntomp xxx -pinoffset yyy指定CPU数量和内核绑定的起始位置。通常CPU不太烂的话,最优参数一般是-bonded cpu -nb gpu -pme gpu -update gpu。 |
snljty2 发表于 2023-12-21 09:45 感谢您的回复,CPU是Intel(R) Xeon(R) Gold 5318Y CPU @ 2.10GHz,也在论坛中找了一下,发现之前默认-ntmpi 弄成了8个 现在使用命令-ntmpi 1 -ntomp 24来运行,现在好像速度快了很多;此外,学习了“GROMACS (2019.3 GPU版) 并行效率测试及调试思路”,这个发现我之前mdrun的命令中只写了 -nb gpu,现在还加上了-pme gpu,不知道是否也是影响了速度。 再次对您的回复表示感谢,学习到了很多东西。 |
|
说清你的CPU型号。 4090不支持NVLink,恐怕不适合两张显卡跑一个任务。如果CPU带得动,应该用两张卡分别各跑一个任务,适当设定线程绑定,每个任务应该是-ntmpi 1 -ntomp xxx,xxx代表并行核数。用GPU版本如果不跨显卡跑任务,通常thread-MPI或者MPI的数量都应该设为1。 |
sobereva 发表于 2023-12-21 03:36 感觉跑的还是很慢吧 Core t (s) Wall t (s) (%) Time: 29654.310 617.817 4799.9 (ns/day) (hour/ns) Performance: 5.818 4.125 |
sobereva 发表于 2023-12-21 03:36 感谢老师的回复! 我看了刚刚运行mdrun的提示如下 “On host cryo 2 GPUs selected for this run. Mapping of GPU IDs to the 8 GPU tasks in the 8 ranks on this node: PP:0,PP:0,PP:0,PP:0,PP:1,PP:1,PP:1,PP:1 PP tasks will do (non-perturbed) short-ranged and most bonded interactions on the GPU PP task will update and constrain coordinates on the CPU Using 8 MPI threads Using 6 OpenMP threads per tMPI thread” 应该是调用了GPU加速了吧 |
|
弄清楚到底GPU加速利用了没有 并且跑半分钟后杀掉,看速度统计每天能跑多少ns |
| 笔记本端 4060 3.8W原子 Linux gromacs2022.06 280ns/day |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2026-2-23 20:27 , Processed in 0.200406 second(s), 25 queries , Gzip On.