计算化学公社
标题:
gromacs使用超算模拟速度问题
[打印本页]
作者Author:
sun666
时间:
2021-9-7 18:57
标题:
gromacs使用超算模拟速度问题
本帖最后由 sun666 于 2021-9-7 18:59 编辑
大家好,由于我们组没有其他做模拟的,因此第一次使用超算计算很多不懂。速度竟然还没有我笔记本速度快,不知道是什么原因。以下为笔记本与超算配置
笔记本:拯救者 R9000P
CPU:AMD Ryzen 7 5800H GPU:GeForce 3070 内存:Samsung DDR4 3200MHz
超算:用的GPU节点,由于我不太懂超算配置以下为客服提供:"BSCC-N22 的 gpu 队列配置为: 每台机器配置 8 块型号为 NVIDIA Tesla V100-SXM2 32GB 显存的 GPU,每块 GPU 卡默认分配 8 CPU 核及 36GB 内存, 即 GPU:CPU:内存配比为 1GPU 卡:8CPU 核:36GB 内存。如果 CPU、内存需求用量超出该配比可以增加 CPU 核数的申请,也可以通过增加 GPU 卡数或CPU 核数的申请获得更多的内存配额,CPU:内存配额比例为 1:4.5GB。"
问题:我笔记本用win版gromacs2018.8版本,同一个算例99ns/day; 而超算计算命令为gmx mdrun -deffnm eq -v -ntmpi 1 -ntomp 8 -gpu_id 0 ,使用超算只能达到70ns/day,查看超算的gpu利用率在25%-35%范围
请问各位前辈是什么问题,该如何优化呢。跑一个伞状采样计算自由能大概花销两三百元,太贵了
。
作者Author:
Entropy.S.I
时间:
2021-9-7 20:12
8核太少了,你没有说CPU频率多少,如果频率只有2点几,顶级GPU需要12核以上的CPU才能发挥出比较完整的性能。5800H在散热好的情况下和显卡一起双烤也能跑到接近4GHz,顶一颗12核的Intel Skylake至强是没有问题的。简单查查可知,V100的单精度浮点性能(16 TFLOPS)不如RTX 3070 Laptop(17 TFLOPS),毕竟V100是4年多前的老架构,这样的差距很正常。
另外,V100这种计算卡擅长的是双精度浮点运算,而gmx是使用单精度进行计算的,所以非常不建议使用。即使是租超算。长期做计算就自己买工作站平台搭配游戏显卡吧。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3