计算化学公社

标题: gromacs使用超算模拟速度问题 [打印本页]

作者
Author: sun666 时间: 2021-9-7 18:57
标题: gromacs使用超算模拟速度问题
本帖最后由 sun666 于 2021-9-7 18:59 编辑

大家好，由于我们组没有其他做模拟的，因此第一次使用超算计算很多不懂。速度竟然还没有我笔记本速度快，不知道是什么原因。以下为笔记本与超算配置
笔记本：拯救者 R9000P
CPU:AMD Ryzen 7 5800H GPU:GeForce 3070 内存：Samsung DDR4 3200MHz

超算：用的GPU节点，由于我不太懂超算配置以下为客服提供:"BSCC-N22 的 gpu 队列配置为：每台机器配置 8 块型号为 NVIDIA Tesla V100-SXM2 32GB 显存的 GPU，每块 GPU 卡默认分配 8 CPU 核及 36GB 内存，即 GPU：CPU：内存配比为 1GPU 卡：8CPU 核：36GB 内存。如果 CPU、内存需求用量超出该配比可以增加 CPU 核数的申请，也可以通过增加 GPU 卡数或CPU 核数的申请获得更多的内存配额，CPU：内存配额比例为 1：4.5GB。"

问题：我笔记本用win版gromacs2018.8版本，同一个算例99ns/day; 而超算计算命令为gmx mdrun -deffnm eq -v -ntmpi 1 -ntomp 8 -gpu_id 0 ，使用超算只能达到70ns/day，查看超算的gpu利用率在25%-35%范围

请问各位前辈是什么问题，该如何优化呢。跑一个伞状采样计算自由能大概花销两三百元，太贵了

。

作者
Author: Entropy.S.I 时间: 2021-9-7 20:12
8核太少了，你没有说CPU频率多少，如果频率只有2点几，顶级GPU需要12核以上的CPU才能发挥出比较完整的性能。5800H在散热好的情况下和显卡一起双烤也能跑到接近4GHz，顶一颗12核的Intel Skylake至强是没有问题的。简单查查可知，V100的单精度浮点性能（16 TFLOPS）不如RTX 3070 Laptop（17 TFLOPS），毕竟V100是4年多前的老架构，这样的差距很正常。
另外，V100这种计算卡擅长的是双精度浮点运算，而gmx是使用单精度进行计算的，所以非常不建议使用。即使是租超算。长期做计算就自己买工作站平台搭配游戏显卡吧。

欢迎光临计算化学公社 (http://bbs.keinsci.com/)