|
|
本帖最后由 Liuneng 于 2025-10-21 12:05 编辑
我的设备是9700x+9070xt,ubuntu,最近开始接触gromacs,对于我自己的70万的体系,模拟速度最快18ns/day,是把pme交给cpu,其他给gpu,14核,这是最快的情况,pme交给gpu会慢到12ns/day,我觉得偏慢,就做了基准测试,如图所示,跟原帖大佬测试的速度比起来,最好的情况也只有3090的三分之一,原帖是http://bbs.keinsci.com/forum.php ... 3296&highlight=4090
显卡运行时功率最高上到240w,cpu和gpu利用率均为100%,pme绘画gpu时功率180w左右,这时候显卡利用率也是显示100%,设计上限340w。
gromacs是基于rocm的adaptivecpp支持的,三个均为最新版本,rocm支持此显卡gfx1201。试过hip编译的,一样情况,而且容易死机。单精度编译。温度65度左右未撞墙,pcie插槽速率没问题,在win11系统玩游戏、烤机均能达到功率上限,电脑为850w电源。
现在没有别的排查方向了,希望大佬们指点迷津,谢谢各位。
|
|