计算化学公社

标题: 求指点:如何配置能发挥两张NVIDIA4090性能 [打印本页]

作者
Author:
GauFeng    时间: 2023-5-29 18:32
标题: 求指点:如何配置能发挥两张NVIDIA4090性能
本帖最后由 GauFeng 于 2023-5-29 18:36 编辑

各位大佬:

       手头有两张    NVIDIA RTX 4090 原厂公版的显卡。
       求怎样的配置能发挥出显卡性能
       我用GROMACS的window编译版,作分子动力学模拟。


       (, 下载次数 Times of downloads: 35)

作者
Author:
abin    时间: 2023-5-29 18:42
硬件
换上强劲的处理器,比如这个论坛一直在推荐的7950X

那个NVLink,链接两个卡片。

系统层面,更换为Linux。
重新编译。

如果任务较多,使用一个调度器,比如slurm。

如果你的任务每次都仅用一个GPU,
那就不用NVLink了。

不使用调度器的话,记得手动绑定GPU。
作者
Author:
牧生    时间: 2023-5-29 18:46
http://bbs.keinsci.com/thread-32172-1-1.html
不能NVLink了

作者
Author:
GauFeng    时间: 2023-5-29 19:40
本帖最后由 GauFeng 于 2023-5-29 19:44 编辑

不能NVLink也无所谓,我跑两个任务吧

能有详细的配置单推荐不

这个配置将电源换成1500W的行不


还是配
两台,一台一块显卡好

CPU:AMD Ryzen 9 7950X(16核,4.5~5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约
散热器:利民FC140  300
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)
显卡:华硕TUF-RTX4090-24G-GAMING  14000
内存:2*金士顿FURY 16GB DDR5 5200  2*440
电源:海韵FOCUS GX-1000  1440
机箱:先马黑洞标准版  260
键盘鼠标:罗技MK200 多媒体套装  80

作者
Author:
Entropy.S.I    时间: 2023-5-29 21:32
本帖最后由 Entropy.S.I 于 2023-5-29 21:41 编辑

先搜索再提问。互联网上有大量关于RTX4090运行GROMACS的测试和配置推荐。
http://bbs.keinsci.com/thread-33296-1-1.html
http://bbs.keinsci.com/thread-35960-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-35988-1-1.html
性价比最高的方法是使用1颗7950X/13900KF配2块RTX4090,此方案需DIY,使用PCIe拆分卡+PCIe延长线(绝对不能把4090插在从芯片组引出的PCIe slot上!!!),并妥善安放2块RTX4090。
若不接受上述方案,则为2块4090分别配一套13900KF/7950X平台,注意,现在13900KF并不贵,如果此平台不跑CPU密集型任务,使用13900KF性价比并不比7950X差,而前者可发挥出更多4090性能,具体请看前面列出文章中的3月第二篇。


最后,用4090在Windows下跑GMX,还妄图“发挥出性能”,是非常愚蠢的想法。

作者
Author:
ogrebit    时间: 2023-6-2 11:39
Entropy.S.I 发表于 2023-5-29 21:32
先搜索再提问。互联网上有大量关于RTX4090运行GROMACS的测试和配置推荐。
http://bbs.keinsci.com/thread- ...

绝对不能把4090插在从芯片组引出的PCIe slot上!!!求科普。
作者
Author:
牧生    时间: 2023-6-2 12:13
ogrebit 发表于 2023-6-2 11:39
绝对不能把4090插在从芯片组引出的PCIe slot上!!!求科普。

刚从坑里出来的人告诉你,没淋过雨的人,不知道这雨有多大。

芯片组引出的PCIe slot速度太慢,带不动4090
作者
Author:
Entropy.S.I    时间: 2023-6-2 12:20
本帖最后由 Entropy.S.I 于 2023-6-2 12:38 编辑
ogrebit 发表于 2023-6-2 11:39
绝对不能把4090插在从芯片组引出的PCIe slot上!!!求科普。

从芯片组引出的PCIe x16 slot实际速率是PCIe Gen4 x4,且时延更高,此状态下4090跑GMX性能连4070Ti都不如。@牧生 早前遇到过此问题,来找过我。
作者
Author:
xptracy    时间: 2023-6-2 19:57
牧生 发表于 2023-6-2 12:13
刚从坑里出来的人告诉你,没淋过雨的人,不知道这雨有多大。

芯片组引出的PCIe slot速度太慢,带不动4 ...

芯片组引出的PCIe slot,是哪个位置,应该插在哪个位置
作者
Author:
xptracy    时间: 2023-6-2 20:05
Entropy.S.I 发表于 2023-6-2 12:20
从芯片组引出的PCIe x16 slot实际速率是PCIe Gen4 x4,且时延更高,此状态下4090跑GMX性能连4070Ti都不如 ...

芯片组引出的PCIe slot,是哪个位置,应该插在哪个位置
作者
Author:
Entropy.S.I    时间: 2023-6-2 20:26
xptracy 发表于 2023-6-2 20:05
芯片组引出的PCIe slot,是哪个位置,应该插在哪个位置

查阅你主板的手册,在主板厂商官网相应的产品详情页下载。
作者
Author:
牧生    时间: 2023-6-2 21:28
xptracy 发表于 2023-6-2 19:57
芯片组引出的PCIe slot,是哪个位置,应该插在哪个位置

最简单省事正规的方法是查阅该主板的说明书,直接就到达正确的终点。

不信邪的(比如我),可以自行把每个插槽都试一遍,然后最终绕一大圈走到终点。
作者
Author:
xptracy    时间: 2023-6-2 21:38
本帖最后由 xptracy 于 2023-6-2 22:15 编辑
牧生 发表于 2023-6-2 21:28
最简单省事正规的方法是查阅该主板的说明书,直接就到达正确的终点。

不信邪的(比如我),可以自行把 ...


(, 下载次数 Times of downloads: 38) (, 下载次数 Times of downloads: 41)
请问,芯片组的PCIe slot是指?

作者
Author:
xptracy    时间: 2023-6-2 22:16
Entropy.S.I 发表于 2023-6-2 20:26
查阅你主板的手册,在主板厂商官网相应的产品详情页下载。

(, 下载次数 Times of downloads: 36) (, 下载次数 Times of downloads: 43) 请问,芯片组的PCIe slot是指?
作者
Author:
Entropy.S.I    时间: 2023-6-2 22:34
xptracy 发表于 2023-6-2 22:16
请问,芯片组的PCIe slot是指?

有些厂商、有些主板的手册会直接给出架构图,例如:
(, 下载次数 Times of downloads: 43)
(, 下载次数 Times of downloads: 46)

若没有架构图,也可看规格列表,例如:
(, 下载次数 Times of downloads: 39)

作者
Author:
xptracy    时间: 2023-6-2 22:38
Entropy.S.I 发表于 2023-6-2 22:34
有些厂商、有些主板的手册会直接给出架构图,例如:

这样的 (, 下载次数 Times of downloads: 25)
作者
Author:
Entropy.S.I    时间: 2023-6-2 22:53
xptracy 发表于 2023-6-2 22:38
这样的

所以你还要问什么?饭已经给你送进胃里了
作者
Author:
牧生    时间: 2023-6-3 08:24
xptracy 发表于 2023-6-2 22:38
这样的


这个位置上4090是最优选择 (, 下载次数 Times of downloads: 22)


作者
Author:
zhaovic    时间: 2023-6-7 16:58
一些x670e支持将直连cpu的16条pcie通道拆成两个4.0x8通道分配给两个x16长度的插槽,性能会稍微损失一些,网上测得是3%左右,想一点不损失需要二代以上的霄龙或三代以上的志强平台
作者
Author:
Entropy.S.I    时间: 2023-6-7 17:11
zhaovic 发表于 2023-6-7 16:58
一些x670e支持将直连cpu的16条pcie通道拆成两个4.0x8通道分配给两个x16长度的插槽,性能会稍微损失一些,网 ...

http://bbs.keinsci.com/thread-35988-1-1.html
1.1.1节说得很清楚,DIY拆分方案是性价比最高的,同时也给出了使用自带拆分的主板+双宽4090的“钱多人懒”方案。当然,此文正文中没有提到,开源宇宙公司正在开发专为此方案定制的机箱,不久后将会开售。

此外,不同计算任务对PCIe通信性能的需求有巨大差别,绝对不能把网上基于video game的测试结论套到科学计算应用上来。具体到RTX4090加速GMX,PCIe速率从Gen4 x16降到Gen4 x8对大体系的性能影响不止3%。
作者
Author:
Illuminatia    时间: 2023-6-24 19:08
x670e平台可以看看proart啊 那个支持pcie拆分 x16 拆成x8/x8。 基本上asus的proart 和workstation系列都支持的。其他家的没怎么关注




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3