计算化学公社

 找回密码 Forget password
 注册 Register
Views: 953|回复 Reply: 10
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 求助:笔记本外接显卡跑GMX

[复制链接 Copy URL]

10

帖子

0

威望

102

eV
积分
112

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
纯小白,实验室不是做计算模拟的,预算不够配台式机或工作站,所以想拿笔记本外接显卡跑GPU加速的GMX。

根据现在查到的资料可能主要有以下两个方案,不确定二者可行与否,大佬们觉得哪个更好:
  • 通过雷电4或者USB4外接显卡坞。优点是外接技术较为成熟。缺点是雷电4和USB4带宽有限,根据各路评测,这种外接形式必然导致显卡的跑分和游戏性能下降。
  • 通过OCulink把显卡接入PCIe主线。优点是PCIe带宽高(PCIe 4.0*16可以到64Gpbs),有助于显卡无损接入主线,根据网上的评测,笔记本通过OCulink外接显卡(4070 super)和台式机显卡的跑分几乎一致。缺点是技术相对不成熟,可能会遇到各种未知问题。

在想这两个方案的时候,我主要遇到了以下几个原理性问题,短时间难以想明白,求大佬指点:


  • 外接显卡加速GMX原理上是否可以实现?
  • GMX的运行速度是否十分依赖于CPU和显卡之间的快速通信?即相比低带宽,显卡通过高带宽的途径接入笔记本是否能给运算速度带来显著的提高?
  • 外接显卡是否可以和笔记本自带的独显交火,或者两个显卡分别跑两段模拟,以实现总体效率的提高?

恳请各位大佬赐教

846

帖子

16

威望

4634

eV
积分
5800

Level 6 (一方通行)

小屁孩

2#
发表于 Post on 2024-2-23 02:05:11 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2024-2-23 02:21 编辑

网上的graphic benchmarks不能充分反映HPC负载下的情况,即使是graphic benchmarks本身都有各种特点。

1. 完全可以
2. GMX对CPU-GPU通信性能(包含bandwidth和latency)非常敏感,4090使用Gen4 x4,在13900K上也只能达到使用x16的1/3的性能。@牧生 9个月前就有这种经历。笔记本能用的OCulink都是SFF8611-4i,只有4条PCIe lane,且这种连接很不稳定,极易出现“掉卡”问题。
3. 不要把游戏的那些概念搬过来,而且“交火”是多年前ATI/AMD GPU上的技术。NVIDIA消费级GPU没有PCIe P2P,抛开早年一部分型号使用SLI/NVLink的情况,GPU之间的数据传输需要先把数据copy进入CPU内存空间再copy进入对方GPU的VRAM,latency比P2P高1个数量级,反映在GMX中就是稍微像样的消费级GPU,使用2卡以上并行运行1个mdrun,并行效率很可能无论如何调优都是负的;即使是2卡,也要有足够高的内存带宽和CPU多核性能来给GPU施加足够的压力才能获得较好的并行效率。更别提前面说过笔记本外接GPU只有PCIe x4宽度。此外,不同性能的GPU并行运行1个mdrun的性能调优工作极为麻烦。建议每块GPU跑独立的mdrun,注意务必设置好thread affinity,不要让多个线程打架,而这首先需要使用Linux系统才有可能实现。

仔细阅读:
http://bbs.keinsci.com/thread-33296-1-1.html
http://bbs.keinsci.com/thread-35960-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-39266-1-1.html
http://bbs.keinsci.com/thread-40313-1-1.html
- 向着虚无前进 -

1376

帖子

0

威望

3986

eV
积分
5362

Level 6 (一方通行)

3#
发表于 Post on 2024-2-23 08:04:37 | 只看该作者 Only view this author
本帖最后由 牧生 于 2024-2-23 08:07 编辑

我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不适合放在办公室。

如果你不是硬件高手,那么建议出出血(要么自己的血,要么老板的血),买台4090的机子


http://sobereva.com/444

极高性能分子动力学服务器推荐配置
CPU:AMD Ryzen 9 7950X(16核,4.5~5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4650
散热器:利民FC140 300(如果希望散热更好,可以用瓦尔基里GL360水冷散热器 770元)
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)  1230
显卡:华硕TUF-RTX4090-24G-GAMING  19000
内存:2*金士顿FURY 16GB DDR5 5200  2*370
电源:海韵FOCUS GX-1000  1100
机箱:先马黑洞标准版  260
键盘鼠标:罗技MK200 多媒体套装  80
总价:约27300
又菜又爱玩

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2024-2-23 10:58:36 | 只看该作者 Only view this author
用笔记本玩, 你可能是想多了.

做计算, 需要长时间负载, 并且一刻都不可以听或者出错.

让专用的机器干活吧, 不要折腾笔记本了.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

10

帖子

0

威望

102

eV
积分
112

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 2024-2-23 11:28:01 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-2-23 02:05
网上的graphic benchmarks不能充分反映HPC负载下的情况,即使是graphic benchmarks本身都有各种特点。

1 ...

感谢大佬回复。
考虑到您说的,相比直连台式机,目前的技术即便通过OCulink接PCIe 4.0*4也会损失显卡过半性能,以及存在“掉卡”问题,我后面还是配个台式机吧。
我整机预算在8k-1w之间,显卡4070Ti或者super,CPU 7900X或者7800X,不知道7900X这种CPU配4070s会不会有点像吕布骑狗,不知道大佬您有什么建议

10

帖子

0

威望

102

eV
积分
112

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2024-2-23 11:30:05 | 只看该作者 Only view this author
牧生 发表于 2024-2-23 08:04
我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不 ...

感谢大佬经验分享,我准备配台式机了,自己出点血吧先
单纯好奇,您当时外接显卡是什么方案,有没有发过帖子啥的,虽然不准备这么干了,但是还想了解一下

10

帖子

0

威望

102

eV
积分
112

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2024-2-23 11:30:37 | 只看该作者 Only view this author
abin 发表于 2024-2-23 10:58
用笔记本玩, 你可能是想多了.

做计算, 需要长时间负载, 并且一刻都不可以听或者出错.

感谢大佬回复,还是配台式机吧,稳点

846

帖子

16

威望

4634

eV
积分
5800

Level 6 (一方通行)

小屁孩

8#
发表于 Post on 2024-2-23 17:07:03 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2024-2-23 17:10 编辑
oOdskOo 发表于 2024-2-23 11:28
感谢大佬回复。
考虑到您说的,相比直连台式机,目前的技术即便通过OCulink接PCIe 4.0*4也会损失显卡过 ...

用7700X,GMX2023.4,运行时加入-bonded gpu即可。完整命令:gmx mdrun [tpr name] -v -deffnm -pin on -pinoffset 0 -pinstride 1 -nt 15 -bonded gpu
- 向着虚无前进 -

10

帖子

0

威望

102

eV
积分
112

Level 2 能力者

9#
 楼主 Author| 发表于 Post on 2024-2-23 17:31:37 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-2-23 17:07
用7700X,GMX2023.4,运行时加入-bonded gpu即可。完整命令:gmx mdrun [tpr name] -v -deffnm -pin on - ...

收到!感谢大佬

31

帖子

0

威望

952

eV
积分
983

Level 4 (黑子)

10#
发表于 Post on 2024-2-24 11:15:58 | 只看该作者 Only view this author
牧生 发表于 2024-2-23 08:04
我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不 ...

再配个27寸 4K 240Hz的显示器

78

帖子

0

威望

581

eV
积分
659

Level 4 (黑子)

11#
发表于 Post on 2024-2-24 20:42:32 | 只看该作者 Only view this author
笔记本一个是pcie4.0*4限速,另一个是稳定性堪忧

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:17 , Processed in 0.176627 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list