计算化学公社

标题: 求助:笔记本外接显卡跑GMX [打印本页]

作者
Author:
oOdskOo    时间: 2024-2-22 23:46
标题: 求助:笔记本外接显卡跑GMX
纯小白,实验室不是做计算模拟的,预算不够配台式机或工作站,所以想拿笔记本外接显卡跑GPU加速的GMX。

根据现在查到的资料可能主要有以下两个方案,不确定二者可行与否,大佬们觉得哪个更好:
在想这两个方案的时候,我主要遇到了以下几个原理性问题,短时间难以想明白,求大佬指点:



恳请各位大佬赐教


作者
Author:
Entropy.S.I    时间: 2024-2-23 02:05
本帖最后由 Entropy.S.I 于 2024-2-23 02:21 编辑

网上的graphic benchmarks不能充分反映HPC负载下的情况,即使是graphic benchmarks本身都有各种特点。

1. 完全可以
2. GMX对CPU-GPU通信性能(包含bandwidth和latency)非常敏感,4090使用Gen4 x4,在13900K上也只能达到使用x16的1/3的性能。@牧生 9个月前就有这种经历。笔记本能用的OCulink都是SFF8611-4i,只有4条PCIe lane,且这种连接很不稳定,极易出现“掉卡”问题。
3. 不要把游戏的那些概念搬过来,而且“交火”是多年前ATI/AMD GPU上的技术。NVIDIA消费级GPU没有PCIe P2P,抛开早年一部分型号使用SLI/NVLink的情况,GPU之间的数据传输需要先把数据copy进入CPU内存空间再copy进入对方GPU的VRAM,latency比P2P高1个数量级,反映在GMX中就是稍微像样的消费级GPU,使用2卡以上并行运行1个mdrun,并行效率很可能无论如何调优都是负的;即使是2卡,也要有足够高的内存带宽和CPU多核性能来给GPU施加足够的压力才能获得较好的并行效率。更别提前面说过笔记本外接GPU只有PCIe x4宽度。此外,不同性能的GPU并行运行1个mdrun的性能调优工作极为麻烦。建议每块GPU跑独立的mdrun,注意务必设置好thread affinity,不要让多个线程打架,而这首先需要使用Linux系统才有可能实现。

仔细阅读:
http://bbs.keinsci.com/thread-33296-1-1.html
http://bbs.keinsci.com/thread-35960-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-39266-1-1.html
http://bbs.keinsci.com/thread-40313-1-1.html
作者
Author:
牧生    时间: 2024-2-23 08:04
本帖最后由 牧生 于 2024-2-23 08:07 编辑

我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不适合放在办公室。

如果你不是硬件高手,那么建议出出血(要么自己的血,要么老板的血),买台4090的机子


http://sobereva.com/444

极高性能分子动力学服务器推荐配置
CPU:AMD Ryzen 9 7950X(16核,4.5~5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4650
散热器:利民FC140 300(如果希望散热更好,可以用瓦尔基里GL360水冷散热器 770元)
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)  1230
显卡:华硕TUF-RTX4090-24G-GAMING  19000
内存:2*金士顿FURY 16GB DDR5 5200  2*370
电源:海韵FOCUS GX-1000  1100
机箱:先马黑洞标准版  260
键盘鼠标:罗技MK200 多媒体套装  80
总价:约27300

作者
Author:
abin    时间: 2024-2-23 10:58
用笔记本玩, 你可能是想多了.

做计算, 需要长时间负载, 并且一刻都不可以听或者出错.

让专用的机器干活吧, 不要折腾笔记本了.
作者
Author:
oOdskOo    时间: 2024-2-23 11:28
Entropy.S.I 发表于 2024-2-23 02:05
网上的graphic benchmarks不能充分反映HPC负载下的情况,即使是graphic benchmarks本身都有各种特点。

1 ...

感谢大佬回复。
考虑到您说的,相比直连台式机,目前的技术即便通过OCulink接PCIe 4.0*4也会损失显卡过半性能,以及存在“掉卡”问题,我后面还是配个台式机吧。
我整机预算在8k-1w之间,显卡4070Ti或者super,CPU 7900X或者7800X,不知道7900X这种CPU配4070s会不会有点像吕布骑狗,不知道大佬您有什么建议
作者
Author:
oOdskOo    时间: 2024-2-23 11:30
牧生 发表于 2024-2-23 08:04
我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不 ...

感谢大佬经验分享,我准备配台式机了,自己出点血吧先
单纯好奇,您当时外接显卡是什么方案,有没有发过帖子啥的,虽然不准备这么干了,但是还想了解一下
作者
Author:
oOdskOo    时间: 2024-2-23 11:30
abin 发表于 2024-2-23 10:58
用笔记本玩, 你可能是想多了.

做计算, 需要长时间负载, 并且一刻都不可以听或者出错.

感谢大佬回复,还是配台式机吧,稳点
作者
Author:
Entropy.S.I    时间: 2024-2-23 17:07
本帖最后由 Entropy.S.I 于 2024-2-23 17:10 编辑
oOdskOo 发表于 2024-2-23 11:28
感谢大佬回复。
考虑到您说的,相比直连台式机,目前的技术即便通过OCulink接PCIe 4.0*4也会损失显卡过 ...

用7700X,GMX2023.4,运行时加入-bonded gpu即可。完整命令:gmx mdrun [tpr name] -v -deffnm -pin on -pinoffset 0 -pinstride 1 -nt 15 -bonded gpu
作者
Author:
oOdskOo    时间: 2024-2-23 17:31
Entropy.S.I 发表于 2024-2-23 17:07
用7700X,GMX2023.4,运行时加入-bonded gpu即可。完整命令:gmx mdrun [tpr name] -v -deffnm -pin on - ...

收到!感谢大佬
作者
Author:
玉米猫    时间: 2024-2-24 11:15
牧生 发表于 2024-2-23 08:04
我已经放弃了外接显卡,为了4090,我买了一台13900的新机子

外接显卡,性能不能充分发挥,噪音还大,不 ...

再配个27寸 4K 240Hz的显示器

作者
Author:
sss668800    时间: 2024-2-24 20:42
笔记本一个是pcie4.0*4限速,另一个是稳定性堪忧




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3