计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4568|回复 Reply: 25
打印 Print 上一主题 Last thread 下一主题 Next thread

[使用经验] 极低成本利用V100洋垃圾跑VASP

[复制链接 Copy URL]

320

帖子

0

威望

1484

eV
积分
1804

Level 5 (御坂)

本帖最后由 slxc920113 于 2025-3-30 20:15 编辑

最近smx 16G版本的V100显卡只要900左右,想要用它来跑GPU版本的VASP,个人自用,没有单位报销,摸索出一套低成本的显卡扩展的方案。
原来有一台7950X+3080Ti的主机用来跑gromacs的,也是二手配件7000搞定的。
虽然7950X的单核性能很高,很适合用来带GPU,但是可惜消费级CPU只有28条PCIE通道,并且主板上也只有2个PCIe X16的插槽。
sxm版本的V100配套的散热器是塔式的,高达9cm,也压根塞不进机箱。所以干脆用显卡扩展坞的方式。
最优的选择其实是用sxm2或者sxmv或者Dell 4140的主板,但是现在这些板子因为AI的火热已经被奸商们炒到6000+的价格了,相比去年1800左右的价格高了3-4倍,实在没有性价比了。

核心的想法在于利用博通的PEX芯片的DMA控制器来加速两张卡的通信,因为带nvlink的V100 PCIe版本,现在一张二手卡也得4000左右。

配件及成本如下:
1. V100显卡*2,900*2 rmb
2. 散热器*2,75*2 rmb
3. PLX8749芯片(带DMA控制器,低配版nvlink的功能)的PCIe扩展卡,带4个SFF8654-8i接口,530 rmb
4. SFF8654的PCIe转接底板*2,70*2 rmb
5. sxm转PCIe转接板*2,260*2 rmb
6. SFF8654-8i线缆*4,35*4 rmb
7. 8025 PWM调速风扇*4,5*4 rmb
8. 4pin风扇延长扩展转接线(连接主板自动调速,7950X的积热严重,主板控制的风扇速度肯定能压住V100的温度不超过65),6 rmb
9. 1200W 服务器电源,50 rmb
10. csps转atx转接板,75 rmb
11. xt60转显卡双8pin转接线*3,25*3 rmb
12. 搭建开放式机架的铝型材五金件若干,60 rmb
总价:3566

怕麻烦的话9+10+11三个可以用750W的ATX模组电源代替,注意电源至少需要4条显卡8pin的线,模组电源价格可能反而更加便宜,就是体积要大不少。

运行效果如下,7950X的性能足够强,两张卡基本可以完全跑满。


GPU版本的VASP_std 计算900多个电子,80多个原子,2*2*1 k点的体系,大约3-4s一个电子步。


如果是gam版本的速度则会更加快。实测和sxmv底板的nvlink相比,单卡运行效率基本完全一样,双卡运行大约会损失10%的运行效率,只适合短期进行过渡,坐等sxm板子降价。


最后,简陋的机架和垃圾7950X主机的照片




评分 Rate

参与人数
Participants 16
eV +56 收起 理由
Reason
zhujiabao + 5 牛!
sarphuart + 5 GJ!
ABaishi7770 + 4 赞!
wenqilab + 5 赞!
Picardo + 2 谢谢
SiqiLee + 5 好物!
反氯化苯 + 1 牛!
xyan11 + 1 牛!
gyp + 3 牛!
qinzhong605 + 5 不明觉厉
funok + 5 牛!
Graphite + 5 绝了
Voidmio + 3 牛!
ChrisZheng + 5 赞!
含光君 + 1 牛!
guoguoping199 + 1 牛!

查看全部评分 View all ratings

22

帖子

0

威望

258

eV
积分
280

Level 3 能力者

2#
发表于 Post on 2025-3-25 17:37:07 | 只看该作者 Only view this author
看到最后的图绷不住了,哈哈哈,好对称的机架啊,俩风扇隔着引体向上呢?

25

帖子

0

威望

501

eV
积分
526

Level 4 (黑子)

3#
发表于 Post on 2025-3-28 11:12:44 | 只看该作者 Only view this author
海鲜市场有matx孔位的双卡板,可以整进机箱里,价格比散装贵一些

f5260080121343c5abccdb6f40656b1.jpg (425.85 KB, 下载次数 Times of downloads: 54)

f5260080121343c5abccdb6f40656b1.jpg

17

帖子

1

威望

258

eV
积分
295

Level 3 能力者

4#
发表于 Post on 2025-3-28 12:10:07 | 只看该作者 Only view this author
牛逼,摩拜!

320

帖子

0

威望

1484

eV
积分
1804

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2025-3-30 20:39:30 | 只看该作者 Only view this author
本帖最后由 slxc920113 于 2025-3-30 20:46 编辑
fantexi113 发表于 2025-3-28 11:12
海鲜市场有matx孔位的双卡板,可以整进机箱里,价格比散装贵一些

期货,暂时还买不到。

成本我也算过:
1. V100显卡*2,900*2 rmb
2. 散热器*2,75*2 rmb
3. SXM主板,1600 rmb
4. PCIe转SFF8654转接卡,120 rmb
5. sSFF8654-8i线缆*2,35*2 rmb
6. 12cm机箱风扇*4, 8*4 rmb
7. 750W ATX电源,350 rmb
8. MATX迷你机箱:80 rmb
总价:4104

229

帖子

0

威望

1277

eV
积分
1506

Level 5 (御坂)

6#
发表于 Post on 2025-3-31 15:54:40 | 只看该作者 Only view this author
GPU版本可以跑CINEB吗

320

帖子

0

威望

1484

eV
积分
1804

Level 5 (御坂)

7#
 楼主 Author| 发表于 Post on 2025-4-5 21:45:43 | 只看该作者 Only view this author
ddddnight 发表于 2025-3-31 15:54
GPU版本可以跑CINEB吗

GPU版本的VASP是每个进程绑定一个GPU,所以如果你还要用VTST的代码,得保证你的GPU数目核images数目一样才行,或者就需要去修改VTST的代码。
如果没有那么多显卡的话,就用ASE的autoNEB算法,VASP作为底层引擎进行计算。

229

帖子

0

威望

1277

eV
积分
1506

Level 5 (御坂)

8#
发表于 Post on 2025-4-6 11:51:23 | 只看该作者 Only view this author
slxc920113 发表于 2025-4-5 21:45
GPU版本的VASP是每个进程绑定一个GPU,所以如果你还要用VTST的代码,得保证你的GPU数目核images数目一样 ...

明白了,感谢您的解答!

320

帖子

0

威望

1484

eV
积分
1804

Level 5 (御坂)

9#
 楼主 Author| 发表于 Post on 2025-4-7 12:39:51 | 只看该作者 Only view this author
ddddnight 发表于 2025-4-6 11:51
明白了,感谢您的解答!

https://www.sciencedirect.com/sc ... i/S0010465518302583
这篇文章发布的PASTA程序也可以,就是bug太多了,我改了十几处,基本上把代码的20%都改得面目全非才跑起来。

12

帖子

0

威望

303

eV
积分
315

Level 3 能力者

10#
发表于 Post on 2025-4-7 14:57:14 | 只看该作者 Only view this author
slxc920113 发表于 2025-4-5 21:45
GPU版本的VASP是每个进程绑定一个GPU,所以如果你还要用VTST的代码,得保证你的GPU数目核images数目一样 ...

一张显卡也可以跑很多插点,只要显存够大就行
yuansuan.top

32

帖子

0

威望

559

eV
积分
591

Level 4 (黑子)

11#
发表于 Post on 2025-4-8 16:21:51 | 只看该作者 Only view this author
gaozx 发表于 2025-4-7 14:57
一张显卡也可以跑很多插点,只要显存够大就行

这个需要什么设置呀

3

帖子

0

威望

19

eV
积分
22

Level 1 能力者

12#
发表于 Post on 2025-4-16 10:14:26 | 只看该作者 Only view this author
妙是妙 风扇全力运转起来 也是受不了。裸露在外风险不小。

389

帖子

1

威望

4824

eV
积分
5233

Level 6 (一方通行)

13#
发表于 Post on 2025-4-20 07:49:02 | 只看该作者 Only view this author
四国也~

4

帖子

0

威望

307

eV
积分
311

Level 3 能力者

14#
发表于 Post on 2025-4-30 11:29:35 | 只看该作者 Only view this author
老师,您好!我想问一下,你这个电脑配配件信息可以给我一份吗,我最近在学分子动力学(水性电解液)、高斯和cp2k(原子小于100)。因为没有报销,目前打算买二手配件组装;另外还有一个小问题,AMDCPU 是买散片还是直接买拆机de,显卡可以直接买帖子里面提到的V100吗。

303

帖子

0

威望

457

eV
积分
760

Level 4 (黑子)

15#
发表于 Post on 2025-4-30 17:01:06 | 只看该作者 Only view this author
本帖最后由 tonganlhy 于 2025-4-30 17:03 编辑
QZA 发表于 2025-4-30 11:29
老师,您好!我想问一下,你这个电脑配配件信息可以给我一份吗,我最近在学分子动力学(水性电解液)、高斯 ...

lz这个方法可能不太适合你,需要解决的问题不少。你这个体系7950X+英伟达显卡即可满足。倒不如加点钱上好一点的显卡,比如5080等等。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 12:09 , Processed in 0.203817 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list