计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: szp12345
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 推荐一套适用于VASP的GPU配置

  [复制链接 Copy URL]

9

帖子

0

威望

171

eV
积分
180

Level 3 能力者

61#
发表于 Post on 2024-3-21 18:13:08 | 只看该作者 Only view this author
想问一下是否采用单核较强的CPU而不是楼主这种E5处理器搭配GPU加速算力更强?

846

帖子

16

威望

4632

eV
积分
5798

Level 6 (一方通行)

小屁孩

62#
发表于 Post on 2024-3-21 18:44:56 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2024-3-27 15:05 编辑
gaozx 发表于 2024-3-21 18:13
想问一下是否采用单核较强的CPU而不是楼主这种E5处理器搭配GPU加速算力更强?

per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,95%以上的情况,我的4卡模组性能都比其他人用弱鸡CPU带的4卡模组强。这套平台已经可以批量出货了。
- 向着虚无前进 -

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

63#
 楼主 Author| 发表于 Post on 2024-3-22 17:56:24 | 只看该作者 Only view this author
gaozx 发表于 2024-3-21 18:13
想问一下是否采用单核较强的CPU而不是楼主这种E5处理器搭配GPU加速算力更强?

是的,这套配置,跑VASP,单核性能是瓶颈。
这套配置可以说是万元内的最佳选择。2696V3单核睿频3.8G,使用四个进程,分配到两个CPU上,CPU性能可以达到3.6G左右,当然这样做的前提是剩余的CPU不能再跑其他任务。
选择其它单核性能更强的CPU时还要注意PCIE通道数问题。
我不是卖服务器的,我只是个垃圾佬,楼上Entropy.S.I是服务器优化这方面的专家

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

64#
 楼主 Author| 发表于 Post on 2024-3-22 19:17:14 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...

大佬好,请教个问题,SXM2版本的V100与CPU通信时会不会产生抢PCIE带宽问题?
最近关注超微的一个四卡SXM2扩展板,这个板通过两条PCIE X16与CPU通信,对于VASP来说,相当于4个GPU共用两条PCIE X16,会不会产生抢带宽问题?

846

帖子

16

威望

4632

eV
积分
5798

Level 6 (一方通行)

小屁孩

65#
发表于 Post on 2024-3-22 22:53:58 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2024-3-22 23:24 编辑
szp12345 发表于 2024-3-22 19:17
大佬好,请教个问题,SXM2版本的V100与CPU通信时会不会产生抢PCIE带宽问题?
最近关注超微的一个四卡SXM ...

我开发的8卡机器就是用这块板子搭的,用上单核性能足够强的CPU,VASP性能远强于无PCIe Switch但使用LGA3647平台的DELL C4140。正确编译VASP后,可以使用P2P,驱动的Runtime会自动选择最佳的通信路径,并行效率很高,至少有NVLink的4卡内几乎完全线性,对于杂化泛函计算,8卡都能保持不错的线性。另外,Lammps的ReaxFF模拟甚至通过IB网络跨节点计算都有很好的并行效率(前提是体系足够大,达到10万原子及以上级别)。

问题是这块板子现在市面上几乎没货了,我做了100个机箱,但没有足够的板子,还在发愁。当然,另一方面还发愁奸商不但把V100的价格抬到翻倍,现在还不给我V100了,大概是觉得我影响他们牟取暴利了,以及他们都想囤V100来搭配非常阴间的技嘉T181-G20卖高价,那玩意4卡共享1个PCIe x16,还是弱鸡的3647平台,性能可想而知。而且T181需要OCP整柜直流供电,尺寸也不是标准的19英寸,上不了大多数人的机柜。顺带一提,T181准系统他们进货价2000多,现在卖6000

这帮奸商毫无技术可言,只会搞JBOG - Just-a-bunch-of-GPUs。其中一个最不要妈的奸商的网址是oyato.com
- 向着虚无前进 -

190

帖子

0

威望

867

eV
积分
1057

Level 4 (黑子)

66#
发表于 Post on 2024-3-23 11:20:52 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...

怎么购买

846

帖子

16

威望

4632

eV
积分
5798

Level 6 (一方通行)

小屁孩

67#
发表于 Post on 2024-3-23 13:51:23 | 只看该作者 Only view this author

先找我分析好具体需求,再确定配置方案,最后移交给合作方走商务流程。价格比不了全用二手且不含税的DIY方案(尤其是某些用一两百元的洋垃圾板U还不插满内存的配置),而且还要计入公司的运营成本和合作方应得的利润(不然谁给你几十万去囤货,资金周转都是大问题,几个月甚至一年不付款的客户太多了)。我确实推荐去DIY,但是这种形态的产品坑是不少的,软件和硬件方面都有,我在开发过程中已经踩坑无数了
- 向着虚无前进 -

12

帖子

0

威望

1175

eV
积分
1187

Level 4 (黑子)

68#
发表于 Post on 2024-3-26 23:17:33 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...

有点意思

31

帖子

0

威望

371

eV
积分
402

Level 3 能力者

69#
发表于 Post on 2024-3-27 09:18:27 | 只看该作者 Only view this author
szp12345 发表于 2024-3-22 17:56
是的,这套配置,跑VASP,单核性能是瓶颈。
这套配置可以说是万元内的最佳选择。2696V3单核睿频3.8G,使 ...

大佬,你的P100   4卡运行时候,,每张卡的功耗是多少啊,我是用的处理器和你一样,但是速度比你整体要慢10%左右。

31

帖子

0

威望

371

eV
积分
402

Level 3 能力者

70#
发表于 Post on 2024-3-27 09:38:30 | 只看该作者 Only view this author
szp12345 发表于 2024-3-22 17:56
是的,这套配置,跑VASP,单核性能是瓶颈。
这套配置可以说是万元内的最佳选择。2696V3单核睿频3.8G,使 ...

我看你这个2卡到4卡的增长,几乎是线性增长,功耗应该是也是线性增长。

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

71#
 楼主 Author| 发表于 Post on 2024-3-27 14:47:33 | 只看该作者 Only view this author
目前还不会计算 发表于 2024-3-27 09:18
大佬,你的P100   4卡运行时候,,每张卡的功耗是多少啊,我是用的处理器和你一样,但是速度比你整体要慢 ...

功耗不是固定的,每个卡的最大功耗在150W左右,GPU温度基本在50度左右。
另外我的测试结果是独占GPU节点测试的,其它32个CPU核心是空闲的,这样才能最大限度地提高GPU的性能。

190

帖子

0

威望

867

eV
积分
1057

Level 4 (黑子)

72#
发表于 Post on 2024-3-27 21:12:04 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-23 13:51
先找我分析好具体需求,再确定配置方案,最后移交给合作方走商务流程。价格比不了全用二手且不含税的DIY ...

私信你嘛,还是直接帖子回复,还是什么其他方法

846

帖子

16

威望

4632

eV
积分
5798

Level 6 (一方通行)

小屁孩

73#
发表于 Post on 2024-3-27 21:43:55 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2024-3-27 22:57 编辑
Picardo 发表于 2024-3-27 21:12
私信你嘛,还是直接帖子回复,还是什么其他方法

论坛不能公布联系方式,否则属于广告,私信应该可以。另外,我不负责营销和商务,我只是个开发者,东西开发好就交给公司运营了,进货、定价、拟合同之类的商务流程以及安装、发货、售后、上门服务之类也是他们负责,我顶多提供技术支持和“增值服务”里面那些调优服务
- 向着虚无前进 -

7

帖子

0

威望

88

eV
积分
95

Level 2 能力者

74#
发表于 Post on 2024-3-27 23:42:09 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...

你们动作真快,我也在做类似的东西,机箱刚刚回来第一版。电路板我自己还在画,还在调。

7

帖子

0

威望

88

eV
积分
95

Level 2 能力者

75#
发表于 Post on 2024-3-27 23:43:55 | 只看该作者 Only view this author
Entropy.S.I 发表于 2024-3-23 13:51
先找我分析好具体需求,再确定配置方案,最后移交给合作方走商务流程。价格比不了全用二手且不含税的DIY ...

话说,你是知乎“熵增熵减”大佬嘛,前段时间还在知乎聊过天,刚刚看头像熟悉。

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
Entropy.S.I + 1 y

查看全部评分 View all ratings

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 03:03 , Processed in 0.185269 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list