计算化学公社

标题: 2686v4双路服务器升级为GPU加速的疑问 [打印本页]

作者
Author:
zwn    时间: 2023-5-26 16:06
标题: 2686v4双路服务器升级为GPU加速的疑问
近期准备把实验室旧的量化计算服务器升级成GPU加速,去跑分子模拟。
旧机器配置如下:
CPU:2686V4*2
主板:华硕Z10PA-D8
内存16GB*4
电源:550w


1.CPU是否支持更换为2696V4,
2.如果再想添配RTX4090,是否只需要更换大功率的电源?
3.这个主板能不能带得动2696V4&RTX4090,有没有实测的老师给点建议?

作者
Author:
wxsxjj    时间: 2023-5-26 16:17
cpu太差了,发挥不了GPU性能。
高显低U,潘凤骑赤兔
作者
Author:
abin    时间: 2023-5-26 18:15
先让主板至少支持PCIe 4.0

做分子动力学,
还是Intel 13代或者Zen3高主频处理器。


作者
Author:
Entropy.S.I    时间: 2023-5-26 18:40
本帖最后由 Entropy.S.I 于 2023-5-26 19:03 编辑

关于4090应该搭配什么样的CPU,去年10月就已有详细测试和讨论——http://bbs.keinsci.com/thread-33296-1-1.html

你当前这种平台配4090,哪怕把CPU换成2696V4,4090也会被严重拖累,最终性能大概率连7700X+4080都不如。在这种CPU单核性能下,核数完全没必要升级,这不会带来性能提升。在此基础上最多只能配个4070Ti,并且应当只用1颗CPU,再加-bonded gpu -update gpu,这样才能发挥出更好的性能。电源改用750W即可,不过目前JD自营海韵FOCUS GX850有优惠,比GX750还便宜,具体你自行考虑。
http://bbs.keinsci.com/thread-35960-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-35988-1-1.html

作者
Author:
anson    时间: 2023-5-26 20:47
这波啊 是狗骑吕布了属于是
作者
Author:
moritaichi    时间: 2023-5-26 21:33
兄啊,2686V4*2现在才几个钱啊,一万多的4090都买了,4700左右的板U还能不舍得?
作者
Author:
sss668800    时间: 2023-5-27 11:15
本帖最后由 sss668800 于 2023-5-27 11:17 编辑
Entropy.S.I 发表于 2023-5-26 18:40
关于4090应该搭配什么样的CPU,去年10月就已有详细测试和讨论——http://bbs.keinsci.com/thread-33296-1-1 ...

海韵我就有这个750w的,比较头疼的是4090的转接头需要4个8pin,而哪怕是850w和1000w也只有5个8pin(官方写的3个显卡+主板2个),750w更是因为少了1个8pin而捉襟见肘(官方2个显卡+2个主板)

海韵解决方法是,1000w可以申请下图的这条线,850w及以下自己去买,但是我是担心2个pin能不能带得动600w。。。

我是觉得如果新买电源,还是加一点直接上ATX3.0原生吧,峰睿现在1299元也是好价。

(, 下载次数 Times of downloads: 40)

作者
Author:
Entropy.S.I    时间: 2023-5-27 11:31
sss668800 发表于 2023-5-27 11:15
海韵我就有这个750w的,比较头疼的是4090的转接头需要4个8pin,而哪怕是850w和1000w也只有5个8pin(官方写 ...

但是我让他买的是4070Ti,用显卡盒子里送的转接线足矣
作者
Author:
sss668800    时间: 2023-5-27 15:45
Entropy.S.I 发表于 2023-5-27 11:31
但是我让他买的是4070Ti,用显卡盒子里送的转接线足矣

那倒是,没问题。
主要是海韵GX1000现在价格是1099,送的压纹线咸鱼直接能350出掉,相当于749元,再送一个价值100元的12pin转接线。
把赠品算进去GX1000很香。
作者
Author:
schinco    时间: 2023-5-27 22:22
有这种想法的人很多,包括鄙人,最近也在考虑这个问题。
异构计算现在很火,但GPU加速有两个前提。
一个是硬件的浮点性能,对高斯而言主要是双精度算力,即FP64算力。游戏卡就算了,因为即便是4090,FP64也就1.18TFLOPS的算力,比R9 7950X只高出20%,意义不大(ZEN4的FPU貌似不错,可惜16核U只给了8个FPU,2:1的配置)。
另一个是软件支持,目前看到的听到的关于高斯的案例,都说用计算卡体验也不好,那只能说软件设计做得还不好,因为计算卡随随便都是好几个TFLOPS的FP64算力,比U强不少。另外,FP64目前也不是计算卡的重点关注方向,因为即便FP64最强的A100,算力也就9.7TFLOPS,比2017年发布的Titan V强一点,但算力也没翻倍,要知道,二者发布时间可相差了6年!
用高斯的话,目前还是老老实实用CPU,鄙人已放弃GPU的想法。
一家之言,拍轻点!
作者
Author:
Entropy.S.I    时间: 2023-5-28 00:30
schinco 发表于 2023-5-27 22:22
有这种想法的人很多,包括鄙人,最近也在考虑这个问题。
异构计算现在很火,但GPU加速有两个前提。
一个 ...

好的,我会拍得轻一点。

1. 你的讨论完全只建立在一个纯Gaussian用户的视角上。楼主要做的是分子模拟,如果没有特殊说明,如今分子模拟在绝大多数语境下指的就是经典分子动力学模拟,这种任务只需要FP32,消费级完全可以胜任,性价比极高,是专业图形卡和数据中心GPU的数倍乃至10倍以上。即使是编译为双精度版本的lammps Kokkos包,RTX 4090的性能也基本能达到Tesla V100的水平。

2. 对GPU历史的描述有重大错误。当前在售的FP64性能最强的GPU是AMD于2021年11月发布的Instinct MI250X,FP64性能47.9 TFLOPS。NVIDIA A100系列是2020年5月发布的产品,2021年初普通客户就已经能随意购买。目前NVIDIA最新的数据中心GPU是2022年4月发布的NVIDIA H100系列,其中H100 SXM5的FP64性能33.5 TFLOPS,基于Tensor Core的FP64性能66.9 TFLOPS。H100系列现在普通客户也可以随意购买,有钱就行,现货,付款立马发出。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3