计算化学公社

标题: 2686v4双路服务器升级为GPU加速的疑问 [打印本页]

作者
Author: zwn 时间: 2023-5-26 16:06
标题: 2686v4双路服务器升级为GPU加速的疑问
近期准备把实验室旧的量化计算服务器升级成GPU加速，去跑分子模拟。
旧机器配置如下：
CPU:2686V4*2
主板：华硕Z10PA-D8
内存16GB*4
电源：550w

1.CPU是否支持更换为2696V4，
2.如果再想添配RTX4090，是否只需要更换大功率的电源？
3.这个主板能不能带得动2696V4&RTX4090，有没有实测的老师给点建议？

作者
Author: wxsxjj 时间: 2023-5-26 16:17
cpu太差了，发挥不了GPU性能。
高显低U，潘凤骑赤兔

作者
Author: abin 时间: 2023-5-26 18:15
先让主板至少支持PCIe 4.0

做分子动力学，
还是Intel 13代或者Zen3高主频处理器。

作者
Author: Entropy.S.I 时间: 2023-5-26 18:40
本帖最后由 Entropy.S.I 于 2023-5-26 19:03 编辑

关于4090应该搭配什么样的CPU，去年10月就已有详细测试和讨论——http://bbs.keinsci.com/thread-33296-1-1.html

你当前这种平台配4090，哪怕把CPU换成2696V4，4090也会被严重拖累，最终性能大概率连7700X+4080都不如。在这种CPU单核性能下，核数完全没必要升级，这不会带来性能提升。在此基础上最多只能配个4070Ti，并且应当只用1颗CPU，再加-bonded gpu -update gpu，这样才能发挥出更好的性能。电源改用750W即可，不过目前JD自营海韵FOCUS GX850有优惠，比GX750还便宜，具体你自行考虑。
http://bbs.keinsci.com/thread-35960-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-35988-1-1.html

作者
Author: anson 时间: 2023-5-26 20:47
这波啊是狗骑吕布了属于是

作者
Author: moritaichi 时间: 2023-5-26 21:33
兄啊，2686V4*2现在才几个钱啊，一万多的4090都买了，4700左右的板U还能不舍得？

作者
Author: sss668800 时间: 2023-5-27 11:15
本帖最后由 sss668800 于 2023-5-27 11:17 编辑

Entropy.S.I 发表于 2023-5-26 18:40
关于4090应该搭配什么样的CPU，去年10月就已有详细测试和讨论——http://bbs.keinsci.com/thread-33296-1-1 ...

海韵我就有这个750w的，比较头疼的是4090的转接头需要4个8pin，而哪怕是850w和1000w也只有5个8pin(官方写的3个显卡+主板2个)，750w更是因为少了1个8pin而捉襟见肘(官方2个显卡+2个主板)

海韵解决方法是，1000w可以申请下图的这条线，850w及以下自己去买，但是我是担心2个pin能不能带得动600w。。。

我是觉得如果新买电源，还是加一点直接上ATX3.0原生吧，峰睿现在1299元也是好价。

(, 下载次数 Times of downloads: 91)

作者
Author: Entropy.S.I 时间: 2023-5-27 11:31

sss668800 发表于 2023-5-27 11:15
海韵我就有这个750w的，比较头疼的是4090的转接头需要4个8pin，而哪怕是850w和1000w也只有5个8pin(官方写 ...

但是我让他买的是4070Ti，用显卡盒子里送的转接线足矣

作者
Author: sss668800 时间: 2023-5-27 15:45

Entropy.S.I 发表于 2023-5-27 11:31
但是我让他买的是4070Ti，用显卡盒子里送的转接线足矣

那倒是，没问题。
主要是海韵GX1000现在价格是1099，送的压纹线咸鱼直接能350出掉，相当于749元，再送一个价值100元的12pin转接线。
把赠品算进去GX1000很香。

作者
Author: schinco 时间: 2023-5-27 22:22
有这种想法的人很多，包括鄙人，最近也在考虑这个问题。
异构计算现在很火，但GPU加速有两个前提。
一个是硬件的浮点性能，对高斯而言主要是双精度算力，即FP64算力。游戏卡就算了，因为即便是4090，FP64也就1.18TFLOPS的算力，比R9 7950X只高出20%，意义不大(ZEN4的FPU貌似不错，可惜16核U只给了8个FPU，2:1的配置)。
另一个是软件支持，目前看到的听到的关于高斯的案例，都说用计算卡体验也不好，那只能说软件设计做得还不好，因为计算卡随随便都是好几个TFLOPS的FP64算力，比U强不少。另外，FP64目前也不是计算卡的重点关注方向，因为即便FP64最强的A100，算力也就9.7TFLOPS，比2017年发布的Titan V强一点，但算力也没翻倍，要知道，二者发布时间可相差了6年！
用高斯的话，目前还是老老实实用CPU，鄙人已放弃GPU的想法。
一家之言，拍轻点！

作者
Author: Entropy.S.I 时间: 2023-5-28 00:30

schinco 发表于 2023-5-27 22:22
有这种想法的人很多，包括鄙人，最近也在考虑这个问题。
异构计算现在很火，但GPU加速有两个前提。
一个 ...

好的，我会拍得轻一点。

1. 你的讨论完全只建立在一个纯Gaussian用户的视角上。楼主要做的是分子模拟，如果没有特殊说明，如今分子模拟在绝大多数语境下指的就是经典分子动力学模拟，这种任务只需要FP32，消费级完全可以胜任，性价比极高，是专业图形卡和数据中心GPU的数倍乃至10倍以上。即使是编译为双精度版本的lammps Kokkos包，RTX 4090的性能也基本能达到Tesla V100的水平。

2. 对GPU历史的描述有重大错误。当前在售的FP64性能最强的GPU是AMD于2021年11月发布的Instinct MI250X，FP64性能47.9 TFLOPS。NVIDIA A100系列是2020年5月发布的产品，2021年初普通客户就已经能随意购买。目前NVIDIA最新的数据中心GPU是2022年4月发布的NVIDIA H100系列，其中H100 SXM5的FP64性能33.5 TFLOPS，基于Tensor Core的FP64性能66.9 TFLOPS。H100系列现在普通客户也可以随意购买，有钱就行，现货，付款立马发出。

欢迎光临计算化学公社 (http://bbs.keinsci.com/)