单路配置和双路配置性能差异讨论

Panbow · 发表于 Post on 2024-9-9 15:49:16

本帖最后由 Panbow 于 2024-9-9 16:15 编辑

课题组预算在3w-4w之间，主要使用MS，Lammps，Gaussian三个软件，目前给出了两款配置及报价，请各位大佬帮忙分析一下哪一款更适合，以及单路双路配置有什么区别，价格是否合理
其中电源都是长城的，主板是同泰怡T2SEEP
如果有更好的，更加推荐的配置也欢迎大家留言

牧生 · 发表于 Post on 2024-9-9 16:20:41

毫无可取之处
仔细看以下博文
http://sobereva.com/444

Panbow · 发表于 Post on 2024-9-9 21:05:24

牧生发表于 2024-9-9 16:20
毫无可取之处
仔细看以下博文
http://sobereva.com/444

那请问在这个预算内，您有推荐的配置嘛

牧生 · 发表于 Post on 2024-9-9 21:43:41

无脑就买两台以下配置

极高性能分子动力学服务器推荐配置
CPU：AMD Ryzen 9 7950X（16核，4.5~5.7G，集显）
主板：技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4500
散热器：瓦尔基里GL360水冷 770元
硬盘：希捷银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)  1230
显卡：微星4090D-魔龙SLIM-24G  14000（预算不够的话用RTX4080 SUPER，8000多）
内存：2*金士顿FURY 16GB DDR5 5200  2*370
电源：海韵FOCUS GX-1000  1100
机箱：先马黑洞X  380
键盘鼠标：罗技MK200 多媒体套装  80
总价：约22800

Panbow · 发表于 Post on 2024-9-9 21:50:08

牧生发表于 2024-9-9 21:43
无脑就买两台以下配置

极高性能分子动力学服务器推荐配置

这个和不需要显卡的单路服务器哪个好一些，把钱花在gpu上对于lammps和ms来说比把钱花在cpu上更具性价比嘛

牧生 · 发表于 Post on 2024-9-9 22:05:07

Panbow 发表于 2024-9-9 21:50
这个和不需要显卡的单路服务器哪个好一些，把钱花在gpu上对于lammps和ms来说比把钱花在cpu上更具性价比嘛 ...

GPU的性价比远远远远远远超过CPU，尤其是使用lammps的场景。

Panbow · 发表于 Post on 2024-9-9 22:10:38

牧生发表于 2024-9-9 22:05
GPU的性价比远远远远远远超过CPU，尤其是使用lammps的场景。

请问这套配置的计算速度大致相当于什么水平的纯cpu服务器

Entropy.S.I · 发表于 Post on 2024-9-10 01:11:10

本帖最后由 Entropy.S.I 于 2024-9-10 01:58 编辑

参考此贴http://bbs.keinsci.com/thread-47879-1-1.html

取消IB卡，把CPU换成48核、8CCX的EPYC 7Y43，GPU底板使用AOM-SXM2而非AOM-SXMV，DIMM用便宜40~50%的非原厂超频版（俗称寨条，32G 3200MT/s RECC只要260元），不配置SSD（你们自己另外买了插上，如消费级的致态7100 2T），整机保修3个月，公费采购，开普票，4万可以拿下。半年前我已将此系列方案完全交给第三方公司运营，本人只在闲暇时间通过社区友情提供技术支持。

至于为什么我帖子中使用了如此多的IB卡，其余部分也没有如前面所说的缩水，节点单价仍只有4万，因为我将此系列方案转交给第三方公司是无偿的（这个公司至今甚至未给我报销去现场教学产生的差旅费，理由是我让他们屯了太多货没卖出去），我自己所在的团队要回头向他们购买，他们没有理由不看在我的面子上把价格给到最低。

如果你没有机房，需要考虑电源和噪音问题，那么只能采用单模组、4GPU的方案，价格大约比8GPU方案低1.7万CNY，此时预算不紧张，配件不需要缩水，大约2.6万能拿下。

性能：

LAMMPS Kokkos：400万原子的LJ势和EAM势，每个4卡模组是[4090D单卡+14700KF]的5~6倍、单路EPYC 9654的3~4倍；400万原子的Tersoff势和66.8万原子的ReaxFF，每个4卡模组是[4090D单卡+14700KF]的8~9倍、单路EPYC 9654的10倍以上。上述体系的VRAM消耗均少于16GB。
另外，不要幻想买了4090D后用单精度/混合精度的GPU包。我曾经幻想过，后来做了很多测试才意识到GPU包比我想象的要落后得多，很多算法无法offload到GPU上，导致在使用4090D这样的高端GPU时有严重的CPU瓶颈，即使拿14700K来带4090D跑混合精度的GPU包，速度还不如单核性能一般的服务器CPU带V100-SXM2跑双精度的Kokkos包。

至于Gaussian，不使用GPU加速的情况，速度是7950X的2~2.5倍，使用GPU加速的情况，速度是7950X的3倍左右，4GPU和8GPU速度没有明显区别。

MS不了解，以CP2K取代之，CP2K的情况和Gaussian基本一致。

最后，通过Slurm可以设置为GPU保留8或4个最近NUMA域的CPU核心，以便同时运行GPU加速的LAMMPS和CPU-only的Gaussian，互不干扰。

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[配置讨论] 单路配置和双路配置性能差异讨论