计算化学公社

标题: 30W预算工作站购买咨询 [打印本页]

作者
Author:
小老山    时间: 2026-1-29 12:15
标题: 30W预算工作站购买咨询
请各位老师帮忙,组里申请了30W用来做DFT,AIMD和ML。由于之前都是在超算上直接跑,没有什么攒机的经验,希望给一些配置建议。

主要(超70%)用VASP和Gaussian来做超胞(晶体和分子)的DFT,原子数通常>300。AIMD用的不多(20%),基于LAMMPS,来算一些大分子的运移和分散情况。老板还希望之后DFT和AIMD可以加上ML(比如RedKit),来筛选设计一些新的材料。这就是主要的述求。

不知道较新的AMD EPYC™ 9965是否够用?组单路还是双路? GPU用两张5090够吗?方便的话,还请各位老师给一些具体建议。谢谢

作者
Author:
zdb    时间: 2026-1-29 14:28
双路肯定是必须得,显卡2 卡 5090 仅能满足基础 GPU 加速,无法支撑 RedKit ML 多模型并行训练 + AIMD 同时运行;4 卡 5090 可实现,而且5090不支持nvlink,多卡并行效率不是很好
那么问题就来了,显卡现在单张2.7W左右,处理器4.6w左右一颗,预算已经用了一大半了,内存高性能计算24根满通道是必须的,9965可以支持的内存带宽最佳是6400MHZ,但是现在内存的价格以海力士32G 6400为例单根8500左右,预算就不够了
而且你要的是工作站,那么很大可能要在办公环境下用,还得用液冷
作者
Author:
Stardust0831    时间: 2026-1-29 17:30
最近不太建议配新服务器,内存已经比去年年初贵了6倍多了,最好是等内存回正常值。
坛友@Entropy.S.I 对v100做了很多改进和调优的工作,通过包括不限于重新涉及板子,设计新的IB互联方案等方法让V100显卡的计算效率接近市面上的H100《改进V100速度直逼H100!论软硬件全栈调优对科学计算的意义》http://bbs.keinsci.com/forum.php ... 1&fromuid=58653 (出处: 计算化学公社)
他的集群现在是可以申请免费测试卡时的,我当时测下来vasp的gpu加速效果很好,1000原子的体系也可以用vasp算动(刚刚那个帖子里也提及了vasp的测试数据);高斯是代码层面的GPU加速效果就有限,不过单节点也能算动300多原子的TDDFT的gaussian的结构优化,集群上也预装了诸如VeloxChem和byteqc这种gpu加速效果很好的量子化学软件,我还在等测试数据出来;至于GMX和lammps这种分子动力学软件的GPU加速已经非常成熟了,在GPU集群上效果很好。




作者
Author:
小老山    时间: 2026-1-30 08:58
本帖最后由 小老山 于 2026-1-30 08:59 编辑
zdb 发表于 2026-1-29 14:28
双路肯定是必须得,显卡2 卡 5090 仅能满足基础 GPU 加速,无法支撑 RedKit ML 多模型并行训练 + AIMD 同时 ...

谢谢你的回复。如果换成2* AMD EPYC9655 会不会好一些呢?RDKit ML和AIMD不会一块运行,AIMD算个单独的支线任务,使用概率只有20%。

方便帮忙攒一份配置吗? 谢谢

作者
Author:
科学计算    时间: 2026-1-30 09:36
DFT和ML是两个方向,侧重的点不同,因为您VASP是主要工作,首先保证CPU和满通道的内存,300个原子,24根16G差不多了。再考虑AIMD和ML,根据情况补充GPU,因为根据您的描述ML是后期的,可以先配置1个或者2个GPU平衡AIMD需求,留好位置,根据情况再加。
作者
Author:
zdb    时间: 2026-1-30 15:38
小老山 发表于 2026-1-30 08:58
谢谢你的回复。如果换成2* AMD EPYC9655 会不会好一些呢?RDKit ML和AIMD不会一块运行,AIMD算个单独的支 ...

9965*2   32G 5600 *16  致态TiPro9000 2T NVME协议PCIE 5.0 M.2*1 3.84T U.2*1  8t机械*1   5090*1   2000W电源*2  双塔机箱*1  pcie拓展卡*4  这个搭配目前可以在预算内   如果内存上到24根会超预算  内存6400的价格太高了,目前大多数采用的是5600,机箱是预计你放在办公环境,采用双塔的,噪音会小很多,并且可以板卡分离,方便后续扩容:
致态TiPro9000 2T NVME协议PCIE 5.0 M.2*1  系统盘
3.84T U.2*1  数据缓存盘  也可以换成M.2
8t机械*1   数据存储
作者
Author:
frontleg    时间: 2026-2-1 18:52
建议搞个小集群,多个老一点配置的节点小集群算力肯定高过同等价位的顶配服务器
作者
Author:
Stardust0831    时间: 2026-2-2 17:18
zdb 发表于 2026-1-30 15:38
9965*2   32G 5600 *16  致态TiPro9000 2T NVME协议PCIE 5.0 M.2*1 3.84T U.2*1  8t机械*1   5090*1   20 ...

对于vasp来说,计算瓶颈就是在内存带宽,内存通道数和频率是得拉满的,单根内存的大小倒是可以根据实际可能计算的体系用小一些的。
内存价格最近确实涨疯了,我很多原定的购买计划都打算等内存价格下来以后再说了。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3