计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2346|回复 Reply: 23
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 求问超算软硬件配置

[复制链接 Copy URL]

299

帖子

0

威望

1924

eV
积分
2223

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
院里打算建设计算中心,咨询软硬件需求。

方向包含催化剂设计(均相,多相),(高分子)材料模拟,流体力学计算和机器学习

我自己只了解 高斯相关软硬件

对于多相, vasp, MS,cp2k等需要都购置吗?  vasp等 需要 用 IB高速网络吗?需要GPU吗?什么型号(4090还是 A100之类的)

分子动力学需要IB高速网络吗? 需要GPU吗? 什么型号(4090还是 A100之类的)

机器学习(化工)需要多大的计算资源?

希望相关大神不吝赐教
谢谢!

预算没说,大致按照300-500w算吧

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

2#
发表于 Post on 2023-10-23 18:14:34 | 只看该作者 Only view this author
按照惯例政策,
这种项目都默认给国字头或者有门路的公司来做……

这里绝大部分,
都是玩散件组装的……

首先要有存储,并行文件系统
其次,要有网络,使用100或者200Gb IB。
最后,这么多机器,有没有专用机房?
要不要建设机房?

你说的预算,是仅仅买机器吗?
机柜等算不算?

如果没有机房,建设机房装修施工,
以及电力改造,防火安全等等,要不要包含在你的预算里面?

如果,对于招标采购没有保护性限制……
我当然可以做全套的……


按照默认要求,只能采用正式售卖的处理器,可能价格不是拼装的那么美丽。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

299

帖子

0

威望

1924

eV
积分
2223

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2023-10-23 19:12:48 | 只看该作者 Only view this author
机房有的,机柜也就几千块
作为使用者,先提需求吧

主要是网络配置和gpu配置的需求
对于高斯不重要,但对固体计算和高分子材料计算重要性和所需规模不确定
具体谁来做,价格多几分少几分再说
但是作为学科建设建议者起码希望买到称心的机器
因为最后的账还是摊到研究者课题上的


846

帖子

16

威望

4652

eV
积分
5818

Level 6 (一方通行)

小屁孩

4#
发表于 Post on 2023-10-24 02:16:38 | 只看该作者 Only view this author
正好两个多月前给某个研究所设计拟定了一套规模比较大的集群(预算是你们的好几倍),用途和你们的几乎完全相同。如果有兴趣,可以来详细交流
- 向着虚无前进 -

5万

帖子

99

威望

5万

eV
积分
112496

管理员

公社社长

5#
发表于 Post on 2023-10-24 04:13:52 | 只看该作者 Only view this author
CP2K是免费的

M$那种东西在我来看完全没有购买价值,整体又慢又贵又不灵活,在学术界用户也越来越少,也没有什么计算非要用M$不可,各个方面都有的是更强大的还往往是免费的程序。有买M$的钱远不如用在投资硬件上
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

11

帖子

0

威望

69

eV
积分
80

Level 2 能力者

6#
发表于 Post on 2023-10-24 14:49:30 | 只看该作者 Only view this author
计算中心有大量多节点并行需求,所以IB网络基本上是属于必备。GPU这方面就要看你计算的软件和体系,一般来说vasp大体系计算GPU有一定的速率提升,CP2K不太熟悉。

846

帖子

16

威望

4652

eV
积分
5818

Level 6 (一方通行)

小屁孩

7#
发表于 Post on 2023-10-24 15:53:05 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2023-10-24 16:01 编辑

在这里再发一遍给楼主私信里回复的内容。

CPU-only节点,CPU用双路9654,没其他选择了;内存可以根据你们的实际需求,选768G或1.5T,也可以两者兼有。由于是比较大的项目,用攒机的方案很可能过不了领导评审,得用准系统方案,价格会比较贵,双路9654 + 768G大约11万/台,搞25台。

跑经典MD、AI推理、小AI模型训练的节点,用6-8卡4090。有两种方案:1. Xeon w9-3495X + 6*RTX4090 + 8*32GB DDR5 5600,CPU单核性能够强,能发挥出4090更多的性能;单台价格大约19万,搞8台。2. 双路EPYC 9334 + 8*RTX4090 + 24*16GB DDR5 4800,理论性价比更高,但4090的性能实际发挥得不太好;单台价格大约23万,搞6台。

A800、H800等计算卡就不用想了,A800 SXM八卡机100多万/台,H800 SXM八卡机200多万一台,搞1台就把你们预算吃掉很大一部分了,并且现在货源也出了问题。

倒是现在特殊渠道有含税3万多一片的A100 PCIe 40G定制版,但是这东西不能走正经大品牌的公司,也即不能包含在集群项目里,可能只能单独买。

主存储直接上全NVMe闪+GPU加速RAID,这个有现成方案,比较成熟了,不过知名度不高,国内基本没人用,我算是了解得比较早的一批。配24块15.36TB PCIe Gen4 NVMe SSD,全部直连CPU,全套价格估计35-40万。另外加个500TB左右的HDD存储做定时自动备份,也可以再加一台HDD存储开放给有需求的用户存冷数据,这种存储基本上15万/台。分布式并行存储架构复杂,维护起来太麻烦,所以我推荐直接接入集群的主存储用一台容量刚刚好的全NVMe闪即可。

计算网络就用40口200G的QM8700,IB卡用200G HDR,计算节点每节点一片,主存储节点用2片,HDD存储节点每节点1片,在500万预算以内接口数肯定够用。

登录节点网络双万兆,接入核心交换机;登录节点到业务网络也用万兆;业务网络用千兆;IPMI管理网络用千兆。这个可以照搬我8月份那套方案。

以上提到的价格都已经包含了厂商合理的利润。

至于计算软件用什么,去找学院里的课题组一个个谈谈比较好。我能想到的常用的基本上就是Gaussian、ORCA、VASP、CP2K、Quantum ESPRESSO、GROMACS、LAMMPS、AMBER、OpenMM、NAMD3、OpenFOAM(CFD)。另外,据说现在PWMat(第一性原理)的GPU加速很强,合理降低了精度,4090的加速比特别高。其中需要买授权的软件有:Gaussian、VASP、PWMat
- 向着虚无前进 -

299

帖子

0

威望

1924

eV
积分
2223

Level 5 (御坂)

8#
 楼主 Author| 发表于 Post on 2023-10-24 16:03:35 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-10-24 15:53
在这里再发一遍给楼主私信里回复的内容。

CPU-only节点,CPU用双路9654,没其他选择了;内存可以根据你 ...

谢谢!
个人觉得存储太大了。有个30T就够了。另外,GPU节点换成 9474F怎么样?兼顾CPU跟GPU计算

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

9#
发表于 Post on 2023-10-24 16:08:51 | 只看该作者 Only view this author
本帖最后由 abin 于 2023-10-24 16:10 编辑
gauss98 发表于 2023-10-24 16:03
谢谢!
个人觉得存储太大了。有个30T就够了。另外,GPU节点换成 9474F怎么样?兼顾CPU跟GPU计算

不建议在一个节点上, 既要又要.
跑GPU的炼丹类程序, 对于内存带宽需求很大;会导致跑CPU并且需要内存的程序, 很吃亏的.



楼上说的对,
这么大的采购, 没有品牌的”组装机器“, 无法通过招标的.

也许使用 华为、联想、浪潮等准系统, 再加其他的处理器, 搭配到一起,
才有可能通过正规招标采购审核.


High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

846

帖子

16

威望

4652

eV
积分
5818

Level 6 (一方通行)

小屁孩

10#
发表于 Post on 2023-10-24 16:12:41 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2023-10-24 16:15 编辑
gauss98 发表于 2023-10-24 16:03
谢谢!
个人觉得存储太大了。有个30T就够了。另外,GPU节点换成 9474F怎么样?兼顾CPU跟GPU计算

那就用12块7.68TB,整个存储只需要13万。另外再加个24*18TB的HDD存储用作主存储的定时备份和用户冷数据存储,10多万。

9474F是8 CCD的配置,每个CCD只开了6核,核间延迟表现很差,并且价格巨高,和9654差不多(甚至可能更贵,我最近没问这玩意的价格,不太了解实时行情),很不值。另外,GPU节点CPU互联只有3组xGMI(因为要留PCIe lane给GPU),因此CPU片间通信瓶颈更严重。
- 向着虚无前进 -

34

帖子

0

威望

313

eV
积分
347

Level 3 能力者

11#
发表于 Post on 2023-10-25 09:41:39 | 只看该作者 Only view this author
本帖最后由 Janus 于 2023-10-25 09:42 编辑
Entropy.S.I 发表于 2023-10-24 15:53
在这里再发一遍给楼主私信里回复的内容。

CPU-only节点,CPU用双路9654,没其他选择了;内存可以根据你 ...

这个配置,如果是课题组用,基本最优。但是,是否也要考虑,楼主提的是整个学院弄计算中心。
9654双路,可以算作胖节点了;都配这种胖节点,管理起来会非常费劲。我不是很懂,只是之前碰到过,介绍哈:
六七年前,我隔壁的学院配了30多个节点的双路2680v4,当时是很好的机器了。刚开始很顺,几个月后,我朋友就开始叫苦了;排队要三四天,总被几个组的长时间任务占着。投诉后,管理员放开了独占节点的限制,更绝的事情发生了:任务提交方式从1节点1个任务,逐渐往14核/任务,7核心/任务,2核心/任务发展。最后朋友又去租超算了。

其实,现阶段VASP等大量的作业很难去跑满双路9654,而如果让一个节点跑多个作业,管理是问题(不是一个组内,很难去要求或者控制用户的习惯)。从vasp cp2k这类软件的用户角度来说,可能限制一个任务一个节点对谁都好。如果这样,可能单路/双路在3:1或者4:1会更优。

299

帖子

0

威望

1924

eV
积分
2223

Level 5 (御坂)

12#
 楼主 Author| 发表于 Post on 2023-10-26 07:51:55 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-10-24 15:53
在这里再发一遍给楼主私信里回复的内容。

CPU-only节点,CPU用双路9654,没其他选择了;内存可以根据你 ...

GPU节点用7950 最多能几卡?多大内存? 相比xeon-w9-3495

846

帖子

16

威望

4652

eV
积分
5818

Level 6 (一方通行)

小屁孩

13#
发表于 Post on 2023-10-26 11:09:45 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2023-10-26 11:35 编辑
gauss98 发表于 2023-10-26 07:51
GPU节点用7950 最多能几卡?多大内存? 相比xeon-w9-3495

只能1卡,撑死2卡,还做不到PCIe x16,还要另外搞一套计算和存储网络专门给GPU节点(PCIe lane不够,插不了IB卡)。有时候还是有多卡并行需求的。另外,这么大的集群还是别整这种花活了,省不了多少钱,前期省了钱,后期维护可能就麻烦了。我3月份的文章里也没这么激进…
至于最近发布的线程撕裂者7000系列,非常令人失望。Pro线价格贵上天,同级别SKU相较于上一代贵了太多,和W790平台比起来性价比并没有多高,还有核间延迟问题。从32核4CCD直接跳到64核8CCD,而平台最多只能支持到6块GPU获得PCIe x16,如果要避免核间延迟的问题,64核8CCD中有2个CCD用不起来。传统HEDT线则把PCIe规格砍成残废了,最多支持2块GPU获得PCIe x16。
- 向着虚无前进 -

299

帖子

0

威望

1924

eV
积分
2223

Level 5 (御坂)

14#
 楼主 Author| 发表于 Post on 2023-10-26 20:15:01 | 只看该作者 Only view this author
sobereva 发表于 2023-10-24 04:13
CP2K是免费的

M$那种东西在我来看完全没有购买价值,整体又慢又贵又不灵活,在学术界用户也越来越少,也 ...

咨询了下MS报价,一个用户界面37万,其他每个模块一百多万
四个模块报下来572万
一个用户,一个用户
真以为企业的钱是大风刮来的?

22

帖子

0

威望

832

eV
积分
854

Level 4 (黑子)

15#
发表于 Post on 2023-10-26 20:21:50 | 只看该作者 Only view this author
MS,国内不差钱的很多

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 07:50 , Processed in 0.180121 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list