|
本帖最后由 Entropy.S.I 于 2024-7-28 23:25 编辑
仔细看http://bbs.keinsci.com/thread-40077-1-1.html,就知道9754明显不如9654。从实测结果来说,256核的双路9754在大多数场景性能不如192核的双路9654;从架构来说,9754每2个8核CCX复用1条GMI3链路,128核只有8条GMI3链路,而9654是每个8核CCX独占1条GMI3链路,96核刚好用完IO Die的12条GMI3链路,因此9754的核间互联完全不如9654,另外9754的per-core理论性能也远低于9654。9754根本不是面向科学计算设计的CPU,买9754跑科学计算完全是被忽悠的。
另外,现在双路9654 + 24*32GB DDR5 4800 2R内存的计算节点报价超过10万的都不用继续问了。
至于IB网络,基于EDR的单层网络的latency水平并不比HDR差,甚至更好,因为从HDR开始单层网络的latency已经优化到头了,HDR和NDR溢价除了在与bandwidth,还在与多层网络需要的“In-network Computing”能力以及一些针对AI集群的特性,而这对于仅有单层网络的小型科学计算HPC完全没用。二手的EDR网络方案成本只有HDR的不到十分之一,哪种方案更合适非常明显。
最后,仔细调研你们的应用是否可以GPU加速,如今所有经典分子动力学程序的GPU加速性价比都远高于CPU-only,新兴的DPMD同样如此,至于第一性原理,以平面波为主的程序(如VASP、QE、PWmat等)的GPU加速效果普遍很好。
我自己课题组新建的GPU集群就在使用二手EDR方案,计算节点是我二次开发的8卡V100 SXM2服务器,每节点有4+1块IB-EDR HCA,其中4块专门用于GPU-Direct RDMA,这种计算节点每个只需要4万元,跑VASP和QE性能相当于2-5台双路EPYC 9654,并且组成集群进行跨节点并行计算的效率也很好。
我可以帮你们设计HPC,甚至可以帮助部署,但请注意不要以甲方对乙方的态度沟通。 |
|