|
本帖最后由 Entropy.S.I 于 2023-5-19 20:57 编辑
你的需求,起码要分2种配置。
1. CFD不能GPU加速的方法巨吃内存带宽,同时CPU缓存大也对性能有加成,故必须上EPYC 9004系列CPU,另外Lammps和一些GPU加速的CFD需要双精度性能强的GPU,综合考虑可以配一台双路EPYC 9654 + 若干块V100的机器,如果没有V100,再选A100 40G PCIe,更贵的GPU完全不推荐,因为双精度性能远远配不上售价,溢价主要来自于AI相关的性能。此外,这个配置同时也很适合跑Gaussian。
2. Lammps以外的MD软件(如GROMACS)需要用多块RTX4090搭配单核性能很强的CPU,intel的W790平台和AMD的线程撕裂者Pro 5000系列都可选,更推荐W790平台。如果GROMACS跑得少,配13900KF + RTX4090就行。实际上,Lammps的GPU加速也并不是必须用双精度,其中一些本身精度就相对较低的力场可以用单精度/混合精度来跑,别用Kokkos包,改用“GPU”包就行(根据开发者的说法,预计今年也会对Kokkos加上单精度/混合精度的支持),此配置很适合这种情况。另外,有些GPU加速CFD方法可以用单精度,所以此配置也适合跑这类任务。
给4090专门分一套配置首先是因为其性能太强,服务器CPU单核性能不够用;其次是因为目前要把4090塞进品牌机架式服务器基本只能用涡轮卡,而涡轮卡是没有品牌、没有正常质保的,且用料也非常差(这东西目前是英伟达重点打击对象,但下游代工厂做涡轮卡利润极高,是普通风冷游戏卡的几倍,所以有厂家偷偷做、偷偷卖),非常不推荐买涡轮卡,所以买普通风冷卡并配成台式机/DIY机架式更合适。
顺便去看看这几篇文章:
http://bbs.keinsci.com/thread-35988-1-1.html
http://bbs.keinsci.com/thread-35986-1-1.html
http://bbs.keinsci.com/thread-33296-1-1.html
|
|