计算化学公社

标题: 这个配置怎么样?请评判 [打印本页]

作者
Author:
ChaosChiao    时间: 2014-10-20 09:40
标题: 这个配置怎么样?请评判
本帖最后由 ChaosChiao 于 2014-10-20 09:44 编辑

做计算,主要用AMBER,高斯,另外少量用GROMACS,预算没有限制,大家觉得怎样配置才能把运算性能发挥的更好?

CPU服务器:
曙光I620-G15,
CPU:E5-2660v2*2
内存:8G*4
硬盘3.5寸 2T SATA

GPU:
I620-G15
CPU:E5-2640v2*2
GPU:Tesla K20*1
内存:8G*8
硬盘 2T SATA
有几个问题想请教:若CPU升级到v3版本是否有意义?内存32G对高斯是否够用?内存用哪个规格(1866/1600/1333/1066 )?

作者
Author:
sobereva    时间: 2014-10-20 19:19
Tesla太亏,强烈不推荐。GTX780Ti是性价比最高的。还可以插两块。
另外GPU跑MD的机子用那么大内存也没意义,还不如给CPU机子。
内存频率不是什么问题,不是瓶颈。不同CPU支持的内存频率上限不同,看情况。
区分v2、v3意义不大,只看核数和频率就够了,同频同核的性能基本一致。v3核心是haswell,唯一优点是支持AVX2,不过目前的程序对其大多没怎么优化。
给高斯用多少合适看算什么,比如DFT消耗内存不大,而后HF则多多益善。如果确定要跑高斯,建议不小于64GB。
作者
Author:
chrinide    时间: 2014-10-20 22:27
本帖最后由 chrinide 于 2014-10-20 22:39 编辑

E5-2660v2 主频2.2G 睿频3G; E5-2660v3 主频2.6G 睿频3.3G,v3比v2贵500元左右,如果是土豪(都上2660了 肯定打土豪错不了)的话 直接v3吧,另外内存建议加到128G
作者
Author:
sobereva    时间: 2014-10-21 08:22
另外补充几点。
要注意高斯的并行效率并不理想,两个10核一起用nproc=20来跑效率会颇低,造成极大的浪费,除非同时可能跑多个任务。更好的选择是核心数少一些,但是频率尽量高一些。2660 v2就属于核数多而频率偏低了。2643是不错的选择(虽然价格定得有点高),其v2、v3在性能和价格上基本没区别。
而MD程序并行效率普遍较好,这个不是大问题。

v3多数支持的是DDR4,虽然频率上限提升了,多数开始支持2133,不过同频性能下DDR4反倒比DDR3稍逊一些。

v3服务器产品是今年9月才发布的,很多服务器厂商还没有广泛推出v3的产品,目前能选择的v3的型号比较有限。
作者
Author:
ChaosChiao    时间: 2014-10-21 09:09
非常感谢sob及chrinide的回复。
我已经准备把CPU服务器中的E5-2660换为高主频的E5-2643或者E5-2667了。
对于GPU,sob姐您推荐的GTX780ti,我看到AMBER官网上并不推荐,不知道是什么原因?难道这个卡只对于amber不适用?
官网信息如下:
"Hardware Version 3.0 / 3.5 (Kepler I / Kepler II)
Tesla K20/K20X/K40
Tesla K10
GTX-Titan / GTX-Titan-Black / GTX-Titan-Z
GTX770 / 780 (780Ti is NOT recommended)
GTX670 / 680 / 690
Quadro cards supporting SM3.0* or 3.5*"
作者
Author:
sobereva    时间: 2014-10-21 09:55
GPU的设计总在变,每一代架构以及不同核心特点各有不同,代码对其充分优化好才能达到最高效率。可能amber尚没充分对780Ti优化,不过运行起来我相信也没问题。具体可以到mailing list问问。gmx不会有这个问题。
你也可以买GTX 780GHz,只是把780的频率提高,核心没变,比780Ti性能只低一丝(实际上各个厂家的非公版780高频板也相当于这个了)。
作者
Author:
ChaosChiao    时间: 2014-10-21 21:04
sobereva 发表于 2014-10-21 09:55
GPU的设计总在变,每一代架构以及不同核心特点各有不同,代码对其充分优化好才能达到最高效率。可能amber尚 ...

sob姐,AMBER maillist的人是这么答复GTX780TI的“ I do NOT recommend the GTX780TI models since experience shows that they can be unreliable (the CAS memory refresh rate is too high).” 额。。不过我不太懂他的意思,难道选显卡跟这个 CAS memory refresh rate还有关?这个参数又是什么意思?
作者
Author:
sobereva    时间: 2014-10-21 21:18
说得有一定道理。CAS是显存/内存的关键性时序参数,直接关系到运行频率。GTX780Ti的显存频率定得比较高,1750Mhz,高于780的1502Mhz,可能是因为这个导致显存在吞吐数据时错误率相对高一些,但是平时玩游戏的时候对数据可靠性不敏感,不会暴露这个问题。
作者
Author:
zhanfei    时间: 2014-10-24 02:30
sobereva 发表于 2014-10-21 08:22
另外补充几点。
要注意高斯的并行效率并不理想,两个10核一起用nproc=20来跑效率会颇低,造成极大的浪费, ...

那么gaussian多少个核心之内,并行效率是比较好的呢。
单路高频E5+大内存64甚至128在预算低的时候是个好选择吗?我查了硬件资料库貌似E3全是32G内存控制器,E5除了LV的都是375G内存控制。
另外配成双路的主板以后加CPU时候,2路型号不一致对程序并行会友影响吗
thanks,sincerely
作者
Author:
sobereva    时间: 2014-10-24 09:42
zhanfei 发表于 2014-10-24 02:30
那么gaussian多少个核心之内,并行效率是比较好的呢。
单路高频E5+大内存64甚至128在预算低的时候是个好 ...

没有明确的坎,只能说核数越多越亏,而且亏得程度不断加大。建议<=16核为宜,把花在增加核数上的前增加到频率上更好(哪怕从“频率*核数”总值上看性价比更低)。
E3都是单路的,所以32GB限制也是情理之中。E5搭配64GB是目前最常规的组合,很合理,预算实在低砍到32GB也可以,但一定要根据实际应用要求来定。跑MD的机子即便用不着多少内存,也不应低于32GB。
两颗U的规格最好一致。
作者
Author:
zhanfei    时间: 2014-10-24 13:53
sobereva 发表于 2014-10-24 09:42
没有明确的坎,只能说核数越多越亏,而且亏得程度不断加大。建议

thanks sob
作者
Author:
516518    时间: 2014-11-3 07:17
有用,学习
作者
Author:
comchem    时间: 2014-11-7 08:10
内存频率高对计算速度的提高还是很明显的,建议尽量选用cpu能支持的最高频率。
作者
Author:
truemantwo    时间: 2014-11-12 14:34
MD计算还是吃主频饭,可能的话把主频提上去吧。
作者
Author:
psfan    时间: 2014-11-25 09:10
针对v3优化的程序还没出现呢。能把v2用好就不错了。
作者
Author:
lao7    时间: 2014-12-15 19:53
我觉得配两台,一台用CPU计算,另外一台用GPU加速,两台侧重点不同。
作者
Author:
laifeng20151107    时间: 2015-11-24 10:30
chrinide 发表于 2014-10-20 22:27
E5-2660v2 主频2.2G 睿频3G; E5-2660v3 主频2.6G 睿频3.3G,v3比v2贵500元左右,如果是土豪(都上2660了 肯 ...

你的价格是在哪里查的啊




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3