计算化学公社

标题: 穷银也要跑MD~~~适合AMBER的分子动力学模拟的省钱配置 [打印本页]

作者
Author:
tomwong4253    时间: 2019-2-17 19:22
标题: 穷银也要跑MD~~~适合AMBER的分子动力学模拟的省钱配置
本帖最后由 tomwong4253 于 2019-2-17 19:38 编辑

各位好,好久不见了。

最近群里偶有听说部分朋友咨询做分子动力学配置的事情,对于专门从事分子动力学的大课题组或者紧邻大课题组的同行来说。按说一些技术支持并不是太难的事情。不过实际上还是在硬件方面有这样或者那样的问题。对于某些“独苗”来说则情况更麻烦,可能周围都是做实验或者做其它方面研究的,而自己在这里孤零零地做着MD计算。特别是一些学生手头没有设备需要自己购买设备,却又有预算上限以及选择困难症的时候。这里阿南叔就目前(截止2019年2月)的硬件性价比,加上自己的理解,给各位推荐一些相对便宜的入门级分子动力学配置。

这些配置的一个原则:压低预算,MD能跑的不算太慢就行。具有运行一定的其它应用(生物信息,深度学习啥的,轻型QM)的能力。

这些配置适用的软件:AMBER,部分适用于NAMD,不适用于gromacs(请特别注意!!!!!!!,别买了说我坑你)

不同单位部门的购买报销要求不一样,如果能拆开了走耗材之类的sao操作,或者可以混在其它地方去报,可以购买消费级硬件。如果使用频率很高,预算相对还是能接受的话,建议在三大件上还是使用服务器级硬件比较稳当。

--------------------------------------------------------------------
消费级硬件配置(无服务器级硬件,价格源自某宝某猫,截至2月17日)
---------------------------------------------------------------------
CPU:I3 8100                       850
主板:微星B360M MORTAR   600
散热:九州风神玄冰400         80
内存:渣士顿8G*2 2400       800
显卡:耕升GTX1060 6g        1500
电源:台达NX450                 300
硬盘:希捷酷狼机械硬盘3T   860
机箱:随便整个ITX的           200
-----------------------------------------------------------------------
总计:                               5190         
-----------------------------------------------------------------------

阿南叔的碎碎念:消费级硬件作为比较容易供货且相对比较容易保修的部分,在一些二三线地区的学校或研究机构、各类商业机构中比较推荐。特别是对于那些对硬件理解较少的同事和同学们来说,购买这样的硬件有很多可以参考的案例,挑选面也比较宽,网上及生活中也有各种各样的攻略可以参考。假货水货有很多方式鉴别出来。唯一需要注意的是渣士顿的内存条最好买不带马甲的,仔细观察暴露出来的内存颗粒来判断是不是买到了水货。

--------------------------------------------------------------------
服务器级硬件配置(部分服务器级硬件,价格源自某宝某猫,截至2月17日)
---------------------------------------------------------------------
CPU:E3 1230 V6                   1700
主板  华硕 E3M-ET V5              700
散热:九州风神玄冰400            80
内存:海力士RECC 8G*2 2133  680
显卡:耕升GTX1060 6g           1500
电源:台达NX450                    300
硬盘:希捷酷狼机械硬盘3T       860
机箱:随便整个ITX的               200
-----------------------------------------------------------------------
总计:                                  6020         
-----------------------------------------------------------------------

阿南叔的碎碎念:服务器级硬件主要求一个稳字,因此价钱也相对高一些。供货保修之类的相较消费级硬件麻烦一些,对硬件理解较少的同事和同学们来说,购买这样的硬件可以参考的案例挑选面等等都不多。服务器级硬件的假货水货需要注意的仍然是内存,服务器级的内存条水货相对多一些,这也是为何阿南叔没有推荐三星的原因,因为山寨货多啊,如果对硬件不了解的,花钱买个山寨货虽然可能不影响使用,但何必便宜了JS呢。此外,服务器级硬件对于并行化等等做了一些优化,如果有一定的QM计算需求(比如搞个小分子参数之类的),同等条件下使用至强比消费级的要好那么一丢丢。

补充:如果预算还有富余,优先升级显卡,将显卡提升至1070(3000元左右)或1070ti(3800元左右),计算速度可以飞跃一个台阶。

另,大家可以关注下老黄家的新卡1660ti,如果价钱可以接受的话,把显卡换成1660ti,计算性能可能会有比较大的提升。

好了先说到这,各位硬件大佬求使劲拍砖
作者
Author:
beyond    时间: 2019-2-18 05:20
为啥适用amber或namd, 反而不适用gromacs?
作者
Author:
k64_cc    时间: 2019-2-18 09:45
哪不适用GMX了……
作者
Author:
tomwong4253    时间: 2019-2-18 18:37
统一回复一下为何这套穷鬼配置不适用于gmx:

gmx有相当数量的运算是在CPU上完成,GPU只承担部分任务(因此gmx有“CPU/GPU负载均衡”的选项和设置),而CPU的很多运算,需要的不仅仅是主频,还要求有一定核数来提高并行速度,否则仅仅4个核心,其计算速度是远不如有十几个核心但主频稍低的CPU的。而核数恰恰是消费级CPU及入门服务器级CPU的弱项。因此这套配置不适用于gmx。感兴趣的可以试试只给gmx 1个CPU核心和1块GPU试试速度。

amber则是纯GPU运算,跑一个amber动力学你会发现一个GPU给一个CPU核心作为协处理器就足够了,给多了CPU核心对以GPU为主计算的速度是没有影响的。

NAMD的运行机制我不太了解,据说是GPU为主,因此具体适合不适合有待观察,所以我只能说是“部分适合”。
作者
Author:
tomwong4253    时间: 2019-2-18 18:37
beyond 发表于 2019-2-18 05:20
为啥适用amber或namd, 反而不适用gromacs?

见楼上回复,这和几个软件用到的具体资源有关
作者
Author:
tomwong4253    时间: 2019-2-18 18:37
k64_cc 发表于 2019-2-18 09:45
哪不适用GMX了……

见楼上回复,这和几个软件用到的具体资源有关
作者
Author:
ene    时间: 2019-2-18 22:30
tomwong4253 发表于 2019-2-18 18:37
统一回复一下为何这套穷鬼配置不适用于gmx:

gmx有相当数量的运算是在CPU上完成,GPU只承担部分任务(因 ...

NAMD还挺依赖CPU的,虽然最新版本有所改进,但是CPU不足的时候,GPU利用率不太好
作者
Author:
k64_cc    时间: 2019-2-19 13:53
tomwong4253 发表于 2019-2-18 18:37
见楼上回复,这和几个软件用到的具体资源有关

啊你说这个,我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高,但是人家代码写得真不错,同等资源下和amber比真不一定就输了。还是得具体问题具体测试……
作者
Author:
tomwong4253    时间: 2019-2-21 14:25
k64_cc 发表于 2019-2-19 13:53
啊你说这个,我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高,但是人家代码写得真不 ...

amber是C,C++和fortran混合代码。而且其MD模块不能独立运行(无ambertools时amber的pmemd不能工作),这个在和同等计算资源下以纯C/C++代码的gmx201X比较的时候肯定是有不同的。

不过从实际操作层面来讲,现在不少对计算有少量需求的研究组,特别是实验为主的大组,可能不会给很多的经费让你买26X0的,新的买不起,二手的可能有各种报销问题。如果CPU出现瓶颈,在经费报销吃紧的情况下为了达到研究的目的,最佳的选择是向不过分依赖CPU的amber靠拢。这也就是为啥我的帖子题目是“省钱配置”的原因。

当然,最佳的选择是忽悠老板给配个双路2696v4+2080ti,最好再来他512G内存,那就上天入地无所不能跑了(逃)
作者
Author:
tomwong4253    时间: 2019-2-21 14:29
ene 发表于 2019-2-18 22:30
NAMD还挺依赖CPU的,虽然最新版本有所改进,但是CPU不足的时候,GPU利用率不太好

NAMD和VMD的关系,我个人的理解更像是半条命与反恐精英的关系。。。侧室比正妻更出名系列

NAMD的文件除PDB之外还需要psf格式的链接文件,虽然带来了一定程度上的排错能力,但我懒~~~
作者
Author:
k64_cc    时间: 2019-2-21 15:34
tomwong4253 发表于 2019-2-21 14:25
amber是C,C++和fortran混合代码。而且其MD模块不能独立运行(无ambertools时amber的pmemd不能工作),这 ...

实验组上AMD啊,便宜大碗实测好用。
作者
Author:
wuzhiyi    时间: 2019-5-3 21:12
我觉得应该提醒一下贪便宜用消费级的显卡的话,需要没过几个月做一下稳定性测试,因为消费级的2080Ti没有ECC,有可能会出现bit flipping。
所以要每过几个月跑一组相同的运算,检测最后一步的能量是不是都一样。我们以前都是用tesla的,后来贪便宜买了1080Ti,前几个月有人发现跑测试结果不太对,结果发现跑20次会有一次结果不一样。
作者
Author:
bobosiji    时间: 2019-5-4 10:41
我上个月测试过,gmx2018指定nb pme pmefft都到GPU上算,速度和不指定差不多;但没仔细测试这时候,模拟速度和CPU core的关系。也许gmx2018不太依赖CPU了?
作者
Author:
tomwong4253    时间: 2019-5-4 11:21
wuzhiyi 发表于 2019-5-3 21:12
我觉得应该提醒一下贪便宜用消费级的显卡的话,需要没过几个月做一下稳定性测试,因为消费级的2080Ti没有EC ...

嗯,确实ECC这东西稳如老狗是不假,但是至少会拖慢10%左右的速度。
AMBER这样的软件在性能提示的章节都建议把ECC关了的,我之前自己用Tesla也没开ECC。
本来MD需要的就是多次重复,2080ti鬼畜一般的速度足以弥补它个别时候显存抽风的弱点了。
在我另一篇帖子里提到过,长时间的单次计算和模拟,如果要求几乎完全不抽风,最好还是买Tesla,即使关了ECC,还是比游戏卡要稳。但是一般的MD这种可以多次重复的计算,消费级的显卡完全胜任。
作者
Author:
tomwong4253    时间: 2019-5-4 11:22
bobosiji 发表于 2019-5-4 10:41
我上个月测试过,gmx2018指定nb pme pmefft都到GPU上算,速度和不指定差不多;但没仔细测试这时候,模拟速 ...

gmx2018开始,pme计算往GPU上移动了不少,你关注下显卡占用就知道了。
然而还是对CPU有一定的要求的,所以我XJB写的这套配置,还是比较适用纯GPU的Amber。
作者
Author:
wuzhiyi    时间: 2019-5-5 02:19
本帖最后由 wuzhiyi 于 2019-5-5 02:21 编辑
tomwong4253 发表于 2019-5-4 11:21
嗯,确实ECC这东西稳如老狗是不假,但是至少会拖慢10%左右的速度。
AMBER这样的软件在性能提示的章节都 ...

2080Ti有比1080Ti好很多嘛?球\谈\一\下\体\验。(到底这句话哪个字是不良信息)
2080Ti刚出来的时候我们买了几块感觉和1080Ti没有太大区别(指gromacs)。
但比速度更鬼畜的是散热,站在集群边上可以很明显的感觉,tesla集群温度没太大区别,1080Ti集群已经如同火堆,2080Ti我们都不敢组replicate exchange用的机器,感觉会着 火。
作者
Author:
sobereva    时间: 2019-5-5 06:45
wuzhiyi 发表于 2019-5-5 02:19
2080Ti有比1080Ti好很多嘛?球\谈\一\下\体\验。(到底这句话哪个字是不良信息)
2080Ti刚出来的时候我 ...

不良词语:xia ti
作者
Author:
tomwong4253    时间: 2019-5-5 14:18
wuzhiyi 发表于 2019-5-5 02:19
2080Ti有比1080Ti好很多嘛?球\谈\一\下\体\验。(到底这句话哪个字是不良信息)
2080Ti刚出来的时候我 ...

2080Ti速度比1080Ti快至少30%,这还是保守的估计,实际可能更高(不然老黄卖啥新卡)。
新卡肯定比旧卡在功耗上有优势,速度上也有优势。你要是有兴趣尝试下980Ti,就会发现1080Ti的热量只是个弟弟。。。。
20X0卡现在最大的隐患是:都卖到现在了,仍然有不少花屏的例子,意味着显存的损坏(计算的时候显存出问题将直接导致计算出奇异数值)目前还不清楚是TURING核心还是GDDR6显存设计上存在缺陷。因此后面的1660Ti和1660 1650都慌忙用回了GDDR5显存。
总的来说,用20系的卡,提前跟经销商谈好保修各方面,免得显存挂了到时候用不了。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3