计算化学公社

标题: 穷银也要跑MD~~~适合AMBER的分子动力学模拟的省钱配置 [打印本页]

作者
Author: tomwong4253 时间: 2019-2-17 19:22
标题: 穷银也要跑MD~~~适合AMBER的分子动力学模拟的省钱配置
本帖最后由 tomwong4253 于 2019-2-17 19:38 编辑

各位好，好久不见了。

最近群里偶有听说部分朋友咨询做分子动力学配置的事情，对于专门从事分子动力学的大课题组或者紧邻大课题组的同行来说。按说一些技术支持并不是太难的事情。不过实际上还是在硬件方面有这样或者那样的问题。对于某些“独苗”来说则情况更麻烦，可能周围都是做实验或者做其它方面研究的，而自己在这里孤零零地做着MD计算。特别是一些学生手头没有设备需要自己购买设备，却又有预算上限以及选择困难症的时候。这里阿南叔就目前（截止2019年2月）的硬件性价比，加上自己的理解，给各位推荐一些相对便宜的入门级分子动力学配置。

这些配置的一个原则：压低预算，MD能跑的不算太慢就行。具有运行一定的其它应用（生物信息，深度学习啥的，轻型QM）的能力。

这些配置适用的软件：AMBER，部分适用于NAMD，不适用于gromacs（请特别注意！！！！！！！，别买了说我坑你）

不同单位部门的购买报销要求不一样，如果能拆开了走耗材之类的sao操作，或者可以混在其它地方去报，可以购买消费级硬件。如果使用频率很高，预算相对还是能接受的话，建议在三大件上还是使用服务器级硬件比较稳当。

--------------------------------------------------------------------
消费级硬件配置（无服务器级硬件，价格源自某宝某猫，截至2月17日）
---------------------------------------------------------------------
CPU：I3 8100                      850
主板：微星B360M MORTAR 600
散热：九州风神玄冰400       80
内存：渣士顿8G*2 2400    800
显卡：耕升GTX1060 6g       1500
电源：台达NX450                300
硬盘：希捷酷狼机械硬盘3T 860
机箱：随便整个ITX的          200
-----------------------------------------------------------------------
总计：                            5190
-----------------------------------------------------------------------

阿南叔的碎碎念：消费级硬件作为比较容易供货且相对比较容易保修的部分，在一些二三线地区的学校或研究机构、各类商业机构中比较推荐。特别是对于那些对硬件理解较少的同事和同学们来说，购买这样的硬件有很多可以参考的案例，挑选面也比较宽，网上及生活中也有各种各样的攻略可以参考。假货水货有很多方式鉴别出来。唯一需要注意的是渣士顿的内存条最好买不带马甲的，仔细观察暴露出来的内存颗粒来判断是不是买到了水货。

--------------------------------------------------------------------
服务器级硬件配置（部分服务器级硬件，价格源自某宝某猫，截至2月17日）
---------------------------------------------------------------------
CPU：E3 1230 V6                1700
主板  华硕 E3M-ET V5             700
散热：九州风神玄冰400          80
内存：海力士RECC 8G*2 2133  680
显卡：耕升GTX1060 6g          1500
电源：台达NX450                   300
硬盘：希捷酷狼机械硬盘3T    860
机箱：随便整个ITX的             200
-----------------------------------------------------------------------
总计：                               6020
-----------------------------------------------------------------------

阿南叔的碎碎念：服务器级硬件主要求一个稳字，因此价钱也相对高一些。供货保修之类的相较消费级硬件麻烦一些，对硬件理解较少的同事和同学们来说，购买这样的硬件可以参考的案例挑选面等等都不多。服务器级硬件的假货水货需要注意的仍然是内存，服务器级的内存条水货相对多一些，这也是为何阿南叔没有推荐三星的原因，因为山寨货多啊，如果对硬件不了解的，花钱买个山寨货虽然可能不影响使用，但何必便宜了JS呢。此外，服务器级硬件对于并行化等等做了一些优化，如果有一定的QM计算需求（比如搞个小分子参数之类的），同等条件下使用至强比消费级的要好那么一丢丢。

补充：如果预算还有富余，优先升级显卡，将显卡提升至1070（3000元左右）或1070ti（3800元左右），计算速度可以飞跃一个台阶。

另，大家可以关注下老黄家的新卡1660ti，如果价钱可以接受的话，把显卡换成1660ti，计算性能可能会有比较大的提升。

好了先说到这，各位硬件大佬求使劲拍砖

作者
Author: beyond 时间: 2019-2-18 05:20
为啥适用amber或namd, 反而不适用gromacs?

作者
Author: k64_cc 时间: 2019-2-18 09:45
哪不适用GMX了……

作者
Author: tomwong4253 时间: 2019-2-18 18:37
统一回复一下为何这套穷鬼配置不适用于gmx：

gmx有相当数量的运算是在CPU上完成，GPU只承担部分任务（因此gmx有“CPU/GPU负载均衡”的选项和设置），而CPU的很多运算，需要的不仅仅是主频，还要求有一定核数来提高并行速度，否则仅仅4个核心，其计算速度是远不如有十几个核心但主频稍低的CPU的。而核数恰恰是消费级CPU及入门服务器级CPU的弱项。因此这套配置不适用于gmx。感兴趣的可以试试只给gmx 1个CPU核心和1块GPU试试速度。

amber则是纯GPU运算，跑一个amber动力学你会发现一个GPU给一个CPU核心作为协处理器就足够了，给多了CPU核心对以GPU为主计算的速度是没有影响的。

NAMD的运行机制我不太了解，据说是GPU为主，因此具体适合不适合有待观察，所以我只能说是“部分适合”。

作者
Author: tomwong4253 时间: 2019-2-18 18:37

beyond 发表于 2019-2-18 05:20
为啥适用amber或namd, 反而不适用gromacs?

见楼上回复，这和几个软件用到的具体资源有关

作者
Author: tomwong4253 时间: 2019-2-18 18:37

k64_cc 发表于 2019-2-18 09:45
哪不适用GMX了……

见楼上回复，这和几个软件用到的具体资源有关

作者
Author: ene 时间: 2019-2-18 22:30

tomwong4253 发表于 2019-2-18 18:37
统一回复一下为何这套穷鬼配置不适用于gmx：

gmx有相当数量的运算是在CPU上完成，GPU只承担部分任务（因 ...

NAMD还挺依赖CPU的，虽然最新版本有所改进，但是CPU不足的时候，GPU利用率不太好

作者
Author: k64_cc 时间: 2019-2-19 13:53

tomwong4253 发表于 2019-2-18 18:37
见楼上回复，这和几个软件用到的具体资源有关

啊你说这个，我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高，但是人家代码写得真不错，同等资源下和amber比真不一定就输了。还是得具体问题具体测试……

作者
Author: tomwong4253 时间: 2019-2-21 14:25

k64_cc 发表于 2019-2-19 13:53
啊你说这个，我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高，但是人家代码写得真不 ...

amber是C，C++和fortran混合代码。而且其MD模块不能独立运行（无ambertools时amber的pmemd不能工作），这个在和同等计算资源下以纯C/C++代码的gmx201X比较的时候肯定是有不同的。

不过从实际操作层面来讲，现在不少对计算有少量需求的研究组，特别是实验为主的大组，可能不会给很多的经费让你买26X0的，新的买不起，二手的可能有各种报销问题。如果CPU出现瓶颈，在经费报销吃紧的情况下为了达到研究的目的，最佳的选择是向不过分依赖CPU的amber靠拢。这也就是为啥我的帖子题目是“省钱配置”的原因。

当然，最佳的选择是忽悠老板给配个双路2696v4+2080ti，最好再来他512G内存，那就上天入地无所不能跑了（逃）

作者
Author: tomwong4253 时间: 2019-2-21 14:29

ene 发表于 2019-2-18 22:30
NAMD还挺依赖CPU的，虽然最新版本有所改进，但是CPU不足的时候，GPU利用率不太好

NAMD和VMD的关系，我个人的理解更像是半条命与反恐精英的关系。。。侧室比正妻更出名系列

NAMD的文件除PDB之外还需要psf格式的链接文件，虽然带来了一定程度上的排错能力，但我懒～～～

作者
Author: k64_cc 时间: 2019-2-21 15:34

tomwong4253 发表于 2019-2-21 14:25
amber是C，C++和fortran混合代码。而且其MD模块不能独立运行（无ambertools时amber的pmemd不能工作），这 ...

实验组上AMD啊，便宜大碗实测好用。

作者
Author: wuzhiyi 时间: 2019-5-3 21:12
我觉得应该提醒一下贪便宜用消费级的显卡的话，需要没过几个月做一下稳定性测试，因为消费级的2080Ti没有ECC，有可能会出现bit flipping。
所以要每过几个月跑一组相同的运算，检测最后一步的能量是不是都一样。我们以前都是用tesla的，后来贪便宜买了1080Ti，前几个月有人发现跑测试结果不太对，结果发现跑20次会有一次结果不一样。

作者
Author: bobosiji 时间: 2019-5-4 10:41
我上个月测试过，gmx2018指定nb pme pmefft都到GPU上算，速度和不指定差不多；但没仔细测试这时候，模拟速度和CPU core的关系。也许gmx2018不太依赖CPU了？

作者
Author: tomwong4253 时间: 2019-5-4 11:21

wuzhiyi 发表于 2019-5-3 21:12
我觉得应该提醒一下贪便宜用消费级的显卡的话，需要没过几个月做一下稳定性测试，因为消费级的2080Ti没有EC ...

嗯，确实ECC这东西稳如老狗是不假，但是至少会拖慢10%左右的速度。
AMBER这样的软件在性能提示的章节都建议把ECC关了的，我之前自己用Tesla也没开ECC。
本来MD需要的就是多次重复，2080ti鬼畜一般的速度足以弥补它个别时候显存抽风的弱点了。
在我另一篇帖子里提到过，长时间的单次计算和模拟，如果要求几乎完全不抽风，最好还是买Tesla，即使关了ECC，还是比游戏卡要稳。但是一般的MD这种可以多次重复的计算，消费级的显卡完全胜任。

作者
Author: tomwong4253 时间: 2019-5-4 11:22

bobosiji 发表于 2019-5-4 10:41
我上个月测试过，gmx2018指定nb pme pmefft都到GPU上算，速度和不指定差不多；但没仔细测试这时候，模拟速 ...

gmx2018开始，pme计算往GPU上移动了不少，你关注下显卡占用就知道了。
然而还是对CPU有一定的要求的，所以我XJB写的这套配置，还是比较适用纯GPU的Amber。

作者
Author: wuzhiyi 时间: 2019-5-5 02:19
本帖最后由 wuzhiyi 于 2019-5-5 02:21 编辑

tomwong4253 发表于 2019-5-4 11:21
嗯，确实ECC这东西稳如老狗是不假，但是至少会拖慢10%左右的速度。
AMBER这样的软件在性能提示的章节都 ...

2080Ti有比1080Ti好很多嘛？球\谈\一\下\体\验。（到底这句话哪个字是不良信息）
2080Ti刚出来的时候我们买了几块感觉和1080Ti没有太大区别（指gromacs）。
但比速度更鬼畜的是散热，站在集群边上可以很明显的感觉，tesla集群温度没太大区别，1080Ti集群已经如同火堆，2080Ti我们都不敢组replicate exchange用的机器，感觉会着火。

作者
Author: sobereva 时间: 2019-5-5 06:45

wuzhiyi 发表于 2019-5-5 02:19
2080Ti有比1080Ti好很多嘛？球\谈\一\下\体\验。（到底这句话哪个字是不良信息）
2080Ti刚出来的时候我 ...

不良词语：xia ti

作者
Author: tomwong4253 时间: 2019-5-5 14:18

wuzhiyi 发表于 2019-5-5 02:19
2080Ti有比1080Ti好很多嘛？球\谈\一\下\体\验。（到底这句话哪个字是不良信息）
2080Ti刚出来的时候我 ...

2080Ti速度比1080Ti快至少30%，这还是保守的估计，实际可能更高（不然老黄卖啥新卡）。
新卡肯定比旧卡在功耗上有优势，速度上也有优势。你要是有兴趣尝试下980Ti，就会发现1080Ti的热量只是个弟弟。。。。
20X0卡现在最大的隐患是：都卖到现在了，仍然有不少花屏的例子，意味着显存的损坏（计算的时候显存出问题将直接导致计算出奇异数值）目前还不清楚是TURING核心还是GDDR6显存设计上存在缺陷。因此后面的1660Ti和1660 1650都慌忙用回了GDDR5显存。
总的来说，用20系的卡，提前跟经销商谈好保修各方面，免得显存挂了到时候用不了。

欢迎光临计算化学公社 (http://bbs.keinsci.com/)