计算化学公社

 找回密码 Forget password
 注册 Register
Views: 10834|回复 Reply: 17
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 穷银也要跑MD~~~适合AMBER的分子动力学模拟的省钱配置

[复制链接 Copy URL]

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 tomwong4253 于 2019-2-17 19:38 编辑

各位好,好久不见了。

最近群里偶有听说部分朋友咨询做分子动力学配置的事情,对于专门从事分子动力学的大课题组或者紧邻大课题组的同行来说。按说一些技术支持并不是太难的事情。不过实际上还是在硬件方面有这样或者那样的问题。对于某些“独苗”来说则情况更麻烦,可能周围都是做实验或者做其它方面研究的,而自己在这里孤零零地做着MD计算。特别是一些学生手头没有设备需要自己购买设备,却又有预算上限以及选择困难症的时候。这里阿南叔就目前(截止2019年2月)的硬件性价比,加上自己的理解,给各位推荐一些相对便宜的入门级分子动力学配置。

这些配置的一个原则:压低预算,MD能跑的不算太慢就行。具有运行一定的其它应用(生物信息,深度学习啥的,轻型QM)的能力。

这些配置适用的软件:AMBER,部分适用于NAMD,不适用于gromacs(请特别注意!!!!!!!,别买了说我坑你)

不同单位部门的购买报销要求不一样,如果能拆开了走耗材之类的sao操作,或者可以混在其它地方去报,可以购买消费级硬件。如果使用频率很高,预算相对还是能接受的话,建议在三大件上还是使用服务器级硬件比较稳当。

--------------------------------------------------------------------
消费级硬件配置(无服务器级硬件,价格源自某宝某猫,截至2月17日)
---------------------------------------------------------------------
CPU:I3 8100                       850
主板:微星B360M MORTAR   600
散热:九州风神玄冰400         80
内存:渣士顿8G*2 2400       800
显卡:耕升GTX1060 6g        1500
电源:台达NX450                 300
硬盘:希捷酷狼机械硬盘3T   860
机箱:随便整个ITX的           200
-----------------------------------------------------------------------
总计:                               5190         
-----------------------------------------------------------------------

阿南叔的碎碎念:消费级硬件作为比较容易供货且相对比较容易保修的部分,在一些二三线地区的学校或研究机构、各类商业机构中比较推荐。特别是对于那些对硬件理解较少的同事和同学们来说,购买这样的硬件有很多可以参考的案例,挑选面也比较宽,网上及生活中也有各种各样的攻略可以参考。假货水货有很多方式鉴别出来。唯一需要注意的是渣士顿的内存条最好买不带马甲的,仔细观察暴露出来的内存颗粒来判断是不是买到了水货。

--------------------------------------------------------------------
服务器级硬件配置(部分服务器级硬件,价格源自某宝某猫,截至2月17日)
---------------------------------------------------------------------
CPU:E3 1230 V6                   1700
主板  华硕 E3M-ET V5              700
散热:九州风神玄冰400            80
内存:海力士RECC 8G*2 2133  680
显卡:耕升GTX1060 6g           1500
电源:台达NX450                    300
硬盘:希捷酷狼机械硬盘3T       860
机箱:随便整个ITX的               200
-----------------------------------------------------------------------
总计:                                  6020         
-----------------------------------------------------------------------

阿南叔的碎碎念:服务器级硬件主要求一个稳字,因此价钱也相对高一些。供货保修之类的相较消费级硬件麻烦一些,对硬件理解较少的同事和同学们来说,购买这样的硬件可以参考的案例挑选面等等都不多。服务器级硬件的假货水货需要注意的仍然是内存,服务器级的内存条水货相对多一些,这也是为何阿南叔没有推荐三星的原因,因为山寨货多啊,如果对硬件不了解的,花钱买个山寨货虽然可能不影响使用,但何必便宜了JS呢。此外,服务器级硬件对于并行化等等做了一些优化,如果有一定的QM计算需求(比如搞个小分子参数之类的),同等条件下使用至强比消费级的要好那么一丢丢。

补充:如果预算还有富余,优先升级显卡,将显卡提升至1070(3000元左右)或1070ti(3800元左右),计算速度可以飞跃一个台阶。

另,大家可以关注下老黄家的新卡1660ti,如果价钱可以接受的话,把显卡换成1660ti,计算性能可能会有比较大的提升。

好了先说到这,各位硬件大佬求使劲拍砖

评分 Rate

参与人数
Participants 2
eV +15 收起 理由
Reason
lonemen + 5 再多碎碎念几句嘛
sobereva + 10

查看全部评分 View all ratings

122

帖子

0

威望

1441

eV
积分
1563

Level 5 (御坂)

2#
发表于 Post on 2019-2-18 05:20:33 | 只看该作者 Only view this author
为啥适用amber或namd, 反而不适用gromacs?

545

帖子

0

威望

3123

eV
积分
3668

Level 5 (御坂)

3#
发表于 Post on 2019-2-18 09:45:05 | 只看该作者 Only view this author
哪不适用GMX了……

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2019-2-18 18:37:24 | 只看该作者 Only view this author
统一回复一下为何这套穷鬼配置不适用于gmx:

gmx有相当数量的运算是在CPU上完成,GPU只承担部分任务(因此gmx有“CPU/GPU负载均衡”的选项和设置),而CPU的很多运算,需要的不仅仅是主频,还要求有一定核数来提高并行速度,否则仅仅4个核心,其计算速度是远不如有十几个核心但主频稍低的CPU的。而核数恰恰是消费级CPU及入门服务器级CPU的弱项。因此这套配置不适用于gmx。感兴趣的可以试试只给gmx 1个CPU核心和1块GPU试试速度。

amber则是纯GPU运算,跑一个amber动力学你会发现一个GPU给一个CPU核心作为协处理器就足够了,给多了CPU核心对以GPU为主计算的速度是没有影响的。

NAMD的运行机制我不太了解,据说是GPU为主,因此具体适合不适合有待观察,所以我只能说是“部分适合”。

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2019-2-18 18:37:53 | 只看该作者 Only view this author
beyond 发表于 2019-2-18 05:20
为啥适用amber或namd, 反而不适用gromacs?

见楼上回复,这和几个软件用到的具体资源有关

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2019-2-18 18:37:58 | 只看该作者 Only view this author
k64_cc 发表于 2019-2-18 09:45
哪不适用GMX了……

见楼上回复,这和几个软件用到的具体资源有关

224

帖子

5

威望

4548

eV
积分
4872

Level 6 (一方通行)

7#
发表于 Post on 2019-2-18 22:30:20 | 只看该作者 Only view this author
tomwong4253 发表于 2019-2-18 18:37
统一回复一下为何这套穷鬼配置不适用于gmx:

gmx有相当数量的运算是在CPU上完成,GPU只承担部分任务(因 ...

NAMD还挺依赖CPU的,虽然最新版本有所改进,但是CPU不足的时候,GPU利用率不太好
我需要一些假日,但我不希望每天都是假日。因为我没有承担痛苦,因为那不是真正的自由。

545

帖子

0

威望

3123

eV
积分
3668

Level 5 (御坂)

8#
发表于 Post on 2019-2-19 13:53:42 | 只看该作者 Only view this author
tomwong4253 发表于 2019-2-18 18:37
见楼上回复,这和几个软件用到的具体资源有关

啊你说这个,我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高,但是人家代码写得真不错,同等资源下和amber比真不一定就输了。还是得具体问题具体测试……

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2019-2-21 14:25:49 | 只看该作者 Only view this author
k64_cc 发表于 2019-2-19 13:53
啊你说这个,我还以为你的意思是GMX不能跑……

虽然GMX在核数低的时候效率不高,但是人家代码写得真不 ...

amber是C,C++和fortran混合代码。而且其MD模块不能独立运行(无ambertools时amber的pmemd不能工作),这个在和同等计算资源下以纯C/C++代码的gmx201X比较的时候肯定是有不同的。

不过从实际操作层面来讲,现在不少对计算有少量需求的研究组,特别是实验为主的大组,可能不会给很多的经费让你买26X0的,新的买不起,二手的可能有各种报销问题。如果CPU出现瓶颈,在经费报销吃紧的情况下为了达到研究的目的,最佳的选择是向不过分依赖CPU的amber靠拢。这也就是为啥我的帖子题目是“省钱配置”的原因。

当然,最佳的选择是忽悠老板给配个双路2696v4+2080ti,最好再来他512G内存,那就上天入地无所不能跑了(逃)

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2019-2-21 14:29:49 | 只看该作者 Only view this author
ene 发表于 2019-2-18 22:30
NAMD还挺依赖CPU的,虽然最新版本有所改进,但是CPU不足的时候,GPU利用率不太好

NAMD和VMD的关系,我个人的理解更像是半条命与反恐精英的关系。。。侧室比正妻更出名系列

NAMD的文件除PDB之外还需要psf格式的链接文件,虽然带来了一定程度上的排错能力,但我懒~~~

545

帖子

0

威望

3123

eV
积分
3668

Level 5 (御坂)

11#
发表于 Post on 2019-2-21 15:34:04 | 只看该作者 Only view this author
tomwong4253 发表于 2019-2-21 14:25
amber是C,C++和fortran混合代码。而且其MD模块不能独立运行(无ambertools时amber的pmemd不能工作),这 ...

实验组上AMD啊,便宜大碗实测好用。

374

帖子

2

威望

1539

eV
积分
1953

Level 5 (御坂)

12#
发表于 Post on 2019-5-3 21:12:41 | 只看该作者 Only view this author
我觉得应该提醒一下贪便宜用消费级的显卡的话,需要没过几个月做一下稳定性测试,因为消费级的2080Ti没有ECC,有可能会出现bit flipping。
所以要每过几个月跑一组相同的运算,检测最后一步的能量是不是都一样。我们以前都是用tesla的,后来贪便宜买了1080Ti,前几个月有人发现跑测试结果不太对,结果发现跑20次会有一次结果不一样。

279

帖子

0

威望

2271

eV
积分
2550

Level 5 (御坂)

13#
发表于 Post on 2019-5-4 10:41:57 | 只看该作者 Only view this author
我上个月测试过,gmx2018指定nb pme pmefft都到GPU上算,速度和不指定差不多;但没仔细测试这时候,模拟速度和CPU core的关系。也许gmx2018不太依赖CPU了?

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2019-5-4 11:21:09 | 只看该作者 Only view this author
wuzhiyi 发表于 2019-5-3 21:12
我觉得应该提醒一下贪便宜用消费级的显卡的话,需要没过几个月做一下稳定性测试,因为消费级的2080Ti没有EC ...

嗯,确实ECC这东西稳如老狗是不假,但是至少会拖慢10%左右的速度。
AMBER这样的软件在性能提示的章节都建议把ECC关了的,我之前自己用Tesla也没开ECC。
本来MD需要的就是多次重复,2080ti鬼畜一般的速度足以弥补它个别时候显存抽风的弱点了。
在我另一篇帖子里提到过,长时间的单次计算和模拟,如果要求几乎完全不抽风,最好还是买Tesla,即使关了ECC,还是比游戏卡要稳。但是一般的MD这种可以多次重复的计算,消费级的显卡完全胜任。

160

帖子

7

威望

785

eV
积分
1085

Level 4 (黑子)

15#
 楼主 Author| 发表于 Post on 2019-5-4 11:22:34 | 只看该作者 Only view this author
bobosiji 发表于 2019-5-4 10:41
我上个月测试过,gmx2018指定nb pme pmefft都到GPU上算,速度和不指定差不多;但没仔细测试这时候,模拟速 ...

gmx2018开始,pme计算往GPU上移动了不少,你关注下显卡占用就知道了。
然而还是对CPU有一定的要求的,所以我XJB写的这套配置,还是比较适用纯GPU的Amber。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 08:55 , Processed in 0.623593 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list