计算化学公社

 找回密码 Forget password
 注册 Register
Views: 35090|回复 Reply: 45
打印 Print 上一主题 Last thread 下一主题 Next thread

[计算机购买] 高斯软件并行效率实测与购机建议,还有一些胡言乱语

  [复制链接 Copy URL]

592

帖子

12

威望

4799

eV
积分
5631

Level 6 (一方通行)

密度泛函·小卒

本帖最后由 yjcmwgk 于 2015-1-6 14:16 编辑

郑重声明:本总结是基于楼主本人的知识以及真实测试结果而做的。本人与intel的关系仅限于“买了一些intel的cpu并长期使用它们”。本人与Gaussian的关系仅限于“买了高斯的版权并长期使用它”。我不是intel或Gaussian的托!

这篇胡言乱语主要包含以下内容:
(一)高斯的多核心并行效率真不咋地
(二)虽然少核心高主频的CPU确实很贵,但是它们就是偏偏适合高斯计算
(三)买电脑,砍价一定要腰斩

(四)能自己攒的机器,就要自己攒!不要买品牌机

好了,开始!

(一)高斯的并行效率

测试机器:两片E5-2680v2处理器,64G内存,普通SAS硬盘,整个机器是按照DDRIII-1600配起来的,关掉超线程后,共20个计算核心。
系统为Centos 6.4 X64。软件为Gaussian 09 D.01 ES64L

测试题:
一个已经用cam-b3lyp优化好的200多个原子的体系,有氢氧硫碳氮碘锌。基组为6-31G(d)和LanL2DZ混用。现在拿着这个构型在同等水平下,进行单点能计算,很幸运的,每次测试的SCF cycle都是13次。

测试结果:

图1 高斯实测并行效率

当使用12核心并行的时候,总CPU时间为33分36秒,平均每核心运行时间2分48秒
当使用20核心并行的时候,总CPU时间为43分32秒,平均每核心运行时间2分11秒

我们绘制图1,得到以下结论
(1)高斯的2核并行效率很好,4核并行效率也说得过去,8核并行效率就有些难看了。再往上加核心数,并行效率惨不忍睹。
(2)8核心并行,任务运行205秒后结束。而16核心并行,任务运行144秒后结束。多加了一倍的核心数,计算时间仅仅减少了三成儿。
(3)6核心并行,任务运行285秒后结束。而16核心并行,任务运行144秒后结束。为了减少一半的计算时间,我们付出了2.6倍的CPU核心数。
(4)2核并行效率高达95%,12核心并行效率已经降至51%,而20核并行效率更是低达38%。

总结论:高斯的并行效率真心不咋地!超过8核心并行的话,意义已经不大了。我建议极限最多并行核心数不要超过12。

(二)虽然少核心高主频的CPU确实很贵,但是它们就是偏偏适合高斯计算

少核心高主频的CPU确实很贵,我们用理论计算常用的E5-2600v2系列来对比一下,一个是大众化的多核心正常主频的E5-2650v2,一个是小众化的少核心高主频的E5-2643v2,一个是很少有人知道的少核心高主频的E5-2637v2:
(1)E5-2650v2,每颗CPU为八核心,20M缓存,处理器基本频率为2.6GHz,最大睿频3.4GHz,这样总基本频率为20.8GHz,总睿频可达到27.2GHz,热设计功耗功率也仅仅只有95W,每颗CPU出厂价为1171美元
(2)E5-2643v2,每颗CPU为六核心,25M缓存,处理器基本频率为为3.5GHz,最大睿频3.8GHz,这样总基本频率为21.0GHz,但是总睿频仅仅达到22.8GHz,热设计功耗居然高达130W,每颗CPU出厂价也达到了瞠目结舌的1552美元
(3)E5-2637v2,每颗CPU为四核心,15M缓存,处理器基本频率为为3.5GHz,最大睿频3.8GHz,这样总基本频率为14.0GHz,但是总睿频仅仅达到15.2GHz,热设计功耗也是高达130W,每颗CPU出厂价也竟然也达到了996美元
考虑到高斯糟糕的并行效率,我宁可选择2号或3号,而不选择1号。换句话说,高斯糟糕的并行效率逼迫我做出了很浪费钱的一个决定。同时,考虑到高斯糟糕的并行效率,我觉得双路主板对咱们来说真是够了!

(三)买电脑,砍价一定要腰斩

我便抱着自己的测试结果去买电脑,想买以下电脑配置。
一个2U的四子星,内含4个节点,每个节点内有2颗E5-2643v2的CPU,8条8G的ECC内存,千兆网卡,预留infiniband接口(只是预留而已,为了以后方便,现在用不着)。四个节点公用一个电源模块,公用一个冗余电源模块。四个节点公用一个硬盘盒,盒内有4块1T的sas硬盘。
这货就长这样:

图2 四子星(2U)结构


我先联系曙光,曙光报价18万,我让他们滚一边儿去!
然后联系华硕,华硕报价16万多不到17万,我没说啥,心中默默给他们画了个叉。
然后联系越海扬波,越海杨波报价12万。我心动了!
我早就给他们合算了成本了,如果我按照市场价自己买散件自己攒机,那么总价格为12万7千多。考虑到各大服务器公司都有自己的进货渠道,这台机器让他们攒,纯硬件成本绝对不多于10万零5千。
曙光报价18万,我虽不齿,却也理解。曙光公司有很高大的金字塔架构。底层一千个销售员,要养活上中层八百个坐办公室的!一套设备,他们没赚到足够的钱就相当于赔本了。
而我需要的就是一个攒机商。我只需要硬件质保。从系统到软件,我完全不需要对方服务。
最后我还是没要越海扬波的机器,我要了另一家更小的公司的机器。价格仅有11万稍出头而已,我估计对方从这单生意中赚走我的钱不超过6000块。但是我这儿不能公布那家公司的名字,因为我不是他们的托。嘿嘿

(四)能自己攒的机器,就要自己攒!不要买品牌机

我实际上已经花掉了20多万,为自己和三位研究生买了两台四子星,也就是8个双路节点了。再加上我师兄出国前留给我8个老的双路节点,嗯,机器一时间富裕起来,我便开始动了花花肠子,看着自己的办公用的主机箱越来越不顺眼。而且我的主机箱里边儿,现在已经是老牛破车哐当当了。究其原因,全是因为我用它用的太狠。这台主机,内有俩系统。三年来,它白天开着win给我当办公电脑,晚上临走我就换到linux下给它挂个小任务让它算着,第二天早上我来收庄稼。现在这台主机箱那是动辄死机啊。我就想换掉它。
老规矩,攒机!
既然主要用途是白天开win给我办公用,夜里开linux为我算小任务,那么,就限制在LGA1150接口的CPU好了,不必追求LGA2011接口既然白天要开win,那么一定要用的爽,不爽不就白瞎了么。慎重思考后,如下:
  • 华硕(ASUS)B85M-E 主板(Intel B85/LGA 1150)
  • 英特尔(Intel)酷睿四核i7-4770k Haswell全新架构盒装CPU(LGA1150/3.5GHz/8M三级缓存/84W/22纳米)
  • (主板和CPU套装价格为2608元)
  • 华硕(ASUS) R9270X-DC2T-4GD5 1120MHz/5600MHz 4GB/256bit DDR5 PCI-E 3.0 显卡 1499元
  • 金士顿(Kingston)骇客神条 Fury系列 DDR3 1600 16GB(8GBx2条)台式机内存(HX316C10FK2/16)蓝色 1099元
  • 两块金士顿(Kingston)V300 240GB SATA3 固态硬盘 699元*2
  • 西部数据(WD)绿盘 2TB SATA6Gb/s 64M 台式机硬盘(WD20EZRX) 529元
  • 酷冷至尊(CoolerMaster)V650S额定650W电源(80PLUS金牌/半模组/静音/主动式PFC/支持背线/质保5年) 649元
  • 酷冷至尊(CoolerMaster)毁灭者经典U3升级版 游戏机箱(ATX/USB3.0/背走线/电源下置/支持SSD/LED风扇)黑色 199元
  • 三星(SAMSUNG) SH-224DB 24速 串口 DVD刻录机 (黑色)106元
  • 总额8087元


说干就干了,买来硬件,插了机器,然后在两个固态硬盘上,分别装win7系统和ubuntu14.10系统,机械硬盘给我分成两个1T的分区,分别搞成ntfs格式给win7,和ext4格式给ubuntu用。
说实话这台机器都快顶上一台小服务器了啊……把超线程一关,4x3.5GHz的CPU,16G的内存,2T的机械硬盘……我师兄早年买的服务器也不过如此!这儿插一句:如果把上述配置中的显卡省略掉,那么,还剩下不到6600块钱的配置。把这六千多块钱的硬件一攒,你就已经获得了一台Linux操作系统及计算化学软件与编程的学习用机了(玩票用)
这货就长这样:

图3 酷冷至尊毁灭者经典U3升级版游戏机箱



童鞋,跑个分儿呗?
处理器和内存都接近满分,硬盘和显卡直接就是满分,嗯,玩模拟城市,终于可以把特效全开了!
实际上这个机器的配置已经远远超过了win7测评的范围了。它之所以给出满分纯粹是因为没有更高分可给了。

八千块啊,如果买品牌机,我敢保证顶多达到我这个机器一半的配置就算销售商有良心了。所以,即使在今天,攒机也是王道!

评分 Rate

参与人数
Participants 13
威望 +1 eV +54 收起 理由
Reason
Senses_Y + 5 好萌好萌好萌!
PhoenixYeti + 4 谢谢分享
Xin + 1 好物!
qwoop + 4 赞!
momian + 5
ChemiAndy + 5 赞!
asdf + 1 谢谢
youyno + 5 好萌好萌好萌!
stm8150 + 2
nunup5 + 4 赞!
Shannon + 3 我很赞同
sobereva + 1 + 10
卡开发发 + 5 你太可爱

查看全部评分 View all ratings

一出生响亮登场,十几岁快乐成长,
二十岁天天向上,三十岁基本定向,
四十岁拼命打创,五十岁回首一望,
六十岁告老还乡,七十岁搓搓麻将,
八十岁躺在床上,九十岁挂在墙上,
人生一世,匆匆忙忙,生得嘹亮,走得凄凉!
生活就像五味瓶,酸甜苦辣难消停!
该吃吃,该喝喝,遇事别去心里搁,
想哭哭,想笑笑,烦恼就往云外抛,
记住甜,忘掉苦,亲人朋友好相处,
心情好,最重要,自我麻痹乐逍遥!

50

帖子

0

威望

837

eV
积分
887

Level 4 (黑子)

46#
发表于 Post on 2023-9-22 17:49:24 | 只看该作者 Only view this author
laplacesuanzi 发表于 2023-9-22 15:04
您好,怎么样在虚拟机上实现Gaussian的并行计算?我是16核24线程的机子,采用的是Centos系统,谢谢

单节点计算参考社长的帖子http://sobereva.com/439

11

帖子

0

威望

156

eV
积分
167

Level 3 能力者

45#
发表于 Post on 2023-9-22 15:04:10 | 只看该作者 Only view this author
bluewhale 发表于 2015-7-30 21:21
2W元确实少一点,2个CPU就要近2W, 再按4GB/核的标准配内存,光这些就要不少银子,算MD内存需求不大,算高斯 ...

您好,怎么样在虚拟机上实现Gaussian的并行计算?我是16核24线程的机子,采用的是Centos系统,谢谢

230

帖子

0

威望

2665

eV
积分
2895

Level 5 (御坂)

44#
发表于 Post on 2016-9-15 06:10:01 | 只看该作者 Only view this author
楼主,你的基函数有多少?像我用6-31G*,16个线程根本就跑不满,效率肯定不高。换了大基组就可以满载了

14

帖子

0

威望

102

eV
积分
116

Level 2 能力者

43#
发表于 Post on 2016-3-1 14:34:07 | 只看该作者 Only view this author
对于高斯的并行计算的问题,我感觉不能一并而论的,从测试结果上来看,如果计算手法对于IO部分非常小的话,它的确还是可以随着核数的增加而计算时间减少的,并行效果不明显的这种说法只是说,可能没有达到理论上的并行效率,所以不能一概而论

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

42#
发表于 Post on 2015-10-31 16:14:44 | 只看该作者 Only view this author
yjcmwgk 发表于 2015-10-31 14:33
哈哈,刚才纯属开玩笑啦。其实这些散件儿的报价信息都在网上有。我主要用ZOL网站查配置的曾经的价格,有 ...

哈哈,把每顿饭每个菜的制作当成配服务器,买菜的时候也拦腰砍,最后做出物美价廉的饭菜,也会有相似的成就感吧?

592

帖子

12

威望

4799

eV
积分
5631

Level 6 (一方通行)

密度泛函·小卒

41#
 楼主 Author| 发表于 Post on 2015-10-31 14:33:33 | 只看该作者 Only view this author
dreamyeye 发表于 2015-10-31 11:21
去服务器公司的ban list上看看有没有你的名。

哈哈,刚才纯属开玩笑啦。其实这些散件儿的报价信息都在网上有。我主要用ZOL网站查配置的曾经的价格,有时候在京东网站上查当前价格,然后你就知道这些散件儿的价格啦。至于处理器,你下载一个Intel ARK即可,Intel全部产品的规格价格等都在内。
一出生响亮登场,十几岁快乐成长,
二十岁天天向上,三十岁基本定向,
四十岁拼命打创,五十岁回首一望,
六十岁告老还乡,七十岁搓搓麻将,
八十岁躺在床上,九十岁挂在墙上,
人生一世,匆匆忙忙,生得嘹亮,走得凄凉!
生活就像五味瓶,酸甜苦辣难消停!
该吃吃,该喝喝,遇事别去心里搁,
想哭哭,想笑笑,烦恼就往云外抛,
记住甜,忘掉苦,亲人朋友好相处,
心情好,最重要,自我麻痹乐逍遥!

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

40#
发表于 Post on 2015-10-31 11:21:39 | 只看该作者 Only view this author
yjcmwgk 发表于 2015-10-31 10:37
对,必须讲。十二块七毛的东西,你要从一块两毛七开始讲起

去服务器公司的ban list上看看有没有你的名。

592

帖子

12

威望

4799

eV
积分
5631

Level 6 (一方通行)

密度泛函·小卒

39#
 楼主 Author| 发表于 Post on 2015-10-31 10:37:29 | 只看该作者 Only view this author
dreamyeye 发表于 2015-10-25 18:09
楼主买品牌机那个报价是讲过的吗?品牌服务器能讲下多少价格呢?品牌服务器官网那些报价是不是太扯了?

对,必须讲。十二块七毛的东西,你要从一块两毛七开始讲起
一出生响亮登场,十几岁快乐成长,
二十岁天天向上,三十岁基本定向,
四十岁拼命打创,五十岁回首一望,
六十岁告老还乡,七十岁搓搓麻将,
八十岁躺在床上,九十岁挂在墙上,
人生一世,匆匆忙忙,生得嘹亮,走得凄凉!
生活就像五味瓶,酸甜苦辣难消停!
该吃吃,该喝喝,遇事别去心里搁,
想哭哭,想笑笑,烦恼就往云外抛,
记住甜,忘掉苦,亲人朋友好相处,
心情好,最重要,自我麻痹乐逍遥!

6万

帖子

99

威望

5万

eV
积分
120060

管理员

公社社长

38#
发表于 Post on 2015-10-29 08:57:01 | 只看该作者 Only view this author
xialaxiu 发表于 2015-10-29 05:48
哪个量化软件并行效率好?GAMESS?Q-CHEM?MOLPRO?还是什么软件?

NWChem、ADF、DeMon2K都是号称并行效率高的量化程序。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

17

帖子

0

威望

41

eV
积分
58

Level 2 能力者

37#
发表于 Post on 2015-10-29 05:48:35 | 只看该作者 Only view this author
哪个量化软件并行效率好?GAMESS?Q-CHEM?MOLPRO?还是什么软件?

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

36#
发表于 Post on 2015-10-25 18:09:01 | 只看该作者 Only view this author
楼主买品牌机那个报价是讲过的吗?品牌服务器能讲下多少价格呢?品牌服务器官网那些报价是不是太扯了?

6万

帖子

99

威望

5万

eV
积分
120060

管理员

公社社长

35#
发表于 Post on 2015-8-19 00:24:43 | 只看该作者 Only view this author
yjcmwgk 发表于 2015-8-17 16:37
忒能折腾!
你呀,最好是买个mac电脑,在MAC OS X里装一个虚拟机,装一个红帽子或者centos系统进去,然后 ...


虚拟机效率还是很高的而且用起来非常便利

至少对于vmware虚拟机,如果试图在虚拟机里再装虚拟机,程序会明确阻止这种不良企图。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

3097

帖子

29

威望

1万

eV
积分
17094

Level 6 (一方通行)

34#
发表于 Post on 2015-8-18 20:38:45 | 只看该作者 Only view this author
yjcmwgk 发表于 2015-8-17 16:37
忒能折腾!
你呀,最好是买个mac电脑,在MAC OS X里装一个虚拟机,装一个红帽子或者centos系统进去,然后 ...

故而表示惊讶。

592

帖子

12

威望

4799

eV
积分
5631

Level 6 (一方通行)

密度泛函·小卒

33#
 楼主 Author| 发表于 Post on 2015-8-17 16:37:09 | 只看该作者 Only view this author
本帖最后由 yjcmwgk 于 2015-8-17 16:42 编辑
liyuanhe211 发表于 2015-7-24 04:23
啊?在Win上用虚拟机装Linux跑Gaussian吗?
忒能折腾!
你呀,最好是买个mac电脑,在MAC OS X里装一个虚拟机,装一个红帽子或者centos系统进去,然后在linux里装一个虚拟机,虚拟机里装一个win7,然后在win7里再装一个安卓模拟器。很棒很酷毙吧
一出生响亮登场,十几岁快乐成长,
二十岁天天向上,三十岁基本定向,
四十岁拼命打创,五十岁回首一望,
六十岁告老还乡,七十岁搓搓麻将,
八十岁躺在床上,九十岁挂在墙上,
人生一世,匆匆忙忙,生得嘹亮,走得凄凉!
生活就像五味瓶,酸甜苦辣难消停!
该吃吃,该喝喝,遇事别去心里搁,
想哭哭,想笑笑,烦恼就往云外抛,
记住甜,忘掉苦,亲人朋友好相处,
心情好,最重要,自我麻痹乐逍遥!

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 16:30 , Processed in 0.979095 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list