计算化学公社

 找回密码 Forget password
 注册 Register
Views: 30652|回复 Reply: 24
打印 Print 上一主题 Last thread 下一主题 Next thread

[Gaussian/gview] 高斯官方的G16 GPU加速测试

[复制链接 Copy URL]

3097

帖子

29

威望

1万

eV
积分
17221

Level 6 (一方通行)

本帖最后由 liyuanhe211 于 2017-6-28 12:54 编辑

高斯官网出现了一个GPU加速的测速结果。原数据链接:http://gaussian.com/g16/gpus.pdf

硬件:
加速基数:2 * E5-2698 v3 (共32核*2.6 GHz)
加速配置:2 * E5-2698 v3 + 4 * Tesla K80 dual GPU ([8*GPU + 8 CPU core for GPU control] + 24 CPU cores)
内存256GB

加速效果:
加速效果如下(加速 1.34 指使用GPU后耗时降低约25%(1-1/1.34)):





硬件价格:

加速前:2 * E5-2698 v3:两颗共¥33000~38000 的样子 (P.S. E5-2696 v3 两颗约¥10000,共36核*2.3GHz,性能接近、实惠极多)
加速后:没买过高端显卡,淘宝报价Tesla K80 每颗大概在¥27000~32000 之间,四块 Tesla K80 价格约 ¥10W~13W,加之前的CPU在¥12.5~15W的量级


总结:
从约 ¥3.5W(2*E5-2698 v3)或 ¥1W(2*E5-2696 v3)的 CPU;提升至总价约¥12.5~15W 的 CPU+GPU,算 Freq 平均降低了约 40% 的耗时 →_→


6万

帖子

99

威望

6万

eV
积分
125147

管理员

公社社长

2#
发表于 Post on 2017-6-28 18:05:19 | 只看该作者 Only view this author
高湿简直自己打自己脸。比比Amber官网上华丽丽的GPU加速数据,简直了
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

471

帖子

0

威望

1800

eV
积分
2271

Level 5 (御坂)

3#
发表于 Post on 2017-6-28 18:27:51 | 只看该作者 Only view this author
sobereva 发表于 2017-6-28 18:05
高湿简直自己打自己脸。比比Amber官网上华丽丽的GPU加速数据,简直了

搞死嘛,诚实值得肯定
不过拿搞死比琥珀,可比性值得商榷

6万

帖子

99

威望

6万

eV
积分
125147

管理员

公社社长

4#
发表于 Post on 2017-6-28 18:29:41 | 只看该作者 Only view this author
hakuna 发表于 2017-6-28 18:27
搞死嘛,诚实值得肯定
不过拿搞死比琥珀,可比性值得商榷


虽然肯定比不上amber,量化和MD的GPU加速性能没得比,但至少花费的投入比例和GPU加速性能应当有线性关系。像VASP的GPU加速起码还能看到实效。
这么惨的数据令人怀疑高湿的人这些年都干嘛了。
ORCA现在也在搞GPU,估计超过高湿的GPU加速性能是轻而易举的事

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

471

帖子

0

威望

1800

eV
积分
2271

Level 5 (御坂)

5#
发表于 Post on 2017-6-28 18:41:54 | 只看该作者 Only view this author
sobereva 发表于 2017-6-28 18:29
虽然肯定比不上amber,量化和MD的GPU加速性能没得比,但至少花费的投入比例和GPU加速性能应当有线性关 ...

搞死的GPU性价比的确惨了点,VASP稍好点,只能说还能接受

177

帖子

0

威望

1482

eV
积分
1659

Level 5 (御坂)

6#
发表于 Post on 2017-6-28 20:37:53 | 只看该作者 Only view this author
搞死和高湿都是搞事

3097

帖子

29

威望

1万

eV
积分
17221

Level 6 (一方通行)

7#
 楼主 Author| 发表于 Post on 2017-6-28 21:44:12 | 只看该作者 Only view this author
hakuna 发表于 2017-6-28 18:27
搞死嘛,诚实值得肯定
不过拿搞死比琥珀,可比性值得商榷

起码加速效率要使得买GPU是经济上值得的,现在这样傻子才这么配置。如此,除非有人本来就因为其他应用、有K40或K80(只支持这两种);而现成有注重双精度浮点的、这么高端显卡的机器很少见。所以G16的GPU加速就几乎没用了→_→

44

帖子

0

威望

663

eV
积分
707

Level 4 (黑子)

8#
发表于 Post on 2017-6-29 02:26:50 | 只看该作者 Only view this author
说实在的, 高端的显卡不是给个人用户设计。这几年Nvidia,Intel都在鼓励支持科学计算领域GPU或co-processor的应用,大规模的计算中心都上了GPU节点。我使用过的一个计算中心马上要上Nvidia P100节点,这是这些量化程序的用武之地,虽然目前还不成熟,未来是个趋势。

3097

帖子

29

威望

1万

eV
积分
17221

Level 6 (一方通行)

9#
 楼主 Author| 发表于 Post on 2017-6-29 03:19:25 | 只看该作者 Only view this author
jjjspring 发表于 2017-6-29 02:26
说实在的, 高端的显卡不是给个人用户设计。这几年Nvidia,Intel都在鼓励支持科学计算领域GPU或co-processo ...

不论从功耗还是硬件成本角度考虑,如果超算收费模式合理,我个人认为在现有加速比的情况下,G16 GPU加速的“鸡肋性”在超算上比在个人机器上还要明显。因为容易的租更多的CPU还解决了峰值性能的问题、削弱了GPU加速优势。

当然未来Gaussian能把GPU加速改进的不鸡肋、亦或是停滞不前乃至死掉都是有可能的,不过现在还看不清楚。

310

帖子

3

威望

6408

eV
积分
6778

Level 6 (一方通行)

10#
发表于 Post on 2017-6-29 09:39:02 | 只看该作者 Only view this author
搞事的高湿要搞死自己。
欢迎使用量子化学软件Amesp

230

帖子

0

威望

940

eV
积分
1170

Level 4 (黑子)

11#
发表于 Post on 2017-6-30 01:12:00 | 只看该作者 Only view this author
AMBER不需要双精度,MD的轨迹也只是sampling的方案,出点小偏差没关系。跟量化非要算到高精度没法比吧?

其实我一直没看明白AMBER的单精度/双精度混合计算的算法到底是啥原理,有没有同仁科普一下啊

81

帖子

0

威望

915

eV
积分
996

Level 4 (黑子)

12#
发表于 Post on 2017-7-1 09:35:32 | 只看该作者 Only view this author
sobereva 发表于 2017-6-28 18:05
高湿简直自己打自己脸。比比Amber官网上华丽丽的GPU加速数据,简直了

Gaussian的优化真是烂
都什么年代了跨节点还用linda也是醉了
但是现在大学里用Gaussian的实在太多,不能不买

6万

帖子

99

威望

6万

eV
积分
125147

管理员

公社社长

13#
发表于 Post on 2017-7-1 10:49:04 | 只看该作者 Only view this author
hanshan 发表于 2017-7-1 09:35
Gaussian的优化真是烂
都什么年代了跨节点还用linda也是醉了
但是现在大学里用Gaussian的实在太多,不 ...


关键是高斯是基于OpenMP的,直接用linda跨节点的话不需要改太多代码,如果改写成MPI的会花费巨大精力
linda也没那么不济,论坛里有人在IB下测过高斯linda跨节点效率,还可以接受。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

81

帖子

0

威望

915

eV
积分
996

Level 4 (黑子)

14#
发表于 Post on 2017-7-1 11:38:47 | 只看该作者 Only view this author
sobereva 发表于 2017-7-1 10:49
关键是高斯是基于OpenMP的,直接用linda跨节点的话不需要改太多代码,如果改写成MPI的会花费巨大精力
...

gaussian流行的原因就是历史路径依赖,还有gaussview的一部分功劳吧
就技术而言没什么厉害的

6万

帖子

99

威望

6万

eV
积分
125147

管理员

公社社长

15#
发表于 Post on 2017-7-2 00:41:21 | 只看该作者 Only view this author
hanshan 发表于 2017-7-1 11:38
gaussian流行的原因就是历史路径依赖,还有gaussview的一部分功劳吧
就技术而言没什么厉害的


高斯有自己的独特优势,诸如:
输入文件是所有量化程序里最简单的
所有最常用的功能非常全面,而且大多数都很成熟稳定,这点没有程序敢跟高斯叫板的
抛开RI不谈的话,没几个程序DFT速度能超过Gaussian
支持HF/DFT三阶解析导数,直接能算解析超极化率,能做到这点的程序很少
几何优化、过渡态搜索、溶剂模型高斯公司里专门有领域内的top大牛在搞(schlegel、barone),在所有量化程序里是佼佼者
支持的振动谱有IR、Raman、共振/预共振Raman、VCD、ROA,还能在非谐振级别下做,其它能做到这份上的没有。

高斯能广为流行,不是光靠gview,也不是靠exploring、历史因素,一个程序很烂的话,外因再多也烂泥扶不上墙。很多人低估高斯的地位,往往是对高斯理解得不够充分。当然,我并不否认如今Gaussian的发展势头渐缓,没有ORCA的锋芒。

评分 Rate

参与人数
Participants 2
eV +8 收起 理由
Reason
IridiumLINCH-SK + 3 我很赞同
qwoop + 5 我很赞同

查看全部评分 View all ratings

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-22 13:43 , Processed in 0.180589 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list