计算化学公社

 找回密码 Forget password
 注册 Register

Gaussian 并行效率新测

查看数: 32512 | 评论数: 20 | 收藏 Add to favorites 11
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2015-11-24 16:29

正文摘要:

本帖最后由 liyuanhe211 于 2016-12-29 12:30 编辑 网络上有不少对Gaussian并行效率的测试,其测试基本都如下图示意。只用2核时(横坐标),会占用“4格”时间(纵坐标),而用4核时,可能只需2格时间。这种只运 ...

回复 Reply

psfan 发表于 Post on 2015-12-24 08:04:22
很不错的测试,为更好使用胖节点提供依据。
hcxytpp@163.com 发表于 Post on 2015-12-9 08:52:20
我们服务器是以节点来分配的,为了资源合理利用,只给使用12核
liyuanhe211 发表于 Post on 2015-12-8 21:48:19
Aminus 发表于 2015-12-8 21:30
建议做如下测试:
1. 同一个节点上,对同一任务,计算分别为4,8,12,16,20,24核,然后看总的计算时间 ...

没懂为什么这样合理。
显然CPU的总占用率跟任务的最佳核数是相关的,故作这样的的正交优化显然不一定能得到最优解。

目前所有测试都是单台工作站的测试。以及有前人测试的结果表明硬盘写入不构成决速步。
Aminus 发表于 Post on 2015-12-8 21:30:45
建议做如下测试:
1. 同一个节点上,对同一任务,计算分别为4,8,12,16,20,24核,然后看总的计算时间,找出最优使用的核心数,
2. 如果以上最优核心数小于总核数的一半以上,分别再测试同一任务在最优核使用情况下,同时提交两个三个任务,再看

楼主没有提到的参数还有,临时文件,输出文件log,写在哪里,是在计算节点,还是其他节点(如存贮节点),这些也是影响因素。
liyuanhe211 发表于 Post on 2015-11-25 23:41:39
youyno 发表于 2015-11-25 23:01
有没有测试超线程开启情况下的效率?

已经开了
youyno 发表于 Post on 2015-11-25 23:01:32
有没有测试超线程开启情况下的效率?
978142355 发表于 Post on 2015-11-25 19:12:57
liyuanhe211 发表于 2015-11-25 13:11
呃~~忘记了~~好像有一个自变量是基函数个数,可以查一下。
以及想怎么测?用2个核不就能测了

恩,谢谢Li老师,谷歌一下看一看能不能找到。
liyuanhe211 发表于 Post on 2015-11-25 13:11:45
978142355 发表于 2015-11-25 12:27
其实我一直就想做这个测试,只不过只有1个4个核的机器,没法做。经验公式?Li老师在哪里看到的?

呃~~忘记了~~好像有一个自变量是基函数个数,可以查一下。
以及想怎么测?用2个核不就能测了
978142355 发表于 Post on 2015-11-25 12:27:40
liyuanhe211 发表于 2015-11-25 11:04
可能对计算确实有影响,有一个理想值,我记得还有一个经验公式来算,给多少内存合适。不过这么做的假设是 ...

其实我一直就想做这个测试,只不过只有1个4个核的机器,没法做。经验公式?Li老师在哪里看到的?
liyuanhe211 发表于 Post on 2015-11-25 11:04:04
978142355 发表于 2015-11-25 08:25
对,我就是这个意思,比如算苯分子,内存给的极小和极大,算的时间都比合适地给要长。我想你如果都给力4 ...

可能对计算确实有影响,有一个理想值,我记得还有一个经验公式来算,给多少内存合适。不过这么做的假设是,绝对速度与内存有关,但使用不同核数且内存与核数成正比时,不同核数之间的相对速度基本不受影响。有时间也可以测试一下。
978142355 发表于 Post on 2015-11-25 08:25:02
liyuanhe211 发表于 2015-11-25 03:09
呃,没懂。记得有人说内存和线程数成正比是比较合理的,即所有的内存平分给各核用。故而这样分配内存,不 ...

对,我就是这个意思,比如算苯分子,内存给的极小和极大,算的时间都比合适地给要长。我想你如果都给力4个G对于计算会不会有影响呢?
liyuanhe211 发表于 Post on 2015-11-25 03:09:18
978142355 发表于 2015-11-24 23:50
分子中原子个数似乎对%mem的不同,计算速度也不同。

呃,没懂。记得有人说内存和线程数成正比是比较合理的,即所有的内存平分给各核用。故而这样分配内存,不知道这个说法对不对。
liyuanhe211 发表于 Post on 2015-11-25 03:07:22
smutao 发表于 2015-11-24 22:38
从第二部分的测试来看
似乎任务很多的时候集中火力一个一个任务跑反而是效率最高的
这个也不难理解——因 ...

这个结论只对l703成立,如果观察其他几项,如总时间,似乎最高的还是较少的核数。另外根据检测,整个过程中CPU等待io都很低,所以硬盘读写可能不够成决速步。一些读写较多的任务比如post-HF可能确实会有你说的问题。
978142355 发表于 Post on 2015-11-24 23:50:56
liyuanhe211 发表于 2015-11-24 20:21
除列出的以外,每核4G,上面写了。

分子中原子个数似乎对%mem的不同,计算速度也不同。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:46 , Processed in 0.477864 second(s), 27 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list