计算化学公社

 找回密码 Forget password
 注册 Register
Views: 67404|回复 Reply: 40
打印 Print 上一主题 Last thread 下一主题 Next thread

[Gaussian/gview] win平台下最新版Gaussian16使用经验分享

  [复制链接 Copy URL]

93

帖子

2

威望

252

eV
积分
385

Level 3 能力者

跳转到指定楼层 Go to specific reply
#
本帖最后由 tjchkj 于 2017-12-7 16:04 编辑

看到论坛里几乎是清一色的在linux下使用Gaussian16的交流,使我这个linux门外汉感到居然找不到在windows平台下的任何前人的经验可以借鉴。找遍整个互联网也是没有什么发现,所以不得不潜心自己摸索一下。
先说一下运行环境:
软件:Gaussian 版本: Gaussian 16R A.03 WIN64, VERSION 1.1 单用户版。win10 64位版,win7旗舰版 64位版.
硬件:双路E5-22696v4(44核心)@2.2G ,超微X10DAL-i主板,三星原厂REG ECC 8G*8 总计64G内存。OCZ VECTOR 180 256G固态盘,显卡GTX750-2G,硬盘ST2000NM0033 ES.03 企业级2T。电源900瓦。满载cpu最高温度62度。
在win10下,无论是否打开和关闭超线程,观察Gaussian 各个模块,明显比I5 4440 的机器跑相同任务慢一个量级,因此不是两种cpu主频高低差别问题造成。在win7下也发现类问题。而关闭超线程后,win7下各个模块运行速度完全正常了。因此,可以得到结论就是在windows平台下使用Gaussian16,必须关闭超线程。
下面针对44核心的机器,做一些使用方面的经验,少于44核心的机器,可以类似参考。
一、Link 0中cpu使用的方法
1、老指令%nprocshared,可以用到所有的cpu核心。所以这个机器可以使用到44核心,即%nprocshared=44 可正常用,但这样使用每个cpu核心的使用率不很充分,瞬间cpu总使用率可达99%,但平均总使用率不到50%。测试发现,如果空出几个核心,可以达到计算用时短的效果,我这里是%nprocshared=42最佳。
2、新指令%CPU。该指令可以在任务中选择特定的核心。参数后面跟随用逗号分隔的核心列表例如%CPU=4,5,6,33,43等,或者用核心范围,例如%CPU=3-17 等.
探索发现这里存在bug,就是说%CPU这行核心列表里到最后一位字符,最长字符不能超过57个(win10里不能超过60个),去掉%CPU=这5个字符,在win7中核心列表字符最长是52个。即便你使用核心范围表示也是如此规则。
二、cpu核心限制
1、由于2中所出现的BUG问题,导致目前该版本的核心使用受到制约,采用%CPU指令时,最多核心的上限是21个(win10中是22个),如果你的核心列表里,没有使用到0-9这样单个字符表示的核心,那样能使用的核心只更会少而不会多。因为用范围表示的时候都是转换为列表来进行的。
2、采用多开的方式可以同时运行多个任务。我们知道在win平台下开一个Gaussian窗口只可以跑一个任务,但可以多开窗口实现同时跑多个任务。实验中可以做到1分钟同时运行起32个窗口,每个窗口都是调用BCF文件去运行。每个bcf中可以有上千行任务。这样可以一次投递几万个任务进去。
3、测试表明,Gaussian16 用%CPU=格式指定cpu使用的核心上限是32.不知道是他们用于开发的机器是只有32核心呢,还是在程序中存在BUG,定位核心的时候,采用了MOD函数,把你输入的cpu核心按32整除后得到的余数来定位cpu核心。也就是说,你即便是使用一个核心,这个值大于32就会按整除32后的余数去找核心。这样你多的核心就无法使用了。
三、从cpu负荷率来换个角度看并行效率
    我们采用一个测试样本,由于指定核心职能最多用21个,测试了两种方式的cpu使用,完成任务时间比较接近。
    以下研究的是多开计算的对比数据:
    单开 share = 44  时间是7:46 ;单开 最佳42 核心 用时3分41秒。
    四开 share = 11  用时10分10秒。      折算为 单个用时2分32秒,
    可见,如果算多任务,宜采用多开。
    另外 如果采用指定核心方式,则对于多任务计算的最佳方式就是32开每个指定1核心,折算后单个任务花费的时间是最少的。比较数据就略去不再赘述。如果你一次计算的任务不超过32个,可以适当组合一下,可以采用16开双核心,8开4核心,4开8核心,2开16核心的方式。或者是采用多开不均匀核心,比如三开:两个11核心加一个10核心这样做。四、采用缓存,利用机器的大内存对运算中的临时文件做缓存,我把scratch单独放在磁盘靠近中心的盘符里,用superchche 64位的来做缓存,大大降低磁盘的读写频次。懒写延迟可以任意设置。注意对系统盘不要做懒写。图中可以看到浅蓝色是读缓存命中。

有了大量多开,多窗口友好的界面,加上缓存运用,配合Gaussian View6 直接可视化的工具,在windows下直接运行Gaussian1做计算,就是一件愉快而高效的事情了,相信更多的人会越来越喜欢在windows下做运算了吧?运算的同时,你可以办公,写论文,娱乐休闲,一台机器就解决问题了。鉴于最后那个缓存scratch读写硬盘很多。我后来直接把scratch用RAMdisk 用内存虚拟成一个盘符,这样直接连supercache都不用给它分配内存了。而且是比supercache效率高的没法比。








Mon Dec 04 16-38-56.jpg (376.19 KB, 下载次数 Times of downloads: 207)

多开提高并行效率

多开提高并行效率

Mon Dec 04 16-37-24.jpg (452.95 KB, 下载次数 Times of downloads: 133)

缓存使得scratch读写优化

缓存使得scratch读写优化

评分 Rate

参与人数
Participants 9
eV +41 收起 理由
Reason
dio. + 4 谢谢分享
wxyhgk + 4 很不错这个,值得看看
liuhao + 4 赞!
panernie + 5 好萌好萌好萌!
ezez + 5 赞!
LSNIR + 3 赞!
zyzhang + 3 赞!
linux + 3 好物!
sobereva + 10

查看全部评分 View all ratings

14

帖子

0

威望

565

eV
积分
579

Level 4 (黑子)

40#
发表于 Post on 2024-10-31 11:05:44 | 只看该作者 Only view this author
64位 价格怎么样

12

帖子

0

威望

39

eV
积分
51

Level 2 能力者

39#
发表于 Post on 2023-10-26 11:17:57 | 只看该作者 Only view this author
大大们,想要g16win的安装包

76

帖子

0

威望

3838

eV
积分
3914

Level 5 (御坂)

38#
发表于 Post on 2023-5-6 19:20:26 | 只看该作者 Only view this author
aran217 发表于 2023-4-23 15:12
老师,我改用Winserver2022依旧是同一时刻只能被调用20个核,但是与发帖之前用2019运行有一点区别,2019 ...

win11经过测试可以。

3

帖子

0

威望

115

eV
积分
118

Level 2 能力者

37#
发表于 Post on 2023-4-23 15:12:40 | 只看该作者 Only view this author
paramecium86 发表于 2023-4-23 00:09
这个cpu的双路是40核心80线程。当总线程数超过64的时候 win10就会出问题。无法调用第二个cpu。 但是关掉 ...

谢谢老师,超线程已关闭,现在还在用计算例题测试中。

3

帖子

0

威望

115

eV
积分
118

Level 2 能力者

36#
发表于 Post on 2023-4-23 15:12:18 | 只看该作者 Only view this author
lanthanum 发表于 2023-4-23 03:45
http://bbs.keinsci.com/forum.php?mod=redirect&goto=findpost&ptid=35462&pid=240349&fromuid=8664

老师,我改用Winserver2022依旧是同一时刻只能被调用20个核,但是与发帖之前用2019运行有一点区别,2019的时候是另一个CPU直接20个核全部在睡觉,用2022的时候运行一个计算任务是过几秒钟第一个CPU跑满,一会第二个CPU跑满,但不能同时跑满。关闭超线程后好像解决了,还在测试中。

76

帖子

0

威望

3838

eV
积分
3914

Level 5 (御坂)

35#
发表于 Post on 2023-4-23 03:45:06 | 只看该作者 Only view this author
aran217 发表于 2023-4-22 18:14
老师我和你一样linux门外汉,也找不到在windows平台下的任何前人的经验可以借鉴。想请教老师为什么你可以做 ...

http://bbs.keinsci.com/forum.php ... 49&fromuid=8664

328

帖子

1

威望

5841

eV
积分
6189

Level 6 (一方通行)

34#
发表于 Post on 2023-4-23 00:09:41 | 只看该作者 Only view this author
aran217 发表于 2023-4-22 18:14
老师我和你一样linux门外汉,也找不到在windows平台下的任何前人的经验可以借鉴。想请教老师为什么你可以做 ...

这个cpu的双路是40核心80线程。当总线程数超过64的时候 win10就会出问题。无法调用第二个cpu。 但是关掉超线程 就只剩下40核心40线程 这时候大概率就可以正常调用了。

3

帖子

0

威望

115

eV
积分
118

Level 2 能力者

33#
发表于 Post on 2023-4-22 18:14:34 | 只看该作者 Only view this author
老师我和你一样linux门外汉,也找不到在windows平台下的任何前人的经验可以借鉴。想请教老师为什么你可以做到用%nproc指定44核全部调用呢?我是双E3 2673V4共40核,用%nproc无论怎么输核数运行G16以后都只有20个核在跑(另一个CPU在睡觉),尝试%cpu命令直接报错。跪求指教呜呜呜。

7

帖子

0

威望

37

eV
积分
44

Level 2 能力者

32#
发表于 Post on 2022-8-4 15:43:31 | 只看该作者 Only view this author
lanthanum 发表于 2022-7-27 23:25
谢谢,那第2个问题,您能看一下吗?

我是至强双路72核192G,新机器最开始3个月没问题,双路能跑满。 但是3个月后有一天脑抽做CPU和内存压力测试,跑到机器蓝屏,重启后就也只能用到50%了。两路CPU都是好的,内存换了也都没问题,但是跑任务的时候只有一路cpu 工作,跑动力学 量化这样不同的工作,也是只有一路工作。有时是这路,有时是那路,我也不清楚是为啥,不过任务能跑,就懒得折腾了。

76

帖子

0

威望

3838

eV
积分
3914

Level 5 (御坂)

31#
发表于 Post on 2022-7-27 23:25:31 | 只看该作者 Only view this author
guoruo 发表于 2022-7-21 14:22
http://memory.dataram.com/products-and-services/software/ramdisk
这是一个小工具哈,128G内存以上的 ...

谢谢,那第2个问题,您能看一下吗?

7

帖子

0

威望

37

eV
积分
44

Level 2 能力者

30#
发表于 Post on 2022-7-21 14:22:35 | 只看该作者 Only view this author
lanthanum 发表于 2022-7-19 19:49
请问楼主,
(1)用RAMdisk 用内存虚拟成一个盘符,这个是一个软件,还是启动时的一条命令?
(2)我用26 ...

http://memory.dataram.com/products-and-services/software/ramdisk
这是一个小工具哈,128G内存以上的话可以用这个,速度挺快的。

76

帖子

0

威望

3838

eV
积分
3914

Level 5 (御坂)

29#
发表于 Post on 2022-7-19 19:49:22 | 只看该作者 Only view this author
请问楼主,
(1)用RAMdisk 用内存虚拟成一个盘符,这个是一个软件,还是启动时的一条命令?
(2)我用2696v3双路,win10 pro或workstation版,g16w_64位版,无论%nprocs=多少,都只有一个cpu在工作,另一个cpu闲着,就是说cpu占用率最多到50%,这个您怎么解决的?我看您图里cpu占用率是80-90%吧。

174

帖子

0

威望

5199

eV
积分
5373

Level 6 (一方通行)

28#
发表于 Post on 2022-1-5 09:28:25 | 只看该作者 Only view this author
有人试过这东西(Microsoft HPC Pack 2019)吗?
https://docs.microsoft.com/en-us ... rview?view=hpc19-ps

1万

帖子

0

威望

9001

eV
积分
20757

Level 6 (一方通行)

27#
发表于 Post on 2022-1-4 16:27:52 | 只看该作者 Only view this author
本帖最后由 wzkchem5 于 2022-1-4 09:28 编辑
mfdsrax2 发表于 2022-1-4 02:25
这么厉害,可以直接打开INP和OUT文件吗?

可以,诸如画轨道图之类的都可以做。在orca论坛的下载区可以下载到
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?hl=zh-CN&user=XW6C6eQAAAAJ&view_op=list_works&sortby=pubdate
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1034/1702.htm
本团队长期招收研究生,有意者可私信联系

6万

帖子

99

威望

5万

eV
积分
120165

管理员

公社社长

26#
发表于 Post on 2022-1-4 09:49:18 | 只看该作者 Only view this author
mfdsrax2 发表于 2022-1-3 19:08
主要是没有ORCAView

如果有gview,看ORCA的优化曲线、振动分析结果等,用:
OfakeG:使GaussView能够可视化ORCA输出文件的工具
http://sobereva.com/498http://bbs.keinsci.com/thread-13952-1-1.html

看轨道可以用Multiwfn载入ORCA的molden文件
使用Multiwfn观看分子轨道
http://sobereva.com/269http://bbs.keinsci.com/thread-462-1-1.html

Multiwfn也可以直接打开ORCA的输入和输出文件进主功能0看结构,也可以直接产生ORCA输入文件
详谈Multiwfn产生ORCA量子化学程序的输入文件的功能
http://sobereva.com/490http://bbs.keinsci.com/thread-13560-1-1.html
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-16 18:19 , Processed in 0.239749 second(s), 31 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list