计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4735|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] ORCA计算freq 并行问题和续算问题

[复制链接 Copy URL]

38

帖子

0

威望

435

eV
积分
473

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 是aweia 于 2022-2-23 14:17 编辑

我最近在计算freq
计算用到的输入如下:
! B3LYP 6-31G  freq
%maxcore 10000
%pal
   nprocs 64
end
%tddft
nroots 5
IROOT 1
end
* xyz 0 1

...
在计算Calculating on displaced geometry时并行计算出现问题
发现问题时计算已经进行了五天左右,我发现计算的速度慢了下来,于是我ssh到对应的计算节点使用top命令查看计算情况
计算共用到两个节点各32核心,
其中一个节点的top显示已经没有ORCA的任务在计算,

   PID      USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND      
17576     root      20   0 3232784  49776  14444 S   6.2  0.0 366:40.09 containerd   
33046     root      20   0       0      0      0 S   6.2  0.0   1594:08 krdma_evthd/0
104873   gc09  20   0  160936   2780   1456 R   6.2  0.0   0:00.03 top          
     1       root      20   0   54320   6404   2536 S   0.0  0.0  30:54.70 systemd      
     2       root      20   0       0      0      0 S   0.0  0.0   0:04.34 kthreadd     
     3       root      20   0       0      0      0 S   0.0  0.0   2:39.03 ksoftirqd/0  
     5       root       0 -20       0      0      0 S   0.0  0.0   0:00.00 kworker/0:0H
另一个节点只有一个orca_cis在计算
55632    gc09  20   0 1004676 427644   9868 R 100.0  0.2  18:10.51 orca_cis     
68401     gc09  20   0  162680   2520   1456 R    6.2    0.0    0:00.03 top         
     1 root      20   0   54160   5900   2120 S   0.0  0.0  32:43.48 systemd      
     2 root      20   0       0      0      0 S   0.0  0.0   0:05.50 kthreadd     
     3 root      20   0       0      0      0 S   0.0  0.0   3:11.20 ksoftirqd/0  
     5 root       0 -20       0      0      0 S   0.0  0.0   0:00.09 kworker/0:0H


作为比较,我所有输入输出复制到新目录下重新提交,在计算Calculating on displaced geometry时查看计算节点的状态如下:其中共25个orca任务在进行(但是一共有32个核心)
  5806 gc09  20   0 1004824 419700   1596 R 100.0  0.2  20:49.31 orca_cis      
  5813 gc09  20   0 1004872 419316   1704 R 100.0  0.2  20:49.44 orca_cis      
  9530 gc09  20   0 1004856 423004   1576 R 100.0  0.2  15:31.23 orca_cis      
  9605 gc09  20   0 1004856 419728   1716 R 100.0  0.2  15:17.06 orca_cis      
13383 gc09  20   0 1428864 847104   1452 R 100.0  0.3   9:28.46 orca_cis      
16118 gc09  20   0 1428904 847536   1772 R 100.0  0.3   5:35.91 orca_cis      
16212 gc09  20   0 1428912 844056   2084 R 100.0  0.3   5:24.96 orca_cis      
16282 gc09  20   0 1428940 844628   2468 R 100.0  0.3   5:06.13 orca_cis      
16687 gc09  20   0 1428936 847768   2636 R 100.0  0.3   4:43.07 orca_cis      
16906 gc09  20   0 1428944 847472   3196 R 100.0  0.3   3:55.54 orca_cis      
17875 gc09  20   0 1428940 845164   3620 R 100.0  0.3   3:29.25 orca_cis      
  5818 gc09  20   0 1004844 419180   1716 R  94.1  0.2  20:46.84 orca_cis      
  9155 gc09  20   0 1004848 423204   1576 R  94.1  0.2  15:41.00 orca_cis      
  9388 gc09  20   0 1004872 422660   1596 R  94.1  0.2  15:38.90 orca_cis      
12992 gc09  20   0 1428932 847220   1508 R  94.1  0.3   9:49.19 orca_cis      
13016 gc09  20   0 1428916 843012   1304 R  94.1  0.3   9:46.43 orca_cis      
16077 gc09  20   0 1428924 844128   1864 R  94.1  0.3   5:41.70 orca_cis      
16116 gc09  20   0 1428944 847224   1680 R  94.1  0.3   5:35.83 orca_cis      
16162 gc09  20   0 1428920 844212   1980 R  94.1  0.3   5:30.26 orca_cis      
16170 gc09  20   0 1428912 846492   2080 R  94.1  0.3   5:29.72 orca_cis      
16283 gc09  20   0 1428952 844208   2476 R  94.1  0.3   5:05.92 orca_cis      
16453 gc09  20   0 1428924 847484   2528 R  94.1  0.3   4:52.64 orca_cis      
16697 gc09  20   0 1428920 844700   2632 R  94.1  0.3   4:41.73 orca_cis      
16817 gc09  20   0 1428916 844812   2904 R  94.1  0.3   4:15.73 orca_cis      
17472 gc09  20   0 1428852 845056   3284 R  94.1  0.3   3:51.46 orca_cis       
20672 zdwlgc09  20   0  162812   2780   1456 R  11.8  0.0   0:00.04 top            
33373 root      20   0       0      0      0 S   5.9  0.0   2:09.18 fence_topo_relo
     1 root      20   0   54048   6224   2536 S   0.0  0.0  24:31.18 systemd        

我想了解一下出现这个情况的原因是什么  是否是我的作业提交方式或输入文件有问题,或者是这个服务器的问题?


我现在把所有输入输出复制到新目录下并在.inp中加入
%freq
Restart true
end
重新提交计算 这样是正确的续算方式么





4114

帖子

4

威望

8875

eV
积分
13069

Level 6 (一方通行)

MOKIT开发者

2#
发表于 Post on 2022-2-23 11:15:03 | 只看该作者 Only view this author
老铁,6-31G做实际计算没啥用啊,算freq就更不用考虑了。看Sob老师博文《谈谈量子化学中基组的选择》http://sobereva.com/336
自动做多参考态计算的程序MOKIT

38

帖子

0

威望

435

eV
积分
473

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2022-2-23 12:13:30 | 只看该作者 Only view this author
zjxitcc 发表于 2022-2-23 11:15
老铁,6-31G做实际计算没啥用啊,算freq就更不用考虑了。看Sob老师博文《谈谈量子化学中基组的选择》http:/ ...

您好 我有读过sob老师的这个文章 在很多地方也见过老师有类似的说法 但是我导喜欢用这个 我无法反驳

4114

帖子

4

威望

8875

eV
积分
13069

Level 6 (一方通行)

MOKIT开发者

4#
发表于 Post on 2022-2-23 13:10:20 | 只看该作者 Only view this author
本帖最后由 zjxitcc 于 2022-2-23 13:12 编辑
是aweia 发表于 2022-2-23 12:13
您好 我有读过sob老师的这个文章 在很多地方也见过老师有类似的说法 但是我导喜欢用这个 我无法反驳:shut ...

做实际应用型计算,不能用这基组。万一碰到计算类别审稿人,大概率拒稿;即使不拒稿,以后也容易被人拿出来当反例教材。不值当。
自动做多参考态计算的程序MOKIT

2407

帖子

1

威望

5960

eV
积分
8387

Level 6 (一方通行)

5#
发表于 Post on 2022-2-23 13:32:11 | 只看该作者 Only view this author
本帖最后由 abin 于 2022-2-23 14:17 编辑

看描述,用到了两个节点。
那么问题是,
这套集群或者平台,
采用什么I/O设备?
采用什么网络设备?

盲目使用太多核心,和采用128核心,跑g09一样糟糕。

ORCA做计算, I/O需求很高的.
我也跑ORCA/TD/freq计算, 某一个节点, 2周内, 读写高达36.5 TiB.
这套机器就我在用, 所以还凑合了.

如果你的机器是公用的, I/O或者网络不行, 那么很多时候, 程序都是在等待I/O, 出现你描述的情形, 是很“正常”的.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

38

帖子

0

威望

435

eV
积分
473

Level 3 能力者

6#
 楼主 Author| 发表于 Post on 2022-2-23 14:15:20 | 只看该作者 Only view this author
zjxitcc 发表于 2022-2-23 13:10
做实际应用型计算,不能用这基组。万一碰到计算类别审稿人,大概率拒稿;即使不拒稿,以后也容易被人拿出 ...

嗯嗯 好的 我也怕到时候出现这样的问题   我和老师请教一下吧 看他怎么说 谢谢您的建议

1万

帖子

0

威望

9004

eV
积分
20764

Level 6 (一方通行)

7#
发表于 Post on 2022-2-23 16:29:27 | 只看该作者 Only view this author
是aweia 发表于 2022-2-23 05:13
您好 我有读过sob老师的这个文章 在很多地方也见过老师有类似的说法 但是我导喜欢用这个 我无法反驳:shut ...

你有没有和你导师确认过,你导师要用的就是6-31G本身,而不是6-31G*、6-31G**?
有的人口头上喜欢用6-31G泛指所有6-31G系列的基组,比如6-31G*,6-31+G*等等,就好比很多人喜欢把CCSD(T)叫做CCSDT而不把括号说出来一样。这种情况下你按你导师字面意思理解就理解错了。
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?hl=zh-CN&user=XW6C6eQAAAAJ&view_op=list_works&sortby=pubdate
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1034/1702.htm
本团队长期招收研究生,有意者可私信联系

38

帖子

0

威望

435

eV
积分
473

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2022-2-23 20:32:43 | 只看该作者 Only view this author
wzkchem5 发表于 2022-2-23 16:29
你有没有和你导师确认过,你导师要用的就是6-31G本身,而不是6-31G*、6-31G**?
有的人口头上喜欢用6-31 ...

对 有可能是我的理解有问题

38

帖子

0

威望

435

eV
积分
473

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2022-2-23 21:11:59 | 只看该作者 Only view this author
abin 发表于 2022-2-23 13:32
看描述,用到了两个节点。
那么问题是,
这套集群或者平台,

嗯嗯 好的 谢谢您的帮助  我下午去了解了一下 也没搞清楚这个的I/O和网络是什么设备  不过很可能是您说的情况 非常感谢

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-18 02:16 , Processed in 0.159229 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list