计算化学公社

标题: r2SCAN-3c的RIJ加速要额外写加速项的关键词和辅助基团吗? [打印本页]

作者
Author:
Oliviaw    时间: 2024-1-24 11:42
标题: r2SCAN-3c的RIJ加速要额外写加速项的关键词和辅助基团吗?
我正在尝试高斯和orca联用,想用r2SCAN-3c 方法,同时用RIJ加速
我在orca.sh里面的相关设置是:level="r2SCAN-3c RIJ",这样写是不是不对?要不要去掉RIJ,会不会自动调用RIJ,我写的关键词是不是错了?要不要加def2/J辅助基团?

我不确定任务失败的原因是不是我设置的加速项的问题,我运行后.err里面显示如下:

[file orca_main/maininp4.cpp, line 11068]:

forrtl: No such file or directory
forrtl: severe (29): file not found, unit 10, file /data/home/grp-chenggj/wangjiaxin/orca_g16_test/mol.engrad
Image              PC                Routine            Line        Source            
extorca            00000000004076FB  Unknown               Unknown  Unknown
extorca            0000000000416EE0  Unknown               Unknown  Unknown
extorca            0000000000404435  Unknown               Unknown  Unknown
extorca            0000000000404262  Unknown               Unknown  Unknown
libc-2.17.so       00002B3589208555  __libc_start_main     Unknown  Unknown
extorca            0000000000404169  Unknown               Unknown  Unknown
mv: cannot stat ‘mol.gbw’: No such file or directory
mv: cannot stat ‘tmp.gbw’: No such file or directory
作者
Author:
ionexchangeC    时间: 2024-1-24 14:08
没有RIJ关键词,可以写RI,也可以什么都不写
作者
Author:
wzkchem5    时间: 2024-1-24 20:44
不要只看err文件,也看orca的主输出文件,看最后有没有报错信息,由报错信息分析报错原因
作者
Author:
sobereva    时间: 2024-1-25 04:42
r2SCAN-3c默认就会用RIJ加速,不用特意写
作者
Author:
Oliviaw    时间: 2024-1-25 11:22
ionexchangeC 发表于 2024-1-24 14:08
没有RIJ关键词,可以写RI,也可以什么都不写

我后来没有写加速项,重新装了openmpi 4.1.1,但是跑了半天,但是.out文件都只有73K。
.err文件显示:mca_base_component_repository_open: unable to open mca_btl_openib: libosmcomp.so.3: cannot open shared object file: No such file or directory (ignored)

作者
Author:
Oliviaw    时间: 2024-1-25 11:25
wzkchem5 发表于 2024-1-24 20:44
不要只看err文件,也看orca的主输出文件,看最后有没有报错信息,由报错信息分析报错原因

我看.out文件跑了半天都只有73k,觉得有问题,就主动终止了。
.out文件显示如下:

Generating mol.inp
Running ORCA...
ORCA running finished!
Extracting data from ORCA outputs via extderi
     6   0   0   F    T  2.27D+00 0.07155572 0.01449686 0.21513510 0.03728469-8099.2093505 ----
Generating mol.inp
Running ORCA...
作者
Author:
Oliviaw    时间: 2024-1-25 11:26
sobereva 发表于 2024-1-25 04:42
r2SCAN-3c默认就会用RIJ加速,不用特意写

那要不要加辅助基组呢?
作者
Author:
Oliviaw    时间: 2024-1-25 11:40
本帖最后由 Oliviaw 于 2024-2-29 10:05 编辑

这是.out文件。
能帮忙看下是哪里出错了吗?
作者
Author:
ionexchangeC    时间: 2024-1-25 12:59
orca的路径都写对了吗?检查一下
作者
Author:
sobereva    时间: 2024-1-26 03:08
Oliviaw 发表于 2024-1-25 11:26
那要不要加辅助基组呢?

自动用合适的辅助基组
作者
Author:
wzkchem5    时间: 2024-1-26 17:54
Oliviaw 发表于 2024-1-25 04:40
这是.out文件。
能帮忙看下是哪里出错了吗?

我说的是orca的输出,不是orca-高斯联用脚本的输出
作者
Author:
Oliviaw    时间: 2024-1-26 18:16
下面是mol.out的结尾,不知道这个是不是orca的输出

WARN  object 0x2e8a380 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.476982] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8a540 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.476989] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8a700 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.476996] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8a8c0 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.477003] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8ac40 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.477010] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8ae00 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
[1706085224.477017] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8afc0 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests


-------------------------------------------------------------------------------
                          DFT DISPERSION CORRECTION                           
                                                                              
                                 DFTD4 V2.5                                    
-------------------------------------------------------------------------------
The R2SCAN3C composite method is recognized
Using three-body term ABC
Active option DFTDOPT                   ...         5   

Starting D4
-------------------------   ----------------
Dispersion correction           -0.261717688
-------------------------   ----------------

------------------   -----------------
gCP correction             0.078058857
------------------   -----------------

-------------------------   --------------------
FINAL SINGLE POINT ENERGY     -8099.356652697523
-------------------------   --------------------



           ************************************************************
           *        Program running with 20 parallel MPI-processes    *
           *              working on a common directory               *
           ************************************************************
------------------------------------------------------------------------------
                         ORCA SCF GRADIENT CALCULATION
------------------------------------------------------------------------------


作者
Author:
Oliviaw    时间: 2024-1-26 19:34
ionexchangeC 发表于 2024-1-25 12:59
orca的路径都写对了吗?检查一下

orca是可以单独正常运行的,路径没有错
作者
Author:
Oliviaw    时间: 2024-1-26 19:37
sobereva 发表于 2024-1-26 03:08
自动用合适的辅助基组

谢谢社长,试过了,但是没有正常结束,而且生成的mol.out, stdout.out很小,不知道哪里出问题了
作者
Author:
sobereva    时间: 2024-1-27 04:01
Oliviaw 发表于 2024-1-26 19:37
谢谢社长,试过了,但是没有正常结束,而且生成的mol.out, stdout.out很小,不知道哪里出问题了

这种描述没有丝毫意义
哪能不看文件内容光说文件大小的,难道得让别人猜文件内容?
作者
Author:
Oliviaw    时间: 2024-1-27 20:54
本帖最后由 Oliviaw 于 2024-2-29 10:06 编辑

不好意思,之前一直上传不成功,麻烦请看附件。
其中显示:[1706085224.477017] [h025:138619:0]           mpool.c:55   UCX  WARN  object 0x2e8afc0 {{cpml|cb|snd_tag|rk_use} send length 237568 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests
但是最后有显示能量。不知道是哪里不对?

作者
Author:
Oliviaw    时间: 2024-1-27 23:28
sobereva 发表于 2024-1-27 04:01
这种描述没有丝毫意义
哪能不看文件内容光说文件大小的,难道得让别人猜文件内容?

社长,我在同个帖子的上一层回复里添加了附件,可以麻烦看一下吗?
作者
Author:
sobereva    时间: 2024-1-28 02:50
Oliviaw 发表于 2024-1-27 23:28
社长,我在同个帖子的上一层回复里添加了附件,可以麻烦看一下吗?

可能MPI并行不正常。串行计算再试,或者先跑个其它小任务测试以确保当前运行环境下ORCA能正常并行
作者
Author:
Oliviaw    时间: 2024-1-29 13:16
sobereva 发表于 2024-1-28 02:50
可能MPI并行不正常。串行计算再试,或者先跑个其它小任务测试以确保当前运行环境下ORCA能正常并行

单独的ORCA是可以正常运行的。
ORCA和gaussian 16联用的时候用的20个核,我这一个CPU有20个核,一个节点2个CPU。
如果我把任务设定20个核,而且任务在运行的时候在一个节点下面,计算机是会用一个CPU的20核,还是一个节点下,2个CUP都参与运算呢?
作者
Author:
sobereva    时间: 2024-1-30 03:47
Oliviaw 发表于 2024-1-29 13:16
单独的ORCA是可以正常运行的。
ORCA和gaussian 16联用的时候用的20个核,我这一个CPU有20个核,一个节点 ...

说清楚对什么设置的核数
如果节点内CPU总物理核心数是40,Gaussian任务应当设单核,调用ORCA做计算用40核

哪些核参与运算,参考下文
通过设置CPU内核绑定降低ORCA同时做多任务的耗时
http://sobereva.com/553http://bbs.keinsci.com/thread-17751-1-1.html


作者
Author:
Oliviaw    时间: 2024-1-30 14:02
sobereva 发表于 2024-1-30 03:47
说清楚对什么设置的核数
如果节点内CPU总物理核心数是40,Gaussian任务应当设单核,调用ORCA做计算用40 ...

现在按社长说的设置了,但是不知道提交gaussian的任务的.lsf脚本应该设置1核,还是40核,还是41核?
作者
Author:
Oliviaw    时间: 2024-1-30 14:47
本帖最后由 Oliviaw 于 2024-2-29 10:06 编辑

1)我设置了gaussian 任务 1 个核,orca任务30个核(只有30几核的空位)。提交高斯任务的.lsf脚本中设置的核数是30核。
2)我设置了gaussian 任务 1 个核,orca任务15个核(只有十几核的空位)。提交高斯任务的.lsf脚本中设置的是16核。

这两种情况生成的mol.out文件有几行显示如下:
06596282.962468] [h026:125009:0]           mpool.c:55   UCX  WARN  object 0x3113400 {{cpml|cb|snd_tag|rk_use} send length 1780736 ucp_proto_progress_tag_rndv_rts() comp:mca_pml_ucx_send_completion()host memory} was not returned to mpool ucp_requests

这个显示的语句跟此贴的16楼的回复的内容一样。

请问社长这该怎么办?
作者
Author:
Oliviaw    时间: 2024-1-30 14:48
sobereva 发表于 2024-1-30 03:47
说清楚对什么设置的核数
如果节点内CPU总物理核心数是40,Gaussian任务应当设单核,调用ORCA做计算用40 ...

社长,我在22楼回复您了,麻烦您看一下。
作者
Author:
sobereva    时间: 2024-1-31 01:45
Oliviaw 发表于 2024-1-30 14:48
社长,我在22楼回复您了,麻烦您看一下。

lsf脚本的事我不清楚,没法回答
我只能回答在本机上常规方式提交任务的情况的问题
作者
Author:
Oliviaw    时间: 2024-1-31 20:27
您好,在Xshell上提交任务的时候,您说的常规方法会指定节点,指定核数吗?
如果要指定,那就确定提交任务的核数是gaussian任务.gjf文件里面的1核,还是orca和高斯联用的orca.sh里面的40核,还是1核+40核。

以下是我用到提交任务的脚本,能麻烦社长看下是哪里有问题吗?
作者
Author:
Oliviaw    时间: 2024-1-31 20:28
sobereva 发表于 2024-1-31 01:45
lsf脚本的事我不清楚,没法回答
我只能回答在本机上常规方式提交任务的情况的问题

社长,我在25楼回复您了,麻烦方便的时候看一下。
作者
Author:
sobereva    时间: 2024-2-1 02:57
Oliviaw 发表于 2024-1-31 20:27
您好,在Xshell上提交任务的时候,您说的常规方法会指定节点,指定核数吗?
如果要指定,那就确定提交任务 ...

我说的常规运行是指直接在本机用诸如g16 < test.gjf |tee test.out方式的情况,不牵扯任何lsf之类的东西
作者
Author:
sailing0512    时间: 2024-9-6 16:54
Oliviaw 发表于 2024-1-25 11:22
我后来没有写加速项,重新装了openmpi 4.1.1,但是跑了半天,但是.out文件都只有73K。
.err文件显示:mc ...

您好我想问一下您这个问题解决了吗,我安装了orca6.0.0和open4.1.6,进行水分子测试orca是否能正常工作时,.err文件一直显示这句话,不知道这个对最终的计算结果是否有影响
作者
Author:
Oliviaw    时间: 2024-9-20 20:00
sailing0512 发表于 2024-9-6 16:54
您好我想问一下您这个问题解决了吗,我安装了orca6.0.0和open4.1.6,进行水分子测试orca是否能正常工作时 ...

如果你只是问orca单独运行的问题,只要openmpi版本是orca官方要求的版本,应该就没有问题。如果版本没有问题,那就尝试用脚本提交任务。如果是在终端提交任务,关闭窗口任务就会停止,没法后台运行。我不知道你是什么问题。一般orca单独运行就这两个问题。
作者
Author:
sailing0512    时间: 2024-9-23 22:51
Oliviaw 发表于 2024-9-20 20:00
如果你只是问orca单独运行的问题,只要openmpi版本是orca官方要求的版本,应该就没有问题。如果版本没有 ...

好的好的,十分感谢,我是用学校的超算平台,通过sbatch提交任务,提交任务后会生成.err和.log文件,不过每次提交完任务运算完成后,orca生成的.out文件说是正常运算完成,但是超算平台上生成的.err文件中这句话"[c02n06:736224] mca_base_component_repository_open: unable to open mca_btl_openib: libosmcomp.so.3: cannot open shared object file: No such file or directory (ignored)"一直在重复,不知道会不会影响计算结果。
作者
Author:
Oliviaw    时间: 2024-9-24 20:40
sailing0512 发表于 2024-9-23 22:51
好的好的,十分感谢,我是用学校的超算平台,通过sbatch提交任务,提交任务后会生成.err和.log文件,不过 ...

.err有报错没有关系,只要.out是normal termination




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3