计算化学公社

 找回密码 Forget password
 注册 Register
Views: 429|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] 请问在计算SOC的时候总是显示OUT OF MOMORY该怎么办?

[复制链接 Copy URL]

1

帖子

0

威望

19

eV
积分
20

Level 1 能力者

跳转到指定楼层 Go to specific reply
楼主
老师们好,我想要计算一个230个原子体系的S与T之间的SOC。但是每次进行TD-DFT计算的时候都会显示ORCA finished by error termination in CIS,并且提示OUT OF MEMORY 。
看了之前有类似问题的帖子,根据老师的解决办法尝试减小核数并增大内存。现在使用的是 %maxcore 80000 ,%pal nprocs  4 end可是还是会提示OUT OF MEMORY难道80个
G还是太小吗?.out文件里报错的地方明明提示了Memory needed 只有8767 MB,80000MB怎么会不够呢?
不知道该怎么办了,希望大家帮助一下。下面是.inp文件与.out文件报错的地方:
.inp文件:
NAME = 2.inp
|  1> ! B3LYP/G TZVP RIJCOSX tightSCF miniprint  
|  2> %maxcore 80000
|  3> %pal nprocs  4 end
|  4> %tddft
|  5> nroots 8
|  6> dosoc true
|  7> TDA false
|  8> printlevel 3
|  9> end
| 10> * xyz   0   1
|原子坐标省略
|247>  *
|248>


.out文件:
                       ****Iteration    0****

Building the sigma vectors                     ...
   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   365 MB
   Memory needed                 ...  8767 MB
   Memory available              ... 80000 MB
   Number of vectors per batch   ...   219
   Number of batches             ...     1
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 2 with PID 58292 on node a03r04n05 exited on signal 9 (Killed).
--------------------------------------------------------------------------

ORCA finished by error termination in CIS
Calling Command: mpirun -np 4  /work/home/ysuanap31/yeesuan/software/orca_5_0_3_linux_x86-64_shared_openmpi411/orca_cis_mpi 2.cisinp.tmp 2
[file orca_tools/qcmsg.cpp, line 465]:
  .... aborting the run
[file orca_tools/qcmsg.cpp, line 465]:
  .... aborting the run
slurmstepd: error: Detected 22 oom-kill event(s) in StepId=7173252.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.



2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2024-4-24 15:14:45 | 只看该作者 Only view this author
Paste the slurm script here.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

1万

帖子

0

威望

7396

eV
积分
18149

Level 6 (一方通行)

3#
发表于 Post on 2024-4-24 15:44:09 | 只看该作者 Only view this author
maxcore不仅需要大于计算所需的内存,还要小于总物理内存除以nprocs。注意是物理内存而非虚拟内存,而且要除以nprocs。
如果不满足前者,相当于计算需要很多内存,但你不让程序分配那么多内存,因此算不了;如果不满足后者,等于是你告诉程序可以分配很多内存给自己用,但是实际上机器没有那么多内存,所以在程序试图分配内存的时候会报错。
你估计是只考虑了前者而没考虑后者,建议看一下你的机器的物理内存有多少,除以4后是否大于80000MB。
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 20:49 , Processed in 0.301707 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list