计算化学公社

标题: 请问在计算SOC的时候总是显示OUT OF MOMORY该怎么办? [打印本页]

作者
Author:
1298607809    时间: 2024-4-24 14:51
标题: 请问在计算SOC的时候总是显示OUT OF MOMORY该怎么办?
老师们好,我想要计算一个230个原子体系的S与T之间的SOC。但是每次进行TD-DFT计算的时候都会显示ORCA finished by error termination in CIS,并且提示OUT OF MEMORY 。
看了之前有类似问题的帖子,根据老师的解决办法尝试减小核数并增大内存。现在使用的是 %maxcore 80000 ,%pal nprocs  4 end可是还是会提示OUT OF MEMORY难道80个
G还是太小吗?.out文件里报错的地方明明提示了Memory needed 只有8767 MB,80000MB怎么会不够呢?
不知道该怎么办了,希望大家帮助一下。下面是.inp文件与.out文件报错的地方:
.inp文件:
NAME = 2.inp
|  1> ! B3LYP/G TZVP RIJCOSX tightSCF miniprint  
|  2> %maxcore 80000
|  3> %pal nprocs  4 end
|  4> %tddft
|  5> nroots 8
|  6> dosoc true
|  7> TDA false
|  8> printlevel 3
|  9> end
| 10> * xyz   0   1
|原子坐标省略
|247>  *
|248>


.out文件:
                       ****Iteration    0****

Building the sigma vectors                     ...
   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   365 MB
   Memory needed                 ...  8767 MB
   Memory available              ... 80000 MB
   Number of vectors per batch   ...   219
   Number of batches             ...     1
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 2 with PID 58292 on node a03r04n05 exited on signal 9 (Killed).
--------------------------------------------------------------------------

ORCA finished by error termination in CIS
Calling Command: mpirun -np 4  /work/home/ysuanap31/yeesuan/software/orca_5_0_3_linux_x86-64_shared_openmpi411/orca_cis_mpi 2.cisinp.tmp 2
[file orca_tools/qcmsg.cpp, line 465]:
  .... aborting the run
[file orca_tools/qcmsg.cpp, line 465]:
  .... aborting the run
slurmstepd: error: Detected 22 oom-kill event(s) in StepId=7173252.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.




作者
Author:
abin    时间: 2024-4-24 15:14
Paste the slurm script here.
作者
Author:
wzkchem5    时间: 2024-4-24 15:44
maxcore不仅需要大于计算所需的内存,还要小于总物理内存除以nprocs。注意是物理内存而非虚拟内存,而且要除以nprocs。
如果不满足前者,相当于计算需要很多内存,但你不让程序分配那么多内存,因此算不了;如果不满足后者,等于是你告诉程序可以分配很多内存给自己用,但是实际上机器没有那么多内存,所以在程序试图分配内存的时候会报错。
你估计是只考虑了前者而没考虑后者,建议看一下你的机器的物理内存有多少,除以4后是否大于80000MB。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3