计算化学公社

 找回密码 Forget password
 注册 Register
Views: 8136|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[GAMESS-US] gamess在服务器胖节点上运行时出错

[复制链接 Copy URL]

14

帖子

0

威望

142

eV
积分
156

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 m494081672 于 2020-4-9 00:42 编辑

我按照http://sobereva.com/193的方法在服务器上安装和编译了gamess,在24核的节点上可以进行计算任务。
要利用gamess对一个100多个原子的配合物进行能量分解,觉得可能比较慢,我就想用学校超算平台的胖节点(每个节点80核,384G内存)来计算可能更快一些。但是我每次提交任务之后,刚开始就停止,不知道是什么原因,是gamess对NCPUS有数量限制吗?还是我的rungms设置或输入文件设置有什么问题?请大家帮忙解答,谢谢。

输入和输出文件的内容分别如下:

输入文件:
  1. $CONTRL RUNTYP=eda SCFTYP=RHF dfttyp=b3lyp ICHARG=0 MULT=1 $end
  2. $CONTRL maxit=200 nosym=1 PP=READ UNITS=BOHR $end
  3. $LMOEDA MATOM(1)=4 101  MCHARG(1)=0 0 MMULT(1)=1 1 $END
  4. $SYSTEM mwords=300 memddi=7000 $END
  5. $scf dirscf=.t. diis=.t. fdiff=.f. $end
  6. $DATA
  7. D-right-re                                                                     
  8. C1       1
  9. (后面省略)
复制代码
输出文件:
  1. ----- GAMESS execution script 'rungms' -----
  2. This job is running on host c69n02
  3. under operating system Linux at Wed Apr 8 15:03:03 CST 2020
  4. Available scratch disk space (Kbyte units) at beginning of the job is
  5. Filesystem        1K-blocks         Used    Available Use% Mounted on
  6. ssd            809999695872 322944090112 487055605760  40% /scratch
  7. GAMESS temporary binary files will be written to /scratch/chen/gamess_sc
  8. GAMESS supplementary output files will be written to /scratch/chen/gamess_sc
  9. Copying input file D-right-CoIII-corr.inp to your run's scratch directory...
  10. cp D-right-CoIII-corr.inp /scratch/chen/gamess_sc/D-right-CoIII-corr.F05
  11. unset echo

  12. Assuming a single but multicore node.

  13. /share/home/chen/gamess-us/gamess/ddikick.x /share/home/chen/gamess-us/gamess/gamess.00.x D-right-CoIII-corr -ddi 1 80 c69n02:cpus=80 -scr /scratch/chen/gamess_sc

  14. Distributed Data Interface kickoff program.
  15. Initiating 80 compute processes on 1 nodes to run the following command:
  16. /share/home/chen/gamess-us/gamess/gamess.00.x D-right-CoIII-corr

  17. DDI Process 17: error code 911
  18. ddikick.x: application process 17 quit unexpectedly.
  19. ddikick.x: Fatal error detected.
  20. The error is most likely to be in the application, so check for
  21. input errors, disk space, memory needs, application bugs, etc.
  22. ddikick.x will now clean up all processes, and exit...
  23. DDI Process 0: terminated upon request.
  24. DDI Process 1: terminated upon request.
  25. DDI Process 2: terminated upon request.
  26. DDI Process 3: terminated upon request.
  27. DDI Process 4: terminated upon request.
  28. DDI Process 5: terminated upon request.
  29. DDI Process 6: terminated upon request.
  30. DDI Process 7: terminated upon request.
  31. DDI Process 8: terminated upon request.
  32. DDI Process 9: terminated upon request.
  33. DDI Process 10: terminated upon request.
  34. DDI Process 11: terminated upon request.
  35. DDI Process 12: terminated upon request.
  36. DDI Process 13: terminated upon request.
  37. DDI Process 14: terminated upon request.
  38. ……(中间省略)
  39. DDI Process 74: terminated upon request.
  40. DDI Process 75: terminated upon request.
  41. DDI Process 76: terminated upon request.
  42. DDI Process 77: terminated upon request.
  43. DDI Process 78: terminated upon request.
  44. DDI Process 79: terminated upon request.
  45. ddikick.x: Sending kill signal to DDI processes.
  46. ddikick.x: Execution terminated due to error(s).
  47. unset echo
  48. ----- accounting info -----
  49. Files used on the master node c69n02 were:
  50. -rw-r--r-- 1 chen chem 73167 Apr  8 15:03 /scratch/chen/gamess_sc/D-right-CoIII-corr.F05
  51. ls: No match.
  52. ls: No match.
  53. ls: No match.
  54. Wed Apr  8 15:03:04 CST 2020
  55. 0.094u 0.057s 0:01.85 7.5%        0+0k 96+0io 0pf+0w

  56. ------------------------------------------------------------
  57. Sender: LSF System <lsfadmin@c69n02>
  58. Subject: Job 1808112: </share/home/chen/gamess-us/gamess/rungms D-right-CoIII-corr.inp 00 80> in cluster <njucluster> Done

  59. Job </share/home/chen/gamess-us/gamess/rungms D-right-CoIII-corr.inp 00 80> was submitted from host <c01n01> by user <chen> in cluster <njucluster> at Wed Apr  8 14:53:06 2020
  60. Job was executed on host(s) <80*c69n02>, in queue <fat_768>, as user <chen> in cluster <njucluster> at Wed Apr  8 15:03:02 2020
  61. </share/home/chen> was used as the home directory.
  62. </share/home/chen/gamess-us/gamess/salen/1> was used as the working directory.
  63. Started at Wed Apr  8 15:03:02 2020
  64. Terminated at Wed Apr  8 15:03:04 2020
  65. Results reported at Wed Apr  8 15:03:04 2020

  66. Your job looked like:

  67. ------------------------------------------------------------
  68. # LSBATCH: User input
  69. /share/home/chen/gamess-us/gamess/rungms D-right-CoIII-corr.inp 00 80
  70. ------------------------------------------------------------

  71. Successfully completed.

  72. Resource usage summary:

  73.     CPU time :                                   0.18 sec.
  74.     Max Memory :                                 -
  75.     Average Memory :                             -
  76.     Total Requested Memory :                     -
  77.     Delta Memory :                               -
  78.     Max Swap :                                   -
  79.     Max Processes :                              -
  80.     Max Threads :                                -
  81.     Run time :                                   3 sec.
  82.     Turnaround time :                            598 sec.

  83. The output (if any) is above this job summary.
复制代码




14

帖子

0

威望

142

eV
积分
156

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2020-4-11 15:59:48 | 只看该作者 Only view this author
zjxitcc 发表于 2020-4-10 13:01
按照预期进展迈入了下一个坑。就是中间某个SCF没收敛,你自己翻一翻输出就知道了。提示:SCF IS UNCONVER ...

学长,我改了一下SCF的设置,这次没有找到SCF IS UNCONVERGED 的提示了,结果也好了一些,但是OWN BASIS SET和ALL BASIS SET相差还是比较大,BSSE不会这么大吧,不知道这次是什么原因?输入输出在附件。谢谢。

right-5-3.log

195.95 KB, 下载次数 Times of downloads: 6

right-5-3.inp

73.18 KB, 下载次数 Times of downloads: 1

4289

帖子

4

威望

9546

eV
积分
13915

Level 6 (一方通行)

MOKIT开发者

6#
发表于 Post on 2020-4-10 13:01:05 | 只看该作者 Only view this author
本帖最后由 zjxitcc 于 2020-4-10 13:03 编辑
m494081672 发表于 2020-4-10 11:43
学长,我重新编译了一下,确实可以算了,但是EDA结果中的OWN BASIS SET和ALL BASIS SET相差很大,哪一个 ...

按照预期进展迈入了下一个坑。就是中间某个SCF没收敛,你自己翻一翻输出就知道了。提示:SCF IS UNCONVERGED。
没有万能的办法,自己对着手册看$SCF下与收敛有关的关键词,试一两个。不行再稍微减小基组,或者换泛函。实在不行也没办法,这是程序问题。
自动做多参考态计算的程序MOKIT

14

帖子

0

威望

142

eV
积分
156

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2020-4-10 11:43:52 | 只看该作者 Only view this author
zjxitcc 发表于 2020-4-9 09:37
这不是显然的么,都告诉你compddi了。。当然改完后是./compddi了(以及mv),这其实是博文中的一步,注意 ...

学长,我重新编译了一下,确实可以算了,但是EDA结果中的OWN BASIS SET和ALL BASIS SET相差很大,哪一个是正确的?是计算过程中出了什么问题吗?
输入文件和输出文件在附件。

right-5.log

206.77 KB, 下载次数 Times of downloads: 3

right-5.inp

73.19 KB, 下载次数 Times of downloads: 2

right-2.log

179.2 KB, 下载次数 Times of downloads: 1

right-2.inp

71.45 KB, 下载次数 Times of downloads: 0

4289

帖子

4

威望

9546

eV
积分
13915

Level 6 (一方通行)

MOKIT开发者

4#
发表于 Post on 2020-4-9 09:37:02 | 只看该作者 Only view this author
m494081672 发表于 2020-4-9 08:41
多谢解答,还有
1、怎么重新编译?
2、如果SCF不收敛,一般有哪些方法可以尝试?3、我的输入文件设置有 ...

这不是显然的么,都告诉你compddi了。。当然改完后是./compddi了(以及mv),这其实是博文中的一步,注意仔细看博文。
第二个问题论坛上很多这样的帖子,自己搜。
第三个问题基本回答不了。输入文件都没给全,赝势写没写对都不知道。
自动做多参考态计算的程序MOKIT

14

帖子

0

威望

142

eV
积分
156

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2020-4-9 08:41:29 | 只看该作者 Only view this author
本帖最后由 m494081672 于 2020-4-9 08:43 编辑
zjxitcc 发表于 2020-4-9 01:07
可能的原因有很多。
一个可能的原因是ddikick.x默认核数最大只有32,超过会报错,得重新编译ddikick.x。在 ...

多谢解答,还有
1、怎么重新编译?
2、如果SCF不收敛,一般有哪些方法可以尝试?3、我的输入文件设置有没有不合适的地方?


4289

帖子

4

威望

9546

eV
积分
13915

Level 6 (一方通行)

MOKIT开发者

2#
发表于 Post on 2020-4-9 01:07:13 | 只看该作者 Only view this author
可能的原因有很多。
一个可能的原因是ddikick.x默认核数最大只有32,超过会报错,得重新编译ddikick.x。在ddi/目录下打开compddi可以打开看到set MAXCPUS=32。
当然,这一关过了后面还有更多头疼的事,可以预测的就是SCF不收敛。。。
自动做多参考态计算的程序MOKIT

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-22 12:17 , Processed in 0.171952 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list