计算化学公社

 找回密码 Forget password
 注册 Register
Views: 8639|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] 求助,使用DLPNO-CCSD(T)计算较大的金属原子团簇卡死的问题

[复制链接 Copy URL]

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 DoorBell 于 2020-5-11 10:04 编辑

如题,金属团簇大约20个Rh,关键词如下:
  1. ! DLPNO-CCSD(T)

  2. %basis
  3.     basis "def2-TZVP"
  4.     AuxC "def2-TZVP/C"
  5.     AuxJ "def2/J"
  6.     AuxJK "def2/JK"
  7. end

  8. %maxCore 32768

  9. %pal
  10.     nProcs 48
  11. end

  12. %output
  13.     XYZFile true
  14. end
复制代码
由于事先读入了Gaussian的同级别收敛HF波函数所以HF计算可以顺利收敛,但计算到此处(即耦合簇迭代开始时)时就会卡住:
  1. ----------------------------------------------------------
  2.                      OPEN-SHELL COUPLED CLUSTER ITERATIONS
  3. ----------------------------------------------------------

  4. Number of PNO amplitudes to be optimized        ...         22546366
  5. Number of canonical amplitudes for strong pairs ...       7781712546
  6. Untruncated number of canonical amplitudes      ...      18702520106

  7. Iter       E(tot)           E(Corr)          Delta-E          Residual     Time
  8.   0
复制代码
具体表现为所有orca_mdci_mpi进程CPU占用均降低至1%以下,进程状态为D且该任务在接下来几天时间里不会再输出任何信息,仅可以看到临时文件修改日期发生变化。


已经调整了并行核数和线程内存限制多次,均会出现此问题,并且检查计算节点(192核,6T内存)无任何报错且该节点可以完成较小分子的DLPNO-CCSD(T)计算。
ORCA为4.2.1,OpenMPI为3.1.3(使用GNU和Intel编译器均已尝试),可否请各位老师看看这是什么问题?非常感谢各位老师!

221

帖子

0

威望

2685

eV
积分
2906

Level 5 (御坂)

2#
发表于 Post on 2020-5-11 14:32:37 | 只看该作者 Only view this author
以前本版讨论过,硬盘的问题。临时文件过大,需配大容量SSD

221

帖子

0

威望

2685

eV
积分
2906

Level 5 (御坂)

3#
发表于 Post on 2020-5-11 14:35:28 | 只看该作者 Only view this author
另外,多大的簇?体系大了,每核32G不一定够哟

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2020-5-11 14:52:21 | 只看该作者 Only view this author
shalene 发表于 2020-5-11 14:35
另外,多大的簇?体系大了,每核32G不一定够哟

大小是20个Rh
测试过16核每核200G内存,依然有问题
另外硬盘的话,还有169T空间可用2333,应该不是这个原因。

221

帖子

0

威望

2685

eV
积分
2906

Level 5 (御坂)

5#
发表于 Post on 2020-5-11 15:11:34 | 只看该作者 Only view this author
给个参考,我60原子纯有机体系,def2tzvp,dlpno-ccsd(t1),临时文件230GB(只是一瞥,肯定比这大)。

你估计下你体系临时文件有多大,硬盘要写多久。

通常并不是硬盘容量不够,是写的速度不够,所以要大容量SSD

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2020-5-11 15:31:14 | 只看该作者 Only view this author
shalene 发表于 2020-5-11 15:11
给个参考,我60原子纯有机体系,def2tzvp,dlpno-ccsd(t1),临时文件230GB(只是一瞥,肯定比这大)。

你 ...

这是超算啊2333
在计算过程中测试硬盘持续写入速度都有3G/s。这个计算的临时文件大约1T,读写速度应该够快啊。
另外就算是需要等待硬盘读写,orca_mdci_mpi的CPU占用不会降到1%以下这么低

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

7#
发表于 Post on 2020-5-11 21:16:27 | 只看该作者 Only view this author
这恐怕是bug吧,方便的话可以传输入文件还有轨道上来我在我机器上跑一下看看

221

帖子

0

威望

2685

eV
积分
2906

Level 5 (御坂)

8#
发表于 Post on 2020-5-12 11:09:28 | 只看该作者 Only view this author
DoorBell 发表于 2020-5-11 15:31
这是超算啊2333
在计算过程中测试硬盘持续写入速度都有3G/s。这个计算的临时文件大约1T,读写速度应该够 ...

临时文件大小变了么?

你说得对,我回去看了下,写硬盘时还有10%左右cpu占用

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2020-5-13 12:56:10 | 只看该作者 Only view this author
本帖最后由 DoorBell 于 2020-5-13 13:02 编辑
biogon 发表于 2020-5-11 21:16
这恐怕是bug吧,方便的话可以传输入文件还有轨道上来我在我机器上跑一下看看

应该不是Bug,在另外一个很老的集群上面反而可以正常计算,就是慢到无法算完,而且有一定几率无故终止。在这个较新的集群上是直接卡住了。。。

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2020-5-13 12:56:59 | 只看该作者 Only view this author
shalene 发表于 2020-5-12 11:09
临时文件大小变了么?

你说得对,我回去看了下,写硬盘时还有10%左右cpu占用

临时文件修改日期有变化,但是整个文件夹的修改日期无变化,说明没有任何新文件产生

186

帖子

0

威望

4092

eV
积分
4278

Level 6 (一方通行)

11#
发表于 Post on 2020-5-13 14:26:43 | 只看该作者 Only view this author
8核足以

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

12#
发表于 Post on 2020-5-13 15:32:03 | 只看该作者 Only view this author
本帖最后由 biogon 于 2020-5-13 15:36 编辑
DoorBell 发表于 2020-5-13 12:56
应该不是Bug,在另外一个很老的集群上面反而可以正常计算,就是慢到无法算完,而且有一定几率无故终止。 ...

慢到算不完这不也是有问题

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

13#
 楼主 Author| 发表于 Post on 2020-5-13 22:31:30 | 只看该作者 Only view this author
biogon 发表于 2020-5-13 15:32
慢到算不完这不也是有问题

问题倒不是算得慢因为集群很老了,主要是有一定几率无故终止。在新集群上是直接卡住那种,不是快慢问题,CPU占用基本都是0

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 20:07 , Processed in 0.183887 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list