计算化学公社

 找回密码 Forget password
 注册 Register
Views: 28058|回复 Reply: 25
打印 Print 上一主题 Last thread 下一主题 Next thread

[VASP] 求助:VASP意外停止

[复制链接 Copy URL]

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

采用社长的方法编译了vasp5.4.4(http://bbs.keinsci.com/thread-11812-1-1.html),大多数任务都在运行12个小时内意外停止,无报错而且任务显示仍在运行,只是OUTCAR不再更新了,少数任务能运行超过24小时,但是最终也会发生同样的问题而停止。

因为没有报错,而且停止的时间很随机,所以完全不清楚问题在哪儿,有哪位大神能帮帮忙吗?

课题组自己的机群。。。

59

帖子

0

威望

3661

eV
积分
3720

Level 5 (御坂)

2#
发表于 Post on 2019-9-5 09:12:06 | 只看该作者 Only view this author
是否体系太大,内存不足。

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2019-9-5 09:15:15 | 只看该作者 Only view this author
ntrip 发表于 2019-9-5 09:12
是否体系太大,内存不足。

体系是很大,200个原子左右含过渡金属原子,但是使用了8个节点共160个核,每个节点有64g内存。。。脚本文件没单独请求内存,与这个有关吗?

48

帖子

0

威望

1395

eV
积分
1443

Level 4 (黑子)

4#
发表于 Post on 2019-9-5 09:40:22 | 只看该作者 Only view this author
内存64g太少了

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2019-9-5 09:42:36 | 只看该作者 Only view this author

所以其实请求了多个节点,获得的内存不是8*64=512g?只是64g?

48

帖子

0

威望

1395

eV
积分
1443

Level 4 (黑子)

6#
发表于 Post on 2019-9-5 10:06:17 | 只看该作者 Only view this author

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

7#
 楼主 Author| 发表于 Post on 2019-9-5 10:12:05 | 只看该作者 Only view this author
KevinLee 发表于 2019-9-5 10:06
VASP是吃内存带宽的,http://blog.wangruixing.cn/2019/08/19/vasp-memory/

有解决办法吗?

48

帖子

0

威望

1395

eV
积分
1443

Level 4 (黑子)

8#
发表于 Post on 2019-9-5 10:13:54 | 只看该作者 Only view this author
通俗的讲就是把你们集群的内存槽插满

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2019-9-5 11:50:22 | 只看该作者 Only view this author
KevinLee 发表于 2019-9-5 10:13
通俗的讲就是把你们集群的内存槽插满

好吧,不过这个方法不是优先考虑的选项啊,最好是软件层面解决问题,您知道这方面的信息吗?

48

帖子

0

威望

1395

eV
积分
1443

Level 4 (黑子)

10#
发表于 Post on 2019-9-5 13:58:30 | 只看该作者 Only view this author
那就少占用cpu核心数,软件不会解决的

36

帖子

0

威望

1892

eV
积分
1928

Level 5 (御坂)

11#
发表于 Post on 2019-9-5 15:44:04 | 只看该作者 Only view this author
本帖最后由 fallleave 于 2019-9-5 15:45 编辑

我安装的VASP也有这个现象。也不知道怎么解决,目前的方案就是,copy CONTCAR POSCAR,然后重新运行。

22

帖子

0

威望

179

eV
积分
201

Level 3 能力者

12#
发表于 Post on 2019-9-5 23:39:45 | 只看该作者 Only view this author
我也遇到过这种情况,可以确定不是内存的问题。

36

帖子

0

威望

1892

eV
积分
1928

Level 5 (御坂)

13#
发表于 Post on 2019-9-6 12:05:02 | 只看该作者 Only view this author
搞理论的 发表于 2019-9-5 23:39
我也遇到过这种情况,可以确定不是内存的问题。

能问问后来怎么解决的吗?

22

帖子

0

威望

179

eV
积分
201

Level 3 能力者

14#
发表于 Post on 2019-9-9 20:18:56 | 只看该作者 Only view this author
fallleave 发表于 2019-9-6 12:05
能问问后来怎么解决的吗?

没找到有效方法,修改了一些参数,继续跑

60

帖子

0

威望

867

eV
积分
927

Level 4 (黑子)

15#
 楼主 Author| 发表于 Post on 2019-9-10 18:46:41 | 只看该作者 Only view this author
问题已解决,找的专业的机群维护工程师,可惜当时不在,所以并不清楚怎么修好的。。。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 21:25 , Processed in 0.308780 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list