计算化学公社

 找回密码 Forget password
 注册 Register
Views: 13239|回复 Reply: 10
打印 Print 上一主题 Last thread 下一主题 Next thread

[Amber] 求助heat时出现内存访问错误

[复制链接 Copy URL]

138

帖子

0

威望

443

eV
积分
581

Level 4 (黑子)

报错信息:
Error: an illegal memory access was encountered launching kernel kNLSkinTest

背景描述:
1. 在进行普通md时出现以上报错信息,查看min发现已经有问题
    - 修改初始pdb,发现存在不合理的键连,局部在DS中优化后重新tleap生成top文件2. min还有少量不合理报错但可以在最大循环处退出,降低min的步数
3. heat始终无法正常运行
    - 查询Amber官方回复的邮件似乎是因为变动太大,调整heat.in参数,减小步长,加大步数(更缓慢地加热)依然无法运行
    - 如下表heat.out只有第一个点的数据,有时会有后面几组但会显示 TEMP(K) = NaN

--------------------------------------------------------------------------------
   4.  RESULTS
--------------------------------------------------------------------------------


NSTEP =        0   TIME(PS) =       0.000  TEMP(K) =     0.00  PRESS =     0.0
Etot   =   -163100.8812  EKtot   =         0.0000  EPtot      =   -163100.8812
BOND   =       203.0446  ANGLE   =       786.1310  DIHED      =      3863.9436
1-4 NB =      1132.6369  1-4 EEL =     12356.1205  VDWAALS    =     16389.3417
EELEC  =   -197832.0995  EHBOND  =         0.0000  RESTRAINT  =         0.0000
------------------------------------------------------------------------------

NMR restraints: Bond =    0.000   Angle =     0.000   Torsion =     0.000
===============================================================================


heat.in

404 Bytes, 下载次数 Times of downloads: 34

min.in

89 Bytes, 下载次数 Times of downloads: 11

Complex-STong.inpcrd

1.25 MB, 下载次数 Times of downloads: 2

Complex-STong.prmtop

6.81 MB, 下载次数 Times of downloads: 8

上海交通大学计算化学与分子生物信息学实验室
Shanghai JiaoTong University
Computational Chemistry and Molecular Bioinformatics Laboratory

CCMBI of SJTU
点击访问个人主页

138

帖子

0

威望

443

eV
积分
581

Level 4 (黑子)

2#
 楼主 Author| 发表于 Post on 2020-7-3 13:50:31 | 只看该作者 Only view this author
补充:
将体系中自己搭建得小分子删除,直接用空载蛋白进行min,heat与equil在equil这步会出现格点错误报错信息如下:
ERROR: Calculation halted.  Periodic box dimensions have changed too much from their initial values.

使用cpptraj check 后报错信息如下:
----- equil.mdcrd (1-28, 1) -----
0% Warning: Unit cell size has changed so much that grid must be recalculated.
Warning: Old sizes= {48, 48, 48}  New sizes= {47, 47, 47}
        Total Grid memory: 151.180 MB
11% 22% Warning: Unit cell size has changed so much that grid must be recalculated.
Warning: Old sizes= {47, 47, 47}  New sizes= {46, 46, 46}
        Total Grid memory: 141.787 MB
33% 41% 52% 63% 70% 81% 93% 100% Complete.


所有得rst文件都无法通过ambpdb导出为pdb文件
上海交通大学计算化学与分子生物信息学实验室
Shanghai JiaoTong University
Computational Chemistry and Molecular Bioinformatics Laboratory

CCMBI of SJTU
点击访问个人主页

230

帖子

0

威望

2653

eV
积分
2883

Level 5 (御坂)

3#
发表于 Post on 2020-7-3 14:32:14 | 只看该作者 Only view this author
你跑之前做能量最小化了吗?

另外步长再缩小一半试试,步长大小的标准你可以参考陈正隆分子动力学那本书了解一下

138

帖子

0

威望

443

eV
积分
581

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2020-7-3 15:50:20 | 只看该作者 Only view this author
一颗赛艇 发表于 2020-7-3 14:32
你跑之前做能量最小化了吗?

另外步长再缩小一半试试,步长大小的标准你可以参考陈正隆分子动力学那本书 ...

做最小化了
步长参考sob老师的建议已经改成0.0005,还要再小吗?
上海交通大学计算化学与分子生物信息学实验室
Shanghai JiaoTong University
Computational Chemistry and Molecular Bioinformatics Laboratory

CCMBI of SJTU
点击访问个人主页

5万

帖子

99

威望

5万

eV
积分
112354

管理员

公社社长

5#
发表于 Post on 2020-7-7 05:13:35 | 只看该作者 Only view this author
DoubeeTwT 发表于 2020-7-3 15:50
做最小化了
步长参考sob老师的建议已经改成0.0005,还要再小吗?

0.5 fs还不行就不是步长的事了,必定存在其它严重问题
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

7

帖子

0

威望

269

eV
积分
276

Level 3 能力者

6#
发表于 Post on 2020-8-18 23:28:15 | 只看该作者 Only view this author
本帖最后由 mengskl 于 2020-8-20 17:46 编辑

相似问题,请问最后贴主是如何解决的?我是膜蛋白,加了膜之后,dt设置为0.0005,heat可以在cpu下跑出结果,但是temp第二步就跳到3000K左右,设置温度限制也没用,cuda则无法运行,报错内存访问错误。
2020/08/20:
问题解决了,但是原理不明。
我的解决方法是,dt=0.0005,nstlim=100,ntpr=1,ntwx=1,cpu计算不会报错了,轨迹可以正常加载,并且轨迹看起来很正常。而且温度恢复正常限制慢慢升温。然后heat_02从100K到300K正常。
只要heat_01正常结束后,再改heat_01的参数,dt不动,改nstlim、ntpr、ntwx,可以正常重启heat_01往后做了,不会再出现cuda的内存非法访问的错误或者温度NaN或*****的问题。
虽然解决了问题,但是原理不明,我用的是amber18,有知道原理的前辈们可以指点一下

138

帖子

0

威望

443

eV
积分
581

Level 4 (黑子)

7#
 楼主 Author| 发表于 Post on 2020-8-22 08:59:02 | 只看该作者 Only view this author
mengskl 发表于 2020-8-18 23:28
相似问题,请问最后贴主是如何解决的?我是膜蛋白,加了膜之后,dt设置为0.0005,heat可以在cpu下跑出结果 ...

我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限
上海交通大学计算化学与分子生物信息学实验室
Shanghai JiaoTong University
Computational Chemistry and Molecular Bioinformatics Laboratory

CCMBI of SJTU
点击访问个人主页

7

帖子

0

威望

269

eV
积分
276

Level 3 能力者

8#
发表于 Post on 2020-9-4 14:16:53 | 只看该作者 Only view this author
本帖最后由 mengskl 于 2020-9-4 16:12 编辑
DoubeeTwT 发表于 2020-8-22 08:59
我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限

咨询贴主一个问题,cuda下面prod阶段计算了约10ns后总是出an illegal memory access was encountered. 换用CPU做则在相同时间会出好几行 vlimit exceeded for step ******:提示,但是会继续往下做,同时每步都会提示ewald error estimate。
ewald error estimate根据 https://structbio.vanderbilt.edu ... chive/2009/4723.php 解释可以理解为an estimate of the uncertainties arising from finite grid resolution in the PME calculation。并且可以忽略。
vlimit exceed for step根据http://archive.ambermd.org/201004/0173.html 解释很可能是发生的原子重叠,但是我输出文件中step编号为**** 没有指出具体的步数,同时VMD加载因为体系过大也没有找到明显重叠的地方。prod计算前通过cuda进行了10轮5ns的平衡都没有问题,立场检查过了也没有问题,同时整体电荷已经平衡到了0.0000000,请问贴主有类似发现或者了解该问题的解决方法吗。如果没有发现有原子重叠,读ncrst文件重启模拟,或者多进行几轮hold是否有助于解决问题呢

138

帖子

0

威望

443

eV
积分
581

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2020-9-7 12:36:33 | 只看该作者 Only view this author
mengskl 发表于 2020-9-4 14:16
咨询贴主一个问题,cuda下面prod阶段计算了约10ns后总是出an illegal memory access was encountered. 换 ...

我也觉得会有原子重叠,一般出现在H原子上确实不是很好发现,你看一下你自己做的力场导入的mol2文件中的最后一列电荷是否有特别正或者特别负的(>+2或者<-2)
上海交通大学计算化学与分子生物信息学实验室
Shanghai JiaoTong University
Computational Chemistry and Molecular Bioinformatics Laboratory

CCMBI of SJTU
点击访问个人主页

5

帖子

0

威望

107

eV
积分
112

Level 2 能力者

10#
发表于 Post on 2022-3-25 23:57:31 | 只看该作者 Only view this author
DoubeeTwT 发表于 2020-8-22 08:59
我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限

贴主,想请问一下,怎么样查看力场文件?我也是升温时报错Calculation halted.  Periodic box dimensions have changed too much from their initial values.
  Your system density has likely changed by a large amount, probably from
  starting the simulation from a structure a long way from equilibrium.
但是我导出pdb文件比对并没有看见蛋白有差异,溶剂盒子也没变化

7

帖子

0

威望

269

eV
积分
276

Level 3 能力者

11#
发表于 Post on 2023-1-15 18:35:08 | 只看该作者 Only view this author
说一下我发现的问题,我是用mutiwfn拟合的RESP,得到的chg文件我替换回去时有一对原子替换错了。导致两个相邻原子互相排斥
简单的说就是C-H,这个链接状态的两个原子,都是带很大的正电。
这个情况下做MD静电肯定直接起飞了,然后C-H之间的键又得把这两个原子拉回来,就出现了反复地且很剧烈的弹开,拉回来,弹开。
解决方案:将chg里面的电荷正确的替换回去就行了

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 01:20 , Processed in 0.241325 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list