计算化学公社

标题: 求助heat时出现内存访问错误 [打印本页]

作者
Author:
DoubeeTwT    时间: 2020-7-2 20:46
标题: 求助heat时出现内存访问错误
报错信息:
Error: an illegal memory access was encountered launching kernel kNLSkinTest

背景描述:
1. 在进行普通md时出现以上报错信息,查看min发现已经有问题
    - 修改初始pdb,发现存在不合理的键连,局部在DS中优化后重新tleap生成top文件2. min还有少量不合理报错但可以在最大循环处退出,降低min的步数
3. heat始终无法正常运行
    - 查询Amber官方回复的邮件似乎是因为变动太大,调整heat.in参数,减小步长,加大步数(更缓慢地加热)依然无法运行
    - 如下表heat.out只有第一个点的数据,有时会有后面几组但会显示 TEMP(K) = NaN

--------------------------------------------------------------------------------
   4.  RESULTS
--------------------------------------------------------------------------------


NSTEP =        0   TIME(PS) =       0.000  TEMP(K) =     0.00  PRESS =     0.0
Etot   =   -163100.8812  EKtot   =         0.0000  EPtot      =   -163100.8812
BOND   =       203.0446  ANGLE   =       786.1310  DIHED      =      3863.9436
1-4 NB =      1132.6369  1-4 EEL =     12356.1205  VDWAALS    =     16389.3417
EELEC  =   -197832.0995  EHBOND  =         0.0000  RESTRAINT  =         0.0000
------------------------------------------------------------------------------

NMR restraints: Bond =    0.000   Angle =     0.000   Torsion =     0.000
===============================================================================



作者
Author:
DoubeeTwT    时间: 2020-7-3 13:50
补充:
将体系中自己搭建得小分子删除,直接用空载蛋白进行min,heat与equil在equil这步会出现格点错误报错信息如下:
ERROR: Calculation halted.  Periodic box dimensions have changed too much from their initial values.

使用cpptraj check 后报错信息如下:
----- equil.mdcrd (1-28, 1) -----
0% Warning: Unit cell size has changed so much that grid must be recalculated.
Warning: Old sizes= {48, 48, 48}  New sizes= {47, 47, 47}
        Total Grid memory: 151.180 MB
11% 22% Warning: Unit cell size has changed so much that grid must be recalculated.
Warning: Old sizes= {47, 47, 47}  New sizes= {46, 46, 46}
        Total Grid memory: 141.787 MB
33% 41% 52% 63% 70% 81% 93% 100% Complete.


所有得rst文件都无法通过ambpdb导出为pdb文件

作者
Author:
一颗赛艇    时间: 2020-7-3 14:32
你跑之前做能量最小化了吗?

另外步长再缩小一半试试,步长大小的标准你可以参考陈正隆分子动力学那本书了解一下

作者
Author:
DoubeeTwT    时间: 2020-7-3 15:50
一颗赛艇 发表于 2020-7-3 14:32
你跑之前做能量最小化了吗?

另外步长再缩小一半试试,步长大小的标准你可以参考陈正隆分子动力学那本书 ...

做最小化了
步长参考sob老师的建议已经改成0.0005,还要再小吗?
作者
Author:
sobereva    时间: 2020-7-7 05:13
DoubeeTwT 发表于 2020-7-3 15:50
做最小化了
步长参考sob老师的建议已经改成0.0005,还要再小吗?

0.5 fs还不行就不是步长的事了,必定存在其它严重问题
作者
Author:
mengskl    时间: 2020-8-18 23:28
本帖最后由 mengskl 于 2020-8-20 17:46 编辑

相似问题,请问最后贴主是如何解决的?我是膜蛋白,加了膜之后,dt设置为0.0005,heat可以在cpu下跑出结果,但是temp第二步就跳到3000K左右,设置温度限制也没用,cuda则无法运行,报错内存访问错误。
2020/08/20:
问题解决了,但是原理不明。
我的解决方法是,dt=0.0005,nstlim=100,ntpr=1,ntwx=1,cpu计算不会报错了,轨迹可以正常加载,并且轨迹看起来很正常。而且温度恢复正常限制慢慢升温。然后heat_02从100K到300K正常。
只要heat_01正常结束后,再改heat_01的参数,dt不动,改nstlim、ntpr、ntwx,可以正常重启heat_01往后做了,不会再出现cuda的内存非法访问的错误或者温度NaN或*****的问题。
虽然解决了问题,但是原理不明,我用的是amber18,有知道原理的前辈们可以指点一下

作者
Author:
DoubeeTwT    时间: 2020-8-22 08:59
mengskl 发表于 2020-8-18 23:28
相似问题,请问最后贴主是如何解决的?我是膜蛋白,加了膜之后,dt设置为0.0005,heat可以在cpu下跑出结果 ...

我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限
作者
Author:
mengskl    时间: 2020-9-4 14:16
本帖最后由 mengskl 于 2020-9-4 16:12 编辑
DoubeeTwT 发表于 2020-8-22 08:59
我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限

咨询贴主一个问题,cuda下面prod阶段计算了约10ns后总是出an illegal memory access was encountered. 换用CPU做则在相同时间会出好几行 vlimit exceeded for step ******:提示,但是会继续往下做,同时每步都会提示ewald error estimate。
ewald error estimate根据 https://structbio.vanderbilt.edu ... chive/2009/4723.php 解释可以理解为an estimate of the uncertainties arising from finite grid resolution in the PME calculation。并且可以忽略。
vlimit exceed for step根据http://archive.ambermd.org/201004/0173.html 解释很可能是发生的原子重叠,但是我输出文件中step编号为**** 没有指出具体的步数,同时VMD加载因为体系过大也没有找到明显重叠的地方。prod计算前通过cuda进行了10轮5ns的平衡都没有问题,立场检查过了也没有问题,同时整体电荷已经平衡到了0.0000000,请问贴主有类似发现或者了解该问题的解决方法吗。如果没有发现有原子重叠,读ncrst文件重启模拟,或者多进行几轮hold是否有助于解决问题呢

作者
Author:
DoubeeTwT    时间: 2020-9-7 12:36
mengskl 发表于 2020-9-4 14:16
咨询贴主一个问题,cuda下面prod阶段计算了约10ns后总是出an illegal memory access was encountered. 换 ...

我也觉得会有原子重叠,一般出现在H原子上确实不是很好发现,你看一下你自己做的力场导入的mol2文件中的最后一列电荷是否有特别正或者特别负的(>+2或者<-2)
作者
Author:
shiny    时间: 2022-3-25 23:57
DoubeeTwT 发表于 2020-8-22 08:59
我后来发现是我的力场出现了问题,有一个键长的参数有误,导致模拟时体系崩溃,能量超出浮点数上限

贴主,想请问一下,怎么样查看力场文件?我也是升温时报错Calculation halted.  Periodic box dimensions have changed too much from their initial values.
  Your system density has likely changed by a large amount, probably from
  starting the simulation from a structure a long way from equilibrium.
但是我导出pdb文件比对并没有看见蛋白有差异,溶剂盒子也没变化
作者
Author:
mengskl    时间: 2023-1-15 18:35
说一下我发现的问题,我是用mutiwfn拟合的RESP,得到的chg文件我替换回去时有一对原子替换错了。导致两个相邻原子互相排斥
简单的说就是C-H,这个链接状态的两个原子,都是带很大的正电。
这个情况下做MD静电肯定直接起飞了,然后C-H之间的键又得把这两个原子拉回来,就出现了反复地且很剧烈的弹开,拉回来,弹开。
解决方案:将chg里面的电荷正确的替换回去就行了




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3