计算化学公社

标题: 求助:如何减少gmx msd计算扩散系数的不确定性 [打印本页]

作者
Author:
zypshine    时间: 2022-10-26 14:06
标题: 求助:如何减少gmx msd计算扩散系数的不确定性
本帖最后由 zypshine 于 2022-11-1 08:49 编辑

在用gmx msd计算同一体系的扩散系数时,发现在不改变模拟方法的情况下,重复跑,得到的MSD曲线具有不确定性。
下面的MSD图是我算的一个案例,温度为473K,压力为2MPa,采用em+NVT(Vrescale)+NPT(Vrescale+Berendsen)+MD(NPT,Vrescale+Parrinello-Rahman),MD段跑了20ns,重复了5次,选择MSD前面比较直的段进行了拟合,得到了不同的扩散系数值,范围在1.8-3.3。也有采用NPT+NVT计算,跑了3ns的,5次,MSD平均值看起来也不算太好。也有改变步长的,每算一次能得到一个新的扩散系数,有时能算到6。想请教下:
(1)同一体系的扩散系数差距较大,本例中为1.8~6.0,有三四倍,这种差距是否可接受?
(2)MSD的这种不确定性是它本身自带的,还是跟所研究的体系有关?目前看到的文献中,少数提到了跑多次求MSD均值的,多数跑一次取拟合值。如果是自带的,为啥以某一次的结果作为扩散值?如果跟研究体系有关,请问下什么样的体系需要多次跑呢?跑多少次算合适呢?除了跑多次取均值外,还有其它方法能够减少这种不确定性吗?
作者
Author:
sobereva    时间: 2022-10-26 15:26
跟体系很有关,没有具体描述没法说
诸如像小分子液体的情况,小分子扩散运动很容易,就很容易得到较平直的MSD曲线,而且可重复性较好
如果是扩散困难的情况,诸如磷脂膜中的磷脂,MSD的可重现性和平直程度就没那么理想。但这也和被统计分子的数目、计算MSD的方式(是否考虑时间平均)有很大关系,采样不充分的情况此问题会很显著。在计算方式确实得当的前提下,遇到可重复性差的情况,也可以跑多次取统计平均。
作者
Author:
zypshine    时间: 2022-10-26 16:48
本帖最后由 zypshine 于 2022-11-1 08:50 编辑
sobereva 发表于 2022-10-26 15:26
跟体系很有关,没有具体描述没法说
诸如像小分子液体的情况,小分子扩散运动很容易,就很容易得到较平直的 ...

谢谢sob老师解答,我是算生物质分子在50%的乙醇溶液的扩散系数,该分子有165个原子,总共12648个原子,扩散难度不算难吧.
采样的话,有算过步长为0.5fs、1fs、2fs的,总时长3ns,每1ps输出;也算过步长为1fs,总时长3ns,每10fs、1ps、10ps输出的,最后跑出来的MSD重复性10fs相对较好一点。
sob老师,以我这样的体系,以步长为1fs,取样在三万步,即每100fs输出的话,这样的采样程度算是充分吗?
作者
Author:
sobereva    时间: 2022-10-27 04:53
165原子的生物质分子扩散运动当然难了。而且体系里又只有这么一个这种分子,采样误差也容易比较大。
采样不是说你动力学模拟的步长,而是计算MSD时候考虑的“有效”的数据量,诸如跑很多次取平均,或者一个很大的体系里有多种这样的分子做统计平均,都属于。轨迹保存频率(保存间隔)设得过高也没什么意义,相邻帧过于接近的话增加保存频率不会显著增加有效数据。
对于本来内在可重复性就差的数据(比如一个难扩散分子的MSD,体系里还就这一个分子,没法做同种分子的平均),不可能要求结果的可重复性好,你只能通过增加采样(诸如反复跑多次取平均,或者体系内纳入多种这种分子)来让你要研究的信息的统计误差较小、能说明问题。

作者
Author:
zypshine    时间: 2022-10-27 08:43
sobereva 发表于 2022-10-27 04:53
165原子的生物质分子扩散运动当然难了。而且体系里又只有这么一个这种分子,采样误差也容易比较大。
采样 ...

明白了,谢谢sob老师
作者
Author:
qyw    时间: 2023-10-5 09:49
请问这个MSD为啥会降低呢
作者
Author:
zypshine    时间: 2024-8-22 15:38
qyw 发表于 2023-10-5 09:49
请问这个MSD为啥会降低呢

没想明白,可能体系太复杂了




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3