计算化学公社

标题: 请教改进的构型搜索流程是否正确 [打印本页]

作者
Author:
王涛    时间: 2025-12-24 10:59
标题: 请教改进的构型搜索流程是否正确
我参考老师的帖子,学会了构型搜索流程。我的体系为多肽与小分子。
使用Molclus结合xtb做的动力学模拟对瑞德西韦(Remdesivir)做构象搜索
http://bbs.keinsci.com/forum.php ... 5&fromuid=84268
(出处: 计算化学公社)

我计算一个结构耗时约为35个小时。我觉得耗时有些久,我进行了一些调整
1.用xtb在GFNFF-xtb下跑动力学
2.通过CREST调用xtb,在GFNFF/ GFN0-xTB下对动力学的每一帧进行批量优化
3.通过CREST调用xtb,对(2)产生的每一个结构用GFN2-xTB在溶剂模型下进行批量优化
4.通过Molclus调用Gaussian,对(3)筛选出来的结构用B3LYP-D3(BJ)/6-31G*在水环境下做几何优化,但不做振动分析。再调用ORCA对每个结构在wB97M-V结合SMD模型表现的水环境下算单点能并排序
5.选择(4)中能量最低的前三个构象,调用Gaussian只做频率计算(频率计算的理论级别/溶剂设定与几何优化一致,不再重新做几何优化)。再调用ORCA对每个结构在revDSD-PBEP86-D4/2021结合SMD模型表现的水环境下算高精度单点能

调整讲解:1.用CREST加速了动力学模拟
                2.尽可能少的进行振动分析来节约时间
目前第四步五个结构只做结构优化用了22小时
请问:
1.这个流程是否合理?能否通过脚本实现整个流程的批量化处理(不知道Molclus是否可以)?
2.还有没有其他可以加快这个流程的方法呢?因为后面有大量的结构需要处理,流程所需时间越短就越好。

作者
Author:
wzkchem5    时间: 2025-12-24 12:54
第3步可以考虑省略,GFN2-xTB相比GFN-FF的改进未必很大。第4步之前可以考虑用DFT double zeta单点能再做一步筛选。频率计算如果有虚频得消虚频。其他问题不大。
更多可以参见我做的构象搜索的科普讲座https://www.koushare.com/video/details/192997
作者
Author:
王涛    时间: 2025-12-27 16:34
wzkchem5 发表于 2025-12-24 12:54
第3步可以考虑省略,GFN2-xTB相比GFN-FF的改进未必很大。第4步之前可以考虑用DFT double zeta单点能再做一 ...

非常感谢老师的帮助!从老师的讲座中我学到了很多之前没有了解过的方法,对于我这个初学者真是受益匪浅。我有两个问题想请教一下老师:
1.“第4步之前可以考虑用DFT double zeta单点能再做一步筛选。”我的体系为六肽-氨气,大约有115个原子,这一步我选用6-31G(d)可以吗?或者老师有别的推荐呢?
2.我在用目前的方法进行构象搜索时,发现不同的氨气放置位点,最终得出的最低能量的构象不同,能量也有略微差距(约为0.01 a.u.)。
我打算采用老师讲座中提到的particle swarm进行分子对接,找到六肽和氨气相互作用的最优构象。也有人建议我跑md,逐帧算mmgbsa。首先确保充分采样。然后基于mmgbsa的结果做后续的精筛。我想找到一个能够平衡时间与精度的方法,我的目的是构建一个机器学习模型,现在在构建数据集需要计算许多不同的肽段。
请问老师觉得哪个方法更适用于我目前的情况呢
作者
Author:
wzkchem5    时间: 2025-12-27 18:33
王涛 发表于 2025-12-27 16:34
非常感谢老师的帮助!从老师的讲座中我学到了很多之前没有了解过的方法,对于我这个初学者真是受益匪浅。 ...

1. 可以,可以考虑再用gCP校正一下BSSE
2. 你的溶剂是水吗?氨和肽的作用可能弱于水和肽的作用,应当画一些显式水分子;但这样一来需要画很多水分子才能把六肽的极性基团都包起来。所以跑MD比较好。但另一方面,不建议“逐帧算mmgbsa”:首先即使要做MMGBSA也是隔很多帧取一帧,相邻帧的结构太像,只挑一帧算和两帧都算的结果几乎不会有差异的,每帧都算是浪费时间。其次,你的体系即使加了很多水分子,也小到能用DFT算单点,精度比MM单点高多了,不要用纯MM的workflow
作者
Author:
王涛    时间: 2025-12-29 11:35
wzkchem5 发表于 2025-12-27 18:33
1. 可以,可以考虑再用gCP校正一下BSSE
2. 你的溶剂是水吗?氨和肽的作用可能弱于水和肽的作用,应当画 ...

感谢老师在百忙之中的解答!我的溶剂为水,环境PH = 7。我在这里修正一个错误:我的体系为六肽-铵根,氨气在PH=7的水溶液中以铵根的形式存在。
根据老师您的回复,我理解的意思是:我的体系先跑MD(不加显式水分子),然后基于能量取帧,挑选能量最低的几帧,再去进行后面的xTB和DFT操作。
我回顾了老师的讲座,我有几个问题想请教一下:
1.我理解的操作是否正确呢?我在跑MD取帧时,是根据RMSD还是根据能量取帧比较合理呢?亦或者直接把取帧时间间隔长一些就好。
2.若是MD根据能量取帧,在进行后面的xTB和DFT操作时是只需要选能量最低的进行还是要多选几个比较合理呢?
3.老师您在讲解MD时讲到了两个方法(1)长时间MD取snapshots(2)在MD中不断退火,在每次退火到最低温时取一。方法(2)对于我这个体系是否会有更好的效果呢?
4.老师您还提到球形限制式。我认为我这个体系也是非共价吸附,加一个球形限制式会不会更好?之前我这个体系跑xTB-GFN0时就出现了铵根远离多肽的情况了。
作者
Author:
wzkchem5    时间: 2025-12-29 13:20
王涛 发表于 2025-12-29 11:35
感谢老师在百忙之中的解答!我的溶剂为水,环境PH = 7。我在这里修正一个错误:我的体系为六肽-铵根,氨 ...

1. 每间隔若干帧(例如间隔1000帧)取一帧即可,刻意考虑RMSD/能量不太会提高取的帧的质量
2. 取出来的帧自然是至少要做xTB计算的,否则没必要取。但是可以把xTB优化的结构按能量再排序一下,去掉能量高的,或做小基组DFT单点后再去掉能量高的。不建议不做xTB优化就用能量筛选,因为MD跑出来的结构的能量差距有很大一部分是因为键长的区别,而一般只有二面角对能量贡献的差别才是重要的
3. (1)取出的构象更能代表MD模拟温度下“典型”的构象,(2)取出的构象能量更低,两者各有利弊。举例:假设你的肽链有1个alpha螺旋构象(自由能0kcal/mol)和100个无规coil构象(自由能3kcal/mol),那么alpha螺旋构象和无规coil构象的平衡比例相近,(1)倾向于得到无规coil构象,(2)倾向于得到alpha螺旋构象,很难说哪个更好,需要结合你研究的具体问题来判断,假设有少量低能构象和大量能量稍高的构象,你更想得到前者还是得到后者。
4. 可以。另一种做法是加周期性边界条件
作者
Author:
王涛    时间: 2025-12-29 16:45
wzkchem5 发表于 2025-12-29 13:20
1. 每间隔若干帧(例如间隔1000帧)取一帧即可,刻意考虑RMSD/能量不太会提高取的帧的质量
2. 取出来的 ...

谢谢老师您!经过您的解答,我对计算清晰明了了许多。但还是有一个疑惑:
我在跑完MD取帧了之后(比如取了5帧),是着五帧各自单独进行xTB计算和DFT计算,得到5个能量,然后取最小值;还是着五帧合并在一个文件里,一起进行xTB计算和DFT计算,最后DFT计算结果排序最小值呢?
作者
Author:
wzkchem5    时间: 2025-12-29 19:02
王涛 发表于 2025-12-29 16:45
谢谢老师您!经过您的解答,我对计算清晰明了了许多。但还是有一个疑惑:
我在跑完MD取帧了之后(比如取 ...

如果只用orca,只能用后一种方法;如果也用molclus,两种方法都可以用。
但是5帧太少了,最少最少也得好几十帧,我一般都至少100帧
作者
Author:
王涛    时间: 7 day ago
wzkchem5 发表于 2025-12-29 19:02
如果只用orca,只能用后一种方法;如果也用molclus,两种方法都可以用。
但是5帧太少了,最少最少也得好 ...

老师您好。我看社长帖子里是用xtb在GFN0-xTB下跑动力学,这个方法和GROMACS跑md有什么区别吗?
A-B复合体系跑分子动力学的初始构型老师您是如何确定的呢?(我的体系是六肽-铵根,拟采用的方法为分子对接确定初始构型)
作者
Author:
wzkchem5    时间: 7 day ago
王涛 发表于 2026-1-16 16:17
老师您好。我看社长帖子里是用xtb在GFN0-xTB下跑动力学,这个方法和GROMACS跑md有什么区别吗?
A-B复合 ...

GFN0-xTB是半经验方法,适用范围更广,更robust,但计算更慢;GROMACS里的力场对于其擅长的体系精度不错,但你研究的体系稍微超出力场的设计范围,精度就变差了。
如果A-B结合足够弱,那么初始结构可以随便摆;否则做分子对接是可以的,而且最好多对接几个结构,分别跑MD
作者
Author:
王涛    时间: 6 day ago
wzkchem5 发表于 2026-1-16 19:27
GFN0-xTB是半经验方法,适用范围更广,更robust,但计算更慢;GROMACS里的力场对于其擅长的体系精度不错 ...

老师您好
1.我这个六肽-铵根体系,第一次初始结构随便摆的,之前用用xtb在GFN0-xTB下跑动力学,出现了脱羧和键长异常的情况,然后GFN2批量优化后能量最低的结构NH4+距离肽段很遥远。
我的解决方法为:先对肽段进行结构优化(把帖子里从GFN0-xTB下跑动力学直到ORCA算单点能都进行了),然后在这个六肽结构上放置解决了脱羧和键长异常的情况(从GFN0-xTB下跑动力学直到GFN2-xTB在溶剂模型下进行批量优化),也就发现了在GFN2-xTB下,不同的NH4+放置位点,最终得出的最低能量的构象不同,能量也有略微差距(约为0.01 a.u.)
我想请问一下老师:这个误差是在GFN2-xTB下无法避免的,还是由于我第一步GFN0-xTB下跑动力学不全面导致的呢?
2.我做了分子对接,但是结果是与二号位亮氨酸更接近,与文献中(分子与肽的N端Asp1结合)不同。我感觉文献的位点更合理,碱性气体与酸性氨基酸应更易结合。
我想请问一下老师:在这种情况下,我还要不要继续采用分子对接确定初始结构呢?因为我还没有做后面的MD,我考虑可能做MD后分子也不一定在目前的位点上了,分子对接只是帮助我确定一个最初的结构而已。
作者
Author:
wzkchem5    时间: 5 day ago
王涛 发表于 2026-1-17 11:14
老师您好
1.我这个六肽-铵根体系,第一次初始结构随便摆的,之前用用xtb在GFN0-xTB下跑动力学,出现了脱 ...

1. 可以试一下如果放置位点相同,但随机种子不同,是否也会找到能量不同的构象。如果也会的话,说明要么MD轨迹跑得不够长,要么跑的条数不够多
2. 文献是怎么做的?此外我已经说了,分子对接的时候多保留一些结构,不要只取能量最低的一个结构
作者
Author:
王涛    时间: 5 day ago
wzkchem5 发表于 2026-1-18 14:11
1. 可以试一下如果放置位点相同,但随机种子不同,是否也会找到能量不同的构象。如果也会的话,说明要么M ...

文章所使用的方法
1.确定肽的初始构象。在真空环境中使用Boltzmann跳跃构象搜索方法,计算并确定了相关肽序列的自由构象状态。
2.引入目标分子。然后使用 “Molecular Silverware” 算法,将目标分子引入肽分子中。该算法能够高效采样整个肽段图谱中的小分子结合位点。
3.优化结合方式并计算结合能。确定了目标分子和肽分子的最优结合方式后,使用了分子力学方法进行初步估算,并用DFT计算在最小的结合位点上进行验证。
Molecular Silverware算法在1991年《Molecular silverware. I. General solutions to excluded volume constrained problems》首次提到。其中这个算法分为小算法,我猜测文章用的是MS-R, molecular recognition :用于研究分子相互作用的算法,适用于在药物设计和分子识别领域。1991年的文章中展示了该算法在DNA-配体识别中的应用。
现在在网上关于Molecular Silverware的信息很少,相关论文很少,也没有教程。
好的老师,我再试一试多保留结构的办法。
作者
Author:
wzkchem5    时间: 4 day ago
王涛 发表于 2026-1-18 23:06
文章所使用的方法
1.确定肽的初始构象。在真空环境中使用Boltzmann跳跃构象搜索方法,计算并确定了相关 ...

别用AI总结了直接贴过来,自己验证AI总结的是不是对的




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3