计算化学公社

标题: 请教使用ORCA做蛋白与小分子簇模型AIMD的基组选择及计算复杂度预估 [打印本页]

作者
Author:
liz8966    时间: 2024-2-9 21:10
标题: 请教使用ORCA做蛋白与小分子簇模型AIMD的基组选择及计算复杂度预估
本帖最后由 liz8966 于 2024-2-9 22:03 编辑

各位老师好,我尝试使用ORCA 5.0.4的MD模块做CPY1A1代谢茶碱的簇模型AIMD计算。我使用Vina对接后,取了小分子周围5A的氨基酸残基,包括CYP1A1的HEME分子,总共161个原子。我对外周原子使用了3-21G基组,对茶碱分子和可能涉及反应的氨基酸残基中部分原子使用了6-31G*基组,对过渡态的FE使用了6-311G**基组。该模拟计算的预估是观察到茶碱的叔胺失去一个甲基。
我在实践中有几个问题想请教:
1.基组的使用是否合理。我参考了sob老师的文章(http://sobereva.com/597http://sobereva.com/576http://sobereva.com/336)选择了上述三个基组。在http://sobereva.com/214中,sob老师提到“对于一百多个原子的情况,目前笔者最推荐的是Grimme在2018年提出的B97-3c方法”,但这篇文章是关于弱相互作用的,不知道对于CPY1A1代谢茶碱的计算是否可以适用。
2.要不要用显式溶剂。因为茶碱的去甲基化可能要与溶剂进行质子交换,请问要不要使用显式溶剂,或在茶碱反应位置添加几个水分子。
3.是否可以用反应力场在MD的基础上来实现模拟上述反应的过程。
4.混合基组如何一个命令指定多个原子。%basis NewGTO貌似一次只能指定一个或一类原子,例如不能直接使用%basis NewGTO 1-12 end直接指定序号1-12的原子。我猜应该是有方法指定的,但是我翻了手册没有找到。
5.是否有方法或者技巧加速ORCA运行。由于计算资源匮乏,我手里最好的cpu是r5 5600g,这个体系在3-21G小基组下仍然算不动。
6.AIMD的计算复杂度如何随体系大小变化的,在尝试计算http://sobereva.com/576中的例子时我感觉速度还行,但是在计算CPY1A1代谢茶碱时完全算不动。因此好奇计算的复杂度随原子数量如何变化的。
我是个计算化学的门外汉,提出的问题可能有些幼稚。烦请各位老师百忙之中授我以渔,万分感谢。另外祝各位老师新年快乐,研究顺利。
以下是简要的输入文件,完整文件在附件:
! 3-21G noautostart miniprint nopop CPCM(water)
%basis
NewGTO 0
  "6-31G*"
end
NewGTO 1
  "6-31G*
end
[省略部分原子的基组指定]
NewGTO FE
  "6-311G**"
end
end
%geom
Constraints #固定氨基酸残基和HEM位置
{ C 13:160 C }
end
end
%maxcore  5000
%pal nprocs   12 end
%md
#minimize  # Do minimization prior to MD simulation
timestep 1_fs  # This stepsize is safe at several hundreds of Kelvin
initvel 100_K no_overwrite # Assign velocity according to temperature for atoms whose velocities are not available
thermostat CSVR 310.15_K timecon 30.0_fs  #37摄氏度  Target temperature and coupling time constant
dump position stride 1 format xyz filename "pos.xyz"  # Dump position every "stride" steps
constraint add center 0..160 #约束质心位置
run 3000 CenterCOM # Number of MD steps. Remove motion of center of mass
end
* xyz   0   2
[坐标部分]
*

附件是簇模型的图片、PDB文件、ORCA输入的INP文件。
(, 下载次数 Times of downloads: 15) (, 下载次数 Times of downloads: 1) (, 下载次数 Times of downloads: 7)
作者
Author:
sobereva    时间: 2024-2-10 08:33
如果不是无势垒或反应势垒很低的反应,不要随便跑AIMD,不仅极其昂贵,在很有限时间的模拟中得到你感兴趣的现象的可能性还微乎其微。此时应当首先考虑用簇模型找过渡态、跑IRC方式研究,参看《要善用簇模型,不要盲目用ONIOM算蛋白质-小分子相互作用问题》(http://sobereva.com/597)里的一些讨论。除非利用一些增强采样技术跑AIMD。

量子化学程序基于DFT跑AIMD通常也就跑得动几十原子,160多原子没戏,跑10步看平均每步耗时便知。非要跑AIMD也只能改用GFN-xTB之类半经验级别跑。你当前的基组选择从精度方面倒是合理的,虽然跑不动。改成B97-3c更贵。主流双路服务器上优化这种大小体系都挺耗时,更别提用r5 5600g这种档次CPU跑AIMD了。

输入文件里居然都不写理论方法,太离谱了。
作者
Author:
liz8966    时间: 2024-2-10 09:09
sobereva 发表于 2024-2-10 08:33
如果不是无势垒或反应势垒很低的反应,不要随便跑AIMD,不仅极其昂贵,在很有限时间的模拟中得到你感兴趣的 ...

感谢老师回复。老师新年快乐。此外想问一下输入文件里的"理论方法"是什么意思。
作者
Author:
wzkchem5    时间: 2024-2-10 16:49
liz8966 发表于 2024-2-10 02:09
感谢老师回复。老师新年快乐。此外想问一下输入文件里的"理论方法"是什么意思。

仔细阅读http://sobereva.com/680
作者
Author:
liz8966    时间: 2024-2-10 19:29
wzkchem5 发表于 2024-2-10 16:49
仔细阅读http://sobereva.com/680

非常感谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3