|
本帖最后由 zeus12138 于 2025-7-17 04:37 编辑
社长,各位老师,大家好,本人初次使用gromacs也初次学习计算化学方面的知识,可能有些术语表述有错误或歧义,在操作上也可能出现了错误,恳请老师批评指正,学生也希望可以一直深入学习计算化学方面的知识。学生没有更多的资金自费购买Gaussian软件,因为同组同学着急毕业需要我这部分数据所以在考虑操作步骤上因为操作和思考着急可能忽略了某些步骤,也请老师们批评指正。
分子结构获得,ORCA优化,原子电荷生成部分:学生按照7次测试中,操作步骤中可能比较能说通的一次举例。据讲义上的蛋白质与配体章节,学生首先从pubchem中下载该分子的2D sdf格式,使用Openbable转换格式为pdb格式,通过Avogrado对该分子加氢使用auto optimization tool(force field 选择GAFF,algorithm设置为:sleepest Descent),当dE=0的时候点击停止,输出pdb文件(自动优化工具 - Avogadro)。用Multiwfn产生ORCA的输出文件,Multiwfn版本为3.8(dev)更新日期为2020-May-5。选择步骤optimization+frequency,使用B97-3C,得到分子的INP文件。使用ORCA6.0.1对分子优化,输出的out文件,获得红外光谱。学生使用orca_2mkl coumarin -molden命令将gbw文件转化为molden格式,绘制,观看分子轨道,其中62为HOMO,63为LUMO(基于ORCA量子化学程序对分子做优化、振动分析、观看红外光谱、观看轨道的简单演示_哔哩哔哩_bilibili)。优化结束后查看coumarin.xyz文件。使用VMware搭建虚拟机,Ubuntu24.04.2 amd64,文件传输通过百度网盘,虚拟机配置为memory为4096MB,processor8。搭建好虚拟机配置,下载,并在虚拟机配置好linux版本Multiwfn,版本为3.8(dev)更新日期为:2025-July-12。使用Multiwfn操作:step1:chmod +x ./Multiwfn step2: ./Multiwfn获得版本信息 step3:进入examples\RESP,使用命令1chmod +x ./RESP_ORCA.sh 命令2./RESP_ORCA.sh coumarin.xyz 0 1 water 回车运行命令(计算RESP原子电荷的超级懒人脚本(一行命令就算出结果) - 思想家公社的门口:量子化学·分子模拟·二次元),得到coumarin.chg文件。查看文件,使用该成员编辑的脚本(快速将RESP电荷从.chg文件迁移至.mol2文件 - 波函数分析与Multiwfn (Wavefunction Analysis & Multiwfn) - 计算化学公社)将chg格式转换为mol2格式,命名为coumarin_new.mol2。
配体拓扑部分:使用sobtop软件,软件版本为sobtop1.0(dev5) first release时间为:2024-sep-15,生成配体的拓扑文件,只考虑了例2和FAQ8。步骤按照例2操作,得到配体的gro,top和itp文件,检查文件。蛋白质为7JRA,序列通过PDB下载获得,该蛋白为三聚体,为了补全晶体结构中缺失的蛋白质残基片段,采用 Alphafold3 对目标蛋白进行了结构预测。下载保存为PDB格式。
随后按讲义步骤进行限制性动力学分析操作,将配体的itp文件,gro文件拷贝到与蛋白质同一目录下,随后使用gmx pdb2gmx -f protein.pdb -o protein.gro -p topol.top命令生成蛋白质的拓扑文件,力场选择为Amber14SB和TIP3P水,得到topol_Protein_chain_A,topol_Protein_chain_B,topol_Protein_chain_C。Posre开头文件对应限制势itp,文件名为: Posre_Protein_chain_A, Posre_Protein_chain_B, Posre_Protein_chain_C。将分子的gro文件加入到pdb2gmx生成的protein.gro末尾,将第二行原子数修改,保存为complex.gro。使用VMD检查complex.gro。发现分子与蛋白质残基有重合。对残基和蛋白质单独使用VMD查看,没有蛋白质残基结构和配体结构错误。将配体的itp文件引入整体的拓扑文件topol.top中,在最后一段设置好分子数
设置盒子:gmx editconf -f complex.gro -o complex_box.gro -d 0.8 -bt cubic,加水:gmx solvate -cp complex_box.gro -o complex_SOL.gro -p topol.top,拷贝em.mdp,pr.mdp,md.mdp到蛋白质与配体存在的目录中。预处理能量极小化。加离子:gmx genion -s em.tpr -p topol.top -o system.gro -neutral,gromacs提示:No ions to add, will just copy input configuration.能量极小化:gmx grompp -f em.mdp -c system.gro -p topol.top -o em.tpr
gmx mdrun -v -deffnm em
随后使用限制性动力学分析:gmx grompp -f pr.mdp -c em.gro -p topol.top -r em.gro -o pr.tpr
gmx mdrun -v -deffnm pr
gromacs出现警告。
再次之前测试了5次,分别解决了自身忘记使用ORCA优化配体的力场问题,解决了忘记使用Multiwfn生成电荷的问题,解决了chg文件与mol2文件的格式转换问题。
问题:学生查看原子910和911的约束偏差极其严重,在这之前也出现了更多的原子间距离大于限制,学生根据complex.gro文件确定是蛋白质的原子出现了距离大于限制的问题,学生应该要怎么做,需要重新建模,重新生成拓扑文件还是手动修改?
学生在vmd查看结构的时候看到不正确的连接,一时犯了难,也按照上述的方法多跑了2次,得到的结果近似,学生不知道应该怎么样完整的跑完这个限制性分子动力学分析了,期望社长和老师们可以指点下学生的迷津。
以下为该次运行的材料附件和gromacs出现警告的代码。警告部分的图片标注与文字对应。
|
|