计算化学公社
标题: 使用MolAICal 进行分子对接 [打印本页]
作者Author: MolAICal 时间: 2021-10-17 01:58
标题: 使用MolAICal 进行分子对接
本帖最后由 MolAICal 于 2021-10-17 17:31 编辑
使用MolAICal进行分子对接
作者:MolAICal (update 2021-10-16)
更多教程(含英文教程)请见如下:
MolAICal QQ学术讨论群: 1151656349
1.简介
SARS-CoV-2导致2019年冠状病毒病(COVID-19)在世界范围内迅速传播。在本教程中,选择在冠状病毒复制中起重要作用的SARS-CoV-2主蛋白酶(Mpro)作为示例目标。已经报道了SARS-CoV-2Mpro的晶体结构包括PDB ID:6LU7,6Y2F等[1][2]。在本教程中,基于MolAICal (https://doi.org/10.1093/bib/bbaa161)介绍了蛋白质和配体之间的分子对接。在3130复合物的实验结合亲和力的测试中,Autodock Vina的Pearson和Spearman相关系数(rp/rs)为0.5259和0.5421,对于MolAICal,在与Autodock Vina相同测定条件下,rp/rs分别为0.5335和0.5489。这表明MolAICal比Autodock Vina具有较好的“对接”和“排名”能力。
2.材料
2.1软件需求
2.2示例文件
1)All the necessary tutorial files are downloaded from:
3.步骤
3.1处理受体和配体
1. 打开与配体结合的SARS-CoV-2主蛋白酶文件(PDB ID:6Y2F):File-->Open(见图1)。
(, 下载次数 Times of downloads: 79)
图1
2. 准备 Mpro 受体并保存名为“protein.pdb”的 Mpro 受体。详细过程如图2所示。
(, 下载次数 Times of downloads: 61)
图2
3. 准备配体并保存名为“ligand.pdb”的配体。详细过程如图3所示。
(, 下载次数 Times of downloads: 84)
图3
3.2将受体和配体转换为 PQBQT 格式
1. 使用cd命令切换到protein.pdb所在的文件夹,并使用以下命令获取受体的 PDBQT 格式:
- #> MolAICal-xxx\molaical.exe -dock receptor -i protein.pdb
复制代码注意:MolAICal-xxx是您下载的MolAICal版本的目录。
它将生成名为“protein.pdbqt”的文件,该文件具有与“protein.pdb”相同的前缀名称。
2. 使用以下命令获取配体的PDBQT格式:
- #> MolAICal-xxx\molaical.exe -dock ligand -i ligand.pdb
复制代码它将生成名为“ligand.pdbqt”的文件,该文件具有与“ligand.pdb”相同的前缀名称。
3.3. 获取对接盒的中心和长度
1. 依次打开protein.pdb和ligand.pdb。 然后打开Chimera的“命令行”:Favorites-->Command Line(见图4)。
(, 下载次数 Times of downloads: 58)
图4
2. 确定配体的开放序列。如果蛋白质首先打开,它将对应于“Active models 0”。 第二个打开对应于“Active models 1”,依此类推(见图5)。 在这里,配体是第二个打开的(“Active models 1”)。将以下命令放入命令行(见图5):
- define centroid mass false #1
复制代码
并按“Enter”键。然后,依次点击图5中的序号。它将显示配体的几何中心坐标 (x,y, z) 为(10.879, -0.251, 20.754)。
(, 下载次数 Times of downloads: 81)
图5
3. 通过 UCSF Chimera确定框大小和中心。
打开盒子工具: Tools-->Surface/Binding Analysis-->Autodock Vina
选择盒子大小: 选择正确的受体(此处命名为“protein.pdb”)和配体(此处命名为“ligand.pdb”)(参见图6)。将上述中心坐标“10.879,-0.251,20.754”填入中心框内(见图6),用户可以尝试大小,直到找出合适的尺寸。
(, 下载次数 Times of downloads: 74)
图6
注意:用户可以勾选 “Resize search volumeusing button 1, 2 or 3”。按钮1、2或3表示鼠标左键、中键或右键单击。如果用户选择此功能,他们可以通过鼠标调整框大小。如果你对它感兴趣,你可以试试这个功能。
4.假设配置文件名为“conf.txt”,最终的配置文件可以写成:
- out = all.pdbqt
- cpu = 4
- receptor = protein.pdbqt
- center_x = 10.879
- center_y = -0.251
- center_z = 20.754
- size_x = 20
- size_y = 20
- size_z = 20
- num_modes = 3
复制代码
其中“out”是输出文件名。“cpu”是使用CPU的数量。“receptor”代表受体名称。“num_modes”是生成对接构象的数量。如果“num_modes”为3,它将生成3个配体的对接结构。
3.4 MolAICal 的分子对接
1. 现在MolAICal软包中的MolAICalD用于受体与配体的分子对接:
- #> MolAICal-xxx\molaicald --config conf.txt --ligand ligand.pdbqt
复制代码注意:MolAICal-xxx是您下载的MolAICal版本的目录。
在某些情况下,配体分子有很多旋转键,这样就需要多次试验才可以得到较好的对接结果,可以通过多次运行MolAICal找出合适的random seed来得到较好的对接结果, 这个random seed 可以进一步用来这个靶点的分子对接或虚拟筛选(见图7)。
(, 下载次数 Times of downloads: 70)
图7
例如, 本教程中,用户可以用筛选出的random seed:555767984来重复本教程。请输入下面的命令:
- #> MolAICal-xxx\molaicald --config conf.txt --ligand ligand.pdbqt --seed 555767984
复制代码
2. 将结果拆分为单个分子
- #> MolAICal-xxx\molaical.exe -tool pdbqt -i all.pdbqt -o ./
复制代码单个分子被命名为1.pdbqt、2.pdbqt或3.pdbqt等。“1.pdbqt”包含结合亲和力最好的对接构象,以此类推。
用户可以直接通过Pymol 软件查看 1.pdbqt、2.pdbqt 或3.pdbqt。在这里,UCSF Chimera 用于检查结果。它需要首先通过MolAICal使用以下命令将“pdbqt”转化为“pdb”格式:
1) 加氢(选项)
- #> MolAICal-xxx\molaical.exe -dock addh -i 1.pdbqt
复制代码2) 将“pdbqt”更改为“pdb”格式
- #> MolAICal-xxx\molaical.exe -dock pdbqt2pdb -i 1.pdbqt
复制代码用户可以在本教程中对2.pdbqt 和 3.pdbqt使用相同的方式。现在,打开 UCSF Chimera 并加载protein.pdb、1.pdb、2.pdb 和 3.pdb:
3) 用户可以通过Favorites-->Model Panel在所有分子加载时选择显示或隐藏分子(见图8)
(, 下载次数 Times of downloads: 82)
图8
注意:如果用户想分析蛋白质和对接配体之间的相互作用,用户可以选择在protein.pdb上添加氢。
结果显示“1.pdb”有部分结构跟原始配体有叠合,而“3.pdb”与原始配体有相似的重叠部分。这个体系做过分子动力学模拟(见教程MM/GBSA:https://molaical.gitee.io/tutorial.html)。MM/GBSA教程的结果显示原始配体N3的Andricioaei熵值是-84.70646297459386 (kcal/mol)。这表明原始配体N3在SARS-CoV-2Mpro的口袋中是不稳定的。
参考文献
[1] JinZ, Du X, Xu Y, Deng Y, Liu M, Zhao Y, et al. Structure of Mpro from COVID-19virus and discovery of its inhibitors. bioRxiv. 2020.
[2] ZhangL, Lin D, Sun X, Curth U, Drosten C, Sauerhering L, et al. Crystal structure ofSARS-CoV-2 main protease provides a basis for design of improved alpha-ketoamideinhibitors. Science. 2020. doi: 10.1126/science.abb3405. PubMed PMID: 32198291
作者Author: exity 时间: 2021-10-17 10:58
本帖最后由 exity 于 2021-10-17 11:03 编辑
1.2版的ChimeraX里找不到
ToolsàSurface/Binding AnalysisàAutodock Vina
是不是要先安装 Autodock Vina?
貌似Chimera和ChimeraX的差异比较大,先去研究一下,可能是我用的是ChimeraX的原因。
作者Author: MolAICal 时间: 2021-10-17 11:26
不需要安装autodock vina.....不要使用chimera X.....使用UCSF Chimera,它的这个tool-->Surface/Binding Analysis-->Autodock Vina选项确定盒子大小,很方便。。。
作者Author: exity 时间: 2021-10-17 11:45
windows下用powershell不支持tab补齐命令有点难受
作者Author: exity 时间: 2021-10-17 11:57
本帖最后由 exity 于 2021-10-17 12:25 编辑
我按照教程走了一遍,得到3个结构,一个都没能和原始ligand对的上,请问应该怎么改进?
下图123是我跑出来的结果,箭头是自带的ligand.
(, 下载次数 Times of downloads: 74)
修改参数 --exhaustiveness 16 --num_modes 20 后 still dose not work T_T
(, 下载次数 Times of downloads: 75)
作者Author: MolAICal 时间: 2021-10-17 12:06
本帖最后由 MolAICal 于 2021-10-17 12:09 编辑
你检查一下conf.txt文件,确定一下中心坐标和盒子大小有没有问题?你可以把文件打包,我下载看一下,包括conf.txt-配体和受体文件
作者Author: exity 时间: 2021-10-17 12:27
(, 下载次数 Times of downloads: 2)
以上是我的pdb、pdbqt以及config文件,请帮忙查看。
作者Author: exity 时间: 2021-10-17 12:42
又跑了一次就成功了,貌似是第一次用chimeraX拆的ligand和protein,然后用chimera打开的时候坐标变了,导致对接质量很差。谢谢了。
作者Author: exity 时间: 2021-10-17 12:58
本帖最后由 exity 于 2021-10-17 13:34 编辑
你好,这是最新的输入文件集合和对接结果。额外使用了num_modes = 30,exhaustiveness = 20参数,但结果和晶体文件里的ligand的吻合情况不好(RMSD很大)。
很久没有用过vina或smina了,如果我没有记错,这种简单的对接,他们很大概率是能收敛到和晶体文件配体几乎一致的结果上去的。
请问还有其他tuning方法吗?
刚刚用smina跑了一下,对接结果和晶体结果吻合的也不是很好。
(, 下载次数 Times of downloads: 3)
作者Author: MolAICal 时间: 2021-10-17 14:23
本帖最后由 MolAICal 于 2021-10-17 14:25 编辑
这个分子柔性太大了,确实很难做,vina作出的结果也是这样的,你查看一下附件,这个只提升了点效果,目前还在抓紧时间提升。。。
作者Author: exity 时间: 2021-10-17 15:13
是的,也不排除有其他晶体级别的解。
作者Author: MolAICal 时间: 2021-10-17 17:14
本帖最后由 MolAICal 于 2021-10-17 17:24 编辑
还有1个解决方案,对于柔性特别大的分子,需要多次试验,找出最佳的解决参数,通过random seed来记录,我简单筛选了一个参数,你可以使用命令重复一下,num_modes设置成3个就行,命令如下:
- #> MolAICal-xxx\molaicald --config conf.txt --ligand ligand.pdbqt --seed 555767984
复制代码
作者Author: MolAICal 时间: 2021-10-17 17:14
这个结果显示“1.pdb”有部分结构跟原始配体有叠合,而“3.pdb”与原始配体有相似的重叠部分。这个体系做过分子动力学模拟(见教程MM/GBSA:https://molaical.gitee.io/tutorial.html)。MM/GBSA教程的结果显示原始配体N3的Andricioaei熵值是-84.70646297459386 (kcal/mol)。这表明原始配体N3在SARS-CoV-2Mpro的口袋中是不稳定的。
作者Author: Tonycjlu 时间: 2021-10-19 11:07
和ADT vina有显著性提高吗?我大致看了一下,这个过程和vina差不多。
作者Author: MolAICal 时间: 2021-10-19 14:16
是的,不在依赖ADT,, 独立开发,有提升,后面会有大提升。
作者Author: BEICEHNG 时间: 2022-6-21 11:38
你好,请问我这里怎么生成不了PDBQT文件呢?
作者Author: MolAICal 时间: 2022-7-2 16:38
本帖最后由 MolAICal 于 2022-7-2 16:39 编辑
你把protein.pdb以附件的形式贴在回复贴里面。。我帮你看一下。或者加QQ群:1151656349 ,我在群里帮你看一下
作者Author: XYT42 时间: 2023-7-16 22:39
本帖最后由 XYT42 于 2023-7-16 23:21 编辑
请问在windows系统下使用Cmder运行molaical.exe,为什么显示的是# Project leader: Qifeng Bai, the official site of MolAICal: https://molaical.github.io or https://molaical.gitee.io #(前提:已经在系统环境变量添加MolAICal的安装路径 D:\Linuxpackage\Docking\MolAICal-win64-v1.3)
该问题已解决:https://molaical.github.io/install.html
作者Author: MolAICal 时间: 2023-12-13 15:25
需要安装一下MolAICal,具体请见:https://molaical.github.io/install.html
作者Author: nianbin 时间: 2023-12-14 08:52
请问支持虚拟筛选吗?有小分子数据库吗?
作者Author: MolAICal 时间: 2023-12-14 15:58
支持虚拟筛选,直接用ZINC数据库即可 https://zinc.docking.org/
| 欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |