使用MolAICal和Pafnucy模型对药物亲和力进行预测

MolAICal · 发表于 Post on 2021-11-3 11:25:20

本帖最后由 MolAICal 于 2021-11-4 14:10 编辑

使用MolAICal和Pafnucy模型对药物

亲和力进行预测

更多教程（含英文教程）请见如下：

MolAICal官方主页：https://molaical.github.io

MolAICal官方主页中国镜像：https://molaical.gitee.io

MolAICal 文章介绍：https://arxiv.org/abs/2006.09747 和 https://doi.org/10.1093/bib/bbaa161

MolAICal中文博客：https://molaical.github.io/cntutorial.html

MolAICal Twitter：https://twitter.com/MolAICal

MolAICal QQ学术讨论群： 1151656349

1. 简介

深度学习模型可以用来计算配体和受体之间的亲和力，将Pafnucy嵌入到MolAICal用以计算配体的亲和力。这个案例可以帮助使用者快速了解深度学习是如何计算配体和蛋白的亲和力，本文介绍的pafnucy在亲和力预测方面还是比较稳定的。有关MolAICal的更多详细信息，请参考文章(https://doi.org/10.1093/bib/bbaa161)。

2. 软件和所需数据

2.1 软件需求

1) MolAICal: https://molaical.github.io

国内镜像MolAICal: https://molaical.gitee.io

2) UCSF Chimera: https://www.cgl.ucsf.edu/chimera/

3) VMD: https://www.ks.uiuc.edu/Research/vmd/

2.2 案例文件

1）所有在教程中的重要文件可以从该网址下载：

https://gitee.com/molaical/tutorials/tree/master/015-bindingaffinityPafnucy

3. 步骤

3.1安装Pafnucy模型

现阶段只支持linux系统

1）点击并打开网页：DownloadModel

在已打开的网页中根据路径AImodels/BindingAffinity/pafnucy/linux，下载文件名是“pafnucy.tar.gz”。

2）把pafnucy.tar.gz移动到MolAICal-xxx/mtools目录下，“MolAICal-xxx”是你解压并安装MolAICal的目录，“mtools ”是指定目录。

3）解压目录

#> tar -xzvf pafnucy.tar.gz

复制代码

进入到pafnucy目录下

#> cd pafnucy

复制代码

4）安装Pafnucy模型

#> chmod +x install.sh
#> ./install.sh

复制代码

现在已成功安装Pafnucy模型

3.2计算一个复合物的亲和力

3.2.1 准备蛋白文件

1）从PDB数据库下载“3ui7.pdb”文件（假设已加氢）。打开UCSF文件，把“3ui7.pdb”的A链保存为“3ui7_A.pdb”.

图1. 处理蛋白文件

2）得到配体几何中心，几何中心坐标为5.081, 12.632, 43.498

图2

3）Pafnucy的原文中是在配体几何中心周围剪裁了一个大小为20 Å的盒子。通过MolAICal获得20 Å盒子的最大和最小坐标（注意：在写坐标时，一定要加上双引号，X,Y,Z和盒子的长度数值之间的间隔是一个空格）：

#> molaical.exe -tool box -i "5.081 12.632 43.498" -l "20.0 20.0 20.0" -o box.bild

复制代码

将会生成“box.bild”文件，该文件中“.box”部分包含最大和最小坐标。打开该文件，你会发现“.box”部分类似于：-4.919 2.6319999999999997 33.498 15.08122.631999999999998 53.498

4）用VMD导入“3ui7_A.pdb”文件，打开Tk终端（图3）。

图3

5）用VMD保存距配体几何中心20 Å盒子的复合物。

本教程的工作目录时在E盘，因此使用下列命令改变Tk的工作目录。

#> cd E:
#> cd workdir/MolAICal/tutorial/tutorial/015-bindingaffinityPafnucy/

复制代码

在Tk终端输入下面命令（由于先前的步骤已经计算出了盒子的x,y,z的最大和最小坐标，研究人员只需用自己真实数据代替下列坐标数据即可）

#> set box [atomselect top "protein and (not ((x < -4.919 or x > 15.081) or (y < 2.6319999999999997 or y > 22.631999999999998) or (z < 33.498 or z > 53.498)))"]
#> $box writepdb box.pdb

复制代码

图4展示了上述步骤的整个过程，请核对。使用者应该要使用自身的坐标数据。

图4

6）使用UCSF将“box.pdb”文件保存为“3ui7_pocket.mol2”（如图5所示）。（某些情况下，一些研究者直接将整个蛋白用于亲和力预测，如果这样的话，研究人员可以跳过上面六个步骤。）

图5

3.2.2 计算单个蛋白和配体之间的亲和力

到015-bindingaffinityPafnucy目录下，使用以下命令。

#> molaical.exe -model pafnucy -l 3ui7_ligand.mol2 -p 3ui7_pocket.mol2 -o results.csv

复制代码

运行结束后，会生成一个包含pKx值的results.csv的文件，如果研究人员想要将pKx值转化为结合自由能，可以参照该网页(https://molaical.github.io/tutorial.html), MolAICal提供自由能转化模块。

注意：如果研究人员没有mol2格式的文件，可以使用MolAICal转换文件格式。例如，如果研究人员有pdb格式的文件，可以使用下面的命令来进行格式转换（注释：分子应该由正确的后缀，否则无法被MolAICal自动识别）。

#> molaical.exe -tool format -i ligand.pdb -o ligand.mol2

复制代码

3.2.3 计算多个配体和蛋白之间的亲和力

某些情况下，研究人员想要计算多个配体的亲和力，基于以上需求，使用linux终端会很容易实现。

进入到015-bindingaffinityPafnucy目录，输入以下命令。

#> ls lig*.mol2 > list.txt

复制代码

生成一个包含所有配体名字的“list.txt”文件，打开“run.sh”文件，修改molical.exe的正确路径。（如图6所示）

图6

最终运行下列命令

#> bash run.sh

复制代码

合并所有计算结果

#> cat *.csv > results.csv

复制代码

运行结束后，会生成一个包含预测值pKx的results.csv的文件，如果研究人员想要将pKx值转化为结合自由能，可以参照该网页(https://molaical.github.io/tutorial.html), MolAICal提供自由能转化模块。

3.2.4 在命令行中计算少数配体和蛋白的亲和力

如果研究人员不需要计算大量的配体，那么他们可以在命令行中使用一行命令来计算少量的配体和蛋白。

进入到015-bindingaffinityPafnucy/list目录下，输入下面的指令：

#> molaical.exe -model pafnucy -l "lig_1.mol2 lig_2.mol2" -p receptor.mol2 -o twoTest.csv

复制代码

生成了“twoTest.csv”文件，lig_1.mol2和lig_2.mol2两个配体文件所计算的亲和力包含在该文件中，请注意要有双引号标记这两个配体文件。更为详细的指令，请参考MolAIcal的文档。

附录：

Linux系统下“run.sh”文件的内容：

#!/bin/bash
i=0
cat list.txt | while read line
do
echo $line
~/bai/soft/moaicalv11/molaical.exe -model pafnucy -l $line -p pocket.mol2 -o $line'.csv'
let i+=1
done

复制代码

参考文献：

1. Stepniewska-Dziubinska MM, Zielenkiewicz P, Siedlecki P.Development and evaluation of a deep learning model for protein-ligand bindingaffinity prediction. Bioinformatics. 2018;34(21):3666-74.

Labber · 发表于 Post on 2021-11-30 15:39:10

请问这个方法用来研究四肽+小分子的相互作用和亲和力可以吗？就是受体不是蛋白质这么大的，只是一个四肽分子

MolAICal · 发表于 Post on 2021-12-5 21:45:57

本帖最后由 MolAICal 于 2021-12-5 21:48 编辑

Labber 发表于 2021-11-30 15:39
请问这个方法用来研究四肽+小分子的相互作用和亲和力可以吗？就是受体不是蛋白质这么大的，只是一个四肽分 ...

应该可以的，你试试看，还有一个模型，你也可以试试看： http://bbs.keinsci.com/thread-25833-1-1.html

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[虚拟筛选] 使用MolAICal和Pafnucy模型对药物亲和力进行预测

评分 Rate

浏览过的版块