计算化学公社

标题: 使用MolAICal和Pafnucy模型对药物亲和力进行预测 [打印本页]

作者
Author:
MolAICal    时间: 2021-11-3 11:25
标题: 使用MolAICal和Pafnucy模型对药物亲和力进行预测
本帖最后由 MolAICal 于 2021-11-4 14:10 编辑

使用MolAICalPafnucy模型对药物
亲和力进行预测

更多教程(含英文教程)请见如下:
MolAICal官方主页:https://molaical.github.io
MolAICal官方主页中国镜像:https://molaical.gitee.io
MolAICal 文章介绍:https://arxiv.org/abs/2006.09747 https://doi.org/10.1093/bib/bbaa161
MolAICal中文博客:https://molaical.github.io/cntutorial.html
MolAICal Twitterhttps://twitter.com/MolAICal
MolAICal QQ学术讨论群: 1151656349

1. 简介
深度学习模型可以用来计算配体和受体之间的亲和力,将Pafnucy嵌入到MolAICal用以计算配体的亲和力。这个案例可以帮助使用者快速了解深度学习是如何计算配体和蛋白的亲和力,本文介绍的pafnucy在亲和力预测方面还是比较稳定的。有关MolAICal的更多详细信息,请参考文章(https://doi.org/10.1093/bib/bbaa161)

2. 软件和所需数据

2.1  软件需求
1) MolAICal: https://molaical.github.io
国内镜像MolAICal: https://molaical.gitee.io
2) UCSF Chimera: https://www.cgl.ucsf.edu/chimera/
3) VMD: https://www.ks.uiuc.edu/Research/vmd/

2.2 案例文件
1)所有在教程中的重要文件可以从该网址下载:
https://gitee.com/molaical/tutorials/tree/master/015-bindingaffinityPafnucy

3. 步骤
3.1安装Pafnucy模型

现阶段只支持linux系统

1)点击并打开网页:DownloadModel
在已打开的网页中根据路径AImodels/BindingAffinity/pafnucy/linux,下载文件名是“pafnucy.tar.gz”

2)把pafnucy.tar.gz移动到MolAICal-xxx/mtools目录下,“MolAICal-xxx”是你解压并安装MolAICal的目录,“mtools ”是指定目录。

3)解压目录
  1. #> tar -xzvf pafnucy.tar.gz
复制代码

进入到pafnucy目录下
  1. #> cd pafnucy
复制代码

4)安装Pafnucy模型
  1. #> chmod +x install.sh
  2. #> ./install.sh
复制代码
现在已成功安装Pafnucy模型


3.2计算一个复合物的亲和力
3.2.1 准备蛋白文件

1)从PDB数据库下载“3ui7.pdb”文件(假设已加氢)。打开UCSF文件,把“3ui7.pdb”A链保存为“3ui7_A.pdb”.
(, 下载次数 Times of downloads: 44)
1. 处理蛋白文件

2)得到配体几何中心,几何中心坐标为5.081, 12.632, 43.498
(, 下载次数 Times of downloads: 52)
2

3Pafnucy的原文中是在配体几何中心周围剪裁了一个大小为20 Å的盒子。通过MolAICal获得20 Å盒子的最大和最小坐标(注意:在写坐标时,一定要加上双引号,X,Y,Z和盒子的长度数值之间的间隔是一个空格):
  1. #> molaical.exe -tool box -i "5.081 12.632 43.498" -l "20.0 20.0 20.0" -o box.bild
复制代码

将会生成“box.bild”文件,该文件中“.box”部分包含最大和最小坐标。打开该文件,你会发现“.box”部分类似于:-4.919 2.6319999999999997 33.498 15.08122.631999999999998 53.498

4)用VMD导入“3ui7_A.pdb”文件,打开Tk终端(图3)。
(, 下载次数 Times of downloads: 50)
3

5)用VMD保存距配体几何中心20 Å盒子的复合物。
本教程的工作目录时在E盘,因此使用下列命令改变Tk的工作目录。
  1. #> cd E:
  2. #> cd workdir/MolAICal/tutorial/tutorial/015-bindingaffinityPafnucy/
复制代码

Tk终端输入下面命令(由于先前的步骤已经计算出了盒子的x,y,z的最大和最小坐标,研究人员只需用自己真实数据代替下列坐标数据即可)
  1. #> set box [atomselect top "protein and (not ((x < -4.919 or x > 15.081) or (y < 2.6319999999999997 or y > 22.631999999999998) or (z < 33.498 or z > 53.498)))"]
  2. #> $box writepdb box.pdb
复制代码

4展示了上述步骤的整个过程,请核对。使用者应该要使用自身的坐标数据。
(, 下载次数 Times of downloads: 59)
4

6)使用UCSF“box.pdb”文件保存为“3ui7_pocket.mol2”(如图5所示)。(某些情况下,一些研究者直接将整个蛋白用于亲和力预测,如果这样的话,研究人员可以跳过上面六个步骤。)
(, 下载次数 Times of downloads: 52)
5

3.2.2 计算单个蛋白和配体之间的亲和力

015-bindingaffinityPafnucy目录下,使用以下命令。
  1. #> molaical.exe -model pafnucy -l 3ui7_ligand.mol2 -p 3ui7_pocket.mol2 -o results.csv
复制代码
运行结束后,会生成一个包含pKx值的results.csv的文件,如果研究人员想要将pKx值转化为结合自由能,可以参照该网页(https://molaical.github.io/tutorial.html), MolAICal提供自由能转化模块。

注意:如果研究人员没有mol2格式的文件,可以使用MolAICal转换文件格式。例如,如果研究人员有pdb格式的文件,可以使用下面的命令来进行格式转换(注释:分子应该由正确的后缀,否则无法被MolAICal自动识别)。
  1. #> molaical.exe -tool format -i ligand.pdb -o ligand.mol2
复制代码

3.2.3 计算多个配体和蛋白之间的亲和力

某些情况下,研究人员想要计算多个配体的亲和力,基于以上需求,使用linux终端会很容易实现。

进入到015-bindingaffinityPafnucy目录,输入以下命令。
  1. #> ls lig*.mol2 > list.txt
复制代码

生成一个包含所有配体名字的“list.txt”文件,打开“run.sh”文件,修改molical.exe的正确路径。(如图6所示)
(, 下载次数 Times of downloads: 60)
6

最终运行下列命令
  1. #> bash run.sh
复制代码

合并所有计算结果
  1. #> cat *.csv > results.csv
复制代码

运行结束后,会生成一个包含预测值pKxresults.csv的文件,如果研究人员想要将pKx值转化为结合自由能,可以参照该网页(https://molaical.github.io/tutorial.html), MolAICal提供自由能转化模块。


3.2.4 在命令行中计算少数配体和蛋白的亲和力

如果研究人员不需要计算大量的配体,那么他们可以在命令行中使用一行命令来计算少量的配体和蛋白。
进入到015-bindingaffinityPafnucy/list目录下,输入下面的指令:
  1. #> molaical.exe -model pafnucy -l "lig_1.mol2 lig_2.mol2" -p receptor.mol2 -o twoTest.csv
复制代码

生成了“twoTest.csv”文件,lig_1.mol2lig_2.mol2两个配体文件所计算的亲和力包含在该文件中,请注意要有双引号标记这两个配体文件。更为详细的指令,请参考MolAIcal的文档。



附录:
Linux系统下“run.sh”文件的内容:
  1. #!/bin/bash

  2. i=0
  3. cat list.txt | while read line
  4. do
  5.         echo $line
  6.         ~/bai/soft/moaicalv11/molaical.exe -model pafnucy -l $line -p pocket.mol2 -o $line'.csv'
  7.         let i+=1
  8. done
复制代码






参考文献:
1.      Stepniewska-Dziubinska MM, Zielenkiewicz P, Siedlecki P.Development and evaluation of a deep learning model for protein-ligand bindingaffinity prediction. Bioinformatics. 2018;34(21):3666-74.



作者
Author:
Labber    时间: 2021-11-30 15:39
请问这个方法用来研究四肽+小分子的相互作用和亲和力可以吗?就是受体不是蛋白质这么大的,只是一个四肽分子
作者
Author:
MolAICal    时间: 2021-12-5 21:45
本帖最后由 MolAICal 于 2021-12-5 21:48 编辑
Labber 发表于 2021-11-30 15:39
请问这个方法用来研究四肽+小分子的相互作用和亲和力可以吗?就是受体不是蛋白质这么大的,只是一个四肽分 ...

应该可以的,你试试看,还有一个模型,你也可以试试看: http://bbs.keinsci.com/thread-25833-1-1.html




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3