本帖最后由 MolAICal 于 2021-11-4 14:10 编辑
使用MolAICal和Pafnucy模型对药物 亲和力进行预测
更多教程(含英文教程)请见如下: MolAICal QQ学术讨论群: 1151656349
1. 简介 深度学习模型可以用来计算配体和受体之间的亲和力,将Pafnucy嵌入到MolAICal用以计算配体的亲和力。这个案例可以帮助使用者快速了解深度学习是如何计算配体和蛋白的亲和力,本文介绍的pafnucy在亲和力预测方面还是比较稳定的。有关MolAICal的更多详细信息,请参考文章(https://doi.org/10.1093/bib/bbaa161)。
2. 软件和所需数据
2.1 软件需求
2.2 案例文件 1)所有在教程中的重要文件可以从该网址下载:
3. 步骤 3.1安装Pafnucy模型
现阶段只支持linux系统
在已打开的网页中根据路径AImodels/BindingAffinity/pafnucy/linux,下载文件名是“pafnucy.tar.gz”。
2)把pafnucy.tar.gz移动到MolAICal-xxx/mtools目录下,“MolAICal-xxx”是你解压并安装MolAICal的目录,“mtools ”是指定目录。
3)解压目录 - #> tar -xzvf pafnucy.tar.gz
复制代码
进入到pafnucy目录下
4)安装Pafnucy模型 - #> chmod +x install.sh
- #> ./install.sh
复制代码 现在已成功安装Pafnucy模型
3.2计算一个复合物的亲和力 3.2.1 准备蛋白文件
1)从PDB数据库下载“3ui7.pdb”文件(假设已加氢)。打开UCSF文件,把“3ui7.pdb”的A链保存为“3ui7_A.pdb”. 图1. 处理蛋白文件
2)得到配体几何中心,几何中心坐标为5.081, 12.632, 43.498 图2
3)Pafnucy的原文中是在配体几何中心周围剪裁了一个大小为20 Å的盒子。通过MolAICal获得20 Å盒子的最大和最小坐标(注意:在写坐标时,一定要加上双引号,X,Y,Z和盒子的长度数值之间的间隔是一个空格): - #> molaical.exe -tool box -i "5.081 12.632 43.498" -l "20.0 20.0 20.0" -o box.bild
复制代码
将会生成“box.bild”文件,该文件中“.box”部分包含最大和最小坐标。打开该文件,你会发现“.box”部分类似于:-4.919 2.6319999999999997 33.498 15.08122.631999999999998 53.498
4)用VMD导入“3ui7_A.pdb”文件,打开Tk终端(图3)。 图3
5)用VMD保存距配体几何中心20 Å盒子的复合物。 本教程的工作目录时在E盘,因此使用下列命令改变Tk的工作目录。 - #> cd E:
- #> cd workdir/MolAICal/tutorial/tutorial/015-bindingaffinityPafnucy/
复制代码
在Tk终端输入下面命令(由于先前的步骤已经计算出了盒子的x,y,z的最大和最小坐标,研究人员只需用自己真实数据代替下列坐标数据即可) - #> set box [atomselect top "protein and (not ((x < -4.919 or x > 15.081) or (y < 2.6319999999999997 or y > 22.631999999999998) or (z < 33.498 or z > 53.498)))"]
- #> $box writepdb box.pdb
复制代码
图4展示了上述步骤的整个过程,请核对。使用者应该要使用自身的坐标数据。 图4
6)使用UCSF将“box.pdb”文件保存为“3ui7_pocket.mol2”(如图5所示)。(某些情况下,一些研究者直接将整个蛋白用于亲和力预测,如果这样的话,研究人员可以跳过上面六个步骤。) 图5
3.2.2 计算单个蛋白和配体之间的亲和力
到015-bindingaffinityPafnucy目录下,使用以下命令。 - #> molaical.exe -model pafnucy -l 3ui7_ligand.mol2 -p 3ui7_pocket.mol2 -o results.csv
复制代码
注意:如果研究人员没有mol2格式的文件,可以使用MolAICal转换文件格式。例如,如果研究人员有pdb格式的文件,可以使用下面的命令来进行格式转换(注释:分子应该由正确的后缀,否则无法被MolAICal自动识别)。 - #> molaical.exe -tool format -i ligand.pdb -o ligand.mol2
复制代码
3.2.3 计算多个配体和蛋白之间的亲和力
某些情况下,研究人员想要计算多个配体的亲和力,基于以上需求,使用linux终端会很容易实现。
进入到015-bindingaffinityPafnucy目录,输入以下命令。 - #> ls lig*.mol2 > list.txt
复制代码
生成一个包含所有配体名字的“list.txt”文件,打开“run.sh”文件,修改molical.exe的正确路径。(如图6所示) 图6
最终运行下列命令
合并所有计算结果 - #> cat *.csv > results.csv
复制代码
3.2.4 在命令行中计算少数配体和蛋白的亲和力
如果研究人员不需要计算大量的配体,那么他们可以在命令行中使用一行命令来计算少量的配体和蛋白。 进入到015-bindingaffinityPafnucy/list目录下,输入下面的指令: - #> molaical.exe -model pafnucy -l "lig_1.mol2 lig_2.mol2" -p receptor.mol2 -o twoTest.csv
复制代码
生成了“twoTest.csv”文件,lig_1.mol2和lig_2.mol2两个配体文件所计算的亲和力包含在该文件中,请注意要有双引号标记这两个配体文件。更为详细的指令,请参考MolAIcal的文档。
附录: Linux系统下“run.sh”文件的内容: - #!/bin/bash
- i=0
- cat list.txt | while read line
- do
- echo $line
- ~/bai/soft/moaicalv11/molaical.exe -model pafnucy -l $line -p pocket.mol2 -o $line'.csv'
- let i+=1
- done
复制代码
参考文献: 1. Stepniewska-Dziubinska MM, Zielenkiewicz P, Siedlecki P.Development and evaluation of a deep learning model for protein-ligand bindingaffinity prediction. Bioinformatics. 2018;34(21):3666-74.
|