请选择 进入手机版 | 继续访问电脑版

计算化学公社

 找回密码
 现在注册!
查看: 65|回复: 3

[其它程序] 【教程】RosettaVIP: 优化蛋白疏水内核折叠的稳定性设计方法

[复制链接]

198

帖子

2

威望

2522

eV
积分
2760

Level 5 (御坂)

发表于 2019-5-15 10:54:23 | 显示全部楼层 |阅读模式
本帖最后由 kunkun 于 2019-5-15 13:40 编辑

参考: https://www.rosettacommons.org/d ... tion/design/vip-app

教程资源: 位于$ROSETTA3/demos/public/vip

注意: demo中的结果格式已经过时,以本文实际测试结果为准。

注意: demo中的flag比较诡异,以本文实际测试结果为准。




前言

RosettaVIP最早是为了解决人工设计蛋白不稳定的问题而开发的,RosettaVIP使用RosettaHoles的方法来发现蛋白质结构中折叠不合理的疏水空隙,并搜索合适的氨基酸来替代,使得蛋白核心折叠更加稳定。


算法原理:

RosettaVIP设计是通过不断迭代以下3个步骤实现:

- 使用RosettaHoles搜索蛋白内部中的疏水空隙,并确定该空隙周围的氨基酸组成;
- 将这些氨基酸单点突变为疏水氨基酸(Fixed Backbone Design);
- 将本轮具潜力的一些点突变进一步进行Relax优化的结构,计算单点突变的ddG值,并从这些点突变中选择最好的,在此突变的基础上进行下一轮迭代。

以上的迭代持续进行,直到找不到空隙,或没有更好点突变位点为止。

rosettavip.png


设计效果:

> 参考Automated selection of stabilizing mutations in designed and natural proteins一文


Benjamin 通过RosettaVIP算法对数据集测试: 结果显示算法相比于RosettaDesign算法可以更加准确地识别蛋白疏水内核的稳定型残基。并以人工重新设计的λ受体蛋白DNA结合结构域、Protein L进行内核优化,试验验证结果提示RosettaVIP均能解决重设计蛋白不稳定性的问题。

此外,他们团队也尝试将RosettaVIP应用于天然蛋白的设计,以eMAP为例,通过设计获得了含5个点突变的eMAP5,其Tm值提升17.6℃。并且经过回复突变验证,这5个点突变只有组合在一起时,才能起到强大的组合效应。

eMAP5.jpg


1 准备输入文件

准备RosettaVIP的运行参数文件flags, 内容如下:

  1. # 采样参数控制:
  2. -s Start_Lambda_Model.pdb  # 定义输入的结构
  3. -ignore_unrecognized_res   # 删除多余的无法识别的残基 以及 水分子
  4. -cp:ncycles 4            # 控制迭代次数(不推荐使用)。
  5. -cp:cutoff 6.0            # 定义可突变邻近氨基酸范围,文献值为7.0
  6. -cp:max_failures 1        # 代表一次命令运行中,如果出现了x次错误,才会退出程序,设置为5次,可以确保RosettaHoles找到空隙。
  7. -sasa_calculator_probe_radius 1.0 # 表面探针<p></p>
  8. <p style="line-height: 30px; text-indent: 2em;"># 控制侧链优化:
  9. -cp:pack_sfxn ref2015     # 设置打分函数
  10. -cp:exclude_file $filename # 允许定义不可突变的关键氨基酸 </p>
  11. <p style="line-height: 30px; text-indent: 2em;"># relax优化控制
  12. -cp:relax_sfxn ref2015 # 设置relax的打分函数
  13. -cp:skip_relax         # 是否不进行额外的relax优化?
  14. -cp:relax_mover "relax"  # 默认relax,可选"classic_relax",但是更慢
  15. #-cp:local_relax        # 是否只进行局部relax的范围。针对大体系时启用,或对PDB结构进行截短处理,无关紧要的部分不考虑。demo中启用后,点突变寻找的能力下降,经常是失败的**。</p>
  16. <p style="line-height: 30px; text-indent: 2em;"># 报告输出
  17. -cp:print_reports # 将生成 reports.txt报告文件。
  18. -cp:print_intermediate_pdbs # 输出每一步的中间体蛋白PDB文件</p>
复制代码


exclude_file格式: 每行定义一个氨基酸(pdb number)。

- 如: 不允许A链128,136号计算突变:
  1. 128 A
  2. 136 A
复制代码


写好之后,将文件的全名替换掉`-cp:exclude_file`后面的$filename即可。

2 运行RosettaVIP

demo以λ受体为例,测试RosettaVIP。

  1. # 切换到工作目录
  2. cd $ROSETTA/demos/public/vip/rosetta_inputs<p></p>
  3. <p style="line-height: 30px; text-indent: 2em;"># 直接运行
  4. vip.mpi.macosclangrelease @flags</p>
复制代码



3 结果分析

运行结果输出至`reports.txt`文件:

可见,RosettaVIP对于我们输入的PDB结构总共进行了多轮迭代: 其中每轮都列出了候选的突变类型以及ddEgoe值(一种简化的能量函数打分值,可粗略地判断突变对稳定性的影响)

第一轮Relax后,程序分析出了10、13、35、52、57、60、66、71位点突变对结构稳定性有提升。而L13I的稳定性提升更明显(ddEgoe:-4.6042),选取了该突变。

第二轮迭代筛选时是在L13I突变的基础上重新分析能够减少疏水空隙的点突变,新的结构基础上,突变的位置,以及能量贡献都发生了变化。

如此类推RosettaVIP模拟了"单点组合突变"的实验过程。

  1. Iteration 1 :  Found candidate mutations:
  2. Position: 10 Native AA: ALA  Mutant AA: LEU  ddEgoe: -8.60701
  3. Position: 13 Native AA: LEU  Mutant AA: ILE  ddEgoe: -1.75332
  4. Position: 17 Native AA: PHE  Mutant AA: ILE  ddEgoe: -5.2701
  5. Position: 31 Native AA: VAL  Mutant AA: ILE  ddEgoe: -1.65599
  6. Position: 35 Native AA: ILE  Mutant AA: LEU  ddEgoe: -3.73465
  7. Position: 42 Native AA: PHE  Mutant AA: ILE  ddEgoe: -7.19784
  8. Position: 52 Native AA: PRO  Mutant AA: LEU  ddEgoe: -1.66479
  9. Position: 57 Native AA: ALA  Mutant AA: VAL  ddEgoe: -5.48826
  10. Position: 60 Native AA: PHE  Mutant AA: ILE  ddEgoe: -6.92573
  11. Position: 61 Native AA: ALA  Mutant AA: ILE  ddEgoe: -5.89349
  12. Position: 64 Native AA: PHE  Mutant AA: MET  ddEgoe: -9.8102
  13. Position: 66 Native AA: VAL  Mutant AA: ILE  ddEgoe: -1.52301
  14. Position: 68 Native AA: ILE  Mutant AA: LEU  ddEgoe: -1.13047
  15. Position: 71 Native AA: PHE  Mutant AA: TRP  ddEgoe: -5.02144
  16. Iteration 1 :  The following mutations were accomodated after relaxation:
  17. Position: 10 chain:  3 Native AA: ALA  Mutant AA: LEU  ddEgoe: -3.07001
  18. Position: 13 chain:  3 Native AA: LEU  Mutant AA: ILE  ddEgoe: -4.6042
  19. Position: 35 chain:  3 Native AA: ILE  Mutant AA: LEU  ddEgoe: -1.76918
  20. Position: 52 chain:  3 Native AA: PRO  Mutant AA: LEU  ddEgoe: -1.53427
  21. Position: 57 chain:  3 Native AA: ALA  Mutant AA: VAL  ddEgoe: -0.947129
  22. Position: 60 chain:  3 Native AA: PHE  Mutant AA: ILE  ddEgoe: -2.34727
  23. Position: 66 chain:  3 Native AA: VAL  Mutant AA: ILE  ddEgoe: -1.05786
  24. Position: 71 chain:  3 Native AA: PHE  Mutant AA: TRP  ddEgoe: -3.56223
  25. Accepted mutation from LEU to ILE at position 13  chain:  3
  26. Iteration 2 :  Found candidate mutations:
  27. Position: 8 Native AA: ALA  Mutant AA: ILE  ddEgoe: -2.1497
  28. Position: 10 Native AA: ALA  Mutant AA: LEU  ddEgoe: -8.0779
  29. Position: 17 Native AA: PHE  Mutant AA: ILE  ddEgoe: -5.2137
  30. Position: 31 Native AA: VAL  Mutant AA: ILE  ddEgoe: -1.65536
  31. Position: 32 Native AA: ALA  Mutant AA: MET  ddEgoe: -4.9991
  32. Position: 35 Native AA: ILE  Mutant AA: LEU  ddEgoe: -3.64756
  33. Position: 42 Native AA: PHE  Mutant AA: ILE  ddEgoe: -7.00559
  34. Position: 52 Native AA: PRO  Mutant AA: LEU  ddEgoe: -1.8697
  35. Position: 57 Native AA: ALA  Mutant AA: ILE  ddEgoe: -5.61317
  36. Position: 60 Native AA: PHE  Mutant AA: ILE  ddEgoe: -4.88678
  37. Position: 61 Native AA: ALA  Mutant AA: ILE  ddEgoe: -5.65812
  38. Position: 64 Native AA: PHE  Mutant AA: MET  ddEgoe: -6.68818
  39. Position: 66 Native AA: VAL  Mutant AA: ILE  ddEgoe: -1.49476
  40. Position: 68 Native AA: ILE  Mutant AA: LEU  ddEgoe: -1.04628
  41. Position: 71 Native AA: PHE  Mutant AA: TRP  ddEgoe: -4.97966
  42. .......................
  43. .......................
复制代码



对比最终效果的展示: 经过VIP design, 内部的疏水空隙明显减少。

屏幕快照 2019-05-15 10.42.55.jpg


**特别注意事项:**

- 不要额外调用`-ex1 -ex2`选项,会大幅度下降计算速度。程序内部设计时已经考虑了额外的Rotamer;
- RosettaVIP中relax是最耗时的部分,因此对大体系的计算能力不足,需要添加`-cp:local_relax`选项。
- RosettaHoles1寻找疏水空隙是随机算法,如果只允许一次,有可能找不到应有的空隙,因此需要多跑几次计算,可以尝试增加`-cp:max_failures`的参数值。多次计算结果,会输出多条不一样的序列。
- 点突变的假阳率大约在25%左右。


备注: RosettaVIP在线服务器: https://rosie.graylab.jhu.edu/vip (一键提交,但是需要等。氨基酸数目较多的蛋白不建议提交)

评分

参与人数 1eV +10 收起 理由
sobereva + 10

查看全部评分

主攻: 蛋白-蛋白对接,蛋白de novo设计、蛋白结构建模,抗体设计等方向。Rosetta/PyRosetta

198

帖子

2

威望

2522

eV
积分
2760

Level 5 (御坂)

 楼主| 发表于 2019-5-15 11:00:15 | 显示全部楼层
好奇怪.....附件上传完成!成功 0 个,失败 1 个:
eMAP5.png: 文件类型限制无法上传那么大的附件(不能超过 614400 字节)

图片无法插入。但是我的图片只有1.5M..
主攻: 蛋白-蛋白对接,蛋白de novo设计、蛋白结构建模,抗体设计等方向。Rosetta/PyRosetta

1万

帖子

25

威望

2万

eV
积分
41896

管理员

公社社长

发表于 2019-5-15 13:12:07 | 显示全部楼层
kunkun 发表于 2019-5-15 11:00
好奇怪.....附件上传完成!成功 0 个,失败 1 个:
eMAP5.png: 文件类型限制无法上传那么大的附件(不能超过 ...

论坛对图片限制是600KB,通常只要恰当调整像素大小,用恰当的jpg压缩质量足够用了。如果确实需要更大的话请通过外链方式插入
北京科音自然科学研究中心:http://www.keinsci.com  致力于计算化学的发展和传播,不定期开办各层次量子化学、分子动力学、波函数分析与Multiwfn程序等主题的培训。欢迎加入“北京科音”微信公众号获取培训最新消息和计算化学资讯
思想家公社QQ群1号:18616395,2号:466017436。超过4000人,用于交流理论、计算化学。两个群讨论范畴相同,可加入任意其一但不可都加入,申请信息必须注明具体研究方向,否则一概不批。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(最流行的量子化学波函数分析程序)

此账号为诸Sobereva共用
Money and papers are rubbish, get a real life!

198

帖子

2

威望

2522

eV
积分
2760

Level 5 (御坂)

 楼主| 发表于 2019-5-15 13:32:42 | 显示全部楼层
sobereva 发表于 2019-5-15 13:12
论坛对图片限制势600KB,通常只要恰当调整像素大小,用恰当的jpg压缩质量足够用了。如果确实需要更大的话 ...

谢谢老师,我感觉我终于会在论坛排版了
主攻: 蛋白-蛋白对接,蛋白de novo设计、蛋白结构建模,抗体设计等方向。Rosetta/PyRosetta
您需要登录后才可以回帖 登录 | 现在注册!

本版积分规则

手机版|北京科音自然科学研究中心|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949-1号 )

GMT+8, 2019-5-24 10:03 , Processed in 0.175586 second(s), 28 queries .

快速回复 返回顶部 返回列表