计算化学公社

 找回密码 Forget password
 注册 Register
Views: 5282|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[蛋白质建模] 几种基于氨基酸序列构建很简单蛋白质三维结构的工具

[复制链接 Copy URL]

6万

帖子

99

威望

5万

eV
积分
120165

管理员

公社社长

几种基于氨基酸序列构建很简单蛋白质三维结构的工具
Several tools for constructing three-dimensional structures of very simple proteins based on amino acid sequences

文/Sobereva@北京科音   2023-Oct-15


经常有人问已知很简单蛋白质(小肽)的氨基酸序列,怎么得到其三维立体结构,这里就介绍几种工具。本文并不是对相关程序做完整的收集,介绍的这些已经足够满足各种实际情况的需要了。注意本文的范畴和蛋白质结构预测完全不同,那类程序是用于构造有三级结构的较复杂蛋白质用的,本文涉及的工具顶多只牵扯到二级结构。

需要注意的是,只有其中部分程序可以产生原子名符合IUPAC规范的pdb结构文件。仅对于这种情况,pdb文件才可以载入VMD后正常显示二级结构(至少得骨架重原子名满足IUPAC规范),以及能够直接被比如GROMACS的pdb2gmx所处理来产生拓扑文件。

笔者另外写了篇文章介绍通过输入序列产生DNA或RNA三维结构的工具,见《几种基于核酸序列构建三维结构的工具》(http://sobereva.com/692)。


1 ProBuilder

这是个在线程序,网址是https://www.ddl.unimi.it/vegaol/probuilder.htm。用户只需要输入氨基酸序列,比如RLCVVPIRLPPLRERT,并且指定要产生的二级结构的phi、psi、omega角度,就可以获得结构文件。能产生的格式很多,包括符合IUPAC命名规范的pdb文件。此程序产生的结构可以要求带和不带侧链,带侧链的情况由于不会自动做结构优化,因此侧链往往有严重重叠,后面介绍的很多程序也都是如此。


2 GaussView

Gaussian的官方界面程序GaussView提供了生物分子片段库,如下所示。可以选择位于链中间、N端、C端的各种氨基酸残基片段,在建模窗口点击一次出现第一个残基后,再一次一次点击肽键末端,就可以逐渐得到满足要求的肽链。


建好后可以保存成结构文件,包括pdb格式。用此程序的优点是可以自行精细修改三维结构,缺点是没法把一长串序列一下子转化为三维结构,而且这么保存的pdb文件里的原子名只是元素名而不是满足IUPAC规范的名字,里面连残基名都没有,而且也没法像ProBuilder那样直接设置对应特定二级结构的phi和psi角度(得手动一个一个调)。


3 Avogadro

免费的可视化程序Avogadro(http://avogadro.cc)的Build - Insert - Peptide界面可以构建有特定二级结构、特定序列的小肽的三维结构,界面如下所示。可以保存出许多格式,保存成pdb的话原子名和残基名都是符合IUPAC规范的。此程序还自己支持GAFF、MMFF94等力场做几何优化,可以用于把建模后侧链的不合理接触消除掉。



4 gabedit

启动免费的可视化程序gabedit(http://gabedit.sourceforge.net)后,点菜单栏的Geometry - Draw,在新窗口里点右键,选Build - PolyPeptide,就可以看到构建多肽的界面,如下所示,也可以类似于Avogadro去产生符合特定二级结构的指定序列的小肽。每点击一次氨基酸的按钮在图形窗口里就会长出来相应的残基。之后点右键选save as,就可以保存成各种格式,包括满足IUPAC原子名和残基名规范的pdb格式。



5 AmberTools中的leap

知名的AmberTools(http://ambermd.org)程序里的leap可以用于根据氨基酸序列产生线型小肽的三维结构并保存成符合IUPAC命名规范的pdb文件。

参考手册或《Amber14安装方法》(http://sobereva.com/263)安装AmberTools后,在命令行窗口输入诸如tleap -f leaprc.protein.ff14SB即可启动纯文本界面的leap(tleap)且同时载入AMBER14SB力场相关的氨基酸的库文件。在里面可以输入比如如下命令定义一个序列,其中残基的N结尾和C开头分别代表N端和C端残基
TC5b = sequence { NASN LEU TYR ILE CGLN }
之后再运行以下命令就可以把序列以三维结构保存成/sob目录下的TC5b_linear.pdb了
savepdb TC5b /sob/TC5b_linear.pdb


6 PeptideBuilder

PeptideBuilder是个基于Python的轻量级构建小肽的库,网址是https://github.com/clauswilke/PeptideBuilder,具体介绍见原文PeerJ, 1, e80 (2013)。

在Linux下联网状态运行pip install PeptideBuilder即可安装。之后可以基于PeptideBuilder写Python脚本来构造小肽结构,可以指定psi和phi角度、有哪些残基等。此程序只产生重原子坐标,没有氢。产生的pdb文件符合IUPAC命名规范。

以下是个例子,比如保存为createQ6.py,之后运行python createQ6.py,就可以在当前目录下得到含有6个谷氨酰胺的yohane.pdb文件。

from PeptideBuilder import Geometry
import PeptideBuilder


geo = Geometry.geometry("Q")
geo.phi = -60
geo.psi_im1 = -40
structure = PeptideBuilder.initialize_res(geo)
for i in range(5):
    PeptideBuilder.add_residue(structure, geo)
PeptideBuilder.add_terminal_OXT(structure)


import Bio.PDB


out = Bio.PDB.PDBIO()
out.set_structure(structure)
out.save("yohane.pdb")

有人基于PeptideBuilder做了扩展写了额外Python程序,能生成具有指定序列在N端加上Fmoc或ACE(乙酰)封闭、在C端加上NME(甲胺基)封闭的pdb文件。见《生成任意序列的封端短肽pdb的脚本CappedPeptideBuilder.py》(http://bbs.keinsci.com/thread-30278-1-1.html)。一个简单例子:先把PeptideBuilder装上,然后把CappedPeptideBuilder.py放在当前目录下,再运行python CappedPeptideBuilder.py -s KEYIN -p test,此时当前目录下就出现了test目录,其中ACE_KEYIN.pdb就是N端加了乙酰、C端加了甲氨基的序列为KEYIN的小肽结构了(没有氢)。


7 Tinker

动力学模拟程序Tinker有根据序列建立蛋白质三维结构的命令protein,参见计算化学公社论坛的帖子:http://bbs.keinsci.com/forum.php ... pid=79011&fromuid=1



评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
南北多歧路 + 1 谢谢分享

查看全部评分 View all ratings

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

1657

帖子

5

威望

4562

eV
积分
6319

Level 6 (一方通行)

喵星人

2#
发表于 Post on 2023-10-16 01:55:03 | 只看该作者 Only view this author
本帖最后由 喵星大佬 于 2023-10-16 02:23 编辑

Discovery Studio Visualizer应该是干这事情最舒服的界面了,而且还是学术免费的
可以设定蛋白的常见二级结构,也可以用自定义的Phi/Psi延伸,可以封端,导出的pdb也比较规矩
正反方向延伸,突变特定氨基酸,手动做非标准残基,修改特定的键长键角二面角这些都很方便
同时可以做核酸的结构,单/双链,A/B/Z的,DNA/RNA/LNA,突变已有结构等等

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
KRAS + 5

查看全部评分 View all ratings

82

帖子

2

威望

785

eV
积分
907

Level 4 (黑子)

分子模拟晶戈

3#
发表于 Post on 2023-10-16 14:32:23 | 只看该作者 Only view this author
居然提到了我的toy script,受宠若惊。
最近还在考虑用python胶水把multiwfn,gaussian, sobtop粘起来做一个半傻瓜式的非天然氨基酸GAFF建模的工作。目前基础的思路是从ACE-X-NME出发结合量化结果和sobtop做gromacs的top文件。然后再手动把top里面摘出来rtp和hdb。摘出来RTP的过程参考了openMM的读gromacs的接口,简单地说就是手动search每一个bonded,angle,dihedral的term和数值然后转到rtp里面。不知道sobereva老师对此有何建议。

6万

帖子

99

威望

5万

eV
积分
120165

管理员

公社社长

4#
 楼主 Author| 发表于 Post on 2023-10-16 23:25:33 | 只看该作者 Only view this author
对抗路达摩 发表于 2023-10-16 14:32
居然提到了我的toy script,受宠若惊。
最近还在考虑用python胶水把multiwfn,gaussian, sobtop粘起来做一 ...

看起来可行,挺好
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-16 17:56 , Processed in 0.160030 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list