|
本帖最后由 student0618 于 2024-12-4 09:10 编辑
0. 前言
作蛋白质模拟时经常会从公开的资料库PDB下载structural model 作初始结构。然而,PDB上的结构质素参差不齐。特别是有小分子结合的结构,作蛋白晶体的老师们不论是来自国内还是国外都很常把一句「PDB很多结构根本没小分子在,就硬是放进去」挂在嘴边。因此,判断一个在PDB上的蛋白-配体结构是否能放心使用对后续模拟十分重要。
刚开始和一位实验组老师合作时,我不小心选了个「这种质素居然能发Nature/Science/Cell/PNAS......」的结构而被训了。于是,老师教了我用pdb上该结构的structure factor mtz文件初步判断PDB中配体是否在、pdb原始文献的论点是否言过其实的方法。虽然PDB网站可以用 内建的Mol* viewer看electron density map,但这个map是有model bias 的,可能会有误导性。而结构的原始文献通常都会给没有model bias的omit map图,但作者可以很有技巧地调map 的contour level 把noise当作该残基/配体的electron density,误导读者或者是pdb的用家。因此,较理想的方法是快速自己算一下该配体/残基的omit map来检查。在此分享一下我的学习笔记,希望可以帮助到有需要的同学们。
(注:以下适用于X-ray晶体结构模型,不是cryo-EM的模型。)
一、Software 软件
Phenix (需注册)
- 网址为 https://phenix-online.org/
- 原生Windows 版本较新版本可能用不了,打开就闪退。我目前是在Windows 10 用原生1.20.4487版。官方建议用WSL2 装linux版以使用所有功能,也可以试试。
- Mac需要有XQuartz,也很可能会遇到python bug。搜官方mailing list 安装bugfix 再按指示装那补丁即可。
- Linux版本安装简单直接,Centos 7 和linux mint 19 都没什么问题。
(Alternative: CCP4 也可以。除了那个5GB的包外,也有云端版本不必在本地安装,注册后登入就能用。不过我不太熟悉CCP4,先跳过了。而且他的服务器大概还在完善中,可能不大稳定。先前参加CCP4开发者主持的工作坊,30多人同时交refinement作业时server没了。)
Coot/WinCoot
二、 Workflow操作流程
没装到软件或只用手机的话:
可以先用PDB网站看看density map。如果有红色density 和配体/残基的原子重叠这模型是有问题的。就算没重叠,如果蓝色的map包不住整个分子/残基也是有点可疑的,要小心,未必能尽信。
Phenix+coot/wincoot可用的话:
- 从PDB下载结构的pdb文件和mtz (2024年12月补记:现在PDB好像不能直接下载mtz了,可参考https://www.rcsb.org/docs/genera ... ectron-density-maps 如何把pdb上的structure factor cif 换成mtz)
- 複製一遍pdb文件,新的文件用喜欢的任何方法删除目标的配体/残基。
- Phenix开新project,随便给个名字, set好working directory。
- 右方选单选Phenix.refine,弹出的视窗选删除了目标配体/残基的pdb文件和mtz文件。
- 跑一遍refinement,只是要快速测一遍的话用预设参数就可以。
- 打开Coot或WinCoot,左上file - opem coordinates,选下载的(没删配体/残基的)pdb文件。
- Coot左上file - auto open mtz,选phenix 生成的mtz
- 目标是小分子配体的话:Coot上方第二栏有个2D小分子的图示,按下去就可以快速找到小分子。
- 目标是特定残基的话:按绿色箭头指着黄色圆形的图示,输入编号或者在残基选单找。
- Coot display 上方有小字标 “map (数字) level = ...”,那个是density map的contour level,可用滑鼠滚轮调整。蓝色的2fo-fc map调1 rmsd,红/绿色的fo-fc map/difference map调3 rmsd (注:display manager选择调整哪个map)。
- 检查目标配体/残基是否完整被绿色的Map包裹。不行的可调小一点fo-fc map, 但最好不要低于2 rmsd。
- 想试玩一下的可以自己试试Fit那目标再跑一遍refinement,看看例如R-free能不能做得比PDB好。做法的话偏离了这帖主题了,可参考Phenix官方的保姆级超仔细教程。
三、总结
本帖总结了一下如何初步判断PDB上晶体结构模型可信度的步骤。要选pdb作模拟的初始结构或者是experimental reference for model validation的话可以先用这方法检查一下。这只是个快速测一下的方法,正式算文献中的omit map会用更专门的工具(phenix选单可以找到正式omit map的工具)
作structure determination的老师很强调PDB上那些原子座标是是structural model不是实际structure,使用时要小心注意。其他判断方法除了PDB给的validation report外还有例如看resolution高低、检查R-free值是否和同resolution的结构相近、配体的B-factor是否在蛋白平均B-factor的两倍范围内等。还在学习中怕写错,就先不详细描述了。
四、延伸阅读
五、 备注
- 习惯用英文写学习相关的文章,中文还在练习。若有翻译错误或不通顺之处还请不吝赐教。
- X-ray diffraction相关内容我刚开始学习,只了解一点点皮毛。如有错漏或补充也请指正。
- 目前在国外参加会议,笔电不幸出了点意外,因此没有截图可贴。先贴文字,能救回来有时间再补图。
|
评分 Rate
-
查看全部评分 View all ratings
|