计算化学公社

 找回密码 Forget password
 注册 Register
Views: 864|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] 学习笔记:初步判断PDB上X-ray结构模型中特定残基/配体结构可信度的方法

[复制链接 Copy URL]

487

帖子

1

威望

1137

eV
积分
1644

Level 5 (御坂)

A Student

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 student0618 于 2024-12-4 09:10 编辑

0. 前言
作蛋白质模拟时经常会从公开的资料库PDB下载structural model 作初始结构。然而,PDB上的结构质素参差不齐。特别是有小分子结合的结构,作蛋白晶体的老师们不论是来自国内还是国外都很常把一句「PDB很多结构根本没小分子在,就硬是放进去」挂在嘴边。因此,判断一个在PDB上的蛋白-配体结构是否能放心使用对后续模拟十分重要。

刚开始和一位实验组老师合作时,我不小心选了个「这种质素居然能发Nature/Science/Cell/PNAS......」的结构而被训了。于是,老师教了我用pdb上该结构的structure factor mtz文件初步判断PDB中配体是否在、pdb原始文献的论点是否言过其实的方法。虽然PDB网站可以用 内建的Mol* viewer看electron density map,但这个map是有model bias 的,可能会有误导性。而结构的原始文献通常都会给没有model bias的omit map图,但作者可以很有技巧地调map 的contour level 把noise当作该残基/配体的electron density,误导读者或者是pdb的用家。因此,较理想的方法是快速自己算一下该配体/残基的omit map来检查。在此分享一下我的学习笔记,希望可以帮助到有需要的同学们。

(注:以下适用于X-ray晶体结构模型,不是cryo-EM的模型。)

一、Software 软件

Phenix (需注册)
  • 网址为 https://phenix-online.org/
  • 原生Windows 版本较新版本可能用不了,打开就闪退。我目前是在Windows 10 用原生1.20.4487版。官方建议用WSL2 装linux版以使用所有功能,也可以试试。
  • Mac需要有XQuartz,也很可能会遇到python bug。搜官方mailing list 安装bugfix 再按指示装那补丁即可。
  • Linux版本安装简单直接,Centos 7 和linux mint 19 都没什么问题。

(Alternative: CCP4 也可以。除了那个5GB的包外,也有云端版本不必在本地安装,注册后登入就能用。不过我不太熟悉CCP4,先跳过了。而且他的服务器大概还在完善中,可能不大稳定。先前参加CCP4开发者主持的工作坊,30多人同时交refinement作业时server没了。)

Coot/WinCoot

二、 Workflow操作流程

没装到软件或只用手机的话:
可以先用PDB网站看看density map。如果有红色density 和配体/残基的原子重叠这模型是有问题的。就算没重叠,如果蓝色的map包不住整个分子/残基也是有点可疑的,要小心,未必能尽信。

Phenix+coot/wincoot可用的话:
  • 从PDB下载结构的pdb文件和mtz (2024年12月补记:现在PDB好像不能直接下载mtz了,可参考https://www.rcsb.org/docs/genera ... ectron-density-maps 如何把pdb上的structure factor cif 换成mtz)
  • 複製一遍pdb文件,新的文件用喜欢的任何方法删除目标的配体/残基。
  • Phenix开新project,随便给个名字, set好working directory。
  • 右方选单选Phenix.refine,弹出的视窗选删除了目标配体/残基的pdb文件mtz文件
  • 跑一遍refinement,只是要快速测一遍的话用预设参数就可以。
  • 打开Coot或WinCoot,左上file - opem coordinates,选下载的(没删配体/残基的)pdb文件。
  • Coot左上file - auto open mtz,选phenix 生成的mtz
  • 目标是小分子配体的话:Coot上方第二栏有个2D小分子的图示,按下去就可以快速找到小分子。
  • 目标是特定残基的话:按绿色箭头指着黄色圆形的图示,输入编号或者在残基选单找。
  • Coot display 上方有小字标 “map (数字) level = ...”,那个是density map的contour level,可用滑鼠滚轮调整。蓝色的2fo-fc map调1 rmsd,红/绿色的fo-fc map/difference map调3 rmsd (注:display manager选择调整哪个map)。
  • 检查目标配体/残基是否完整被绿色的Map包裹。不行的可调小一点fo-fc map, 但最好不要低于2 rmsd。
  • 想试玩一下的可以自己试试Fit那目标再跑一遍refinement,看看例如R-free能不能做得比PDB好。做法的话偏离了这帖主题了,可参考Phenix官方的保姆级超仔细教程。

三、总结
本帖总结了一下如何初步判断PDB上晶体结构模型可信度的步骤。要选pdb作模拟的初始结构或者是experimental reference for model validation的话可以先用这方法检查一下。这只是个快速测一下的方法,正式算文献中的omit map会用更专门的工具(phenix选单可以找到正式omit map的工具)

作structure determination的老师很强调PDB上那些原子座标是是structural model不是实际structure,使用时要小心注意。其他判断方法除了PDB给的validation report外还有例如看resolution高低、检查R-free值是否和同resolution的结构相近、配体的B-factor是否在蛋白平均B-factor的两倍范围内等。还在学习中怕写错,就先不详细描述了。

四、延伸阅读


五、 备注
  • 习惯用英文写学习相关的文章,中文还在练习。若有翻译错误或不通顺之处还请不吝赐教。
  • X-ray diffraction相关内容我刚开始学习,只了解一点点皮毛。如有错漏或补充也请指正。
  • 目前在国外参加会议,笔电不幸出了点意外,因此没有截图可贴。先贴文字,能救回来有时间再补图。

评分 Rate

参与人数
Participants 3
威望 +1 eV +10 收起 理由
Reason
imasen + 5 赞!
sobereva + 1
Serious + 5 谢谢分享

查看全部评分 View all ratings

敬仰一针见血的指责,厌倦别有用心的赞美。

32

帖子

0

威望

516

eV
积分
548

Level 4 (黑子)

2#
发表于 Post on 2024-12-3 20:58:35 | 只看该作者 Only view this author
我确实从来没有考虑过X-ray结构的合理性,不过通常 我会看解析PDB的那一篇文章。如果PDB确实找不到结构完整的(缺少辅因子、配体),我会找同源且含有辅因子、配体的结构,将蛋白质准备一下(修复结构、能量最小化之类的   ),根据结合口袋进行对齐,二者叠合的同时去除模板蛋白。就是相当于把同源蛋白中辅因子、配体转移到我需的蛋白上面,最后再refine。我这种方式可行吗?此外我还尝试用AF3增加辅因子。                       

32

帖子

0

威望

516

eV
积分
548

Level 4 (黑子)

3#
发表于 Post on 2024-12-3 21:04:50 | 只看该作者 Only view this author
而且我遇到过一种情况。就是某些蛋白如果加入辅因子就完全无法结晶,所以必须要用特殊手段加入。结构原始文件的作者在文章中是建议找一个同工酶,二者结合口袋叠合一下

487

帖子

1

威望

1137

eV
积分
1644

Level 5 (御坂)

A Student

4#
 楼主 Author| 发表于 Post on 2024-12-3 21:25:02 | 只看该作者 Only view this author
本帖最后由 student0618 于 2024-12-3 21:26 编辑
HNUST 发表于 2024-12-3 20:58
我确实从来没有考虑过X-ray结构的合理性,不过通常 我会看解析PDB的那一篇文章。如果PDB确实找不到结构完整 ...

我这份笔记是判断pdb给的结构是否可信、该PDB entry的文献指“根据我们的晶体结构可以下这个结论”是否言过其实哦。

如果是诚实的作者如实指出晶体里面没有配体或辅因子,而我们要模拟有这些的情况下,通常也是如HNUST您所说从其他途径取得,例如用相近又有该配体的pdb align好合上去跑MD refine一下、或是docking候对比一下相近结构、蛋白不完整的话用例如modeller补等等。

敬仰一针见血的指责,厌倦别有用心的赞美。

45

帖子

1

威望

716

eV
积分
781

Level 4 (黑子)

5#
发表于 Post on 2024-12-12 09:37:59 | 只看该作者 Only view this author
好奇,不是做结构的,这个方法对X-ray可以判断,但是为什么对cryo-EM的模型不可以呢?

487

帖子

1

威望

1137

eV
积分
1644

Level 5 (御坂)

A Student

6#
 楼主 Author| 发表于 Post on 2024-12-12 12:01:54 | 只看该作者 Only view this author
SiqiLee 发表于 2024-12-12 09:37
好奇,不是做结构的,这个方法对X-ray可以判断,但是为什么对cryo-EM的模型不可以呢?

我也还在学习中。以下是我的理解,有误请指正。

X-ray diffraction 的density map 是算出来“目的为最贴近实验数据的”,因此和实验数据不合的地方可以从difference map看到。

Cryo-EM 的density map 是用“拍电影”的方式从超高清二维影像构建的三维density map,因此可说是个“三维影像”。
敬仰一针见血的指责,厌倦别有用心的赞美。

45

帖子

1

威望

716

eV
积分
781

Level 4 (黑子)

7#
发表于 Post on 2024-12-12 19:11:18 | 只看该作者 Only view this author
student0618 发表于 2024-12-12 12:01
我也还在学习中。以下是我的理解,有误请指正。

X-ray diffraction 的density map 是算出来“目的为最 ...

谢谢解答!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 16:34 , Processed in 0.212523 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list