计算化学公社

标题: 学习笔记:初步判断PDB上X-ray结构模型中特定残基/配体结构可信度的方法 [打印本页]

作者
Author:
student0618    时间: 2024-12-3 19:56
标题: 学习笔记:初步判断PDB上X-ray结构模型中特定残基/配体结构可信度的方法
本帖最后由 student0618 于 2024-12-4 09:10 编辑

0. 前言
作蛋白质模拟时经常会从公开的资料库PDB下载structural model 作初始结构。然而,PDB上的结构质素参差不齐。特别是有小分子结合的结构,作蛋白晶体的老师们不论是来自国内还是国外都很常把一句「PDB很多结构根本没小分子在,就硬是放进去」挂在嘴边。因此,判断一个在PDB上的蛋白-配体结构是否能放心使用对后续模拟十分重要。

刚开始和一位实验组老师合作时,我不小心选了个「这种质素居然能发Nature/Science/Cell/PNAS......」的结构而被训了。于是,老师教了我用pdb上该结构的structure factor mtz文件初步判断PDB中配体是否在、pdb原始文献的论点是否言过其实的方法。虽然PDB网站可以用 内建的Mol* viewer看electron density map,但这个map是有model bias 的,可能会有误导性。而结构的原始文献通常都会给没有model bias的omit map图,但作者可以很有技巧地调map 的contour level 把noise当作该残基/配体的electron density,误导读者或者是pdb的用家。因此,较理想的方法是快速自己算一下该配体/残基的omit map来检查。在此分享一下我的学习笔记,希望可以帮助到有需要的同学们。

(注:以下适用于X-ray晶体结构模型,不是cryo-EM的模型。)

一、Software 软件

Phenix (需注册)

(Alternative: CCP4 也可以。除了那个5GB的包外,也有云端版本不必在本地安装,注册后登入就能用。不过我不太熟悉CCP4,先跳过了。而且他的服务器大概还在完善中,可能不大稳定。先前参加CCP4开发者主持的工作坊,30多人同时交refinement作业时server没了。)

Coot/WinCoot

二、 Workflow操作流程

没装到软件或只用手机的话:
可以先用PDB网站看看density map。如果有红色density 和配体/残基的原子重叠这模型是有问题的。就算没重叠,如果蓝色的map包不住整个分子/残基也是有点可疑的,要小心,未必能尽信。

Phenix+coot/wincoot可用的话:

三、总结
本帖总结了一下如何初步判断PDB上晶体结构模型可信度的步骤。要选pdb作模拟的初始结构或者是experimental reference for model validation的话可以先用这方法检查一下。这只是个快速测一下的方法,正式算文献中的omit map会用更专门的工具(phenix选单可以找到正式omit map的工具)

作structure determination的老师很强调PDB上那些原子座标是是structural model不是实际structure,使用时要小心注意。其他判断方法除了PDB给的validation report外还有例如看resolution高低、检查R-free值是否和同resolution的结构相近、配体的B-factor是否在蛋白平均B-factor的两倍范围内等。还在学习中怕写错,就先不详细描述了。

四、延伸阅读


五、 备注


作者
Author:
HNUST    时间: 2024-12-3 20:58
我确实从来没有考虑过X-ray结构的合理性,不过通常 我会看解析PDB的那一篇文章。如果PDB确实找不到结构完整的(缺少辅因子、配体),我会找同源且含有辅因子、配体的结构,将蛋白质准备一下(修复结构、能量最小化之类的   ),根据结合口袋进行对齐,二者叠合的同时去除模板蛋白。就是相当于把同源蛋白中辅因子、配体转移到我需的蛋白上面,最后再refine。我这种方式可行吗?此外我还尝试用AF3增加辅因子。                       
作者
Author:
HNUST    时间: 2024-12-3 21:04
而且我遇到过一种情况。就是某些蛋白如果加入辅因子就完全无法结晶,所以必须要用特殊手段加入。结构原始文件的作者在文章中是建议找一个同工酶,二者结合口袋叠合一下
作者
Author:
student0618    时间: 2024-12-3 21:25
本帖最后由 student0618 于 2024-12-3 21:26 编辑
HNUST 发表于 2024-12-3 20:58
我确实从来没有考虑过X-ray结构的合理性,不过通常 我会看解析PDB的那一篇文章。如果PDB确实找不到结构完整 ...

我这份笔记是判断pdb给的结构是否可信、该PDB entry的文献指“根据我们的晶体结构可以下这个结论”是否言过其实哦。

如果是诚实的作者如实指出晶体里面没有配体或辅因子,而我们要模拟有这些的情况下,通常也是如HNUST您所说从其他途径取得,例如用相近又有该配体的pdb align好合上去跑MD refine一下、或是docking候对比一下相近结构、蛋白不完整的话用例如modeller补等等。


作者
Author:
SiqiLee    时间: 2024-12-12 09:37
好奇,不是做结构的,这个方法对X-ray可以判断,但是为什么对cryo-EM的模型不可以呢?

作者
Author:
student0618    时间: 2024-12-12 12:01
SiqiLee 发表于 2024-12-12 09:37
好奇,不是做结构的,这个方法对X-ray可以判断,但是为什么对cryo-EM的模型不可以呢?

我也还在学习中。以下是我的理解,有误请指正。

X-ray diffraction 的density map 是算出来“目的为最贴近实验数据的”,因此和实验数据不合的地方可以从difference map看到。

Cryo-EM 的density map 是用“拍电影”的方式从超高清二维影像构建的三维density map,因此可说是个“三维影像”。
作者
Author:
SiqiLee    时间: 2024-12-12 19:11
student0618 发表于 2024-12-12 12:01
我也还在学习中。以下是我的理解,有误请指正。

X-ray diffraction 的density map 是算出来“目的为最 ...

谢谢解答!




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3