计算化学公社

标题: gmx_covar输出文件如何转化为本征值大小vs本征值序号 [打印本页]

作者
Author:
土拔鼠    时间: 2020-3-28 21:32
标题: gmx_covar输出文件如何转化为本征值大小vs本征值序号
请教一下大家

我在用gmx_covar计算本征向量和本征值 但输出的eigenvalues.xvg中 X轴坐标单位是Eigenvector index Y轴单位是nm\S2\N

我不是很理解在eigenvalues.xvg中 1号本征值对应的是1.45 (我理解的是这个值不应该小于1吗?就是能描述整个体系运动的百分之多少)

最后我想知道的结果是 比如前5个PC可以描述总体运动的百分之多少这种 那eigenvalues.xvg应该怎么改动才能得到类似的数据

谢谢大家

作者
Author:
sobereva    时间: 2020-3-29 11:26
1.45除以所有PC的本征值的总和再乘以100%就是其贡献百分比

此文有说
浅谈PCA与g_covar+g_anaeig+ddtdp+sigmaplot做自由能面图的方法
http://sobereva.com/73

作者
Author:
土拔鼠    时间: 2020-3-29 17:26
sobereva 发表于 2020-3-29 11:26
1.45除以所有PC的本征值的总和再乘以100%就是其贡献百分比

此文有说

谢谢社长 还想请教一下

如果PC1只占了总eigenvalues的34% 是不是就没有办法用PCA的方法去描述蛋白的运动?也没有办法用自由能形貌图去描述蛋白的运动?

我看了一些文章在进行FEL分析的时候 没有去说PC1 PC2的eigenvalues是多少直接去做的FEL分析 比如https://doi.org/10.1007/s11011-017-0121-2 在正文以及补充材料里都没有提到
是不是没有描述PC1 PC2的eigenvalues是多少 直接去做FEL这种做法是不合理的?

作者
Author:
azero    时间: 2020-3-29 18:25
土拔鼠 发表于 2020-3-29 17:26
谢谢社长 还想请教一下

如果PC1只占了总eigenvalues的34% 是不是就没有办法用PCA的方法去描述蛋白的运 ...

最近我也在研究PCA,发现了同样问题。
很多文章都是说前X个PC占百分之多少(至少70%-80%+吧),还有一些加一句PC1+PC2占多少(看了好几篇,没留意到超60%的,可能文献看得还不够吧),就PC1和PC2开始作图了

还有些文章是用 Cartesian PC1 和 dihedral PC1 做FEL的


作者
Author:
土拔鼠    时间: 2020-3-29 18:50
azero 发表于 2020-3-29 18:25
最近我也在研究PCA,发现了同样问题。
很多文章都是说前X个PC占百分之多少(至少70%-80%+吧),还有一些加 ...

嗯 我试过重复一篇文章的体系 没有原文的输入文件 我是按照相同的模拟设置去做的相同的时间尺度的模拟 我算出来的PC1只有29% 文章里提到PC1+PC2能描述70% 我给作者发邮件问是不是我的计算方法的问题 但没有回复我

我这次算的PC1+PC2差不多在45%
我试过之前模拟的三个蛋白一共14个体系 PC1只有一个体系能超过40% 没有一个PC1+PC2超过60% 所以不太清楚问题到底出现在哪里 - .. -
作者
Author:
azero    时间: 2020-3-29 19:45
土拔鼠 发表于 2020-3-29 18:50
嗯 我试过重复一篇文章的体系 没有原文的输入文件 我是按照相同的模拟设置去做的相同的时间尺度的模拟 我 ...

同样模拟了很多蛋白, PC1+PC2都很低。在想能不能只选取自己感兴趣的氨基酸残基做FEL
等Sob老师和其他大神回答
作者
Author:
Daniel_Arndt    时间: 2020-3-31 02:47
不想用PCA的话,可以尝试用tICA来降维。我试过pyemma这个软件做tICA,效果还行。我当时就是把所有重原子的二面角的正弦值、余弦值随时间的变化都算出来,写到一个文本文件中,然后参考了一下 https://emma-project.org/devel/g ... ptide-showcase.html 这个网页做的。
作者
Author:
Daniel_Arndt    时间: 2020-3-31 02:49
我之前说的那个网址的https证书可能有点问题,建议不要管Chrome浏览器的提示,要不然浏览不成。
作者
Author:
sobereva    时间: 2020-3-31 02:52
对PCA感兴趣的建议看看WIREs Comput Mol Sci, doi: 10.1002/wcms.1099
做PCA分析理应说清楚PC占了百分之多少
如果没有鲜明的定向运动的话,PC1+PC2不高是很正常的

作者
Author:
azero    时间: 2020-4-2 15:21
Daniel_Arndt 发表于 2020-3-31 02:47
不想用PCA的话,可以尝试用tICA来降维。我试过pyemma这个软件做tICA,效果还行。我当时就是把所有重原子的 ...

话说能不能把多段轨迹合并后分析tICA?
就是模拟开始是A构象,结束后变成了B构象;轨迹合并后,B构象又立马变回了A构象。
担心合并后的轨迹跟time-lag的含义有冲突。
不清楚tICA的time-lag的含义,实在看不懂那些公式。
作者
Author:
Daniel_Arndt    时间: 2020-4-3 09:15
azero 发表于 2020-4-2 15:21
话说能不能把多段轨迹合并后分析tICA?
就是模拟开始是A构象,结束后变成了B构象;轨迹合并后,B构象又 ...

做tICA的话,多条轨迹不需要合并吧?
你查一下pyemma官网手册,pyemma.coordinates.tica里面,data对应的参数可以是ndarray,也可以是list of ndarray。一条轨迹就用ndarray,多条轨迹就用list of ndarray。我处理多条轨迹的时候,就是list of ndarray,根本不需要去合并。

而且,我觉得如果你把多条轨迹合并成一条轨迹做tICA,可能由于不连续导致出问题。
作者
Author:
Amelia    时间: 2022-5-18 21:25
老师们,我想请问一下计算每个氨基酸在PC1上的贡献这个怎么做呀?
作者
Author:
sobereva    时间: 2022-5-18 21:37
Amelia 发表于 2022-5-18 21:25
老师们,我想请问一下计算每个氨基酸在PC1上的贡献这个怎么做呀?

我不知道你从哪里看到这种说法的
没见过这种说法。先了解点PCA的原理知识从原理上思考什么能算什么不能算




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3