计算化学公社

 找回密码 Forget password
 注册 Register
Views: 5019|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[Multiwfn使用咨询] 将蛋白质pdb转化为orca输入文件时元素识别出错

[复制链接 Copy URL]

374

帖子

2

威望

1539

eV
积分
1953

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
我想将一个蛋白质的pdb文件转化为orca的输入文件,却发现histindine的NE2被识别为了Ne元素。
希望Multiwfn可以支持pdb标准氨基酸命名模式
https://cdn.rcsb.org/wwpdb/docs/documentation/file-format/PDB_format_1992.pdf 第27页有明确的写明每个氨基酸里的原子应该怎么命名。

我的输入文件
  1. REMARK   4      COMPLIES WITH FORMAT V. 3.0, 1-DEC-2006
  2. REMARK 888
  3. REMARK 888 WRITTEN BY MAESTRO (A PRODUCT OF SCHRODINGER, LLC)
  4. TITLE     crystal
  5. MODEL        1
  6. ATOM     71  N   HIS B   5      26.806  37.427  79.456  1.00 62.10           N
  7. ANISOU   71  N   HIS B   5     5469   8248   9880   -589    813    244
  8. ATOM     72  CA  HIS B   5      28.223  37.642  79.135  1.00 59.01           C
  9. ANISOU   72  CA  HIS B   5     5266   7756   9397   -561    804    194
  10. ATOM     73  C   HIS B   5      28.567  36.819  77.908  1.00 59.69           C
  11. ANISOU   73  C   HIS B   5     5381   7890   9406   -672    682    117
  12. ATOM     74  O   HIS B   5      28.839  35.623  78.013  1.00 58.83           O
  13. ANISOU   74  O   HIS B   5     5322   7726   9304   -795    677     30
  14. ATOM     75  CB  HIS B   5      29.133  37.309  80.333  1.00 58.59           C
  15. ANISOU   75  CB  HIS B   5     5361   7547   9353   -563    914    149
  16. ATOM     76  CG  HIS B   5      28.877  38.158  81.539  1.00 61.21           C
  17. ANISOU   76  CG  HIS B   5     5691   7835   9731   -448   1032    204
  18. ATOM     77  ND1 HIS B   5      28.823  39.543  81.455  1.00 62.58           N
  19. ANISOU   77  ND1 HIS B   5     5858   8012   9906   -306   1049    263
  20. ATOM     78  CD2 HIS B   5      28.665  37.792  82.824  1.00 62.52           C
  21. ANISOU   78  CD2 HIS B   5     5870   7950   9934   -451   1140    205
  22. ATOM     79  CE1 HIS B   5      28.587  39.967  82.684  1.00 61.88           C
  23. ANISOU   79  CE1 HIS B   5     5783   7872   9855   -229   1165    278
  24. ATOM     80  NE2 HIS B   5      28.475  38.951  83.541  1.00 62.18           N1+
  25. ANISOU   80  NE2 HIS B   5     5833   7888   9905   -309   1224    248
  26. ATOM     81  H   HIS B   5      26.583  36.550  79.905  1.00  0.00           H
  27. ATOM     82  HA  HIS B   5      28.359  38.695  78.887  1.00  0.00           H
  28. ATOM     83  HB3 HIS B   5      30.176  37.411  80.034  1.00  0.00           H
  29. ATOM     84  HB2 HIS B   5      29.012  36.259  80.598  1.00  0.00           H
  30. ATOM     86  HD2 HIS B   5      28.671  36.747  83.096  1.00  0.00           H
  31. ATOM     87  HE1 HIS B   5      28.509  41.025  82.884  1.00  0.00           H
  32. ATOM     88  HE2 HIS B   5      28.291  38.907  84.533  1.00  0.00           H
  33. ATOM     89  N   ASP B   6      28.481  37.456  76.734  1.00 54.69           N
  34. ANISOU   89  N   ASP B   6     4715   7367   8700   -623    587    153
  35. ATOM     90  CA  ASP B   6      28.686  36.822  75.433  1.00 53.85           C
  36. ANISOU   90  CA  ASP B   6     4629   7343   8490   -709    463     82
  37. ATOM     91  H   ASP B   6      28.261  38.442  76.709  1.00  0.00           H
  38. ATOM     92  HA1 ASP B   6      28.558  37.562  74.643  1.00  0.00           H
  39. ATOM     93  HA2 ASP B   6      29.694  36.409  75.384  1.00  0.00           H
  40. ATOM     94  HA3 ASP B   6      27.959  36.021  75.300  1.00  0.00           H
  41. ENDMDL
  42. END
复制代码
得到的输出文件
  1. ! B97-3c noautostart miniprint nopop
  2. %maxcore 1000
  3. %pal nprocs  4 end
  4. * xyz   0   1
  5. N     26.80600000   37.42700000   79.45600000
  6. C     28.22300000   37.64200000   79.13500000
  7. C     28.56700000   36.81900000   77.90800000
  8. O     28.83900000   35.62300000   78.01300000
  9. C     29.13300000   37.30900000   80.33300000
  10. C     28.87700000   38.15800000   81.53900000
  11. N     28.82300000   39.54300000   81.45500000
  12. C     28.66500000   37.79200000   82.82400000
  13. C     28.58700000   39.96700000   82.68400000
  14. Ne    28.47500000   38.95100000   83.54100000
  15. H     26.58300000   36.55000000   79.90500000
  16. H     28.35900000   38.69500000   78.88700000
  17. H     30.17600000   37.41100000   80.03400000
  18. H     29.01200000   36.25900000   80.59800000
  19. H     28.67100000   36.74700000   83.09600000
  20. H     28.50900000   41.02500000   82.88400000
  21. H     28.29100000   38.90700000   84.53300000
  22. N     28.48100000   37.45600000   76.73400000
  23. C     28.68600000   36.82200000   75.43300000
  24. H     28.26100000   38.44200000   76.70900000
  25. H     28.55800000   37.56200000   74.64300000
  26. H     29.69400000   36.40900000   75.38400000
  27. H     27.95900000   36.02100000   75.30000000
  28. *
复制代码
可见命名为NE2且元素一栏标明N的原子被转换为了Ne元素

5万

帖子

99

威望

5万

eV
积分
112354

管理员

公社社长

2#
发表于 Post on 2020-2-23 18:59:26 | 只看该作者 Only view this author
Multiwfn不是专门面向生物分子的,所以这个不打算实现
这种问题最好的解决办法就是让pdb严格符合标准的规范,即pdb文件的元素那一列直接定义清楚元素。目前的Multiwfn是优先从那一列判断元素的,没有的时候才根据原子名去猜。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

374

帖子

2

威望

1539

eV
积分
1953

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2020-2-23 19:31:19 | 只看该作者 Only view this author
sobereva 发表于 2020-2-23 18:59
Multiwfn不是专门面向生物分子的,所以这个不打算实现
这种问题最好的解决办法就是让pdb严格符合标准的规 ...

谢谢sob老师的解答,可是源文件中有标明元素。
ATOM     80  NE2 HIS B   5      28.475  38.951  83.541  1.00 62.18           N1+
可见元素那一行写明了N
可转化为orca输入文件之后仍识别为了Ne
Ne    28.47500000   38.95100000   83.54100000

5万

帖子

99

威望

5万

eV
积分
112354

管理员

公社社长

4#
发表于 Post on 2020-2-23 19:38:28 | 只看该作者 Only view this author
wuzhiyi 发表于 2020-2-23 19:31
谢谢sob老师的解答,可是源文件中有标明元素。
ATOM     80  NE2 HIS B   5      28.475  38.951  83.54 ...

应当写成N。把1+去掉。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

374

帖子

2

威望

1539

eV
积分
1953

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2020-2-23 19:52:16 | 只看该作者 Only view this author
sobereva 发表于 2020-2-23 19:38
应当写成N。把1+去掉。

谢谢sob老师

343

帖子

1

威望

6996

eV
积分
7359

Level 6 (一方通行)

6#
发表于 Post on 2020-2-24 19:32:50 | 只看该作者 Only view this author
楼主,是否可以先把pdb文件转成为sdf文件,再打开sdf文件即可。

224

帖子

5

威望

4548

eV
积分
4872

Level 6 (一方通行)

7#
发表于 Post on 2020-2-24 21:28:52 | 只看该作者 Only view this author
建议先用pymol把pdb转换成xyz格式,然后再导入Multiwfn。VMD有时候可能会有坑,有的元素名不正确。
我需要一些假日,但我不希望每天都是假日。因为我没有承担痛苦,因为那不是真正的自由。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 00:23 , Processed in 0.155732 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list