计算化学公社

 找回密码 Forget password
 注册 Register
Views: 5245|回复 Reply: 22
打印 Print 上一主题 Last thread 下一主题 Next thread

[Molclus] 对Sober老师帖子《将多帧xyz文件转化成量子化学输入文件的工具:xyz2QC》的小小质疑

[复制链接 Copy URL]

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 ReviewReview 于 2022-6-8 19:39 编辑

Lu老师和各位小伙伴们:
       你们好!
       最近在一个专门搞计算的师妹的搀扶下学习用Molclus进行构象搜索。在她的极力推荐下我仔细阅读了Sober老师的帖子《使用molclus程序做团簇构型搜索和分子构象搜索》及其子帖《将多帧xyz文件转化成量子化学输入文件的工具:xyz2QC》。读毕,尤其是在读完子帖《将多帧xyz文件转化成量子化学输入文件的工具:xyz2QC》后我对Sober老师为我们这些买不起自己服务器的可怜超算用户体贴入微/量身打造的xyz2QC工具表达由衷的感激和敬畏。
       然而哈佛大学的校训如是说道"Amicus Plato, Amicus Aristotle, Sed Magis Amicus VERITAS",中文大概意思就是"与柏拉图为友,与亚里士多德为友,更与真理为友。",这句话深深影响着我。接下来,我准备按照Sober老师帖子中的步骤开工计算时,心中突然产生一丝担忧。担忧如下:
       在子帖《将多帧xyz文件转化成量子化学输入文件的工具:xyz2QC》中,
       前言部分Sober老师写道: "笔者开发的免费的做构象搜索和团簇构型搜索的Molclus程序已经有很多人在用了,介绍和下载见官网http://www.keinsci.com/research/molclus.html。Molclus做搜索过程一般流程是先用十分廉价但粗糙的级别(如调用Openbabel跑MMFF94、调用xtb跑GFN-xTB)做结构优化和初步筛选,将其中能量最低的、为数不多的一批体系保留,最后再调用量子化学程序用更准确的方法算能量或做进一步优化。在整个过程中,初筛的耗时很低,在个人计算机上跑也没有任何压力,而最后对为数不多的筛出来的体系进一步做DFT/后HF量子化学计算才是占整个搜索过程的大头,才是真正有必要弄到超算上跑的(对于那些没有自己的像样的服务器的人而言)。然而,在超算上,计算任务一般是以提交方式进行的,而molclus这样自动调用其它程序去运行的方式在超算上不方便使用。为了解决这个矛盾,本文介绍笔者开发的xyz2QC程序。xyz2QC作为Molclus程序(1.7版及之后)的一个子程序发布,在Molclus压缩包里就可以找到。";
      例子部分Sober老师写道: "假设我们之前用molclus对某个有机分子在粗糙的半经验方法PM7下做了批量优化,并用isostat做了处理,得到了按照能量排序后的cluster.xyz文件(可以这里下载:http://sobereva.com/attach/472/cluster.xyz)。这里我们想把其中能量最低的三个转化成.gjf文件,之后弄到超算/服务器上算更准确的能量,"。
      读到这里,我心里清楚这是Sober老师是为我们这些贫穷的超算用户想出来的一个折衷妥协策略,但是事实上PM7是属于精度很低的方法,用这个方法算出来的不准确的能量再用isotat去排序,那么排出来的这个能量大小排行榜的可信度也会有问题吧?
       学生万分渴望您的答复!

轻舟一过万重山。

9

帖子

0

威望

377

eV
积分
386

Level 3 能力者

23#
发表于 Post on 2023-2-17 14:02:37 | 只看该作者 Only view this author
超算也可以用脚本提交xtb、Molclus的任务,公社里有帖子提供过脚本文件。

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

22#
 楼主 Author| 发表于 Post on 2022-6-9 15:49:01 | 只看该作者 Only view this author
wzkchem5 发表于 2022-6-9 15:44
不需要任何编程,至多只需要3行左右的脚本,而且只用写一次。
学习成本很低,基本只有对于那种一听到要 ...

嗯嗯知道啦,谢谢老师,那我下下来试试。
轻舟一过万重山。

1万

帖子

0

威望

9902

eV
积分
22161

Level 6 (一方通行)

21#
发表于 Post on 2022-6-9 15:47:31 | 只看该作者 Only view this author
granvia 发表于 2022-6-9 06:19
最好指出是什么类型的分子的构象问题,不能以偏概全啊

具体看那篇文章,里面都写了。就是有机小分子,以类药分子为主
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

1万

帖子

0

威望

9902

eV
积分
22161

Level 6 (一方通行)

20#
发表于 Post on 2022-6-9 15:44:52 | 只看该作者 Only view this author
ReviewReview 发表于 2022-6-9 02:32
嗯嗯谢谢老师学术级的答案。就是想问下您xTB学习成本大吗,听我师妹说要编程的啊?由于我目前已经博三了 ...

不需要任何编程,至多只需要3行左右的脚本,而且只用写一次。
学习成本很低,基本只有对于那种一听到要学软件就吓晕过去的人有门槛,但是其实没有任何门槛,sob老师也写过如何使用xtb的博文,讲得十分详细
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

19#
 楼主 Author| 发表于 Post on 2022-6-9 14:52:41 | 只看该作者 Only view this author
granvia 发表于 2022-6-9 13:26
没门槛,属于傻瓜式操作

谢谢老师,那我下下来试试。
轻舟一过万重山。

1043

帖子

0

威望

4188

eV
积分
5231

Level 6 (一方通行)

18#
发表于 Post on 2022-6-9 13:26:09 来自手机 | 只看该作者 Only view this author
ReviewReview 发表于 2022-6-9 09:32
嗯嗯谢谢老师学术级的答案。就是想问下您xTB学习成本大吗,听我师妹说要编程的啊?由于我目前已经博三了 ...

没门槛,属于傻瓜式操作

1043

帖子

0

威望

4188

eV
积分
5231

Level 6 (一方通行)

17#
发表于 Post on 2022-6-9 13:19:19 来自手机 | 只看该作者 Only view this author
wzkchem5 发表于 2022-6-8 22:41
发现DOI: 10.1002/qua.26381这篇文章测了PM7和GFN2-xTB计算的构象能量,以DLPNO-CCSD(T)为参考值,把半经 ...

最好指出是什么类型的分子的构象问题,不能以偏概全啊

1043

帖子

0

威望

4188

eV
积分
5231

Level 6 (一方通行)

16#
发表于 Post on 2022-6-9 13:18:01 来自手机 | 只看该作者 Only view this author
GoldenBaby 发表于 2022-6-8 22:26
你说的这个问题我还真比较过,PM7确实可以说是烂了。这篇文章用的xtb做的 http://bbs.keinsci.com/thread-1 ...

所谓“很烂”是针对对某些问题和某些体系来说的,但不能得出PM7针对所有问题和所有体系都很烂这样的结论。否则有失客观公允

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

15#
 楼主 Author| 发表于 Post on 2022-6-9 09:32:13 | 只看该作者 Only view this author
wzkchem5 发表于 2022-6-8 22:41
发现DOI: 10.1002/qua.26381这篇文章测了PM7和GFN2-xTB计算的构象能量,以DLPNO-CCSD(T)为参考值,把半经 ...

嗯嗯谢谢老师学术级的答案。就是想问下您xTB学习成本大吗,听我师妹说要编程的啊?由于我目前已经博三了,所以需要考虑学习成本的问题。
轻舟一过万重山。

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

14#
 楼主 Author| 发表于 Post on 2022-6-9 09:16:40 | 只看该作者 Only view this author
本帖最后由 ReviewReview 于 2022-6-9 09:17 编辑
sobereva 发表于 2022-6-9 07:52
PM7仅仅是用来初筛用的,筛选出有哪些构型值得进一步用明显更昂贵的DFT来进一步优化。显然不能直接取PM7 ...

Sober老师我其实领会了您帖子里的步骤的,就是您说的这句话嘛"假设我们之前用molclus对某个有机分子在粗糙的半经验方法PM7下做了批量优化,并用isostat做了处理,得到了按照能量排序后的cluster.xyz文件(可以这里下载:http://sobereva.com/attach/472/cluster.xyz)。这里我们想把其中能量最低的三个转化成.gjf文件,之后弄到超算/服务器上算更准确的能量,"!我当时怀疑的是由于PM7精度的问题,"其中能量最低的三个"可能并不是真正的"其中能量最低的三个"。接着,看了GoldenBaby老师的答复"以及你说的那个能量排行确实是有问题的,所以一般保留相对能量<=3 kcal/mol的结构,从这里面找大概率还是能找到能用的结构的。"后,我心里接着就知道可以这么干了并且知道怎么干了。
轻舟一过万重山。

6万

帖子

99

威望

6万

eV
积分
125235

管理员

公社社长

13#
发表于 Post on 2022-6-9 07:52:25 | 只看该作者 Only view this author
ReviewReview 发表于 2022-6-8 22:54
嗯嗯谢谢老师。"以及你说的那个能量排行确实是有问题的,所以一般保留相对能量

PM7仅仅是用来初筛用的,筛选出有哪些构型值得进一步用明显更昂贵的DFT来进一步优化。显然不能直接取PM7给你的能量最低的那一个结构,我的任何molclus相关的帖子里的例子都没有这么做。要正确领会molclus的构型/构象搜索例子里每一步的思想和目的。即便是精度整体更好点的GFN-xTB,精度也仅仅适合作为初筛目的。在根据能量初筛的同时,顺带也起到了预优化的目的。

结构离谱不离谱,自己用gview看molclus备份出来的Gaussian输出文件里的优化轨迹便知
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

12#
 楼主 Author| 发表于 Post on 2022-6-8 22:54:27 | 只看该作者 Only view this author
本帖最后由 ReviewReview 于 2022-6-9 15:50 编辑
GoldenBaby 发表于 2022-6-8 22:26
你说的这个问题我还真比较过,PM7确实可以说是烂了。这篇文章用的xtb做的 http://bbs.keinsci.com/thread-1 ...

嗯嗯谢谢老师。"以及你说的那个能量排行确实是有问题的,所以一般保留相对能量<=3 kcal/mol的结构,从这里面找大概率还是能找到能用的结构的。",您这句话太有用了,今天攒的eV一次性都给wzkchem5老师了,明天攒到4一定来给您评满分哈哈
还有再请教您一个问题哈:在用Molclus对Genmer产生的100个构象进行构象搜索时,我的template.gjf和template2.gjf用的都是PM7方法,在template2.gjf中加了有助于收敛的关键词"opt(maxstep=5,notrust,maxcyc=150,gdiis) scf=xqc",我都这样了,但是在跑Molclus时:先说下哈,我目前跑到第6个构象了,但是去isomers.xyz里边看了眼只有构象2,3,4,6跑出来了,构象1,5未能成功跑出来。我就开始思考:是不是构象1,5本来就很离谱,在逻辑上反常理,本来就不应该存在,所以我接下来能不能直接将其放弃掉不要,只要我isomer.xyz里边成功跑出来的构象,然后拿去找isostat.exe帮我排序?
轻舟一过万重山。

1万

帖子

0

威望

9902

eV
积分
22161

Level 6 (一方通行)

11#
发表于 Post on 2022-6-8 22:41:21 | 只看该作者 Only view this author
GoldenBaby 发表于 2022-6-8 15:26
你说的这个问题我还真比较过,PM7确实可以说是烂了。这篇文章用的xtb做的 http://bbs.keinsci.com/thread-1 ...

发现DOI: 10.1002/qua.26381这篇文章测了PM7和GFN2-xTB计算的构象能量,以DLPNO-CCSD(T)为参考值,把半经验方法的结果对参考值作图,求R^2(所以相当于反映了能量的排序,而不是反映能量本身的精度)。发现GFN2-xTB的R^2有0.637,而PM7只有0.315,甚至比一些力场(MMFF94)还差。这么看来PM7确实挺差的。
另外我收回我说的关于计算时间的话,从这个benchmark文章来看PM7比GFN2-xTB快不少,不过和GFN0-xTB差不多快,而GFN0-xTB的精度比PM7高得还是挺明显的。所以至少从这篇文章的结论而言,即使是GFN2-xTB跑不动的大体系,也应该用GFN0-xTB而非PM7
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

113

帖子

0

威望

258

eV
积分
371

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2022-6-8 22:29:27 | 只看该作者 Only view this author
wzkchem5 发表于 2022-6-8 22:16
对的,PM7虽然很多时候比GFN2-xTB差,但是没有差到审稿人不认的地步

嗯嗯好的,谢谢老师!
轻舟一过万重山。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-28 15:43 , Processed in 0.181977 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list