计算化学公社

 找回密码 Forget password
 注册 Register
Views: 293|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[波函数分析交流] 关于sobEDA/sobEDAw用于大体系电解液二聚体能量分解分析的适用性与可能改进方向的请教

[复制链接 Copy URL]

12

帖子

0

威望

97

eV
积分
109

Level 2 能力者

本帖最后由 zgs 于 2026-5-15 12:26 编辑

各位老师、前辈好。
最近拜读了卢老师关于使用sobEDA和sobEDAw方法做非常准确、快速、方便、普适的能量分解分析 - 思想家公社的门口:量子化学·分子模拟·二次元的文章和Multiwfn上的相关教程,感觉受益匪浅。
我目前的研究方向是电解液体系,经常需要对体系内的相互作用进行能量分解分析(EDA)。之前我一般是用Psi4跑SAPT0,但在实际做大规模高通量计算时,感觉遇到了点瓶颈:一是SAPT0算起来耗时还是有些偏高;二是Psi4在部分体系里的SCF收敛性实在不太理想,导致整个自动化高通量流程的稳定性和速度都达不到预期。


所以最近我开始认真研究咱们的sobEDA/sobEDAw方法。从文章里看,这套方法计算成本低、普适性强,而且在很多弱相互作用体系中跟高阶SAPT的结果吻合得非常好。相比SAPT0,sobEDAw不仅跑得快,精度往往还更高,甚至几百原子的体系也能搞定。


不过,我也留意到公社里那篇《使用Multiwfn做基于分子力场的能量分解分析》
http://sobereva.com/442
的帖子里提到过:“sobEDA/sobEDAw得到精准结果的前提条件是:目的是对片段间相互作用能进行分解,并不关注各个原子的贡献,且体系也不是特别巨大。”


这让我对把它直接搬到我的研究体系里有些拿不准,想向各位请教几个问题:
1:针对典型的锂盐电解液体系(比如Li+与溶剂分子、Li+与阴离子、溶剂与溶剂之间,以及多体溶剂化团簇),在这种存在较强极化、电荷转移、离子-偶极作用甚至多体协同效应的复杂情况下,sobEDAw是否依然能比较可靠地拆分出静电、Pauli排斥、色散、轨道相互作用等成分?它的物理可信度会不会打折扣?


2:我了解到sobEDAw目前主要是依赖 DFT-D3(BJ) 加经验参数来做拆分。我在想,针对电解液这种特定体系(强极化、高介电环境、特殊的锂盐多体溶剂化结构等),有没有可能去重新拟合一下参数?比如以高阶SAPT或者ALMO-EDA的结果作为参考集,专门为电解液体系重新训练/拟合色散吸引(disp)和交换互斥(rep)里的参数,以此来进一步提升准确性,不知道这个思路在理论和实践上是否可行?


3:关于体系规模,sobEDAw目前到底是更偏向于“中小规模片段间的相互作用”,还是说其实已经可以比较放心地拿来算几百甚至上千原子的电解液团簇体系了?比如像 LiFSI 加上好几个 DME/DOL 分子形成的那种比较复杂的局域高浓度电解液结构。总体感觉,sobEDAw在做高通量、自动化和大规模数据集构建方面潜力太大了,但我对它在“强极化离子型电解液体系”中的理论边界把握不准。


我也在瞎琢磨,不知能否在JPCA这篇工作的基础上,进一步发展出一个“专供电解液体系优化的sobEDAw变体”,不知道做这方面的工作有没有意义?非常期待能得到卢老师和各位前辈的指点,不胜感激!

202605141456484960..png (76.29 KB, 下载次数 Times of downloads: 5)

202605141456484960..png

124

帖子

0

威望

570

eV
积分
694

Level 4 (黑子)

2#
发表于 Post on 2026-5-14 20:45:02 | 只看该作者 Only view this author
AI的味儿还是太浓了,建议下次提示词加上“充分利用网页搜索计算化学公社的帖子,阅读提问者的文风,重新撰写成文”。
————————————————————————————————————————————————————————————————————————
对于电解液这样一种SSIP,CIP,AGG等配位模式同时存在的情况,你应该在MD轨迹里充分抓取典型构型,然后根据许康老师关于离子学的著作,充分讨论第1-第2溶剂化鞘。
sobEDAw本身的参数由于对着SAPT只有0几kcal/mol的误差,且涵盖多种弱相互作用pair体系,你重新拟合是完全不必要的。除非你看到过哪些基组泛函体系对电解液体系有特殊的专用适配。

几百倒还说得过去,但上千原子的电解液团簇体系,不应该是sobEDAw的研究体系,你应该充分学习ONIOM方法,以及marcus电子转移理论。你想研究的这个体系我能感觉出来是在做譬如弱溶剂化等提升动力学的策略,那么就应该充分地学习电子转移理论,并将其转换成界面SEI存在下脱溶过程的动力学问题。

6万

帖子

99

威望

6万

eV
积分
127183

管理员

公社社长

3#
发表于 Post on 2026-5-15 01:54:09 | 只看该作者 Only view this author
chatGPT的文字风格我实在看着太累,都连不成完整段落。不宜以这种方式发帖
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

12

帖子

0

威望

97

eV
积分
109

Level 2 能力者

4#
 楼主 Author| 发表于 Post on 2026-5-15 12:15:45 | 只看该作者 Only view this author
yuzc 发表于 2026-5-14 20:45
AI的味儿还是太浓了,建议下次提示词加上“充分利用网页搜索计算化学公社的帖子,阅读提问者的文风,重新撰 ...

这篇提问帖子确实是我先表述然后ai总结出来我发布的,没想到适得其反
---------------------------------------------------------------------------------------------------------------------------------
我之前确实有点过于关注:
“如何快速、准确地做能量分解”,对于电解液体系,确实更关键的可能是:①如何从MD轨迹里正确提取具有物理意义的局域溶剂化结构,而这一点确实目前我也正在尝试一些方法去提取出最具有代表性的结构;②以及如何把这些静态相互作用和真实脱溶动力学联系起来,针对这一点,之前的思路就是靠能量分解来尝试比如可以把整个大体系分解为第一第二溶剂层等等然后用有一个求和的方式把长程作用力考虑到

老师您后面提到:SEI存在下的脱溶动力学、Marcus电子转移理论,这个方向我感受挺大的。

因为我现在其实也在想:很多所谓“弱溶剂化提升动力学”的工作,最后真正决定倍率性能的,也许不是单个pair interaction本身,而是比如说:Li+在界面附近的重组能、脱溶路径、电子转移耦合、以及局域溶剂化结构演化。

我能不能继续问一问就是:是不是应该先从经典MD/AIMD里统计不同SSIP/CIP/AGG构型,然后再针对典型局域结构做EDA与电子转移分析,最后再和脱溶动力学联系起来。

我之前对Marcus理论和ONIOM其实了解还很浅。如果方便的话,想请教老师:对于您说的这个方法,最值得先系统学习的理论/文章是什么,有推荐的吗,因为确实我目前感觉进展很不顺利,有点像无头苍蝇乱飞了

12

帖子

0

威望

97

eV
积分
109

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 2026-5-15 12:27:50 | 只看该作者 Only view this author
sobereva 发表于 2026-5-15 01:54
chatGPT的文字风格我实在看着太累,都连不成完整段落。不宜以这种方式发帖

之前想表述清楚一点,有点适得其反了,老师我已经全部重写了,望您赐教

6万

帖子

99

威望

6万

eV
积分
127183

管理员

公社社长

6#
发表于 Post on 2026-5-15 18:28:07 | 只看该作者 Only view this author
1 完全可以用

2 没必要

3 有个像样的机子,对几百原子用sobEDA/sobEDAw做能量分解毫无难度。原文里都给了不同规模体系耗时测试数据
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

12

帖子

0

威望

97

eV
积分
109

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2026-5-15 19:58:49 | 只看该作者 Only view this author
本帖最后由 zgs 于 2026-5-15 20:00 编辑
sobereva 发表于 2026-5-15 18:28
1 完全可以用

2 没必要

老师您提到的耗时数据我又仔细重新阅读了原文。确实,对于单次计算来说,几百到上千原子的体系能在一两个小时内跑完EDA,这个效率很高。

但如果面临一个比较极端的场景:对于一个几十万级的数据集,并需要对这些海量数据进行高通量的自动化物理标签提取。在这样的海量数据规模下,即便单个大体系只需1-2小时,整体的算力成本和时间周期依然难以承受。

为了在“超高通量”和“精度”之间寻找一个可能可靠的平衡,想继续向您请教,在进行海量数据集的sobEDA/sobEDAw分析时,有没有什么可以进一步“压榨”计算时间的优化策略?我目前瞎琢磨了几个方向,想听听您的专业判断:

1. 计算级别的妥协与加速:原文中推荐了B3LYP-D3(BJ)/6-31+G(d,p) w.CB 作为一个高性价比的理想选择 。但是针对海量数据集,如果我退而求其次,采用纯泛函(例如 BLYP-D3(BJ) 或 TPSS-D3(BJ)),并利用 Gaussian 中的库仑拟合辅助基组(Density Fitting / RI 近似)来大幅加速计算 ;甚至在必要时牺牲一部分精度,放弃使用复合物基函数(w.CB)转而直接使用单体基函数(MB),这样换取的速度提升是否是合理的?

2:对于电解液团簇这种关注宏观统计规律的机器学习数据集,由此带来的截断误差或BSSE是否还在可接受的系统性偏差范围内?  

3:原文末尾提到,sobEDA未来非常有希望基于CP2K等第一性原理软件实现 。在处理大型体系时,我平时也经常使用CP2K。既然高通量计算对速度要求极高,如果未来能借助CP2K的Quickstep算法,配合双泽塔级别的平面波/赝势基组,是否能在保证物理图像不严重失真的前提下,将上千原子的EDA耗时进一步压缩到分钟级?目前是否有相关脚本或接口可以提前尝试?  

3. 结合机器学习(AI4S)进行预测:因为我主要在做 AI 结合化学的研究,我目前的一个构想是:是否可以先用Gaussian + sobEDAw在相对较小规模的数据集(比如几万个典型的电解液溶剂化构象)上跑出高质量的静电、色散、排斥等能量成分,然后将这些EDA成分作为 Target,训练一套专用的图神经网络(GNN)或大语言模型Agent,直接去预测剩余上百万体系的EDA结果?从化学底层逻辑来看,您认为这种能量成分在强极化体系中的可学习性强吗?在海量数据集构建的背景下,稍微缩短一点单次计算时间都能节省极其庞大的算力,所以问题稍微有些钻牛角尖。再次感谢卢老师的耐心指导!

6万

帖子

99

威望

6万

eV
积分
127183

管理员

公社社长

8#
发表于 Post on 2026-5-16 00:25:53 | 只看该作者 Only view this author
zgs 发表于 2026-5-15 19:58
老师您提到的耗时数据我又仔细重新阅读了原文。确实,对于单次计算来说,几百到上千原子的体系能在一两个 ...

1 没意义。Gaussian里纯泛函用密度拟合仅对于较大基组如def2-TZVP才加速明显
海量数据集可以租超算同时平行跑很多任务

2 截断误差指代不明。6-31+G*结合counterpoise做sobEDAw能量分解的BSSE问题已经很小了

3 八字没一撇

4 我觉得够呛,弄出来的预测模型的精度大概率会很有限并因而缺乏实用性,并且折腾成本太高。想省时间的话,测试更多基组、自行调节指数(参考下面这个幻灯片里的基组的思路)、对于不同元素加弥散和极化函数寻找更划算方式(如尝试碳不加极化和弥散)、尝试减小收缩度(如6-31G降到3-21G),并自行拟合sobEDA用的三个参数,这倒是有希望,使得误差增加不很多的情况下每个体系耗时节约几倍都有可能。




另外SCF收敛限可以尝试设得更宽松(如scf=conver=6)、积分格点可以尝试设得更低(如G16默认的ultrafine降到fine),都能有效降低耗时。并且注意平行跑多个任务的策略,CPU的利用效率能有极大的差异,参考http://bbs.keinsci.com/thread-19215-1-1.html

把上述这些因素全都考虑,使得sobEDAw耗时比你原先降低一个数量级是可能的。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

124

帖子

0

威望

570

eV
积分
694

Level 4 (黑子)

9#
发表于 Post on 5 day ago | 只看该作者 Only view this author
zgs 发表于 2026-5-15 12:15
这篇提问帖子确实是我先表述然后ai总结出来我发布的,没想到适得其反
-------------------------------- ...

既然你也提到了你对弱溶剂化策略感兴趣,那么你应该研究“离子学”。许康老师是离子学的顶级专家,且近年刚出了一本著作,你完全可以学习这本著作中的理论和研究路线,并且研究许康老师有关机理研究的论文,理清楚发展脉络。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-5-31 23:19 , Processed in 4.075972 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list