计算化学公社

标题: 高通量分子计算的轻量化解决方案:基于SMILES的在线自动化工作流 [打印本页]

作者
Author:
王纪峰    时间: 2025-9-16 21:43
标题: 高通量分子计算的轻量化解决方案:基于SMILES的在线自动化工作流
本帖最后由 王纪峰 于 2025-9-16 21:44 编辑

摘要:在分子研究中,高通量筛选与可视化往往无需复杂的量子化学计算。然而,传统的量子化学计算通常依赖人工手动构建结构、选择理论水平,并需人工监控计算与提取结果。这一流程对实验研究人员而言不仅学习门槛高且操作复杂,对计算研究人员而言则在大量简单任务上消耗了不必要的时间与精力。为解决上述问题,我们开发了一套在线高通量量子化学自动化工作流。该工具可通过提交SMILES式,自动完成三维结构生成、输入文件构建,并在远程服务器上调用ORCA完成计算;计算完成后,系统会自动返回结果文件的下载链接。结合我们此前开发的在线可视化模块,该平台既能为实验团队快速补充必要的理论计算数据,也能帮助计算团队高效完成基础性任务,从而显著降低操作门槛并提升研究效率。

所有功能均集成于课题组开发的CEMP平台(https://cleanenergymaterials.cn),使用该功能用于论文发表时请合理引用。
Wang J, Ju J, Wang Y. CEMP: a platform unifying high-throughput online calculation, databases and predictive models for clean energy materials[J]. arXiv preprint arXiv:2507.04423, 2025.

注意事项:
1.        用户需要注册平台账户后方可使用,并且每个用户每天限3次量子化学计算任务。
2.        由于平台算力有限,每次提交的EXCEL表格中的分子数量应该小于等于20个,并且每个分子的重原子数最好不超过40个,平台会自动评估用户提交的计算任务的复杂度,高复杂度的任务将会被安排较低的运行优先级。
3.        由于基组和泛函固定(理论计算水平见简介),计算适合小分子有机体系。
4.        用户的计算结果仅会保留30天,请及时下载。
5.        自动计算任务由于成本高昂,性能可能不稳定,目前属于内测阶段,可能部分时段无法使用。
6.        平台最大同时运行任务数为21,每个任务分配20个核心计算,任务持续时间超过100小时自动中断。

简介:在线高通量计算程序部署在课题组开发的CEMP平台(https://cleanenergymaterials.cn/autocompute/QCcompute)上,所有计算任务将在课题组的服务器上进行,换言之用户不需要提供任何本地算力或软件。
(, 下载次数 Times of downloads: 2)
用户仅需在功能页上传一张含有Name列以及SMILES列的EXCEL表格即可开始计算。EXCEL表格(以单点能计算/氧化还原电位计算的表格为例)如下所示,每一行代表一个分子,一张EXCEL表格可以上传多个分子:
(, 下载次数 Times of downloads: 0)
程序将自动将SMILES转化为3D结构并根据预先设定好的计算工作流,如下图所示,工作流固定遵从“结构优化->能量计算”步,满足大部分简单的量子化学的计算需求,进行量子化学计算任务,在计算过程中,程序会持续监控计算结果,如果未检测到success信号,将会自动匹配失败信息,并更改关键词重新进行计算,如果检测到虚频信号,同样会更改关键词重新进行计算,但多次尝试均失败后,该分子的计算将被标记为失败。
结构优化理论水平为:B3LYP/def2-TZVP,GD3BJ 色散校正,RIJCOSX加速
能量计算的理论水平为:wB97M-V/def2-TZVP,RIJCOSX加速

值得注意的是,平台虽然也支持Gaussian(功能更多,例如反应热力学、反应描述符计算、pka/pkb预测等),但由于版权限制,仅对合作课题组开放,一般用户默认关闭Gaussian权限。
(, 下载次数 Times of downloads: 1)
目前在线量子化学自动计算支持4种类型的任务,分别是:单点能计算,结合能计算、氧化还原电位预测(基于VIP-VEA法,The Journal of Physical Chemistry B, 2024, 128(8): 1943-1952.)以及手动模式的单点能计算(手动模式下,用户需要上传.xyz结构文件,一次仅支持输入1个结构)。

功能链接:
单点能计算:https://cleanenergymaterials.cn/autocompute/HTQC_single_point
结合能计算:https://cleanenergymaterials.cn/autocompute/HTQC_binding_energy
氧化还原电位预测:https://cleanenergymaterials.cn/autocompute/HTQC_ox_red
手动模式的单点能计算:
https://cleanenergymaterials.cn/ ... mode_qccompute_page
值得注意的是,结合能计算、氧化还原电位计算等,在对应页面上已经写上了详细的算法,

视频教程(中文)https://cleanenergymaterials.cn/tutorial_videos

使用示例:
1.        单点能计算/氧化还原电位预测
进入页面,可查看计算细节以及详细算法,下图以氧化还原电位预测为例:
(, 下载次数 Times of downloads: 0)
将页面拉到最下方,下载模板文件并填写模板文件。注意Name列不能有非法字符,最好是数字,英文字母和下划线组成
(, 下载次数 Times of downloads: 1)
这里以模板文件为例,下载并且填写,分子的SMILES可通过chemdraw绘制后转化为SMILES式,也可直接使用网上已有的结果。填写完毕后直接上传。平台自动检查用户填写的Name,SMILES等是否正确,然后给出任务密钥。
(, 下载次数 Times of downloads: 0)
等待任务计算完成,可在Query界面(https://cleanenergymaterials.cn/query/)查看任务进度
(, 下载次数 Times of downloads: 0)
任务状态显示为success后,可将密钥复制到上方搜索框中,下载结果文件,其中一个结果文件为性质表格,另一个文件为量子化学计算的过程文件:
(, 下载次数 Times of downloads: 0)
下载后查看结果文件:
(, 下载次数 Times of downloads: 0)
(, 下载次数 Times of downloads: 1)

使用transfer_tool(https://cleanenergymaterials.cn/ ... mpute/transfer_tool)可将gbw文件转化为molden文件,然后可用于绘制分子的HOMO-LUMO轨道、ESP可视化以及NCI分析等(具体操作方式可见帖http://bbs.keinsci.com/thread-55185-1-1.html)。

2.        结合能计算
结合能计算的总体流程与之前介绍的类似,主要区别在于EXCEL表格填写的不同:
要分别填写二聚体的Name,SMILES,组分A的Name和SMILES以及组分B的Name和SMILES,如下所示:
(, 下载次数 Times of downloads: 0)
二聚体的SMILES同样可以通过chemdraw绘制得到,也可以简单的写成SMILES_A.SMILES_B,即组分A和B之间的SMILES用.连接即可。

3.        手动单点能计算模式
手动单点能计算模式特别适合于那些对构型有要求的分子,尤其是计算不同位点结合的能量,在这种情况下,输入不再是SMILES式(因为SMILES无法确定具体的空间位置,只能猜),而是需要用户提供xyz文件以表示分子的初始坐标,xyz文件可以通过gview绘制后使用vesta导出,除此之外还需要确定体系电荷以及自旋多重度。默认的工作流仍然为“结构优化+能量计算”,同样计算完成后会返回过程文件的下载链接给用户。
(, 下载次数 Times of downloads: 1)






欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3