“第10届量子化学波函数分析与Multiwfn程序培训班将于5月4-8日于北京举办,这是一次性完整、系统学习波函数分析的各种理论知识和全面掌握强大的Multiwfn波函数分析程序使用的最不可错过的机会!请点击此链接查看详情和报名方式,欢迎参加!

“第18届北京科音分子动力学与GROMACS培训班” 将于5月23-26日于北京举办。这是一次性全面、系统学习分子动力学模拟知识和最流行的分子动力学程序GROMACS的关键机会!报名正在进行中,请点击此链接查看详情,欢迎参加!

计算化学公社

 找回密码 Forget password
 注册 Register
Views: 127|回复 Reply: 0
打印 Print 上一主题 Last thread 下一主题 Next thread

[Python] Gaussian输出文件处理小程序Quantum_Toolkit

[复制链接 Copy URL]

10

帖子

1

威望

789

eV
积分
819

Level 4 (黑子)

本帖最后由 xiongbaobao 于 2026-4-8 14:24 编辑

这是一款基于 PyQt5 开发的 Windows 桌面小工具,主要用于数据提取、过渡态(TS)分析、批量生成输入文件以及文件名处理等操作。如果你习惯直接把 Gaussian 的 log/out 输出文件拖到 Windows 桌面上处理,那它应该能帮上忙。
其实早在 2023 年我就写完了第一版,一直在实验室内部测试、缝缝补补。现在临近毕业,从 2025 年开始着手重构代码,想让它看起来更像个正经软件,虽然也只是"凑合能用"的程度。

新版代码地址:LeoJiaGeng/Quantum_Toolkit: 量子化学小工具升级版
新版软件地址:Release 第一次发布 · LeoJiaGeng/Quantum_Toolkit
旧版代码地址:LeoJiaGeng/Quantum_Toolkit: 量子化学小工具升级版
旧版软件地址:Releases · LeoJiaGeng/JiaGengXiong-Python-Files

需要说明的是:公社里其实有不少功能单一但成熟的脚本或软件,很多都是后来我才发现的。回头看,我的工具更像是个大杂烩,把各种常用功能整合到了一起。这也是为什么直到今天才正式发布,赶在这个时间节点,希望能帮到同样面临毕业的同学,也祝自己博士顺利毕业。由于时间有限,没能做大量测试和案例演示,大家下载后自己摸索一下即可,功能就那些,遇到问题欢迎邮件或留言反馈!

介绍主要功能:
  • 能量/频率/坐标提取:批量从 Gaussian 输出文件(.log / .out)中提取单点能、频率、热力学修正量、CBS‑QB3 能量、G4 能量、坐标等信息,并导出为 Excel(.xlsx)或 Word(.docx)文件。
  • 文件信息查询:查看 Gaussian 输出文件中的优化步数、特征值、收敛情况等详细信息,支持正则表达式搜索。
  • 输入文件转换:基于预定义或自定义模板,批量生成 Gaussian 输入文件(.gjf),支持 IRC、过渡态优化、单点能、自旋测试等多种任务类型。
  • 文件重命名:批量修改文件夹内的文件名(添加/删除/替换/大小写转换/序列化),支持预览和撤销操作。
  • 多语言与主题:支持中文/英文界面切换,内置多套界面主题。


---------------------------------------------------------------------------2026.4.8应用场景更新-----------------------------------------------------------------
看到自己写的软件没有太多人用,因为自己没有写清楚,既然要分享给大家,还是把应用场景写清楚。

场景一:提升一组已计算体系的计算水平:假如已经在 B3LYP/6‑31G(d) 水平下优化了一批分子的几何结构,又想换到更高水平(例如 M06‑2X/Aug-cc-pVDZ)下重新进行优化计算
场景二:对关键结构进行高精度单点计算(CBS‑QB3 / G4):假如已经在 M06‑2X/Aug-cc-pVDZ水平下优化了一批分子的几何结构,要进行高精度单点计算
场景三:监测过渡态优化过程:正在优化一个结构,但迟迟不收敛。需要将特征值、向量、收敛标准放一起查看
场景N:自动生成自选测试输入文件、批量提取LOG指定内容(正则表达搜索)、自动生成IRC文件、自动获取IRC和柔性扫描的每一帧结果并写成输入文件、对文件名只进行重命名......

场景一:提升一组已计算体系的计算水平
  • 准备模板  
    在“转换”页签中,选择一个更换水平计算的模板文件(OPT/TS‑template.txt),并编辑其内容,将方法/基组改为所需水平,或者自己编写好所有的模板文件,直接导入整个文件夹
  • 点击 “保存模板” 保存修改。
  • 选择源文件  

    • 勾选 “转换文件夹”
    • 点击 “选择文件夹”,选取存放所有 B3LYP 优化输出文件(.log)的目录。

  • 设置转换参数  

    • 读取文件类型:GauOutFile(从输出文件读取坐标)。  
    • 请选择功能:更换水平(TS/OPT)。  
    • 增加文件前缀名:可输入 M062X 以便区分。  
    • 计算模式:选择已包含上述模板的模式(或使用默认模式并手动选择模板文件)。  
    • 模板文件:查看刚才编辑的 OPT/TS‑template.txt。
    • 如图所示:

  • 执行转换  
    点击 “生成文件”。软件会为文件夹内每一个 .log 文件生成一个对应的 .gjf 输入文件,文件名如 M062X_原文件名.gjf。
  • 批量提交计算  
    将生成的 .gjf 文件复制到计算服务器上,运行 Gaussian。
  • 提取新水平能量
    计算完成后,回到软件 “保存” 页签,选择包含新输出文件的文件夹,点击 “提取能量/xlsx” 即可获得更换水平的能量汇总表,包括热力学校准量。


场景二:对关键结构进行高精度单点计算(CBS‑QB3 / G4)
  • 整理文件夹结构
    按照场景一操作:功能选择高水平单点,选择模式,检查HIGH-SP-template.txt文件,默认CBS-QB3(SP),修改成自己想要的计算水平,进行生成文件,放入服务器计算。
  • 整理文件夹结构
    假设你为每个体系建立了一个子文件夹,内部包含该体系的所有 CBS‑QB3 计算文件(如 MP2、MP4、CCSD(T) 等步骤的输出),最终结果写在某个 .log 文件中。  
    主文件夹结构示例:
    1. D:\CBS_Results\
    2.     species1\
    3.         species1_cbs.log
    4.     species2\
    5.         species2_cbs.log
    6.     ...
    复制代码

  • 设置递归扫描  
    打开 “设置” 页签,将 “文件夹” 选项改为 包含子文件夹。这样保存模块会递归遍历所有子目录。
  • 提取 CBS‑QB3 能量  

    • 切换到 “保存” 页签。  
    • 点击 “打开文件夹”,选择主文件夹 D:\CBS_Results。  
    • “保存文件名” 中输入 CBS_汇总。  
    • 点击 “提取CBS-QB3/xlsx” 按钮。  
    • 程序会自动查找每个子文件夹中的 .log 文件,从中匹配 E(CBS‑QB3)= 字段,并输出一个 Excel 表格,包含两列:物种名(子文件夹名或文件名)和 CBS‑QB3 能量(Hartree)。

  • 查看结果  
    生成的 Excel 文件会自动打开(若启用“自动打开文件”),你可以直接计算相对能量或导出到论文中。

技术说明
  • 对于 CBS‑QB3,软件也提供 “提取分步CBS-QB3/专用” 按钮,可输出中间步骤的能量(MP4、CCSD(T)、MP2、HF、CBS‑Int、OIii、T1 诊断值等),需要自行写多个Link的输入文件,自带模板有
  • 提取过程采用正则表达式精确匹配,所以任何计算结果只要不跨行都可以用正则表达找到,正则规则问ai即可,极大方便使用!


场景三:监测过渡态优化过程
  • 打开待监测的输出文件  

    • 切换到 “查询” 页签。  
    • 点击 “打开文件”,选择正在运行的或已完成的过渡态优化输出文件(如 ts_opt.log)。

  • 精简查找 – 快速判断虚频和收敛  
    点击 “精简查找”,结果输出格式如下:
    1. No Eig_val Eig_val Eig_vec Eig_vec Eig_vec Stu Stu Stu Stu
    2. 1  -0.0321  -0.0023   0.0001   0.0002  -0.0003   NO  YES YES YES
    3. 2  -0.0318  -0.0022   0.0001   0.0002  -0.0002   NO  YES YES YES
    4. 3  -0.0289  -0.0021   0.0001   0.0002  -0.0002  YES  YES YES YES
    5. ...
    复制代码

    • 第一列为步号。  
    • 第二、三列为前两个特征值(负值表示存在虚频)。  
    • 第四至六列为前三个特征向量(大致反映振动方向)。  
    • 最后四列为四个收敛判据(YES/NO)。  
      通过观察特征值的符号变化和收敛判据的 YES/NO,可以判断:
    • 虚频是否在逐步减小(向过渡态靠近)。
    • 收敛判据是否在某一步之后全部变为 YES(优化完成)。

  • 详细查找 – 获取完整数值  
    点击 “详细查找”,输出信息更全面,包含四个特征值、四个特征向量以及每个收敛判据的具体数值(如 Maximum Force 的实际值、阈值等)。这对于精细调整初始猜测结构非常有用。
  • 正则搜索 – 提取能量变化  
    若想提取优化过程中每一步的 HF 能量变化,可在“正则匹配”中输入 SCF Done:\s+E\(R.\)\s+=\s+([-]?\d+\.\d+),点击 “正则搜索”,右侧会列出每一步的能量值,可复制到 Excel 绘制能量变化曲线。
  • 定位异常步  
    当优化意外终止时,查看最后几步的输出:若收敛判据出现大量 NO 或特征值突然变为很大的正数,说明结构可能偏离了过渡态区域,需要调整初始猜测或优化算法。

评分 Rate

参与人数
Participants 4
eV +22 收起 理由
Reason
白糖050626 + 4 好物!
sobereva + 8
rugals + 5 GJ!
student0618 + 5 谢谢分享,祝顺利毕业!

查看全部评分 View all ratings

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-4-14 04:23 , Processed in 0.175121 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list