计算化学公社

 找回密码 Forget password
 注册 Register
Views: 20397|回复 Reply: 64
打印 Print 上一主题 Last thread 下一主题 Next thread

[Multiwfn资源与经验] 基于Multiwfn的分子机器学习助手:MultiwfnMLhelper

  [复制链接 Copy URL]

26

帖子

2

威望

475

eV
积分
541

Level 4 (黑子)

本帖最后由 yumingsuxmu 于 2023-4-11 19:46 编辑

近期,自己的工作里面需要快速提取Multiwfn分子描述符进行机器学习分析,我编写了一个名为“基于Multiwfn的分子机器学习助手”的Python脚本工具MultiwfnMLhelper。它的使用非常简便,给大家分享一下

【原料】任意能产生高斯fchk文件的任务即可,产生后将所有数据集中fchk文件放在某文件夹即可

【使用方法】
自己安装相应python包并运行MultiwfnMLhelper.py.建议将文件清单中中的内容全部复制到包含高斯输出的多个.fchk文件的文件夹中,运行MultiwfnMLhelper.py,选择当前文件夹的路径,然后点击确定,程序就会自动一键生成Multiwfn分子描述符,保存到一个名为 "Multwfn_analysis_feature_matrix3.csv" 的 CSV 文件中。

【文件清单】
(1) Multiwfn_helper.py:主要的Python脚本,用于提取Multiwfn描述符
(2) batchspec.bat:用于运行Multiwfn分析的批处理文件
(3) Step_1.txt1:Multiwfn分析时需要的参数文件
(4) settings.ini:务必isilent= 1(5) Multiwfn :记得把最新的Multiwfn加到文件夹里

【参考】
http://sobereva.com/601
http://sobereva.com/612

【如果有什么建议或者感受,请告诉我】
(本来生成了一个exe文件,但受限于文件太大32M,没法上传了,有需要的可以私聊我)

MultiwfnMLhelper.zip

9.77 KB, 下载次数 Times of downloads: 467

评分 Rate

参与人数
Participants 15
威望 +1 eV +58 收起 理由
Reason
SharkYYX2025 + 3 牛!
Eternal + 2 好物!
wtc18 + 4 好物!
Dreamer1 + 5 赞!
wildon + 5 好物!
xxtnenu + 5 好物!
jiminfu + 5 好物!
乐平 + 5 好物!
玉米猫 + 5 牛!
EdenWuu + 3 谢谢分享
wzkchem5 + 5
pumpkinlily + 3 牛!
ezez + 3 赞!
超限制抱怨 + 5 好物!
sobereva + 1

查看全部评分 View all ratings

4

帖子

0

威望

119

eV
积分
123

Level 2 能力者

65#
发表于 Post on 2025-11-20 13:34:53 | 只看该作者 Only view this author
本帖最后由 Eternal 于 2025-11-20 14:29 编辑

楼主提供的Step_1.txt1是不是可以完善一下,Step_1.txt1末尾改为

2
4
0
-1
-1
q
不改的话会提示forrtl: severe (24): end-of-file during read, unit -4, file CONIN$




205

帖子

0

威望

1137

eV
积分
1342

Level 4 (黑子)

64#
发表于 Post on 2025-10-20 09:08:10 | 只看该作者 Only view this author
sobereva 发表于 2025-10-20 00:16
把我前面提到的601博文完整看一遍,99%的描述符是什么含义、怎么算的,你应该就能了解了,剩下的极少数糊 ...

好的老师 我完整看一遍 谢谢

6万

帖子

99

威望

5万

eV
积分
124671

管理员

公社社长

63#
发表于 Post on 2025-10-20 00:16:20 | 只看该作者 Only view this author
〇66 发表于 2025-10-19 11:35
是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没 ...

把我前面提到的601博文完整看一遍,99%的描述符是什么含义、怎么算的,你应该就能了解了,剩下的极少数糊涂的可以发帖问楼主
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

205

帖子

0

威望

1137

eV
积分
1342

Level 4 (黑子)

62#
发表于 Post on 2025-10-19 12:16:52 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-10-19 12:01
完全找错地方了,这种变量名并不是社长的multiwfn直接输出的而是楼主自定义于脚本的,得到MultiwfnMLhelp ...

原来是这样,感谢你耐心详细的解答,我目前还没有python基础,那后续找别的描述符的物理意义感觉也是怪麻烦的==只能一个帖子一个帖子的盯对了。

1208

帖子

6

威望

2432

eV
积分
3760

Level 5 (御坂)

傻傻的木瓜

61#
发表于 Post on 2025-10-19 12:01:36 | 只看该作者 Only view this author
本帖最后由 Uus/pMeC6H4-/キ 于 2025-10-19 12:02 编辑
〇66 发表于 2025-10-19 11:35
是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没 ...

完全找错地方了,这种变量名并不是社长的multiwfn直接输出的而是楼主自定义于脚本的,得到MultiwfnMLhelper.py里面找并结合python知识理解。实际上第1页就有列表但格式不工整且解释不完善。这个关键词对应的部分代码是
  1.     for line in lines:
  2.     [omitted]
  3.         elif ' Length of the three sides:' in line:
  4.             mol_size = list(map(float, re.findall(r'([\d.]+)', line)))
  5.             sorted_mol_size = sorted(mol_size)
  6.             mol_size_short = sorted_mol_size[0]
  7.             mol_size_2 = sorted_mol_size[1]
  8.             mol_size_l = sorted_mol_size[2]
  9.             length_ratio = mol_size_l / sum(mol_size)
  10.             len_div_diameter = mol_size_l / (2 * mol_radius)
复制代码
这相当于定位到multiwfn输出文件中有“Length of the three sides:”的行,存入并排序该行所有浮点数(一共3个);由于sorted()函数按升序排列,故最小的边长mol_size_short在第1个元素sorted_mol_size[0],最大的边长mol_size_l在第3个元素sorted_mol_size[2],中间的边长mol_size_2在第2个元素sorted_mol_size[1]。(变量命名实在好乱,又缺乏清晰文档,所以出这种问题并不怪用户。)
√546=23.36664289109

205

帖子

0

威望

1137

eV
积分
1342

Level 4 (黑子)

60#
发表于 Post on 2025-10-19 11:35:23 | 只看该作者 Only view this author
sobereva 发表于 2025-10-19 05:39
我的博文里有,手册里也有
使用Multiwfn计算分子的长宽高以及显示分子的主轴
http://sobereva.com/426 ...

是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没有找到对应的地方。想着后续其他描述符在不知道物理意义的情况下,查找起来可能不是很方便。谢谢您的回复。


6万

帖子

99

威望

5万

eV
积分
124671

管理员

公社社长

59#
发表于 Post on 2025-10-19 05:39:00 | 只看该作者 Only view this author
〇66 发表于 2025-10-18 17:29
感谢卢老师和楼上老师的整理,我这里还想请教一下,每个描述符都是英文字母,可能不太清楚他的物理意义是 ...

我的博文里有,手册里也有
使用Multiwfn计算分子的长宽高以及显示分子的主轴
http://sobereva.com/426http://bbs.keinsci.com/thread-10226-1-1.html

下文也提到了
Multiwfn可以计算的分子描述符一览
http://sobereva.com/601http://bbs.keinsci.com/thread-23729-1-1.html

Multiwfn能计算分子的长、宽、高,见《使用Multiwfn计算分子的长宽高以及显示分子的主轴》(http://sobereva.com/426)。


北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

205

帖子

0

威望

1137

eV
积分
1342

Level 4 (黑子)

58#
发表于 Post on 2025-10-18 17:29:58 | 只看该作者 Only view this author
sobereva 发表于 2023-4-12 11:42
我已把此文链接加入此帖了
Multiwfn可以计算的分子描述符一览
http://sobereva.com/601(http://bbs.kein ...

感谢卢老师和楼上老师的整理,我这里还想请教一下,每个描述符都是英文字母,可能不太清楚他的物理意义是什么,想要具体了解的话,有没有一个简便的形式可以看到他对应解释的链接。比如16. Mol_Size_2这个描述符,我在这个帖子中对应的每个帖子和multiwfn手册中进行检索还是没找到,查找起来也比较麻烦一点。问问有没有什么简便的方式能一下知道对应描述符多物理意义或者解释,谢谢老师。

1

帖子

0

威望

65

eV
积分
66

Level 2 能力者

57#
发表于 Post on 2025-7-8 22:35:09 | 只看该作者 Only view this author
你好,请问这个exe文件是不是没有办法直接生成CSV表格呀?我使用exe文件只生成了txt文件

8

帖子

0

威望

386

eV
积分
394

Level 3 能力者

56#
发表于 Post on 2025-7-3 13:52:56 | 只看该作者 Only view this author
整理了一下提取的描述符的单位,不知道是否匹配
基本分子信息
1. 原子数量 (atom_num) 无单位
2. 分子量 (weight) Da
3. HOMO能量和轨道编号 (homo, homo_number) energy: a.u.
4. LUMO能量 (lumo) energy: a.u.  
5. HOMO-LUMO能隙 (homo_lumo_gap) a.u.
轨道离域化指数 (ODI)
6-9. ODI值 (odi_homo_1, odi_homo, odi_lumo, odi_lumoadd1) 无单位
分子形状参数
10. 最远距离 (farthest_distance) Angstrom
11. 分子半径 (mol_radius) Angstrom
12. 分子三边长度 (mol_size) Angstrom
13. 分子平面度参数 (mpp) Angstrom
14. 平面偏差跨度 (sdp) Angstrom
15. 偶极矩 (dipole_moment)  Debye
16. 四极矩 (quadrupole_moment) e·a₀²
17. 八极矩 (octopole_moment) e·a₀3
18. 体积 (volume) Bohr^3
19. 密度 (density) g/cm^3
20. ESP最小值和最大值 (espmin, espmax) kcal/mol
21. 整体表面积 (overall_surf_area) Bohr^2
22. 正表面积 (pos_surf_area) Bohr^2
23. 负表面积 (neg_surf_area) Bohr^2
24. 整体平均值 (overall_ave) a.u.
25. 正平均值 (pos_ave) a.u.
26. 负平均值 (neg_ave) a.u.
27. 整体方差 (Over_var) a.u.^2
28. 电荷平衡 (nu) 无单位
29. 内部电荷分离 (Pi) a.u.
30. 分子极性指数 (MPI) eV
31. 非极性表面积比例 (nonpolar_area) %
32. 极性表面积比例 (polar_area) %
33. ALIE最小值和最大值 (aliemin, aliemax) eV
34. ALIE平均值 (alie_ave) a.u.
35. ALIE方差 (alie_var) a.u.^2
36. LEA最小值和最大值 (leamin, leamax) eV
37. LEA平均值 (lea_ave) a.u.
38. LEA方差 (lea_var) a.u.^2

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
〇66 + 5 赞!

查看全部评分 View all ratings

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

55#
发表于 Post on 2025-6-9 10:19:30 | 只看该作者 Only view this author
liyuanhe211 发表于 2023-4-12 11:41
帮楼主列一下脚本能提取出哪些描述符:

老师,我想问下。Ionization energy, electron affinity, hardness, electronegativity, electrophilicity 这些对应您代码的哪个参数

8

帖子

0

威望

101

eV
积分
109

Level 2 能力者

54#
发表于 Post on 2025-5-17 14:17:39 | 只看该作者 Only view this author
你好 !想请问下计算后 只有txt输出文件,没有描述符信息汇总是为啥

26

帖子

2

威望

475

eV
积分
541

Level 4 (黑子)

53#
 楼主 Author| 发表于 Post on 2024-11-19 21:53:20 | 只看该作者 Only view this author
不应该超过一个小时,加入一个小分子在正常电脑的话

1

帖子

0

威望

15

eV
积分
16

Level 1 能力者

52#
发表于 Post on 2024-11-18 11:24:22 | 只看该作者 Only view this author
老师您好,这个一个fchk文件运行的时间大概是多少合适,感觉等了好久

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 10:32 , Processed in 0.220224 second(s), 31 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list