计算化学公社

 找回密码 Forget password
 注册 Register
Views: 14469|回复 Reply: 56
打印 Print 上一主题 Last thread 下一主题 Next thread

[Multiwfn资源与经验] 基于Multiwfn的分子机器学习助手:MultiwfnMLhelper

  [复制链接 Copy URL]

26

帖子

2

威望

464

eV
积分
530

Level 4 (黑子)

本帖最后由 yumingsuxmu 于 2023-4-11 19:46 编辑

近期,自己的工作里面需要快速提取Multiwfn分子描述符进行机器学习分析,我编写了一个名为“基于Multiwfn的分子机器学习助手”的Python脚本工具MultiwfnMLhelper。它的使用非常简便,给大家分享一下

【原料】任意能产生高斯fchk文件的任务即可,产生后将所有数据集中fchk文件放在某文件夹即可

【使用方法】
自己安装相应python包并运行MultiwfnMLhelper.py.建议将文件清单中中的内容全部复制到包含高斯输出的多个.fchk文件的文件夹中,运行MultiwfnMLhelper.py,选择当前文件夹的路径,然后点击确定,程序就会自动一键生成Multiwfn分子描述符,保存到一个名为 "Multwfn_analysis_feature_matrix3.csv" 的 CSV 文件中。

【文件清单】
(1) Multiwfn_helper.py:主要的Python脚本,用于提取Multiwfn描述符
(2) batchspec.bat:用于运行Multiwfn分析的批处理文件
(3) Step_1.txt1:Multiwfn分析时需要的参数文件
(4) settings.ini:务必isilent= 1(5) Multiwfn :记得把最新的Multiwfn加到文件夹里

【参考】
http://sobereva.com/601
http://sobereva.com/612

【如果有什么建议或者感受,请告诉我】
(本来生成了一个exe文件,但受限于文件太大32M,没法上传了,有需要的可以私聊我)

MultiwfnMLhelper.zip

9.77 KB, 下载次数 Times of downloads: 394

评分 Rate

参与人数
Participants 12
威望 +1 eV +49 收起 理由
Reason
Dreamer1 + 5 赞!
wildon + 5 好物!
xxtnenu + 5 好物!
jiminfu + 5 好物!
乐平 + 5 好物!
玉米猫 + 5 牛!
EdenWuu + 3 谢谢分享
wzkchem5 + 5
pumpkinlily + 3 牛!
ezez + 3 赞!
超限制抱怨 + 5 好物!
sobereva + 1

查看全部评分 View all ratings

6万

帖子

99

威望

5万

eV
积分
120060

管理员

公社社长

2#
发表于 Post on 2023-4-12 09:37:05 | 只看该作者 Only view this author
若方便的话,建议加入说明能自动计算提取哪些描述符

论坛目前文件上传上限是10MB,超过的可以考虑发网盘链接


北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

26

帖子

2

威望

464

eV
积分
530

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2023-4-12 10:11:50 | 只看该作者 Only view this author
多谢社长提醒,windows可直接运行程序.exe链接如下:
链接:https://pan.baidu.com/s/12mduHZQPwGR4-cq--QNG5Q
提取码:w8r1


【核心特点】只需将压缩包中的内容全部复制到包含多个.fchk文件的文件夹中,双击.exe文件,选择当前文件夹的路径,然后点击确定,程序就会自动一键生成Multiwfn分子描述符。


【描述符内容】
SampleName: Sample Name
Orbitals ODIODI_HOMO_1: Orbital Delocalization Index HOMO-1ODI_HOMO: Orbital Delocalization Index HOMOODI_LUMO: Orbital Delocalization Index LUMOODI_LUMO_Add1: Orbital Delocalization Index LUMO+1ODI_Mean: Orbital Delocalization Index MeanODI_Std: Orbital Delocalization Index Standard Deviation
sizeAtomNum: Number of AtomsWeight: Molecular Weight
Frontier_orbitalsHOMO: Highest Occupied Molecular OrbitalHOMO_number: HOMO NumberLUMO: Lowest Unoccupied Molecular OrbitalHOMO_LUMO_Gap: HOMO-LUMO Gap
ShapeFarthest_Distance: Farthest Distance between AtomsMol_Radius: Molecular RadiusMol_Size_Short: Shortest Molecular SizeMol_Size_2: Medium Molecular SizeMol_Size_L: Longest Molecular SizeLength_Ratio: Length RatioLen_Div_Diameter: Length Divided by DiameterMPP: Maximum Positive PotentialSDP: Surface-Derived Polarization
Dipole_momentDipole_Moment: Dipole MomentQuadrupole_Moment: Quadrupole MomentOctopole_Moment: Octopole Moment
Quantitative analysis of molecular surfaceVolume: Molecular VolumeDensity: Molecular DensityESPmin: Minimum Electrostatic PotentialESPmax: Maximum Electrostatic PotentialOverall_Surface_Area: Overall Surface AreaPos_Surface_Area: Positive Surface AreaNeg_Surface_Area: Negative Surface AreaOverall_Average: Overall AveragePos_Average: Positive AverageNeg_Average: Negative AverageOverall_Variance: Overall VarianceNu: Electrophilicity IndexPi: Nucleophilicity IndexMPI: Molecular Polarizability IndexNonpolar_Area: Nonpolar AreaPolar_Area: Polar AreaALIEmin: Minimum ALIE (Average Localized-Ionization-Energy)ALIEmax: Maximum ALIEALIE_Ave: ALIE AverageALIE_Var: ALIE VarianceLEAmin: Minimum LEA (Local Electron Affinity)LEAmax: Maximum LEALEA_Ave: LEA AverageLEA_Var: LEA Variance

3097

帖子

29

威望

1万

eV
积分
17094

Level 6 (一方通行)

4#
发表于 Post on 2023-4-12 11:41:36 | 只看该作者 Only view this author
本帖最后由 liyuanhe211 于 2023-4-12 11:42 编辑

帮楼主列一下脚本能提取出哪些描述符:
  1. ODI_HOMO_1
  2. ODI_HOMO
  3. ODI_LUMO
  4. ODI_LUMO_Add1
  5. ODI_Mean
  6. ODI_Std
  7. AtomNum
  8. Weight
  9. HOMO
  10. HOMO_number
  11. LUMO
  12. HOMO_LUMO_Gap
  13. Farthest_Distance
  14. Mol_Radius
  15. Mol_Size_Short
  16. Mol_Size_2
  17. Mol_Size_L
  18. Length_Ratio
  19. Len_Div_Diameter
  20. MPP
  21. SDP
  22. Dipole_Moment
  23. Quadrupole_Moment
  24. Octopole_Moment
  25. Volume
  26. Density
  27. ESPmin
  28. ESPmax
  29. Overall_Surface_Area
  30. Pos_Surface_Area
  31. Neg_Surface_Area
  32. Overall_Average
  33. Pos_Average
  34. Neg_Average
  35. Overall_Variance
  36. Nu
  37. Pi
  38. MPI
  39. Nonpolar_Area
  40. Polar_Area
  41. ALIEmin
  42. ALIEmax
  43. ALIE_Ave
  44. ALIE_Var
  45. LEAmin
  46. LEAmax
  47. LEA_Ave
  48. LEA_Var
复制代码





评分 Rate

参与人数
Participants 1
eV +2 收起 理由
Reason
EdenWuu + 2 赞!

查看全部评分 View all ratings

6万

帖子

99

威望

5万

eV
积分
120060

管理员

公社社长

5#
发表于 Post on 2023-4-12 11:42:25 | 只看该作者 Only view this author
我已把此文链接加入此帖了
Multiwfn可以计算的分子描述符一览
http://sobereva.com/601http://bbs.keinsci.com/thread-23729-1-1.html
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

34

帖子

0

威望

198

eV
积分
232

Level 3 能力者

6#
发表于 Post on 2023-4-17 21:12:04 | 只看该作者 Only view this author
本帖最后由 张晓婷 于 2023-4-17 21:15 编辑
yumingsuxmu 发表于 2023-4-12 10:11
多谢社长提醒,windows可直接运行程序.exe链接如下:
链接:https://pan.baidu.com/s/12mduHZQPwGR4-cq--Q ...

你好,我下载了网盘链接文件,里面含有的和一楼发的文件清单是不一样的里面有两个exe,我运行了第二个exe,选择了有fchk文件的文件夹之后,生成txt文件,但是里面是空的
请问这是什么问题呢?非常感谢

网盘链接.png (49.05 KB, 下载次数 Times of downloads: 290)

网盘链接.png

生成了空的txt文件.png (42.6 KB, 下载次数 Times of downloads: 284)

生成了空的txt文件.png

34

帖子

0

威望

198

eV
积分
232

Level 3 能力者

7#
发表于 Post on 2023-4-17 21:50:16 | 只看该作者 Only view this author
本帖最后由 张晓婷 于 2023-4-17 21:52 编辑
yumingsuxmu 发表于 2023-4-12 10:11
多谢社长提醒,windows可直接运行程序.exe链接如下:
链接:https://pan.baidu.com/s/12mduHZQPwGR4-cq--Q ...

你好,我”将压缩包中的内容全部复制到包含多个.fchk文件的文件夹中,双击.exe文件,选择当前文件夹的路径,然后点击确定“之后,并没有产生文件
当我直接打开exe文件之后,选择包含有fchk文件的文件夹之后,这个exe是好用的,并且产生了csv文件,但是里面也是空的。是不是不用将压缩包内容复制到要提取描述符的文件夹里,直接用直接选择文件夹就好了
我是少安装插件了吗?谢谢指导

空文件.png (79.47 KB, 下载次数 Times of downloads: 290)

空文件.png

26

帖子

2

威望

464

eV
积分
530

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2023-4-19 09:31:30 | 只看该作者 Only view this author
张晓婷 发表于 2023-4-17 21:12
你好,我下载了网盘链接文件,里面含有的和一楼发的文件清单是不一样的里面有两个exe,我运行了第二个exe ...

可以看出读取fchk文件生成了空的txt,说明Multiwfn读取你的fchk失败了,你可以试试把你的b3lyp.fchk拖到Multiwfn.exe里面看看有没有成功读取,如果没有,是不是fchk文件有问题呢?比如说没有算完?

26

帖子

2

威望

464

eV
积分
530

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2023-4-19 09:36:11 | 只看该作者 Only view this author
张晓婷 发表于 2023-4-17 21:50
你好,我”将压缩包中的内容全部复制到包含多个.fchk文件的文件夹中,双击.exe文件,选择当前文件夹的路 ...

您好,我听的描述,你好像没有“将压缩包中的内容全部复制到包含多个.fchk文件的文件夹中”,意思是你的fchk在哪你把所有fchk复制到解压后的“MultiwfnMLhelper_Win”文件夹中,或者将“MultiwfnMLhelper_Win”中所有复制到fchk那个文件夹里。你的描述是“我直接打开exe文件之后,选择包含有fchk文件的文件夹”,看似不符合,请检查一下

1102

帖子

18

威望

6692

eV
积分
8154

Level 6 (一方通行)

計算化学の社畜

10#
发表于 Post on 2023-4-30 12:44:30 | 只看该作者 Only view this author
本帖最后由 冰释之川 于 2023-5-9 13:46 编辑

我对楼主写的脚本进行了适当的修改,从而适用于Linux平台。
主要修改与增补的内容为:
(1) 将‘batchspec.bat’与‘Step_1.txt1’文件合并入py脚本中
(2) 增加Multiwfn处理的进度条
(3) 对所有求得的描述符增加描述信息

MultiwfnMLhelper.py (15.8 KB, 下载次数 Times of downloads: 296)

另外,我看到楼主对描述符的解释当中,有
Nu: Electrophilicity Index                   + Pi: Nucleophilicity Index

但从原始输出来看,这两个指标应该是:
+ Nu: Balance of charges                   + Pi: Internal charge separation



评分 Rate

参与人数
Participants 4
eV +20 收起 理由
Reason
wildon + 5 谢谢
Acee + 5 赞!
乐平 + 5 赞!
sobereva + 5

查看全部评分 View all ratings

Stand on the shoulders of giants

26

帖子

2

威望

464

eV
积分
530

Level 4 (黑子)

11#
 楼主 Author| 发表于 Post on 2023-5-1 09:20:17 | 只看该作者 Only view this author
冰释之川 发表于 2023-4-30 12:44
我对楼主写的脚本进行了适当的修改,从而适用于Linux平台。
主要修改与增补的内容为:
(1) 将‘batchspec ...

多谢指正和补充!

84

帖子

0

威望

3552

eV
积分
3636

Level 5 (御坂)

12#
发表于 Post on 2023-5-8 15:42:33 | 只看该作者 Only view this author
冰释之川 发表于 2023-4-30 12:44
我对楼主写的脚本进行了适当的修改,从而适用于Linux平台。
主要修改与增补的内容为:
(1) 将‘batchspec ...

老师,这个脚本运行时出了基态的fchk文件还需要别的吗?报错如下,请您帮忙看看:
Traceback (most recent call last):                                                                                                                           File "/home/adong/helper/MultiwfnMLhelper-linux-SingleVersion.py", line 295, in <module>                                                         data_extraction(result_file_list)                                                                                                                        File "/home/adong/helper/MultiwfnMLhelper-linux-SingleVersion.py", line 56, in data_extraction                                                   odi_homo_1, odi_homo, odi_lumo, odi_lumoadd1 = odi_values[:4]                                                                                          ValueError: not enough values to unpack (expected 4, got 0)

1102

帖子

18

威望

6692

eV
积分
8154

Level 6 (一方通行)

計算化学の社畜

13#
发表于 Post on 2023-5-9 08:39:20 | 只看该作者 Only view this author
adong 发表于 2023-5-8 15:42
老师,这个脚本运行时出了基态的fchk文件还需要别的吗?报错如下,请您帮忙看看:
Traceback (most rece ...

只需要fchk文件,需要安装Multiwfn,设置环境变量使之可以直接通过Multiwfn命令调用。另外,Multiwfn配置文件里的isilent必须设置为1
Stand on the shoulders of giants

84

帖子

0

威望

3552

eV
积分
3636

Level 5 (御坂)

14#
发表于 Post on 2023-5-9 12:08:50 | 只看该作者 Only view this author
冰释之川 发表于 2023-5-9 08:39
只需要fchk文件,需要安装Multiwfn,设置环境变量使之可以直接通过Multiwfn命令调用。另外,Multiwfn配置 ...

收到,谢谢老师

31

帖子

0

威望

1177

eV
积分
1208

Level 4 (黑子)

15#
发表于 Post on 2023-6-10 22:01:49 | 只看该作者 Only view this author
请问这个脚本是否可以更改使之对molden文件进行计算
感谢每位帮助过我的人

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 17:22 , Processed in 0.197888 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list