计算化学公社

 找回密码 Forget password
 注册 Register

基于Multiwfn的分子机器学习助手:MultiwfnMLhelper

查看数: 20254 | 评论数: 64 | 收藏 Add to favorites 68
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2023-4-11 19:46

正文摘要:

本帖最后由 yumingsuxmu 于 2023-4-11 19:46 编辑 近期,自己的工作里面需要快速提取Multiwfn分子描述符进行机器学习分析,我编写了一个名为“基于Multiwfn的分子机器学习助手”的Python脚本工具MultiwfnMLhelper ...

回复 Reply

Eternal 发表于 Post on 2025-11-20 13:34:53
本帖最后由 Eternal 于 2025-11-20 14:29 编辑

楼主提供的Step_1.txt1是不是可以完善一下,Step_1.txt1末尾改为

2
4
0
-1
-1
q
不改的话会提示forrtl: severe (24): end-of-file during read, unit -4, file CONIN$




〇66 发表于 Post on 2025-10-20 09:08:10
sobereva 发表于 2025-10-20 00:16
把我前面提到的601博文完整看一遍,99%的描述符是什么含义、怎么算的,你应该就能了解了,剩下的极少数糊 ...

好的老师 我完整看一遍 谢谢
sobereva 发表于 Post on 2025-10-20 00:16:20
〇66 发表于 2025-10-19 11:35
是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没 ...

把我前面提到的601博文完整看一遍,99%的描述符是什么含义、怎么算的,你应该就能了解了,剩下的极少数糊涂的可以发帖问楼主
〇66 发表于 Post on 2025-10-19 12:16:52
Uus/pMeC6H4-/キ 发表于 2025-10-19 12:01
完全找错地方了,这种变量名并不是社长的multiwfn直接输出的而是楼主自定义于脚本的,得到MultiwfnMLhelp ...

原来是这样,感谢你耐心详细的解答,我目前还没有python基础,那后续找别的描述符的物理意义感觉也是怪麻烦的==只能一个帖子一个帖子的盯对了。
Uus/pMeC6H4-/キ 发表于 Post on 2025-10-19 12:01:36
本帖最后由 Uus/pMeC6H4-/キ 于 2025-10-19 12:02 编辑
〇66 发表于 2025-10-19 11:35
是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没 ...

完全找错地方了,这种变量名并不是社长的multiwfn直接输出的而是楼主自定义于脚本的,得到MultiwfnMLhelper.py里面找并结合python知识理解。实际上第1页就有列表但格式不工整且解释不完善。这个关键词对应的部分代码是
  1.     for line in lines:
  2.     [omitted]
  3.         elif ' Length of the three sides:' in line:
  4.             mol_size = list(map(float, re.findall(r'([\d.]+)', line)))
  5.             sorted_mol_size = sorted(mol_size)
  6.             mol_size_short = sorted_mol_size[0]
  7.             mol_size_2 = sorted_mol_size[1]
  8.             mol_size_l = sorted_mol_size[2]
  9.             length_ratio = mol_size_l / sum(mol_size)
  10.             len_div_diameter = mol_size_l / (2 * mol_radius)
复制代码
这相当于定位到multiwfn输出文件中有“Length of the three sides:”的行,存入并排序该行所有浮点数(一共3个);由于sorted()函数按升序排列,故最小的边长mol_size_short在第1个元素sorted_mol_size[0],最大的边长mol_size_l在第3个元素sorted_mol_size[2],中间的边长mol_size_2在第2个元素sorted_mol_size[1]。(变量命名实在好乱,又缺乏清晰文档,所以出这种问题并不怪用户。)
〇66 发表于 Post on 2025-10-19 11:35:23
sobereva 发表于 2025-10-19 05:39
我的博文里有,手册里也有
使用Multiwfn计算分子的长宽高以及显示分子的主轴
http://sobereva.com/426 ...

是的老师,我是在这个帖子http://sobereva.com/426和手册里ctrl+F搜索“Mol_Size_2”这个关键词,但是没有找到对应的地方。想着后续其他描述符在不知道物理意义的情况下,查找起来可能不是很方便。谢谢您的回复。


sobereva 发表于 Post on 2025-10-19 05:39:00
〇66 发表于 2025-10-18 17:29
感谢卢老师和楼上老师的整理,我这里还想请教一下,每个描述符都是英文字母,可能不太清楚他的物理意义是 ...

我的博文里有,手册里也有
使用Multiwfn计算分子的长宽高以及显示分子的主轴
http://sobereva.com/426http://bbs.keinsci.com/thread-10226-1-1.html

下文也提到了
Multiwfn可以计算的分子描述符一览
http://sobereva.com/601http://bbs.keinsci.com/thread-23729-1-1.html

Multiwfn能计算分子的长、宽、高,见《使用Multiwfn计算分子的长宽高以及显示分子的主轴》(http://sobereva.com/426)。


〇66 发表于 Post on 2025-10-18 17:29:58
sobereva 发表于 2023-4-12 11:42
我已把此文链接加入此帖了
Multiwfn可以计算的分子描述符一览
http://sobereva.com/601(http://bbs.kein ...

感谢卢老师和楼上老师的整理,我这里还想请教一下,每个描述符都是英文字母,可能不太清楚他的物理意义是什么,想要具体了解的话,有没有一个简便的形式可以看到他对应解释的链接。比如16. Mol_Size_2这个描述符,我在这个帖子中对应的每个帖子和multiwfn手册中进行检索还是没找到,查找起来也比较麻烦一点。问问有没有什么简便的方式能一下知道对应描述符多物理意义或者解释,谢谢老师。
facia 发表于 Post on 2025-7-8 22:35:09
你好,请问这个exe文件是不是没有办法直接生成CSV表格呀?我使用exe文件只生成了txt文件
Whitedwarf 发表于 Post on 2025-7-3 13:52:56
整理了一下提取的描述符的单位,不知道是否匹配
基本分子信息
1. 原子数量 (atom_num) 无单位
2. 分子量 (weight) Da
3. HOMO能量和轨道编号 (homo, homo_number) energy: a.u.
4. LUMO能量 (lumo) energy: a.u.  
5. HOMO-LUMO能隙 (homo_lumo_gap) a.u.
轨道离域化指数 (ODI)
6-9. ODI值 (odi_homo_1, odi_homo, odi_lumo, odi_lumoadd1) 无单位
分子形状参数
10. 最远距离 (farthest_distance) Angstrom
11. 分子半径 (mol_radius) Angstrom
12. 分子三边长度 (mol_size) Angstrom
13. 分子平面度参数 (mpp) Angstrom
14. 平面偏差跨度 (sdp) Angstrom
15. 偶极矩 (dipole_moment)  Debye
16. 四极矩 (quadrupole_moment) e·a₀²
17. 八极矩 (octopole_moment) e·a₀3
18. 体积 (volume) Bohr^3
19. 密度 (density) g/cm^3
20. ESP最小值和最大值 (espmin, espmax) kcal/mol
21. 整体表面积 (overall_surf_area) Bohr^2
22. 正表面积 (pos_surf_area) Bohr^2
23. 负表面积 (neg_surf_area) Bohr^2
24. 整体平均值 (overall_ave) a.u.
25. 正平均值 (pos_ave) a.u.
26. 负平均值 (neg_ave) a.u.
27. 整体方差 (Over_var) a.u.^2
28. 电荷平衡 (nu) 无单位
29. 内部电荷分离 (Pi) a.u.
30. 分子极性指数 (MPI) eV
31. 非极性表面积比例 (nonpolar_area) %
32. 极性表面积比例 (polar_area) %
33. ALIE最小值和最大值 (aliemin, aliemax) eV
34. ALIE平均值 (alie_ave) a.u.
35. ALIE方差 (alie_var) a.u.^2
36. LEA最小值和最大值 (leamin, leamax) eV
37. LEA平均值 (lea_ave) a.u.
38. LEA方差 (lea_var) a.u.^2

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
〇66 + 5 赞!

查看全部评分 View all ratings

sjkcn 发表于 Post on 2025-6-9 10:19:30
liyuanhe211 发表于 2023-4-12 11:41
帮楼主列一下脚本能提取出哪些描述符:

老师,我想问下。Ionization energy, electron affinity, hardness, electronegativity, electrophilicity 这些对应您代码的哪个参数
非洲黑炭 发表于 Post on 2025-5-17 14:17:39
你好 !想请问下计算后 只有txt输出文件,没有描述符信息汇总是为啥
yumingsuxmu 发表于 Post on 2024-11-19 21:53:20
不应该超过一个小时,加入一个小分子在正常电脑的话
QiuQian 发表于 Post on 2024-11-18 11:24:22
老师您好,这个一个fchk文件运行的时间大概是多少合适,感觉等了好久

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 03:10 , Processed in 0.201553 second(s), 32 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list