计算化学公社

 找回密码 Forget password
 注册 Register
Views: 346|回复 Reply: 9
打印 Print 上一主题 Last thread 下一主题 Next thread

[新手求助] 求助LUMO预测值与计算值误差原因分析

[复制链接 Copy URL]

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

各位大神,我有几个分子的LUMO预测值(AI模型获得),现在想和DFT的计算值做一个比较,获得MAE。我发现以下几个分子的误差比较大,目前分析原因从几何优化后的结构入手,我发现,以下几个分子通过gauss view显示后,都存在断键、共轭双键、双键变单键的情况(看过社长的帖子,明白gauss view呈现的断键与否不重要),想问问是否误差较大和这两个因素有关?
1.C=N变成共轭双键 P000048.zip (62.23 KB, 下载次数 Times of downloads: 1)



2.P=O变成P-O

P000029.zip (110.09 KB, 下载次数 Times of downloads: 0)

3.几何优化后,出现断键

P000020.zip (391.93 KB, 下载次数 Times of downloads: 0)


881

帖子

3

威望

1664

eV
积分
2605

Level 5 (御坂)

傻傻的木瓜

2#
发表于 Post on 2025-7-4 10:22:20 | 只看该作者 Only view this author
第一个结构如果是电中性的话会存在自由基,第二第三个结构的磺酰基空间构型不对(在前帖http://bbs.keinsci.com/thread-53953-1-1.html已经指出来了);不知道你训练ai的具体细节,如果数据集没有覆盖这些化学不合理的情况自然预测不准。
√546=23.36664289109

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2025-7-4 10:27:08 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-7-4 10:22
第一个结构如果是电中性的话会存在自由基,第二第三个结构的磺酰基空间构型不对(在前帖http://bbs.keinsci ...

感谢您,这些分子的元素类型都包含在训练集中了

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2025-7-4 10:29:41 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-7-4 10:22
第一个结构如果是电中性的话会存在自由基,第二第三个结构的磺酰基空间构型不对(在前帖http://bbs.keinsci ...

第一个结构是电中性的,但是我没理解您说的自由基和出现的共轭双键有什么关联,能再详细些吗?谢谢

410

帖子

5

威望

1630

eV
积分
2140

Level 5 (御坂)

鸩羽

5#
发表于 Post on 2025-7-4 12:09:06 | 只看该作者 Only view this author
wwwwwt 发表于 2025-7-4 10:29
第一个结构是电中性的,但是我没理解您说的自由基和出现的共轭双键有什么关联,能再详细些吗?谢谢

既然知道gaussview呈现的断键与否不重要为啥还要管这个所谓的"共轭双键"呢。
某不知名实验组从苞米地里长出来的计算选手

881

帖子

3

威望

1664

eV
积分
2605

Level 5 (御坂)

傻傻的木瓜

6#
发表于 Post on 2025-7-4 12:47:47 | 只看该作者 Only view this author
wwwwwt 发表于 2025-7-4 10:27
感谢您,这些分子的元素类型都包含在训练集中了

其实ai没你想得那么聪明/黑箱,单单元素类型在训练集里还远远不够,还得看化学环境。打个比方,学有机化学前几章掌握了含有碳氢氧的醇和醚的特征,显然并不意味着自动知道了同样含有碳氢氧的醛/酮/羧酸/酸酐/呋喃等等的特征,还得继续学后面很多章来了解不同化学环境下的碳氧键的结构与性质;人是如此,ai也如此。

……说到这里我得讲几句比较难听的话,我很怀疑你的基础化学知识是否足以支撑当前研究:如果连合理的分子结构一般长什么样都不清楚的话,连初始坐标和计算结果对不对都没法确认,更别说给ai构建的训练集和测试集是什么质量了。先别谈什么量子化学计算和ai训练了,赶紧去找些无机和有机教科书补习下最基本的分子结构与官能团知识,要不然后面还得踩很多坑。

评分 Rate

参与人数
Participants 3
eV +7 收起 理由
Reason
wwwwwt + 3 谢谢
PLwang + 1 非常正确
imasen + 3

查看全部评分 View all ratings

√546=23.36664289109

51

帖子

0

威望

345

eV
积分
396

Level 3 能力者

7#
发表于 Post on 2025-7-4 15:05:57 | 只看该作者 Only view this author
如果你的技术路线是"DFT计算得到大量分子的HOMO LUMO作为原始数据-ML进行训练得到ML模型",我只能说你的技术路线创新不足。这是一个已经有很多人做过的领域了,比如https://github.com/MooseML/homo-lumo-gap-predictor,比如https://pubs.acs.org/doi/full/10.1021/acs.jcim.6b00340,你需要目前的工作和先前的工作,不同的地方在哪里。
甚至除过HOMO LUMO,其他的分子量子化学性质,比如pKa、偶极矩等等,都有现成的工作了。
CP2K VASP Gaussian LAMMPS GROMACS欢迎交流

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2025-7-7 09:28:24 | 只看该作者 Only view this author
wal 发表于 2025-7-4 12:09
既然知道gaussview呈现的断键与否不重要为啥还要管这个所谓的"共轭双键"呢。

因为目前出现误差较大的分子,都是与这个问题强相关的。无非就是gauss view 中断键或者出现所谓的共轭双键,所以想知道这种现象和误差是否有关联

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2025-7-7 09:34:01 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-7-4 12:47
其实ai没你想得那么聪明/黑箱,单单元素类型在训练集里还远远不够,还得看化学环境。打个比方,学有机化 ...

感谢!

64

帖子

0

威望

198

eV
积分
262

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2025-7-7 09:35:05 | 只看该作者 Only view this author
PLwang 发表于 2025-7-4 15:05
如果你的技术路线是"DFT计算得到大量分子的HOMO LUMO作为原始数据-ML进行训练得到ML模型",我只能说你的技 ...

感谢!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 21:00 , Processed in 0.171324 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list