计算化学公社

 找回密码 Forget password
 注册 Register
Views: 59|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] 求助有机光伏的机器学习,数据来源和数据生成流程的一致性问题

[复制链接 Copy URL]

13

帖子

0

威望

43

eV
积分
56

Level 2 能力者

各位老师好,我想请教个问题。我导师是做有机光伏的机器学习,让我把做三元有机光伏实验人的新合成的分子结构用Chemdraw画出来,再用Marsketch转为3D,提取坐标,用p opt freq 6-31g(d) m062x进行高斯计算,我觉得是找能量最低的状态,我导师也没有进行构象搜索,把用高斯计算的log文件的数据,作为机器学习的输入特征进行建模。我有的分子结构是用Chemdraw画出来,再用Chem3D转为3D,提取坐标,再用同样的机组泛函进行计算。我觉得我没有保证数据来源的保持数据生成流程的一致性,会有机器学习的结果影响吗?

6万

帖子

99

威望

6万

eV
积分
127615

管理员

公社社长

2#
发表于 Post on yesterday 21:47 | 只看该作者 Only view this author
只要都用比如molclus(http://www.keinsci.com/research/molclus.html)做了构象搜索,尤其是系统式构象搜索(见《gentor:扫描方式做分子构象搜索的便捷工具》http://bbs.keinsci.com/thread-2388-1-1.html),初始三维结构怎么创建的无所谓,别看上去严重离谱就行。

至于没有做构象搜索就做优化结果能不能用,取决于具体是什么分子、初始结构产生成了什么模样,以及具体你把分子的什么属性用于机器学习(对构象不敏感的属性,忽略构象搜索的过程往往还算能说得过去,如多数体系的电离能;而敏感的则不行,比如偶极矩、很多体系的1H NMR、手性分子的VCD/ECD和光学旋转)
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

13

帖子

0

威望

43

eV
积分
56

Level 2 能力者

3#
 楼主 Author| 发表于 Post on yesterday 22:19 | 只看该作者 Only view this author
首先谢谢老师的耐心解答。我是一个小白。
老师你的意思是不管是用Marsketch转为3D还是chem3d转为3D,流程不一致不是最大问题,都没做构象搜索才是。我导师也没有做构象搜索。我的也先不做构象搜索了,你建议我接下来是用Marsketch转为3D还是chem3d转为3D。这不同的流程应该对计算结果影响不大吧?

1万

帖子

0

威望

1万

eV
积分
22753

Level 6 (一方通行)

4#
发表于 Post on halfhour ago | 只看该作者 Only view this author
有直接把结构图片转为SMILES的工具,可以搜一下。有SMILES之后可以用脚本批量调用其他工具转成原子坐标,再做构象搜索之类的,效率能高很多
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php,墙内下载ORCA:https://www.faccts.de/customer)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

13

帖子

0

威望

43

eV
积分
56

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 1 min ago | 只看该作者 Only view this author
好滴,谢谢老师

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-6-23 10:42 , Processed in 0.196761 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list