计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: chrischen1128
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] 机器学习实例介绍

  [复制链接 Copy URL]

1043

帖子

0

威望

4106

eV
积分
5149

Level 6 (一方通行)

16#
发表于 Post on 2020-3-30 14:32:50 | 只看该作者 Only view this author
liyuanhe211 发表于 2020-3-22 05:05
仅对通过机器学习归纳现有计算或实验数据、生成廉价优质的计算模型来说,“不能产生‘为什么’”并不是它 ...

没说机器学习没有用。就总结规律和建立预测模型来说,用处肯定很大,而且比人还精密靠谱。但是,这里总结的规律和预测模型都是有适用范围的,而这个范围的认识和界定,目前机器学习很难做到。 相反,人却可以基于已有的科学体系知识,并使用逻辑推理和合理的洞察,来提取所得到的规律或预测模型的更深层次物理和化学意义(即为什么),从而判断训练得到的规律和模型的世界观。

我只是想强调,目前机器学习远无法替代人在科学中的作用,更不能在目前的现实上过分浮夸其作用。当然,未来怎样不得而知。

3098

帖子

28

威望

1万

eV
积分
16892

Level 6 (一方通行)

17#
发表于 Post on 2020-3-31 06:41:23 | 只看该作者 Only view this author
granvia 发表于 2020-3-30 14:32
没说机器学习没有用。就总结规律和建立预测模型来说,用处肯定很大,而且比人还精密靠谱。但是,这里总结 ...

确实如此,在12楼Sob说的也是“机器学习的价值在于可以通过预测的模型以很少的计算量达到很不错的结果,成本明显低于直接用量化算同样的精度”,而暂时不是发现“更深层次的物理和化学(定律)”。

你说的这方面更多的属于AGI的研究范畴,AGI现在的一些研究其实很有意思,因为当前没有能实现AGI的具体框架,所以AGI问题很纯粹,有类似数学公理体系+推演的洁净感。

28

帖子

3

威望

832

eV
积分
920

Level 4 (黑子)

18#
发表于 Post on 2020-4-1 17:56:10 | 只看该作者 Only view this author
卢老师陈老师!scikit-learn都讲了,RDkit 也不落下,RDKit: Open-Source Cheminformatics Software   http://www.rdkit.org/
RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析、化学反应处理、可视化与化学空间探索及RDkit相关的机器学习、深度学习应用过程详解
http://www.rdkit.org/

28

帖子

3

威望

832

eV
积分
920

Level 4 (黑子)

19#
发表于 Post on 2020-4-2 11:46:53 | 只看该作者 Only view this author
机器学习的基础是数据,数据的高度决定了学习的高度。因此对于化学领域而言,如何得到化学分子的结构信息至关重要。目前开源的化学信息学软件有CDKit,RDkit等可以提取分子描述符合分子指纹信息。但是这些信息都是基于分子结构组成、拓扑、连接性、电负性等提取的参数,都不是基于量子化学计算的电子信息。如果要根据化学环境得到参数,用量化计算的结果可能更加准确。因此如果在multiwfn中能够增加输出gaussian、orca等量化软件计算的数据,可以为机器学习提供大量高质量的数据。这个也是我们做化学信息学领域人员急切需要的功能。卢老师已经在multiwfn中增加了概念密度泛函参数的功能,再增加一个输出multiwfn所能得到的分子所以参数的功能如何?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

20#
发表于 Post on 2020-4-3 12:02:19 | 只看该作者 Only view this author
comboy2008 发表于 2020-4-2 11:46
机器学习的基础是数据,数据的高度决定了学习的高度。因此对于化学领域而言,如何得到化学分子的结构信息至 ...

这个不好整合,不同参数分散在不同功能里,计算原理差异很大
用户用命令行方式自动运行Multiwfn并提取需要的数据即可,非常简单,参考:
详谈Multiwfn的命令行方式运行和批量运行的方法
http://sobereva.com/612http://bbs.keinsci.com/thread-24929-1-1.html

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

28

帖子

3

威望

832

eV
积分
920

Level 4 (黑子)

21#
发表于 Post on 2020-4-4 15:57:20 | 只看该作者 Only view this author
sobereva 发表于 2020-4-3 12:02
这个不好整合,不同参数分散在不同功能里,计算原理差异很大
用户用命令行方式自动运行Multiwfn并提取需 ...

谢谢卢老师指点!

5

帖子

0

威望

227

eV
积分
232

Level 3 能力者

22#
发表于 Post on 2020-4-12 01:52:11 | 只看该作者 Only view this author
机器学习在化学里面可能更像是一种top-down的思路,相对于dft这种从头算的,优势在于速度,劣势就是如果预测性质的话,误差多大心里没有数的,和训练集里面骨架类似就可以做到很小的误差,差的很远那也可能飘到十万八千里了。
很多的机器学习的文章用的是dft算下来的结果,那意义其实就只是节约时间而已了,但是机器学习不一定不能比dft更加精准,个人觉得现在最大的问题就是缺少实验来的数据集。

74

帖子

0

威望

1715

eV
积分
1789

Level 5 (御坂)

23#
发表于 Post on 2020-4-23 15:04:12 | 只看该作者 Only view this author
很详细,好东西呀

26

帖子

0

威望

606

eV
积分
632

Level 4 (黑子)

24#
发表于 Post on 2022-6-30 22:39:05 | 只看该作者 Only view this author
柒月小鱼 发表于 2020-3-13 23:24
https://www.bilibili.com/video/av88260116?p=47
配合食用

链接失效了

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 18:51 , Processed in 0.173308 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list