计算化学公社

标题: 求助:如何使用机器学习对分子模拟(gromacs)和gaussian优化结果进行建模和分析、预测 [打印本页]

作者
Author:
longwenjun    时间: 2026-1-23 12:44
标题: 求助:如何使用机器学习对分子模拟(gromacs)和gaussian优化结果进行建模和分析、预测
本帖最后由 longwenjun 于 2026-1-23 12:44 编辑

导师接了一个项目,要做白酒的跨尺度模拟,通过gaussian对白酒中的主要小分子(除乙醇和水外含量较高的物质,主要是酸和酯,共计15-20种)进行优化(构象),然后再使用gromacs对白酒体系进行模拟,以优化后的各物质进行配比模拟,然后要模拟气-液界面、气相和液相的成分及组成,然后根据gaussian和gromacs的结果,使用机器学习的方式进行分析、建模和预测。主要是预测,比如在液相中的稳定比例,什么比例最稳定,白酒存放过程中,某一物质变多,对其他物质挥发性或构像稳定的影响,以及长时间存放内部构象的变化。最后使用gc-ms和lc-ms来鉴定预测的结果。
提问:
1、之前做过gaussian和gromacs,但是机器学习纯小白,请问要怎么使用机器学习进行分子模拟(gromacs)和gaussian优化结果进行建模和分析、预测,从而达到想要的预测结果?哪些模拟的结果应该是我关注的,我没有搜到相关的文献,请问有大佬做过类似的吗?

2、感觉工作量挺大的,项目计划是三年左右,不知道能不能计算完,目前仅有两台2080ti的计算电脑,如果不行,需要增加计算资源要怎么增加比较合适,重新配一个专门机器学习的吗?
目前想到的主要是这些问题,如果还有不足之处,敬请各位大佬提醒。

作者
Author:
student0618    时间: 2026-1-27 16:03
搜一下机器学习QSPR的文章,不过方向太广了。

先拆分多个短期目标,哪个目标是纯计算普通模拟、哪些实验验证可做、最后哪些是ML,要做什么分子、多少个比例,全部列出来。

找纯计算、实验验证用什么方法的文章。

然后是可以用到计算资源。

然后是用现有计算资源完成每个短期目标所需的时间。找文献订计划、试错、自己建模、模拟、分析大概需时,建立量计算工作流需时、学习并使用ML需时。这些每个人都不同的,有人一天能搞定整个工作流让他自己跑,有人需要更多时间。
作者
Author:
longwenjun    时间: 2026-1-28 09:11
student0618 发表于 2026-1-27 16:03
搜一下机器学习QSPR的文章,不过方向太广了。

先拆分多个短期目标,哪个目标是纯计算普通模拟、哪些实验 ...

谢谢大佬,我最近查文献也没有看到白酒做这种多种组分模拟的文章,所以有点懵,我先按照您的思路查询一下文献,因为机器学习之前整个课题组弄过,所以有点懵~
作者
Author:
student0618    时间: 2026-1-28 09:18
总是要简化体系的,但要合理简化到什么程度也是一个课题。

能确定一个可行的方向后,核心就是“拿一大堆数据fit一个模型,用fit好的模型来预测未知”了。

是否真可行有用还是未知。但先拆分多个短期目标、达成目标的方案还是对了解项目有帮助的。
作者
Author:
longwenjun    时间: 2026-1-29 12:40
student0618 发表于 2026-1-28 09:18
总是要简化体系的,但要合理简化到什么程度也是一个课题。

能确定一个可行的方向后,核心就是“拿一大堆 ...

嗯嗯,谢谢大佬,老师目前给我说大概是根据气相或者液相数据找一个白酒内的某个浓度作为标准,高于这个浓度的分子进行构象优化,然后一起丢到gromacs里面进行优化,然后调节乙醇和水的比例模拟不同的酒精度,分别作液相和气液界面的模拟,然后一直跑,然后用这个模拟的数据来建立模型,根据这个模型预测陈酿10年,15年的白酒的气相和液相数据,然后跟真实的气相和液相数据进行比对,然后让模型反复学习,最后有一个准确度就行了,都不需要太高,可以下一个项目再提升




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3