|
|
1. 初始数据集通常是从不同初始构型出发跑AIMD(AIMD通常设置为高温高压,目的是为了尽可能采集丰富的构型)。此外,一般情况下初始数据集是不完备的,有很多构象是没有探索采样到的,机器学习势函数擅长内推,不擅长外推,对于数据集中没有出现的构型,它的预测效果可能很差,故一般会使用DP-GEN进行数据集的扩充。
2. 可能你的体系比较大,我推荐用CP2K或者ABACUS。(具体问题具体分析,但是无论是用什么软件算,都要先做好收敛性测试!)
3. 一般来说,合格的数据集即“DP-GEN”后收敛的数据集。关于原子数:进行DFT计算的晶胞不能太小,因为机器学习势涉及到一个截断半径rcut,如果你跑DFT的晶胞过小,很可能提供了大量重复信息。
4. 去看DP官方的推文,他们会推大量使用DeepMD-kit+ LAMMPS的论文案例,而且很多论文中的输入文件是开源的,DP自家的Bohrium上也有非常多高质量的notebook,能够非常快的带你入门。
5. 如何评估训练出的模型质量:a)能够精准预测数据集中DFT的能量和受力(这个是最基本的)。b)能够复现一些物性,如RDF, MSD, 温度驱动相变等等。
(开发DP力场流程看起来简单,其实里面的坑很多) |
评分 Rate
-
查看全部评分 View all ratings
|