计算化学公社

标题: 吐槽:近6年来量化计算方法缺乏大的进展 [打印本页]

作者
Author:
sobereva    时间: 2017-2-13 04:11
标题: 吐槽:近6年来量化计算方法缺乏大的进展
近6年来量化计算方法缺乏大的进展

文/Sobereva  2017-Feb-13

2001~2010的10年间,量化上重要的进展一大把,很多都得到了广泛应用、在量化程序中也被广泛支持:
DFT-D2/D3
M06-2X、wB97XD
双杂化泛函
范围分离泛函
COSX、RIJK
SCS-MP2、SCS-CCSD等
SMD
PM6
TDDFT一阶解析导数的广泛普及
...
还有一些很有意义的小进展:
G4、Wn系列
def2系列基组
pcS、pcJ基组
...

而近6年来,从2011开始,虽然量化计算方法的文章极多,benchmark也满天飞,但冷静下来,明显会感觉缺乏重大的进展。小进展倒也有一些,不过重要性相对于以上,则要么价值低得多,要么颇有槽点:
gCP:《大体系弱相互作用计算的解决之道》(http://sobereva.com/214)一文中介绍过,虽然挺有用,但普及速度远不及DFT-D3,主流量化程序仅ORCA支持
PM6带色散校正的一大票变体:虽然很有用,弥补了PM6算色散作用的重大缺陷,但本身没多少技术含量
PM7:比起PM6主要改进也就是算色散作用,但实际上加个D3就解决了,反倒是PM7用的校正形式被指出并不很合理
sTDA:算几百原子体系电子光谱的很有价值的方法,但被使用得仍很少(尽管Grimme网站上提供了公开的程序,而且能支持Gaussian)。不过不排除会火的可能性
DLPNO-CCSD(T):看似很美好,但速度与数值精度终究不可兼得,在我来看用最好的双杂化结合def2-QZVP开RI才是王道
明尼苏达系列泛函的后续发展:对于分子体系,在M06系列已经近乎达到了巅峰,后来再也没油水可榨,搞出的M11就是个破烂,之后不得不转战在拟合参数上还没利用过的周期性体系了,没几年就弄出一堆泛函:N12、MN12-L、N12-SX、MN12-SX、HLE16,同时也继续对分子体系拟合来拟合去,弄出来GAM、MN15、MN15-L。给我的感觉就是比较浮躁,这么搞下去也没什么前途
w调控:近年来红红火火,能把激发能、单三重态能量差、超极化率等算得不错,不过也不是万能(e.g. DOI: 10.1002/jcc.24716)
DSD-PBEP86:目前最好的双杂化泛函之一,挺有用,不过其历史意义远比不上当年B2PLYP提出时开创双杂化泛函这一概念。相关介绍见《Gaussian中非内置的理论方法和泛函的用法》(http://sobereva.com/344

近年来量化计算方法上缺乏重大进展,也反映在g16的新功能乏善可陈。虽然ORCA4.0已经放出了一些风声,但也没有什么令人眼前一亮的(除了Grimme的FOD方法值得把玩一下)。GAMESS-US、molpro等程序近几个大版本也同样没什么很有价值的新功能。

GPU在量化上的应用一直就是个鸡肋,近六年来也没什么很有意义的进展,Terachem早已经被吐槽过了《首个完全基于GPU的量化软件-TeraChem杂谈及真实性能测试》(http://sobereva.com/137)。根据已知信息,g16对GPU的支持简直就是摆设:只对大体系加速有用,还只支持一块卡将近顶一台双路服务器的Tesla K40、K80。

人民群众急需的TDDFT二阶解析导数可算在g16中有了,结果还只支持真空的,用着很憋屈。

虽然离2021还有4年,量化上还会有一些有价值的进展,不过明显不指望2011~2020期间能有2001~2010期间的昌盛景象了。

作者
Author:
sobereva    时间: 2017-2-13 04:14
欢迎各抒己见
作者
Author:
jiangning198511    时间: 2017-2-13 08:55
估计大家在等量子计算机的问世
作者
Author:
我本是个娃娃    时间: 2017-2-13 10:03
挖金子是容易的,找金子是困难的
作者
Author:
遗忘爱神    时间: 2017-2-13 10:35
是否跟计算机计算能力的瓶颈到来有关?
作者
Author:
ggdh    时间: 2017-2-13 13:09
那么有一个问题就是:
量化计算方法在哪方面的进展是目前最需要的?

作者
Author:
helpme    时间: 2017-2-13 14:19
可能是我不了解,感觉周期性体系的第一性原理进展更慢啊。
感觉杂化泛函都还不十分普及,因为速度慢。
对于CsPbI3之类的钙钛矿体系,就因为有个Pb,就成为难算的体系了。

作者
Author:
agent99    时间: 2017-2-13 14:27
不知道Perdew组最近做的SCAN泛函前景怎样?citation不少,去年的文章,现在已经78次
作者
Author:
sobereva    时间: 2017-2-13 15:32
helpme 发表于 2017-2-13 14:19
可能是我不了解,感觉周期性体系的第一性原理进展更慢啊。
感觉杂化泛函都还不十分普及,因为速度慢。
对 ...

同感
作者
Author:
sobereva    时间: 2017-2-13 15:40
ggdh 发表于 2017-2-13 13:09
那么有一个问题就是:
量化计算方法在哪方面的进展是目前最需要的?


个人见解:
1 搞一个精度接近DFT,但是速度接近半经验的方法,使得量化能处理的尺度扩展近一个数量级,AIMD也随之能容易地用于更多问题。DFTB还不行。
2 黑箱式、普适地、可靠地处理含较强静态相关的方法,而且对于M06-2X的强项体系精度又不亚于M06-2X,而且能轻易算几十个乃至百余个原子体系。虽然Hyper-GGA的目的是这个,但是貌似搞了一阵子也没多大成果。虽然MCSCF专门对付强静态相关,但是黑箱程度太差,体系一大也玩不转了。
3 计算量和TDDFT相仿佛,但是能同时算好各种体系激发能、超极化率的方法,不那么经验性地依赖于泛函的选择。w调控虽然有用,但毕竟还得先对各种体系拟合一下,略麻烦
4 轻易做几百原子的TDDFT计算。sTDA有希望
作者
Author:
sobereva    时间: 2017-2-13 15:44
遗忘爱神 发表于 2017-2-13 10:35
是否跟计算机计算能力的瓶颈到来有关?

不仅是计算机的瓶颈,理论发展也遇到了瓶颈。现在已经开始各种盲目化了,也体现在极端地去做各种参数化。
作者
Author:
卡开发发    时间: 2017-2-13 16:26
本帖最后由 卡开发发 于 2017-2-13 16:31 编辑
helpme 发表于 2017-2-13 14:19
可能是我不了解,感觉周期性体系的第一性原理进展更慢啊。
感觉杂化泛函都还不十分普及,因为速度慢。
对 ...

平面波和数值轨道计算的优化的工作其实做的不是很透彻,计算Hartree-Fock项这两种基组的效率很低,远远落后于GTO,算个能带就跟要老命一样。但实际使用GTO的程序如CP2K和Crystal也并非被广泛应用,肯定有一些特别的因素。另外,针对固体性质专门优化的杂化泛函能数得出了的也没有几个。
作者
Author:
plus    时间: 2017-2-13 21:00
方法都差不多了,现在就是向高精度/大体系发展
作者
Author:
ikea1984    时间: 2017-2-13 22:54
现在物理学界注意力放到了机器学习上,对于泛函也有一些文章讨论机器学习的工作。感觉应该能打破目前的僵局,但是能走多远也不清楚
作者
Author:
sobereva    时间: 2017-2-13 23:20
ikea1984 发表于 2017-2-13 22:54
现在物理学界注意力放到了机器学习上,对于泛函也有一些文章讨论机器学习的工作。感觉应该能打破目前的僵局 ...


归根结底还是参数化,如果理解为参数化是给理论方法增加血肉的话,那么理论方法的骨架(物理意义层面上)如果不理想,那很快就会遇到瓶颈。之前也有机器学习搞泛函参数的,这么来搞,物理意义只会越来越歪曲,越来越走偏。不引入参数是困难的,毕竟理论方法形式只是近似的,不拟合一些参数的话性价比太低,但是引入过多,就迷失在参数化之中了。
作者
Author:
jiangning198511    时间: 2017-2-14 08:40
卡开发发 发表于 2017-2-13 16:26
平面波和数值轨道计算的优化的工作其实做的不是很透彻,计算Hartree-Fock项这两种基组的效率很低,远远落 ...

CP2K的一个问题是这个软件对过渡金属体系的收敛做的不好,非常难收敛。许多免费软件在实际使用中都有很多问题
作者
Author:
plus    时间: 2017-2-14 09:14
ikea1984 发表于 2017-2-13 22:54
现在物理学界注意力放到了机器学习上,对于泛函也有一些文章讨论机器学习的工作。感觉应该能打破目前的僵局 ...

列几篇文献瞧瞧?
作者
Author:
yflchx    时间: 2017-2-14 09:56
本帖最后由 yflchx 于 2017-2-14 10:04 编辑
jiangning198511 发表于 2017-2-14 08:40
CP2K的一个问题是这个软件对过渡金属体系的收敛做的不好,非常难收敛。许多免费软件在实际使用中都有很多 ...

大部分免费软件的服务对象是开发该软件的一个组或几个组。

至于外人用的如何,开发者大概不会很上心。

最好熟悉很多的免费软件,不同的问题作不同的取舍。
作者
Author:
卡开发发    时间: 2017-2-14 12:25
jiangning198511 发表于 2017-2-14 08:40
CP2K的一个问题是这个软件对过渡金属体系的收敛做的不好,非常难收敛。许多免费软件在实际使用中都有很多 ...

不只是金属,某些开壳层系统也相当不好做,不知原因何在。开源程序不见得都很难用,比如QE就算好用一些的,不过最近被薛定谔收购了。
作者
Author:
wangxubo    时间: 2017-2-15 21:42
为啥感觉关注点都集中在dft和post-HF上了,别的部分的进展呢?
作者
Author:
coolrainbow    时间: 2017-2-15 23:05
1)分子体系难以有突破。或者说没有什么可突破了,因为原则上穷尽薛定谔方程的解的方法已经有了,FCI,就看你怎么参数化的巧妙了。CC方法,以及PNO之类的改进,似乎是最有效的。但是要获取“最后0.1%”的精度,比如所谓CCSDTQ-CCSDT这种,极高的计算量基本是无论如何也降不下来了。除非有突破性的理论进展,但是与其它相比,这个真的是需要智商和天才了。

2)最有希望“弯道超车”的就是DFT。遗憾的是,现在DFT多少都有些“无脑拟合”的意思,没有什么物理意义可言;可是物理老学究拟合的泛函精度又太低。实在不行,就大把参数的拟吧,能哄哄搞有机的。

3)分子在真实环境中的行为,如溶剂,高压,蛋白质,晶体内等等,现在也算能解决,但还是由于计算量的问题,体系的空间和时间尺度都不能太大,计算精度都不能太高,限制了其应用。像Science那篇苯晶体的,那个Boss在新闻上吹的很大,但那个体系的计算量太大太琐碎,不可能routine的推广。更重要的是,那个苯晶体的几何结构是从实验中抽取出来的,也不能完全算是第一性原理。

4)材料方面,固体的DFT在某些方面的精度不行,相关计算计算量大到几乎动不了。这一系列问题都亟待解决。
作者
Author:
球谐函数    时间: 2017-2-16 19:08
单电子近似受r12的岐性制约收敛太慢,单电子近似似乎山穷水尽了
作者
Author:
yflchx    时间: 2017-2-16 19:29
coolrainbow 发表于 2017-2-15 23:05
1)分子体系难以有突破。或者说没有什么可突破了,因为原则上穷尽薛定谔方程的解的方法已经有了,FCI,就看 ...

山重水复疑无路,柳暗花明又一村。
作者
Author:
wangxubo    时间: 2017-2-17 18:57
那传统电子结构理论(就是DFT,post-HF那些)以外的部分呢?感觉这几年dmrg,qmc啥的是不是也是有些发展的啊?
作者
Author:
sobereva    时间: 2017-2-17 20:18
wangxubo 发表于 2017-2-17 18:57
那传统电子结构理论(就是DFT,post-HF那些)以外的部分呢?感觉这几年dmrg,qmc啥的是不是也是有些发展的 ...


没觉得有多大发展,距离产生实用性还很遥远,所以文中都不提了。就连MRCI这样的传统方法,离普及都差得很远。
作者
Author:
Jasminer    时间: 2017-2-17 23:32
sobereva 发表于 2017-2-13 15:40
个人见解:
1 搞一个精度接近DFT,但是速度接近半经验的方法,使得量化能处理的尺度扩展近一个数量级 ...

第一个的话,FMO+DFTB+QM/MM也算过得去了,只不过黑箱化不够以及跑动力学不便还是个大问题。
作者
Author:
sobereva    时间: 2017-2-17 23:40
Jasminer 发表于 2017-2-17 23:32
第一个的话,FMO+DFTB+QM/MM也算过得去了,只不过黑箱化不够以及跑动力学不便还是个大问题。


这种拼凑的东西太awkward,也因此流行度很有限
最好是在DFT基础上借鉴半经验的思路来降低数值计算开销,但又不至于像现在的半经验或DFTB那样简化程度那么高导致精度损失太大
作者
Author:
qwoop    时间: 2017-2-23 19:28
helpme 发表于 2017-2-13 14:19
可能是我不了解,感觉周期性体系的第一性原理进展更慢啊。
感觉杂化泛函都还不十分普及,因为速度慢。
对 ...

就是,能把ZnO带隙算准就已经是高端方法了,大多时候是拿LDA+U往上面凑。。。
作者
Author:
niobium    时间: 2017-3-4 00:28
线性标度算法有些发展
作者
Author:
SigFig    时间: 2017-3-12 12:17
沉迷线性,无法自拔

Hamiltonian越加越多,Basis Set越堆越高,系数矩阵的角标乱到让开发者本人都绝望,本质却简单的令人发指——换底换底再换底(什么,不知道怎么换?SCF走起),评判也单调的有些惨白——符合符合更符合——21位有效数字的符合。很少有人思考这些参数背后的含义,亦或是我们现在所积累的数字还不足够。

DFT最大的功绩在于它从一定程度上把人们从那一堆坑爹的数学中拉了出来,但是不是推向另一个数学的深渊,不得而知。

人工智能的潜力在于,它可以以超越人类认知的方式更好的处理数学问题。

归根结底是人们的线性思维惰性在作祟。
作者
Author:
scf    时间: 2017-3-16 07:24
Martin Head-Gordon新弄出一个functional,看上去很厉害的样子
作者
Author:
ghifi37    时间: 2022-12-3 18:28
蓦然回首,现在已是2022年末了,有人总结了2010-2020的量化大进展吗?




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3