计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1258|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] CP2K晶胞优化几步之后卡住

[复制链接 Copy URL]

1060

帖子

0

威望

3256

eV
积分
4316

Level 6 (一方通行)

最近编译了纯 GCC, openmpi, OpenBLAS 版的 cp2k-2024.1
编译命令如下:
  1. bash install_cp2k_toolchain.sh --with-gcc=install --with-openblas=install --with-openmpi=install --with-quip=install --with-plumed=install
复制代码




编译过程很顺利,也用测试过 regular-test,4172 个测试全通过,如下。



然后用 Multiwfn 3.8-dev (2024年3月7号发行版)生成了输入文件,提交晶胞优化任务。前 4 步很顺利,但是到第 5 步就卡住不动,如下所示:

  1. ENERGY| Total FORCE_EVAL ( QS ) energy [a.u.]:             -699.610894219900842

  2. STRESS| Analytical stress tensor [GPa]                                                                                                                                    
  3. STRESS|                        x                   y                   z
  4. STRESS|      x       -7.65561582709E-01   1.99858714179E-02   1.50522450367E-01
  5. STRESS|      y        1.99858714179E-02  -7.46967194795E-01   2.44339310443E-02
  6. STRESS|      z        1.50522450367E-01   2.44339310443E-02  -2.64670009464E-02
  7. STRESS| 1/3 Trace                                            -5.12998592817E-01
  8. STRESS| Determinant                                           2.40353886432E-03

  9. STRESS| Eigenvectors and eigenvalues of the analytical stress tensor [GPa]
  10. STRESS|                        1                   2                   3
  11. STRESS| Eigenvalues  -7.99367119211E-01  -7.43671843463E-01   4.04318422307E-03
  12. STRESS|      x           0.944331120223      0.266625870060      0.192741746369
  13. STRESS|      y          -0.278527377207      0.959714119094      0.037031199792
  14. STRESS|      z          -0.175103499465     -0.088653567477      0.980550513461

  15. --------  Informations at step =     4 ------------
  16.   Optimization Method        =                 BFGS
  17.   Total Energy               =      -699.6108942199
  18.   Internal Pressure [bar]    =     -5129.9859281679
  19.   Real energy change         =        -0.0085218982
  20.   Predicted change in energy =        -0.0053202236
  21.   Scaling factor             =         0.4741653438
  22.   Step size                  =         0.0178626558
  23.   Trust radius               =         0.3779452266
  24.   Decrease in energy         =                  YES
  25.   Used time                  =               16.793

  26.   Convergence check :
  27.   Max. step size             =         0.0178626558
  28.   Conv. limit for step size  =         0.0030000000
  29.   Convergence in step size   =                   NO
  30.   RMS step size              =         0.0058162932
  31.   Conv. limit for RMS step   =         0.0015000000
  32.   Convergence in RMS step    =                   NO
  33.   Max. gradient              =         0.0284511874
  34.   Conv. limit for gradients  =         0.0004500000
  35.   Conv. for gradients        =                   NO
  36.   RMS gradient               =         0.0029046871
  37.   Conv. limit for RMS grad.  =         0.0003000000
  38.   Conv. for gradients        =                   NO
  39.   Pressure Deviation [bar]   =     -5130.9991781679
  40.   Pressure Tolerance [bar]   =       100.0000000000
  41.   Conv. for  PRESSURE        =                   NO
  42. ---------------------------------------------------
  43. Estimated peak process memory after this step [MiB]                         236

  44. --------------------------
  45. OPTIMIZATION STEP:      5
  46. --------------------------                                                                                                                                                
复制代码



不太清楚是什么原因。

我将输入文件上传到论坛,请各位高手帮忙查看一下。十分感谢!


PEA2PbI4.inp

15.93 KB, 下载次数 Times of downloads: 6

CP2K输入文件

40

帖子

1

威望

732

eV
积分
792

Level 4 (黑子)

2#
发表于 Post on 2024-3-26 23:23:24 | 只看该作者 Only view this author
以前遇到过小晶胞(几个原子)16核并行跑4-5步卡住,用4核才没问题,不知道你这个是不是相似的问题

5万

帖子

99

威望

5万

eV
积分
112354

管理员

公社社长

3#
发表于 Post on 2024-3-27 00:28:15 | 只看该作者 Only view this author
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

1060

帖子

0

威望

3256

eV
积分
4316

Level 6 (一方通行)

4#
 楼主 Author| 发表于 Post on 2024-3-27 14:19:00 | 只看该作者 Only view this author
ultramanm87 发表于 2024-3-26 23:23
以前遇到过小晶胞(几个原子)16核并行跑4-5步卡住,用4核才没问题,不知道你这个是不是相似的问题

非常感谢!
还真是核数的问题。从 96 核对半降低到 48 核,还是卡柱,24核还是卡柱,目前测试 16 核还能跑。

1060

帖子

0

威望

3256

eV
积分
4316

Level 6 (一方通行)

5#
 楼主 Author| 发表于 Post on 2024-3-27 14:25:07 | 只看该作者 Only view this author

,


谢谢 Sob 老师。

测试过 BFGS,CG,依旧卡在第五步

测试过将 ELPA 换成 ScaLapack,依旧卡在第五步

测试降低 CPU 核心,从 96 核对半降低到 48 核以及 36 核心,还是卡在第 5 步;24核卡在第 35 步,目前测试 16 核还在继续跑(用 BFGS, ELPA 没问题)。

很奇怪啊,测试过 benchmark/QS/H2O-512.inp ,96核跑下来正常结束。难道是晶胞优化算法不支持太多 CPU 并行?

85

帖子

0

威望

433

eV
积分
518

Level 4 (黑子)

6#
发表于 Post on 2024-4-10 14:59:56 | 只看该作者 Only view this author
借楼问一下,请问结构优化续算只要把初始的inp文件换成restart文件提交就可以了吗?我提交了之后发现好像没有续算,没有接着之前的out文件输出,算了几个小时后我给它终止了,提交inp文件从新开始算了。

13

帖子

0

威望

56

eV
积分
69

Level 2 能力者

7#
发表于 Post on 2024-4-16 15:09:58 | 只看该作者 Only view this author
乐平 发表于 2024-3-27 14:19
非常感谢!
还真是核数的问题。从 96 核对半降低到 48 核,还是卡柱,24核还是卡柱,目前测试 16 核还能 ...

求:您的电脑到96核心应该用的不是虚拟机而是直接在电脑装ubuntu系统吧,这样的话安装cp2k的时候是按照什么教程来的,可以分享一下么?我在Ubuntu系统安装cp2k的时候遇见了很多问题,难以解决。感谢!

1060

帖子

0

威望

3256

eV
积分
4316

Level 6 (一方通行)

8#
 楼主 Author| 发表于 Post on 2024-4-16 20:36:34 | 只看该作者 Only view this author
周志博 发表于 2024-4-16 15:09
求:您的电脑到96核心应该用的不是虚拟机而是直接在电脑装ubuntu系统吧,这样的话安装cp2k的时候是按照什 ...

Ubuntu系统安装 CP2K 是最省心最容易的

看我之前的帖子 http://bbs.keinsci.com/thread-28171-1-1.html

31

帖子

0

威望

373

eV
积分
404

Level 3 能力者

9#
发表于 Post on 2024-5-4 21:26:01 | 只看该作者 Only view this author
乐平 发表于 2024-3-27 14:25
谢谢 Sob 老师。

测试过 BFGS,CG,依旧卡在第五步

乐平老师,96核心跑512 H2O用了多少秒啊

1060

帖子

0

威望

3256

eV
积分
4316

Level 6 (一方通行)

10#
 楼主 Author| 发表于 Post on 2024-5-5 11:21:59 | 只看该作者 Only view this author
本帖最后由 乐平 于 2024-5-5 11:30 编辑
目前还不会计算 发表于 2024-5-4 21:26
乐平老师,96核心跑512 H2O用了多少秒啊

CP2K version 2024.1
cp2k-20240.1/benchmarks/QS/H2O-512.inp


PROGRAM STARTED AT   10:59:53.269
PROGRAM ENDED AT      11:15:31.205

总耗时差不多 15 分钟

除了第一步超过 15 秒,后续每步大约 6 ~ 7 秒
  1.   ----------------------------------- OT ---------------------------------------

  2.   Step     Update method      Time    Convergence         Total energy    Change
  3.   ------------------------------------------------------------------------------
  4.      1 OT DIIS     0.15E+00   18.9     0.00467324     -8480.4728425690 -8.48E+03
  5.      2 OT DIIS     0.15E+00    6.7     0.00318266     -8587.4488310143 -1.07E+02
  6.      3 OT DIIS     0.15E+00    6.7     0.00347210     -8644.7931966768 -5.73E+01
  7.      4 OT DIIS     0.15E+00    6.7     0.00204380     -8678.2157923836 -3.34E+01
  8.      5 OT DIIS     0.15E+00    6.7     0.00148292     -8717.4624183879 -3.92E+01
  9.      6 OT DIIS     0.15E+00    6.7     0.00119954     -8738.7795043572 -2.13E+01
  10.      7 OT DIIS     0.15E+00    6.7     0.00099038     -8755.0185947301 -1.62E+01
  11.      8 OT DIIS     0.15E+00    6.7     0.00079894     -8767.5347825454 -1.25E+01
  12.      9 OT DIIS     0.15E+00    6.7     0.00061581     -8780.1862563835 -1.27E+01
  13.     10 OT DIIS     0.15E+00    6.7     0.00048147     -8788.6147471043 -8.43E+00
  14.     11 OT DIIS     0.15E+00    6.7     0.00038278     -8794.1215228889 -5.51E+00
  15.     12 OT DIIS     0.15E+00    6.8     0.00031960     -8797.5363589594 -3.41E+00
  16.     13 OT DIIS     0.15E+00    6.7     0.00026435     -8799.9344030908 -2.40E+00
  17.     14 OT DIIS     0.15E+00    6.7     0.00023004     -8801.7089305035 -1.77E+00
  18.     15 OT DIIS     0.15E+00    6.8     0.00019592     -8803.0697888564 -1.36E+00
  19.     16 OT DIIS     0.15E+00    6.7     0.00016642     -8804.2000843411 -1.13E+00
  20.     17 OT DIIS     0.15E+00    6.7     0.00014164     -8805.0506655806 -8.51E-01
  21.     18 OT DIIS     0.15E+00    6.7     0.00012638     -8805.6725421207 -6.22E-01
  22.     19 OT DIIS     0.15E+00    6.7     0.00010717     -8806.2171485645 -5.45E-01
  23.     20 OT DIIS     0.15E+00    6.7     0.00009868     -8806.5290018963 -3.12E-01
  24.     21 OT DIIS     0.15E+00    6.7     0.00008484     -8806.8772741195 -3.48E-01
  25.     22 OT DIIS     0.15E+00    6.7     0.00007717     -8807.0943334427 -2.17E-01
  26.     23 OT DIIS     0.15E+00    6.7     0.00006815     -8807.2974129499 -2.03E-01
  27.     24 OT DIIS     0.15E+00    6.7     0.00006019     -8807.4529078233 -1.55E-01
  28.     25 OT DIIS     0.15E+00    6.7     0.00005010     -8807.5989834234 -1.46E-01
  29.     26 OT DIIS     0.15E+00    6.7     0.00004000     -8807.6989662228 -1.00E-01
  30.     27 OT DIIS     0.15E+00    6.8     0.00003462     -8807.7827122402 -8.37E-02
  31.     28 OT DIIS     0.15E+00    6.7     0.00003071     -8807.7824932500  2.19E-04
  32.     29 OT DIIS     0.15E+00    6.7     0.00002690     -8807.8200993195 -3.76E-02
  33.     30 OT DIIS     0.15E+00    6.7     0.00002500     -8807.8399634016 -1.99E-02
  34.     31 OT DIIS     0.15E+00    6.7     0.00002395     -8807.8566460922 -1.67E-02
  35.     32 OT DIIS     0.15E+00    6.7     0.00002328     -8807.8682689643 -1.16E-02
  36.     33 OT DIIS     0.15E+00    6.7     0.00002304     -8807.8827275965 -1.45E-02
  37.     34 OT DIIS     0.15E+00    6.7     0.00002300     -8807.8854890297 -2.76E-03
  38.     35 OT SD       0.15E+00    6.7     0.00002301     -8807.8907467596 -5.26E-03
  39.     36 OT SD       0.15E+00    6.7     0.00002308     -8807.8940817096 -3.33E-03
  40.     37 OT SD       0.15E+00    6.7     0.00002318     -8807.8974407043 -3.36E-03
  41.     38 OT SD       0.15E+00    6.7     0.00002329     -8807.9008284718 -3.39E-03
  42.     39 OT SD       0.15E+00    6.7     0.00002341     -8807.9042491083 -3.42E-03
  43.     40 OT SD       0.15E+00    6.7     0.00002354     -8807.9077063659 -3.46E-03
  44.     41 OT SD       0.15E+00    6.7     0.00002369     -8807.9112037365 -3.50E-03
  45.     42 OT SD       0.15E+00    6.7     0.00002384     -8807.9147444866 -3.54E-03
  46.     43 OT SD       0.15E+00    6.7     0.00002400     -8807.9183316715 -3.59E-03
  47.     44 OT SD       0.15E+00    6.7     0.00002417     -8807.9219681410 -3.64E-03
  48.     45 OT DIIS     0.15E+00    6.7     0.00002435     -8807.9256565391 -3.69E-03
  49.     46 OT DIIS     0.15E+00    6.7     0.00004965     -8807.9134610341  1.22E-02
  50.     47 OT SD       0.15E+00    6.7     0.00005093     -8807.9143214037 -8.60E-04
  51.     48 OT SD       0.15E+00    6.7     0.00004017     -8807.9286013755 -1.43E-02
  52.     49 OT SD       0.15E+00    6.7     0.00003560     -8807.9380904629 -9.49E-03
  53.     50 OT SD       0.15E+00    6.7     0.00003337     -8807.9457746385 -7.68E-03

  54.   Leaving inner SCF loop after reaching    50 steps.
复制代码




后续基本上在 10 步左右收敛。
  1.   ----------------------------------- OT ---------------------------------------

  2.   Step     Update method      Time    Convergence         Total energy    Change
  3.   ------------------------------------------------------------------------------
  4.      1 OT DIIS     0.15E+00   17.6     0.00010167     -8807.9546900379 -8.81E+03
  5.      2 OT DIIS     0.15E+00    5.5     0.00007400     -8808.0094398186 -5.47E-02
  6.      3 OT DIIS     0.15E+00    5.6     0.00005494     -8808.0648330447 -5.54E-02
  7.      4 OT DIIS     0.15E+00    5.6     0.00004934     -8808.1022554252 -3.74E-02
  8.      5 OT DIIS     0.15E+00    6.6     0.00004591     -8808.1451997755 -4.29E-02
  9.      6 OT DIIS     0.15E+00    6.8     0.00004348     -8808.1874223236 -4.22E-02
  10.      7 OT DIIS     0.15E+00    6.8     0.00003908     -8808.2478422150 -6.04E-02
  11.      8 OT DIIS     0.15E+00    6.8     0.00002826     -8808.3275851642 -7.97E-02
  12.      9 OT DIIS     0.15E+00    6.7     0.00002024     -8808.3587314345 -3.11E-02
  13.     10 OT DIIS     0.15E+00    6.7     0.00001286     -8808.3785532440 -1.98E-02
  14.     11 OT DIIS     0.15E+00    6.8     0.00001025     -8808.3792773291 -7.24E-04
  15.     12 OT DIIS     0.15E+00    6.7     0.00000704     -8808.3828085449 -3.53E-03

  16.   *** SCF run converged in    12 steps ***
复制代码



31

帖子

0

威望

373

eV
积分
404

Level 3 能力者

11#
发表于 Post on 2024-5-5 22:35:34 | 只看该作者 Only view this author
乐平 发表于 2024-5-5 11:21
CP2K version 2024.1
cp2k-20240.1/benchmarks/QS/H2O-512.inp

好滴,我到时候看下我多显卡跑多少分钟

14

帖子

0

威望

284

eV
积分
298

Level 3 能力者

12#
发表于 Post on 2024-7-4 15:45:40 | 只看该作者 Only view this author
我也遇到了同样的卡住问题,更换过ScaLapack也不行,目前降低了核数还在继续跑,但是速度变慢了,请问各位老师,有没有其他不降低计算速度的解决方案?

170

帖子

0

威望

835

eV
积分
1005

Level 4 (黑子)

13#
发表于 Post on 2024-8-18 10:09:57 | 只看该作者 Only view this author
longyp 发表于 2024-7-4 15:45
我也遇到了同样的卡住问题,更换过ScaLapack也不行,目前降低了核数还在继续跑,但是速度变慢了,请问各位 ...

可以使用psmp版本试试,np小一点,还是开启OMP_NUM_THREADS,让np*OMP_NUM_THREADS等于总核数,可以让速度降的少一点。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 01:55 , Processed in 0.188115 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list