计算化学公社

 找回密码 Forget password
 注册 Register

CP2K晶胞优化几步之后卡住

查看数: 1265 | 评论数: 12 | 收藏 Add to favorites 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2024-3-26 22:28

正文摘要:

最近编译了纯 GCC, openmpi, OpenBLAS 版的 cp2k-2024.1 编译命令如下: bash install_cp2k_toolchain.sh --with-gcc=install --with-openblas=install --with-openmpi=install --with-quip=install --with-plumed= ...

回复 Reply

Shana 发表于 Post on 2024-8-18 10:09:57
longyp 发表于 2024-7-4 15:45
我也遇到了同样的卡住问题,更换过ScaLapack也不行,目前降低了核数还在继续跑,但是速度变慢了,请问各位 ...

可以使用psmp版本试试,np小一点,还是开启OMP_NUM_THREADS,让np*OMP_NUM_THREADS等于总核数,可以让速度降的少一点。
longyp 发表于 Post on 2024-7-4 15:45:40
我也遇到了同样的卡住问题,更换过ScaLapack也不行,目前降低了核数还在继续跑,但是速度变慢了,请问各位老师,有没有其他不降低计算速度的解决方案?
目前还不会计算 发表于 Post on 2024-5-5 22:35:34
乐平 发表于 2024-5-5 11:21
CP2K version 2024.1
cp2k-20240.1/benchmarks/QS/H2O-512.inp

好滴,我到时候看下我多显卡跑多少分钟
乐平 发表于 Post on 2024-5-5 11:21:59
本帖最后由 乐平 于 2024-5-5 11:30 编辑
目前还不会计算 发表于 2024-5-4 21:26
乐平老师,96核心跑512 H2O用了多少秒啊

CP2K version 2024.1
cp2k-20240.1/benchmarks/QS/H2O-512.inp


PROGRAM STARTED AT   10:59:53.269
PROGRAM ENDED AT      11:15:31.205

总耗时差不多 15 分钟

除了第一步超过 15 秒,后续每步大约 6 ~ 7 秒
  1.   ----------------------------------- OT ---------------------------------------

  2.   Step     Update method      Time    Convergence         Total energy    Change
  3.   ------------------------------------------------------------------------------
  4.      1 OT DIIS     0.15E+00   18.9     0.00467324     -8480.4728425690 -8.48E+03
  5.      2 OT DIIS     0.15E+00    6.7     0.00318266     -8587.4488310143 -1.07E+02
  6.      3 OT DIIS     0.15E+00    6.7     0.00347210     -8644.7931966768 -5.73E+01
  7.      4 OT DIIS     0.15E+00    6.7     0.00204380     -8678.2157923836 -3.34E+01
  8.      5 OT DIIS     0.15E+00    6.7     0.00148292     -8717.4624183879 -3.92E+01
  9.      6 OT DIIS     0.15E+00    6.7     0.00119954     -8738.7795043572 -2.13E+01
  10.      7 OT DIIS     0.15E+00    6.7     0.00099038     -8755.0185947301 -1.62E+01
  11.      8 OT DIIS     0.15E+00    6.7     0.00079894     -8767.5347825454 -1.25E+01
  12.      9 OT DIIS     0.15E+00    6.7     0.00061581     -8780.1862563835 -1.27E+01
  13.     10 OT DIIS     0.15E+00    6.7     0.00048147     -8788.6147471043 -8.43E+00
  14.     11 OT DIIS     0.15E+00    6.7     0.00038278     -8794.1215228889 -5.51E+00
  15.     12 OT DIIS     0.15E+00    6.8     0.00031960     -8797.5363589594 -3.41E+00
  16.     13 OT DIIS     0.15E+00    6.7     0.00026435     -8799.9344030908 -2.40E+00
  17.     14 OT DIIS     0.15E+00    6.7     0.00023004     -8801.7089305035 -1.77E+00
  18.     15 OT DIIS     0.15E+00    6.8     0.00019592     -8803.0697888564 -1.36E+00
  19.     16 OT DIIS     0.15E+00    6.7     0.00016642     -8804.2000843411 -1.13E+00
  20.     17 OT DIIS     0.15E+00    6.7     0.00014164     -8805.0506655806 -8.51E-01
  21.     18 OT DIIS     0.15E+00    6.7     0.00012638     -8805.6725421207 -6.22E-01
  22.     19 OT DIIS     0.15E+00    6.7     0.00010717     -8806.2171485645 -5.45E-01
  23.     20 OT DIIS     0.15E+00    6.7     0.00009868     -8806.5290018963 -3.12E-01
  24.     21 OT DIIS     0.15E+00    6.7     0.00008484     -8806.8772741195 -3.48E-01
  25.     22 OT DIIS     0.15E+00    6.7     0.00007717     -8807.0943334427 -2.17E-01
  26.     23 OT DIIS     0.15E+00    6.7     0.00006815     -8807.2974129499 -2.03E-01
  27.     24 OT DIIS     0.15E+00    6.7     0.00006019     -8807.4529078233 -1.55E-01
  28.     25 OT DIIS     0.15E+00    6.7     0.00005010     -8807.5989834234 -1.46E-01
  29.     26 OT DIIS     0.15E+00    6.7     0.00004000     -8807.6989662228 -1.00E-01
  30.     27 OT DIIS     0.15E+00    6.8     0.00003462     -8807.7827122402 -8.37E-02
  31.     28 OT DIIS     0.15E+00    6.7     0.00003071     -8807.7824932500  2.19E-04
  32.     29 OT DIIS     0.15E+00    6.7     0.00002690     -8807.8200993195 -3.76E-02
  33.     30 OT DIIS     0.15E+00    6.7     0.00002500     -8807.8399634016 -1.99E-02
  34.     31 OT DIIS     0.15E+00    6.7     0.00002395     -8807.8566460922 -1.67E-02
  35.     32 OT DIIS     0.15E+00    6.7     0.00002328     -8807.8682689643 -1.16E-02
  36.     33 OT DIIS     0.15E+00    6.7     0.00002304     -8807.8827275965 -1.45E-02
  37.     34 OT DIIS     0.15E+00    6.7     0.00002300     -8807.8854890297 -2.76E-03
  38.     35 OT SD       0.15E+00    6.7     0.00002301     -8807.8907467596 -5.26E-03
  39.     36 OT SD       0.15E+00    6.7     0.00002308     -8807.8940817096 -3.33E-03
  40.     37 OT SD       0.15E+00    6.7     0.00002318     -8807.8974407043 -3.36E-03
  41.     38 OT SD       0.15E+00    6.7     0.00002329     -8807.9008284718 -3.39E-03
  42.     39 OT SD       0.15E+00    6.7     0.00002341     -8807.9042491083 -3.42E-03
  43.     40 OT SD       0.15E+00    6.7     0.00002354     -8807.9077063659 -3.46E-03
  44.     41 OT SD       0.15E+00    6.7     0.00002369     -8807.9112037365 -3.50E-03
  45.     42 OT SD       0.15E+00    6.7     0.00002384     -8807.9147444866 -3.54E-03
  46.     43 OT SD       0.15E+00    6.7     0.00002400     -8807.9183316715 -3.59E-03
  47.     44 OT SD       0.15E+00    6.7     0.00002417     -8807.9219681410 -3.64E-03
  48.     45 OT DIIS     0.15E+00    6.7     0.00002435     -8807.9256565391 -3.69E-03
  49.     46 OT DIIS     0.15E+00    6.7     0.00004965     -8807.9134610341  1.22E-02
  50.     47 OT SD       0.15E+00    6.7     0.00005093     -8807.9143214037 -8.60E-04
  51.     48 OT SD       0.15E+00    6.7     0.00004017     -8807.9286013755 -1.43E-02
  52.     49 OT SD       0.15E+00    6.7     0.00003560     -8807.9380904629 -9.49E-03
  53.     50 OT SD       0.15E+00    6.7     0.00003337     -8807.9457746385 -7.68E-03

  54.   Leaving inner SCF loop after reaching    50 steps.
复制代码




后续基本上在 10 步左右收敛。
  1.   ----------------------------------- OT ---------------------------------------

  2.   Step     Update method      Time    Convergence         Total energy    Change
  3.   ------------------------------------------------------------------------------
  4.      1 OT DIIS     0.15E+00   17.6     0.00010167     -8807.9546900379 -8.81E+03
  5.      2 OT DIIS     0.15E+00    5.5     0.00007400     -8808.0094398186 -5.47E-02
  6.      3 OT DIIS     0.15E+00    5.6     0.00005494     -8808.0648330447 -5.54E-02
  7.      4 OT DIIS     0.15E+00    5.6     0.00004934     -8808.1022554252 -3.74E-02
  8.      5 OT DIIS     0.15E+00    6.6     0.00004591     -8808.1451997755 -4.29E-02
  9.      6 OT DIIS     0.15E+00    6.8     0.00004348     -8808.1874223236 -4.22E-02
  10.      7 OT DIIS     0.15E+00    6.8     0.00003908     -8808.2478422150 -6.04E-02
  11.      8 OT DIIS     0.15E+00    6.8     0.00002826     -8808.3275851642 -7.97E-02
  12.      9 OT DIIS     0.15E+00    6.7     0.00002024     -8808.3587314345 -3.11E-02
  13.     10 OT DIIS     0.15E+00    6.7     0.00001286     -8808.3785532440 -1.98E-02
  14.     11 OT DIIS     0.15E+00    6.8     0.00001025     -8808.3792773291 -7.24E-04
  15.     12 OT DIIS     0.15E+00    6.7     0.00000704     -8808.3828085449 -3.53E-03

  16.   *** SCF run converged in    12 steps ***
复制代码



目前还不会计算 发表于 Post on 2024-5-4 21:26:01
乐平 发表于 2024-3-27 14:25
谢谢 Sob 老师。

测试过 BFGS,CG,依旧卡在第五步

乐平老师,96核心跑512 H2O用了多少秒啊
乐平 发表于 Post on 2024-4-16 20:36:34
周志博 发表于 2024-4-16 15:09
求:您的电脑到96核心应该用的不是虚拟机而是直接在电脑装ubuntu系统吧,这样的话安装cp2k的时候是按照什 ...

Ubuntu系统安装 CP2K 是最省心最容易的

看我之前的帖子 http://bbs.keinsci.com/thread-28171-1-1.html
周志博 发表于 Post on 2024-4-16 15:09:58
乐平 发表于 2024-3-27 14:19
非常感谢!
还真是核数的问题。从 96 核对半降低到 48 核,还是卡柱,24核还是卡柱,目前测试 16 核还能 ...

求:您的电脑到96核心应该用的不是虚拟机而是直接在电脑装ubuntu系统吧,这样的话安装cp2k的时候是按照什么教程来的,可以分享一下么?我在Ubuntu系统安装cp2k的时候遇见了很多问题,难以解决。感谢!
红茶泡枸杞 发表于 Post on 2024-4-10 14:59:56
借楼问一下,请问结构优化续算只要把初始的inp文件换成restart文件提交就可以了吗?我提交了之后发现好像没有续算,没有接着之前的out文件输出,算了几个小时后我给它终止了,提交inp文件从新开始算了。
乐平 发表于 Post on 2024-3-27 14:25:07

,


谢谢 Sob 老师。

测试过 BFGS,CG,依旧卡在第五步

测试过将 ELPA 换成 ScaLapack,依旧卡在第五步

测试降低 CPU 核心,从 96 核对半降低到 48 核以及 36 核心,还是卡在第 5 步;24核卡在第 35 步,目前测试 16 核还在继续跑(用 BFGS, ELPA 没问题)。

很奇怪啊,测试过 benchmark/QS/H2O-512.inp ,96核跑下来正常结束。难道是晶胞优化算法不支持太多 CPU 并行?
乐平 发表于 Post on 2024-3-27 14:19:00
ultramanm87 发表于 2024-3-26 23:23
以前遇到过小晶胞(几个原子)16核并行跑4-5步卡住,用4核才没问题,不知道你这个是不是相似的问题

非常感谢!
还真是核数的问题。从 96 核对半降低到 48 核,还是卡柱,24核还是卡柱,目前测试 16 核还能跑。
sobereva 发表于 Post on 2024-3-27 00:28:15
ultramanm87 发表于 Post on 2024-3-26 23:23:24
以前遇到过小晶胞(几个原子)16核并行跑4-5步卡住,用4核才没问题,不知道你这个是不是相似的问题

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 05:04 , Processed in 0.422222 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list