| core | MaxMem% | SCFStep | total time | total time(s) | total speed | SCF time | C/W rate total | C/W rate SCF |
4 | 12.90% | 15 | 17m3s | 1023 | 0.00097752 | 16m30s | 3.456 | 3.488 |
6 | 16.80% | 15 | 12m20s | 740 | 0.00135135 | 11m52s | 4.976 | 5.053 |
8 | 20.80% | 15 | 10m17s | 617 | 0.00162075 | 9m51s | 6.474 | 6.604 |
10 | 24.80% | 15 | 8m52s | 532 | 0.0018797 | 8m28s | 7.937 | 8.132 |
12 | 28.70% | 15 | 8m11s | 491 | 0.00203666 | 7m48s | 9.306 | 9.559 |
14 | 32.70% | 15 | 7m33s | 453 | 0.00220751 | 7m10s | 10.738 | 11.07 |
16 | 36.70% | 15 | 7m7s | 427 | 0.002342 | 6m44s | 12.374 | 12.793 |
18 | 39.60% | 15 | 6m58 | 418 | 0.002392 | 6m35s | 13.753 | 14.239 |
lyj714 发表于 2021-2-2 12:23
应该还可以测试下不同主频cpu下的差异,我认为高主频的cpu效率会高不少。xtb的并行策略应该是mkl thread + ...
wzkchem5 发表于 2021-2-2 12:30
对于稍微大一点的体系,半经验计算的决速步是Fock矩阵的对角化,而对角化不好并行化。为了进一步提升效率, ...
TaylorWu 发表于 2021-2-2 16:27
Grimme组的人在xTB手册里面提到了xTB的哈密顿量是用密度矩阵的算法。我之前也听说(纯听说嗷)有人说xTB ...
lizw@dicp.ac.cn 发表于 2021-3-14 22:49
请问怎么调CPU并行数?我在.bashrc里调OMP_NUM_THREADS,发现有时并不起作用,请问是什么问题呢?
但有时 ...
lizw@dicp.ac.cn 发表于 2021-3-14 22:49
请问怎么调CPU并行数?我在.bashrc里调OMP_NUM_THREADS,发现有时并不起作用,请问是什么问题呢?
但有时 ...
wzkchem5 发表于 2021-3-15 01:23
你是怎么查看的?top或者ps aux是吗?
xTB并行效率不是太高,可能指定4核的时候4核全都用上了,但是每个 ...
ms860309 发表于 2021-3-15 01:17
試試看command手動指定 -P 4 !?
lizw@dicp.ac.cn 发表于 2021-3-15 11:14
对于附件中的输入文件,1个cpu可以算,两个以上并行就出错,出错信息如下:
---------------------------- ...
lyj714 发表于 2021-3-15 13:05
把OMP_STACKSIZE设置大点,比如export OMP_STACKSIZE=4G
lizw@dicp.ac.cn 发表于 2021-3-15 13:17
谢谢!试了,也不行,很奇怪。请问附件中的输入文件在您机器上可以多核并行吗?
lyj714 发表于 2021-3-15 16:53
当然可以,我直接是在Windows跑的也没有任何问题,只要设置了OPM_STACKSIZE。单点gfn2非常快,设置的是4 ...
lyj714 发表于 2021-2-2 12:23
应该还可以测试下不同主频cpu下的差异,我认为高主频的cpu效率会高不少。xtb的并行策略应该是mkl thread + ...
lizw@dicp.ac.cn 发表于 2021-3-15 11:14
对于附件中的输入文件,1个cpu可以算,两个以上并行就出错,出错信息如下:
---------------------------- ...
| 欢迎光临 计算化学公社 (http://bbs.keinsci.com/) | Powered by Discuz! X3.3 |