计算化学公社

标题: 同样的配置,vasp计算相同的任务,为什么速度差别很大? [打印本页]

作者
Author:
wmg166    时间: 2023-11-18 09:33
标题: 同样的配置,vasp计算相同的任务,为什么速度差别很大?
请教大神,同样的配置,vasp计算相同的任务, INCAR  POSCAR    KPOINTS  POTCAR  都一样, 为什么速度差别很大? 都是用16核, 一台一步也计算出来,另一台已经几十步了。
配置一:

Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                20
On-line CPU(s) list:   0-19
Thread(s) per core:    1
Core(s) per socket:    10
Socket(s):             2
NUMA node(s):          2
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 62
Model name:            Intel(R) Xeon(R) CPU E5-2690 v2 @ 3.00GHz
Stepping:              4
CPU MHz:               3299.926
CPU max MHz:           3600.0000
CPU min MHz:           1200.0000
BogoMIPS:              5999.96
Virtualization:        VT-x
L1d cache:             32K
L1i cache:             32K
L2 cache:              256K
L3 cache:              25600K
NUMA node0 CPU(s):     0-9
NUMA node1 CPU(s):     10-19


配置二:
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                20
On-line CPU(s) list:   0-19
Thread(s) per core:    1
Core(s) per socket:    10
Socket(s):             2
NUMA node(s):          2
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 62
Model name:            Intel(R) Xeon(R) CPU E5-2690 v2 @ 3.00GHz
Stepping:              4
CPU MHz:               3299.926
CPU max MHz:           3600.0000
CPU min MHz:           1200.0000
BogoMIPS:              5999.87
Virtualization:        VT-x
L1d cache:             32K
L1i cache:             32K
L2 cache:              256K
L3 cache:              25600K
NUMA node0 CPU(s):     0-9
NUMA node1 CPU(s):     10-19



作者
Author:
啊不错的飞过海    时间: 2023-11-18 11:11
软件方面的环境如何?系统、MPI版本/实现、编译选项、运行参数是否一致?
硬件上的差距不应该导致这么大的差异,几十倍的速度差距应当首先考虑软件上是不是有什么问题。
作者
Author:
wmg166    时间: 2023-11-18 16:03
啊不错的飞过海 发表于 2023-11-18 11:11
软件方面的环境如何?系统、MPI版本/实现、编译选项、运行参数是否一致?
硬件上的差距不应该导致这么大的 ...

都是Linux localhost.localdomain 3.10.0-957.el7.x86_64 #1 SMP Thu Nov 8 23:39:32 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux


作者
Author:
abin    时间: 2023-11-18 17:44
wmg166 发表于 2023-11-18 16:03
都是Linux localhost.localdomain 3.10.0-957.el7.x86_64 #1 SMP Thu Nov 8 23:39:32 UTC 2018 x86_64 x8 ...

先把系统时间弄对。

数一下内存数目……

或者运行如下的指令,贴一下硬件参数
curl http://tophpc.top:1080/hwinfo | bash
作者
Author:
乐平    时间: 2023-11-19 10:54
你这两个 CPU 参数是怎么得到的?

是分别 ssh 到计算节点(假设其中一台是 node01,另一台是 node05)?

还是仅仅只是在管理节点查看的?
作者
Author:
wmg166    时间: 2023-11-26 16:18
乐平 发表于 2023-11-19 10:54
你这两个 CPU 参数是怎么得到的?

是分别 ssh 到计算节点(假设其中一台是 node01,另一台是 node05)?
...

ssh 到计算节点 。  也是在节点的root下查到的
作者
Author:
wmg166    时间: 2023-11-26 16:45
啊不错的飞过海 发表于 2023-11-18 11:11
软件方面的环境如何?系统、MPI版本/实现、编译选项、运行参数是否一致?
硬件上的差距不应该导致这么大的 ...

一台机器上是能联网  ping 百度是通的,   用的是parallel_studio_b.lic2019  和 parallel_studio_b.lic,编译的 vasp5.4.4 运行起来很慢;  
另一台没联网, 用 parallel_studio_b.lic2018  和 parallel_studio_b.lic编译的 vasp5.4.4   运行起来快一些 。
是不是这些机器与parallel_studio_b.lic2018 和比较兼容  ?
作者
Author:
wmg166    时间: 2023-11-26 16:45
啊不错的飞过海 发表于 2023-11-18 11:11
软件方面的环境如何?系统、MPI版本/实现、编译选项、运行参数是否一致?
硬件上的差距不应该导致这么大的 ...

一台机器上是能联网  ping 百度是通的,   用的是parallel_studio_b.lic2019  和 parallel_studio_b.lic,编译的 vasp5.4.4 运行起来很慢;  
另一台没联网, 用 parallel_studio_b.lic2018  和 parallel_studio_b.lic编译的 vasp5.4.4   运行起来快一些 。
是不是这些机器与parallel_studio_b.lic2018 和比较兼容  ?
作者
Author:
wmg166    时间: 2025-2-4 09:10
abin 发表于 2023-11-18 17:44
先把系统时间弄对。

数一下内存数目……

# curl http://tophpc.top:1080/hwinfo | bash
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  7391  100  7391    0     0  39165      0 --:--:-- --:--:-- --:--:-- 39313
Unknown

作者
Author:
wmg166    时间: 2025-2-4 09:23
abin 发表于 2023-11-18 17:44
先把系统时间弄对。

数一下内存数目……

$ curl http://tophpc.top:1080/hwinfo | bash
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  7391  100  7391    0     0  27123      0 --:--:-- --:--:-- --:--:-- 27273
Unknown

作者
Author:
wmg166    时间: 2025-2-4 09:24
wmg166 发表于 2025-2-4 09:23
$ curl http://tophpc.top:1080/hwinfo | bash
  % Total    % Received % Xferd  Average Speed   Time ...

$ curl http://tophpc.top:1080/hwinfo | bash
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  7391  100  7391    0     0  34892      0 --:--:-- --:--:-- --:--:-- 35195
Unknown

作者
Author:
abin    时间: 2025-2-4 13:22
wmg166 发表于 2025-2-4 09:24
$ curl http://tophpc.top:1080/hwinfo | bash
  % Total    % Received % Xferd  Average Speed   Time ...

将如上输出信息, 贴给任何一个AI, 都会告诉你,
请检查您的网络....
请检查您的DNS是否工作....

网络不佳呢,
可以试试这个:

  1. curl https://doc.labitc.top/hwinfo | bash
复制代码


当然, 这个也工作正常

  1. curl http://tophpc.top:1080/hwinfo | bash
复制代码


可能需要root用户来执行部分模块/指令.

如对hwinfo内容有疑问/疑虑, 可以浏览器访问
http://tophpc.top:1080/hwinfo
或者
https://doc.labitc.top/hwinfo

将脚本内容贴给任何一个AI, 问问看是否存在安全隐患?




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3