计算化学公社

 找回密码 Forget password
 注册 Register
Views: 321|回复 Reply: 7
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 关于CPU运行效率以及核时的一些疑问

[复制链接 Copy URL]

7

帖子

0

威望

47

eV
积分
54

Level 2 能力者

各位老师好,我们组第一次租用超算平台,有一些疑惑,还请各位老师指教
我提交任务之一为例:采用的节点数:1;核数:16;计算的小团簇体系关于吸附的结构优化(61个原子)
(1)提交高斯任务结束时,对比了.out文件的job cpu time(11小时)以及超算平台运行时长(一天13小时多),为什么会相差这么多呢。两者有什么必然关系吗
(2)这个CPU运行效率为啥这么低(6%左右),这是不是严重浪费了核时。怎样设置才能合理利用呢。
(3)超算平台要怎么选择(这一天4个任务就快两百多,虽然不花我的钱,但是也有点心疼)
希望各位老师能够指教,非常感谢

平台运行时间.png (45.71 KB, 下载次数 Times of downloads: 2)

平台运行时间

平台运行时间

out文件时间.png (26.37 KB, 下载次数 Times of downloads: 2)

out文件显示时间

out文件显示时间

CPU效率.png (31.24 KB, 下载次数 Times of downloads: 1)

cpu效率

cpu效率

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2024-9-29 19:00:02 | 只看该作者 Only view this author
查一下,当前高斯输出中,第一次Link 1
对应的时间。

而后和输出文件中最后一个做差……

另,高斯跑56核心,不太合算吧?
不过你们的用法是节点独占模式……
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

7

帖子

0

威望

47

eV
积分
54

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2024-9-30 08:45:05 | 只看该作者 Only view this author
abin 发表于 2024-9-29 19:00
查一下,当前高斯输出中,第一次Link 1
对应的时间。

感谢您的回复,那个时间的问题确实和您说的那样需要这样看才对。另外您说的56核心是什么意思呢,我这应该设置的16核心/节点;内存56GB.应该没没错吧,。还有虚心请教一下这怎么看节点独占模式呢,还有其他模式吗

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2024-9-30 10:11:31 | 只看该作者 Only view this author
zyd 发表于 2024-9-30 08:45
感谢您的回复,那个时间的问题确实和您说的那样需要这样看才对。另外您说的56核心是什么意思呢,我这应该 ...

56,我看错了,
可能把16看成56了……

从输出文件找到的时间,和调度器报告的差不多吧?
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

145

帖子

0

威望

1404

eV
积分
1549

Level 5 (御坂)

5#
发表于 Post on 2024-10-2 17:19:46 | 只看该作者 Only view this author
1 你这是单纯的opt还是opt+freq?如果是后者,你看到的11小时是freq的时间,前面还有opt的时间你没算。
2 6.25%*16=100%
3 一个任务600核时,四个2500核时左右,按照目前市场1毛/核时的主流价格算比较正常的。租超算就是这样,看起来1毛很便宜,实际搞起来就是疯狂砸钱。

顺带一说,你只用了16核和56GB内存,我不相信这超算这么小,连个主流工作站水平都达不到。如果你后面的计算也沿用这个设置,那还不如直接买个服务器工作站。

8

帖子

0

威望

67

eV
积分
75

Level 2 能力者

6#
发表于 Post on 2024-10-10 07:37:38 | 只看该作者 Only view this author
感觉你输出文件里的时间也不对啊。Elapsed time就是wall-clock time,而CPU time类似于是核时的概念。你这里用了16个物理核心,这两个数值的比应该就差不多是十六啊。

7

帖子

0

威望

47

eV
积分
54

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2024-10-10 14:41:38 | 只看该作者 Only view this author
rugals 发表于 2024-10-2 17:19
1 你这是单纯的opt还是opt+freq?如果是后者,你看到的11小时是freq的时间,前面还有opt的时间你没算。
2  ...

非常感谢您的解惑。您的回答对我很有帮助。我那个核数就是测试一下呀

5

帖子

0

威望

226

eV
积分
231

Level 3 能力者

8#
发表于 Post on 2024-10-30 12:28:23 | 只看该作者 Only view this author
两部计算, 只看了一个时间吧.

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:32 , Processed in 0.200545 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list