计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1307|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] linux登陆不了或登陆后输命令没反应

[复制链接 Copy URL]

17

帖子

0

威望

463

eV
积分
480

Level 3 能力者

    不知道怎么回事这段时间总是前一天提交任务,第二天过来登陆不进去,或者登陆进去输命令卡住不动,最后只能重启。但重启后又正常了。有谁遇到过这种情况吗?[url=]图片 Image[/url]

360截图20221010094031501.jpg (134.79 KB, 下载次数 Times of downloads: 38)

360截图20221010094031501.jpg

6万

帖子

99

威望

5万

eV
积分
120100

管理员

公社社长

2#
发表于 Post on 2022-10-10 14:23:30 | 只看该作者 Only view this author
top看看当前任务运行状态,并且注意是跑着任务的时候登录进去时有这种问题,还是没任务在跑的时候也有这种问题。前者的话有可能是资源都被任务占了导致响应过慢
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

17

帖子

0

威望

463

eV
积分
480

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2022-10-10 15:55:17 | 只看该作者 Only view this author
sobereva 发表于 2022-10-10 14:23
top看看当前任务运行状态,并且注意是跑着任务的时候登录进去时有这种问题,还是没任务在跑的时候也有这种 ...

Top的时候看到任务还在,但是cd命令都用不了,文件夹也只能打开一部分。我挂了几个网站也网页打不开,不知道是不是PBS的问题。可能是任务占用,但我52核只用了5个8核任务,%CPU都是1600,正常时候也是这个值

2407

帖子

1

威望

5950

eV
积分
8377

Level 6 (一方通行)

4#
发表于 Post on 2022-10-10 20:48:49 | 只看该作者 Only view this author
drizzt 发表于 2022-10-10 15:55
Top的时候看到任务还在,但是cd命令都用不了,文件夹也只能打开一部分。我挂了几个网站也网页打不开,不 ...

看你的描述,应该是你的pbs 配置错误,
或者使用错误,
导致机器过载。

过载之后,当然效率奇差,相应贼慢。

简单说,top,看右上角的数。
如果52核心,负载数据在110属于正常,
或者56左右,如果没有开超线程的话。

超过此数据,就是明显过载。

如果五个任务,每一个都是1600%,
也就是开了5个16核心计算,
那么机器负载可能是80~90,是过载状态。

你的机器,可能是52个物理核心?

也许你是超线程受害者?

我坚信,是调度器使用错误或者配置错误。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

17

帖子

0

威望

463

eV
积分
480

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2022-10-11 08:40:08 | 只看该作者 Only view this author
abin 发表于 2022-10-10 20:48
看你的描述,应该是你的pbs 配置错误,
或者使用错误,
导致机器过载。

有点懂了. 我gjf配置里写的16核,通过pbs配置#PBS -l nodes=1:ppn=8 来设置,我一直以为通过ppn=8或16 pbs会自动选择核数。这样说来就是gjf配置优先吧,那ppn配置有啥用呢?

17

帖子

0

威望

463

eV
积分
480

Level 3 能力者

6#
 楼主 Author| 发表于 Post on 2022-10-11 08:50:48 | 只看该作者 Only view this author
就是qstat -a 里面TSK是8,我以为就是8核工作,看top的意思还是16核的

2407

帖子

1

威望

5950

eV
积分
8377

Level 6 (一方通行)

7#
发表于 Post on 2022-10-11 10:25:09 | 只看该作者 Only view this author
如果你正确使用调度器,
那么申请了八个核心,
是不可能超过申请额度的。

搞不定pbs的话,
换用slurm 吧……
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

17

帖子

0

威望

463

eV
积分
480

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2022-10-11 11:15:13 | 只看该作者 Only view this author
abin 发表于 2022-10-11 10:25
如果你正确使用调度器,
那么申请了八个核心,
是不可能超过申请额度的。

嗯,谢谢,知道原因就好了,换slurm麻烦,我直接改gjf文件了

2407

帖子

1

威望

5950

eV
积分
8377

Level 6 (一方通行)

9#
发表于 Post on 2022-10-11 11:32:13 | 只看该作者 Only view this author
本帖最后由 abin 于 2022-10-11 11:37 编辑
drizzt 发表于 2022-10-11 11:15
嗯,谢谢,知道原因就好了,换slurm麻烦,我直接改gjf文件了

如有开启超线程, 那么关闭.

比如我,
在机器上定义了高斯的脚本,
判定机器名和处理器, 直接改掉作业中的核心和内存设定.

以免被某些莫名其妙的操作, 祸害了其他的计算任务.

仅供参考.


补充一下,
我见过一个机器,
64个核心,
学生说, 机器卡爆了, 然后找我解决.
我看了下, load average, 1700多.....

机器没死, 真厉害呀.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-13 20:57 , Processed in 0.193222 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list