计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1136|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] 服务器IO一高就连不上SSH,大家有什么技巧吗

[复制链接 Copy URL]

29

帖子

0

威望

284

eV
积分
313

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
最近做CCSD(T)任务做得多,服务器的机械硬盘经常是占满的状态,看top进程全都是IO阻塞。每当这个时候,服务器的ssh就很难连上,不是超时就是进去之后打不开bash。不知道大家对这个问题有没有什么独门技巧呢?

29

帖子

0

威望

284

eV
积分
313

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2022-11-6 10:58:39 | 只看该作者 Only view this author
@abin @万里云 感谢解答!

403

帖子

4

威望

2874

eV
积分
3357

Level 5 (御坂)

3#
发表于 Post on 2022-11-6 10:25:42 | 只看该作者 Only view this author
貌似服务器端在建立SSH链接时,需要往/tmp下面写socket文件。这个现象是有一次硬盘满了,从报错信息里得知的。

如果有别的程序也在往tmp读写文件的话,就会等很久。等时间长了就停止响应了。我们有台服务器,只要在初始化脚本里设置oneAPI,scp传文件铁定失败。

评分 Rate

参与人数
Participants 1
eV +2 收起 理由
Reason
一个用户名 + 2

查看全部评分 View all ratings

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2022-11-5 23:14:51 | 只看该作者 Only view this author
本帖最后由 abin 于 2022-11-6 11:32 编辑

"全是I/O阻塞“,
那么其实应该看看, 是不是内存不足的问题.
内存不足, 会导致SWAP使用过高, 当然整体的I/O会变慢.
可以考虑添加内存, 或者, 如果内存够用, 考虑提升整体I/O规格, 比如使用固态硬盘做I/O缓存.

或者使用work load manager控制机器负载.
比如使用openPBS, slurm都可以达到目的.

另外, 如果是单纯的SSH登录慢,
UseDNS yes --> UseDNS no 会有一定的效果.

不过你提到的是负载高了后, 机器才反应迟钝的, 那么还是机器整体I/O规格的问题.

评分 Rate

参与人数
Participants 1
eV +3 收起 理由
Reason
一个用户名 + 3

查看全部评分 View all ratings

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 17:19 , Processed in 0.263239 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list