计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4946|回复 Reply: 20
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] 工作站上运行gaussian,Centos7.9卡死

[复制链接 Copy URL]

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
请问各位坛友,我配的工作站(2*CPU: Gold 6147F;内存12*16G)连续运行Gaussian16 A.01约十几个小时后,用的核心数是12,内存为12GB,大概率就会卡机动不了,只能重启,可能是什么原因导致的呢?谢谢大家。
其他情况说明:
(1)用的系统是Centos7.9; (2) CPU是正显版(说是经过测试,就差上市发行);(3)内存条本来是可以插12条,但有一根坏了,目前只插了11条;但是利用free -g命令查看,也只有109G的内存(也不知道什么原因)

15

帖子

0

威望

17

eV
积分
32

Level 2 能力者

2#
发表于 Post on 2022-4-16 15:12:37 | 只看该作者 Only view this author
计算机卡死?

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2022-4-16 15:16:47 | 只看该作者 Only view this author

是的,工作站卡死,在图形界面上点击鼠标没有反应

339

帖子

0

威望

4999

eV
积分
5338

Level 6 (一方通行)

4#
发表于 Post on 2022-4-16 15:57:35 | 只看该作者 Only view this author
A: 坏了不止一根内存(大概率),也有可能主板内存插槽坏了(小概率)
B: 有内存条没有插好。拔出来所有内存条,用橡皮擦一下内存的金手指,再重新一条一条插进去,在此过程中可以用排除法找到可能坏的内存

检查方法:拔出所有内存条,用橡皮擦擦好所有内存条的金手指,随机选取一个内存A,插入内存槽1,重启机器测试,如果通过,拔出内存A,插入内存槽2,依次插拔12次,找到可能坏的插槽;然后用好的内存槽测试剩下的内存条,找出可能坏的内存条...

如果你有科学精神,也可以设计一个正交随机试验,这样可以少插拔几次内存条
               

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

5#
发表于 Post on 2022-4-16 17:08:59 | 只看该作者 Only view this author
联系卖家,上门修,或者退货退款,赔偿损失。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

6#
发表于 Post on 2022-4-16 17:31:45 | 只看该作者 Only view this author
手机网络又卡了,重复了一条。重复的删除就好。

之前遇到一台机器,
使用某一主板,用一段时间,
网卡全消失,机器就像果冻一样,
显示器鼠标都不动……其实已经死好久了……

电源按一下,立即灭火……

后来确认是主板问题。仅供参考。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

15

帖子

0

威望

17

eV
积分
32

Level 2 能力者

7#
发表于 Post on 2022-4-16 18:54:24 | 只看该作者 Only view this author
跑一个任务看看,有可能是程序的问题,或者换一个09试试,我以前也遇到过。

15

帖子

0

威望

17

eV
积分
32

Level 2 能力者

8#
发表于 Post on 2022-4-16 18:55:18 | 只看该作者 Only view this author
Michem_ai 发表于 2022-4-16 18:54
跑一个任务看看,有可能是程序的问题,或者换一个09试试,我以前也遇到过。

也有可能是权限设置的问题

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

9#
 楼主 Author| 发表于 Post on 2022-4-16 20:22:37 | 只看该作者 Only view this author
chrinide 发表于 2022-4-16 15:57
A: 坏了不止一根内存(大概率),也有可能主板内存插槽坏了(小概率)
B: 有内存条没有插好。拔出来所有内 ...

谢谢回复,尝试过用橡皮擦金手指。
用dmidecode -t memory命令看下内存条信息,能读出来11根内存的信息,这样的理论应该有132G内存,就坏的那根无论插在哪个内存槽都读不出,。但用free -g命令显示的Total(mem)有109G,Total(Swap)有3G
我用的主板是超微X11DPi-N,这块板子有四个黑色的槽和12个蓝色槽,内存条都插蓝色槽里边了,这么做应该没问题吧?顺带请教下,哪个黑色槽是干什么用的?

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

10#
 楼主 Author| 发表于 Post on 2022-4-16 20:24:58 | 只看该作者 Only view this author
abin 发表于 2022-4-16 17:31
手机网络又卡了,重复了一条。重复的删除就好。

之前遇到一台机器,

谢谢回复。我这情况和您描述的好像啊。我用的主板是超微X11DPi-N;追问下,您是怎么确定最后是主板问题的呢?

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

11#
 楼主 Author| 发表于 Post on 2022-4-16 20:26:39 | 只看该作者 Only view this author
Michem_ai 发表于 2022-4-16 18:54
跑一个任务看看,有可能是程序的问题,或者换一个09试试,我以前也遇到过。

倒没考虑过是程序的问题,我安装个g09试试看,谢谢建议!

2302

帖子

1

威望

5481

eV
积分
7803

Level 6 (一方通行)

12#
发表于 Post on 2022-4-16 20:30:11 | 只看该作者 Only view this author
小强 发表于 2022-4-16 20:24
谢谢回复。我这情况和您描述的好像啊。我用的主板是超微X11DPi-N;追问下,您是怎么确定最后是主板问题的 ...

我那次,
是华擎某批次主板+8173M处理器.
同一批次三个主板 都一个毛病, 当然是主板问题了.

最后, 上海的工程师说, 他们换另一个批次试试, 然后就好了.

我是偶然协助某硬件商, 调试集群的时候, 偶然遇到的故障.
不代表所有的类似故障都是同样原因.
仅供参考.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

13#
 楼主 Author| 发表于 Post on 2022-4-16 20:33:31 | 只看该作者 Only view this author
abin 发表于 2022-4-16 20:30
我那次,
是华擎某批次主板+8173M处理器.
同一批次三个主板 都一个毛病, 当然是主板问题了.

好的,明白,谢谢啦

739

帖子

0

威望

1715

eV
积分
2454

Level 5 (御坂)

14#
发表于 Post on 2022-4-17 02:35:18 | 只看该作者 Only view this author
大概率CPU问题!我之前用过正显CPU,很容易卡死。而且没有规律!运行6-24小时卡死,很多卡在12小时左右。如果长时间计算,换U。如果简单计算没有问题!

60

帖子

0

威望

1742

eV
积分
1802

Level 5 (御坂)

15#
 楼主 Author| 发表于 Post on 2022-4-17 14:44:40 | 只看该作者 Only view this author
lao7 发表于 2022-4-17 02:35
大概率CPU问题!我之前用过正显CPU,很容易卡死。而且没有规律!运行6-24小时卡死,很多卡在12小时左右。如 ...

是的,连续运行超不过1天。一直担心就是U的问题,没想到可能还真是这问题。小白不能贪便宜啊;谢谢你啊。顺便问下,换U是不是比较麻烦?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 20:59 , Processed in 0.206638 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list