计算化学公社

标题: 服务器计算不报错直接kill怎么解决? [打印本页]

作者
Author:
libin093    时间: 2020-6-26 00:22
标题: 服务器计算不报错直接kill怎么解决?
各位老师,我在26核服务器上跑一个Gromacs计算,之前在我的四核电脑和虚拟机上已经跑成功了,但是今天换到服务器上直接不报错直接KILL,在虚拟机上同样也被KILL,甚至我拿官方教程里的“水中的溶菌酶”进行测试,也会在能量最小化部分就被KILL,只有那台四核电脑还能跑,求教可能是因为什么?怎么解决?附件给出了kill时的界面。希望能得到回答,万分感谢。
作者
Author:
abin    时间: 2020-6-26 09:31
AVX2_256  --> AVX_512

Do not run as root user.
Then recompile the source code.
作者
Author:
sobereva    时间: 2020-6-27 00:31
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail/root里有什么信息
实在不行重装系统,或者编译gmx2020试试
作者
Author:
libin093    时间: 2020-6-27 12:51
sobereva 发表于 2020-6-27 00:31
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail ...

这个工作站是系里刚搭的,我尝试着按照sob老师教程里说的,升级gcc,然后用AVX512指令集,但是始终提示内存问题,无法升级gcc,但是内存明明是足够的,试了各种解决办法,解决不了。技术人员甩手掌柜,让我们自己解决,没办法只能用AVX2_512。而且这个工作站是一个26核的,我一个人用且没计算的情况下,有16个是满负荷的,搞不清楚什么情况。下面是root文件里最新的内容




作者
Author:
libin093    时间: 2020-6-27 12:52
abin 发表于 2020-6-26 09:31
AVX2_256  --> AVX_512

Do not run as root user.

我试了用另外的用户运行,依然kill
作者
Author:
abin    时间: 2020-6-27 13:24
libin093 发表于 2020-6-27 12:52
我试了用另外的用户运行,依然kill

你到底用几个核心跑的计算?

Fatal error......
那行写的啥?

单核心能不能跑?
作者
Author:
libin093    时间: 2020-6-27 14:29
abin 发表于 2020-6-27 13:24
你到底用几个核心跑的计算?

Fatal error......

我最开始没有指定核心数,自动有26核心跑,提示那个fatal error后,我用12核跑,然后就kill了
作者
Author:
libin093    时间: 2020-6-27 14:33
abin 发表于 2020-6-27 13:24
你到底用几个核心跑的计算?

Fatal error......

这个是我刚刚连接上后,查看的电脑运行状况

作者
Author:
libin093    时间: 2020-6-27 16:28
sobereva 发表于 2020-6-27 00:31
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail ...

sob老师,我已经解决了问题,我查了服务器的任务,没有计算的情况下,半数CPU100%占用,有个循环任务kill不掉,可能是被挖矿了,现在把那个循环任务解决了就一切正常了,我自己的电脑因为跟服务器连接,致使我的虚拟机也被挖矿,麻烦sob老师了
作者
Author:
abin    时间: 2020-6-27 21:41
天,
还能被挖矿了?
你不会用了什么来路不明的一键脚本吧?
作者
Author:
libin093    时间: 2020-6-27 21:54
abin 发表于 2020-6-27 21:41
天,
还能被挖矿了?
你不会用了什么来路不明的一键脚本吧?

没啊,我就想装个支持AVX512指令集的Gromacs,结果gcc升级不了,一直提示内存有问题,但实际上没问题的,没办法就装了AVX2的,装完运行gmx,一直杀我进程。今天搞定了以后,我特意问了一下网络信息中心,5.1之后我们学校很多linux电脑都被挖矿了
作者
Author:
abin    时间: 2020-6-27 23:05
libin093 发表于 2020-6-27 21:54
没啊,我就想装个支持AVX512指令集的Gromacs,结果gcc升级不了,一直提示内存有问题,但实际上没问题的, ...

升级GCC啊,
看看这个,
GCC9源码编译
https://www.bilibili.com/video/BV1HJ411H7Ca
视频中的技术方案,适用于绕开root授权,给自己安装软件的场景。

我原来写了一个帖子,
把大家可能会用到的场景都录制了简单的视频,
并做了一个合集。
不晓得,那个帖子为啥被隐藏或者屏蔽了。

另,
修改ssh取消root密码登录,
并限定可访问ssh的用户ID,
修改ssh端口。
以上三点,可以预防95%以上的攻击。

其实,所有用户都应该key验证登录,
简单密码是不行的。
作者
Author:
abin    时间: 2020-6-27 23:10
我所在的环境中,也遭遇过Linux机器被黑。

当时我们的Linux机器处于物理隔离的内网。
一个商家上门来部署东西,
说密码能否临时修改简单一点,设定了六个一,30分钟后,又修改为复杂密码。
然后机器就中标了,
想商家做了反应,他们的技术登录做了分析,确认是他们部署的时间段,因为简单密码被黑了。
他们花费了4个小时锁定问题。
不过后来,还是重装了系统,按个商家推荐的产品,也直接清除了。

再后来,任何商家来上门安装东西,
只能通过我们指定的机器来登录访问。
所有的服务器,凡是我管理的,基本是root key验证。好几年了,至今安全。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3