计算化学公社

 找回密码 Forget password
 注册 Register
Views: 8994|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 服务器计算不报错直接kill怎么解决?

[复制链接 Copy URL]

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

各位老师,我在26核服务器上跑一个Gromacs计算,之前在我的四核电脑和虚拟机上已经跑成功了,但是今天换到服务器上直接不报错直接KILL,在虚拟机上同样也被KILL,甚至我拿官方教程里的“水中的溶菌酶”进行测试,也会在能量最小化部分就被KILL,只有那台四核电脑还能跑,求教可能是因为什么?怎么解决?附件给出了kill时的界面。希望能得到回答,万分感谢。

kill.png (78.98 KB, 下载次数 Times of downloads: 32)

kill.png

Factor12.png (67.99 KB, 下载次数 Times of downloads: 45)

Factor12.png

Factor13.png (65.97 KB, 下载次数 Times of downloads: 29)

Factor13.png

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

2#
发表于 Post on 2020-6-26 09:31:21 | 只看该作者 Only view this author
AVX2_256  --> AVX_512

Do not run as root user.
Then recompile the source code.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

6万

帖子

99

威望

6万

eV
积分
125140

管理员

公社社长

3#
发表于 Post on 2020-6-27 00:31:26 | 只看该作者 Only view this author
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail/root里有什么信息
实在不行重装系统,或者编译gmx2020试试
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2020-6-27 12:51:28 | 只看该作者 Only view this author
sobereva 发表于 2020-6-27 00:31
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail ...

这个工作站是系里刚搭的,我尝试着按照sob老师教程里说的,升级gcc,然后用AVX512指令集,但是始终提示内存问题,无法升级gcc,但是内存明明是足够的,试了各种解决办法,解决不了。技术人员甩手掌柜,让我们自己解决,没办法只能用AVX2_512。而且这个工作站是一个26核的,我一个人用且没计算的情况下,有16个是满负荷的,搞不清楚什么情况。下面是root文件里最新的内容



root.png (81.81 KB, 下载次数 Times of downloads: 30)

root.png

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2020-6-27 12:52:07 | 只看该作者 Only view this author
abin 发表于 2020-6-26 09:31
AVX2_256  --> AVX_512

Do not run as root user.

我试了用另外的用户运行,依然kill

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

6#
发表于 Post on 2020-6-27 13:24:42 | 只看该作者 Only view this author
libin093 发表于 2020-6-27 12:52
我试了用另外的用户运行,依然kill

你到底用几个核心跑的计算?

Fatal error......
那行写的啥?

单核心能不能跑?
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2020-6-27 14:29:21 | 只看该作者 Only view this author
abin 发表于 2020-6-27 13:24
你到底用几个核心跑的计算?

Fatal error......

我最开始没有指定核心数,自动有26核心跑,提示那个fatal error后,我用12核跑,然后就kill了

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2020-6-27 14:33:19 | 只看该作者 Only view this author
abin 发表于 2020-6-27 13:24
你到底用几个核心跑的计算?

Fatal error......

这个是我刚刚连接上后,查看的电脑运行状况

任务数.png (157.16 KB, 下载次数 Times of downloads: 27)

任务数.png

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2020-6-27 16:28:18 | 只看该作者 Only view this author
sobereva 发表于 2020-6-27 00:31
这和指令集没必然关系,只不过当前指令集没最大程度发挥CPU性能,但不至于导致killed
去看/var/spool/mail ...

sob老师,我已经解决了问题,我查了服务器的任务,没有计算的情况下,半数CPU100%占用,有个循环任务kill不掉,可能是被挖矿了,现在把那个循环任务解决了就一切正常了,我自己的电脑因为跟服务器连接,致使我的虚拟机也被挖矿,麻烦sob老师了

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

10#
发表于 Post on 2020-6-27 21:41:56 | 只看该作者 Only view this author
天,
还能被挖矿了?
你不会用了什么来路不明的一键脚本吧?
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

34

帖子

0

威望

447

eV
积分
481

Level 3 能力者

11#
 楼主 Author| 发表于 Post on 2020-6-27 21:54:05 | 只看该作者 Only view this author
abin 发表于 2020-6-27 21:41
天,
还能被挖矿了?
你不会用了什么来路不明的一键脚本吧?

没啊,我就想装个支持AVX512指令集的Gromacs,结果gcc升级不了,一直提示内存有问题,但实际上没问题的,没办法就装了AVX2的,装完运行gmx,一直杀我进程。今天搞定了以后,我特意问了一下网络信息中心,5.1之后我们学校很多linux电脑都被挖矿了

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

12#
发表于 Post on 2020-6-27 23:05:16 | 只看该作者 Only view this author
libin093 发表于 2020-6-27 21:54
没啊,我就想装个支持AVX512指令集的Gromacs,结果gcc升级不了,一直提示内存有问题,但实际上没问题的, ...

升级GCC啊,
看看这个,
GCC9源码编译
https://www.bilibili.com/video/BV1HJ411H7Ca
视频中的技术方案,适用于绕开root授权,给自己安装软件的场景。

我原来写了一个帖子,
把大家可能会用到的场景都录制了简单的视频,
并做了一个合集。
不晓得,那个帖子为啥被隐藏或者屏蔽了。

另,
修改ssh取消root密码登录,
并限定可访问ssh的用户ID,
修改ssh端口。
以上三点,可以预防95%以上的攻击。

其实,所有用户都应该key验证登录,
简单密码是不行的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

13#
发表于 Post on 2020-6-27 23:10:09 | 只看该作者 Only view this author
我所在的环境中,也遭遇过Linux机器被黑。

当时我们的Linux机器处于物理隔离的内网。
一个商家上门来部署东西,
说密码能否临时修改简单一点,设定了六个一,30分钟后,又修改为复杂密码。
然后机器就中标了,
想商家做了反应,他们的技术登录做了分析,确认是他们部署的时间段,因为简单密码被黑了。
他们花费了4个小时锁定问题。
不过后来,还是重装了系统,按个商家推荐的产品,也直接清除了。

再后来,任何商家来上门安装东西,
只能通过我们指定的机器来登录访问。
所有的服务器,凡是我管理的,基本是root key验证。好几年了,至今安全。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-21 00:30 , Processed in 0.178643 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list