monk1077 发表于 2021-12-31 10:48 谢谢您指导,我回头用虚拟机先练习练习,目前还只用到计算任务提交排队这么初级功能,对于slurm与Torque的区别及优缺点还真得找资料了解了解。比如先去论坛里把相关的贴文看完。 |
Tanmin 发表于 2021-12-30 19:59 可以参考这个 https://www.bilibili.com/video/B ... id_from=333.337.0.0 |
Tanmin 发表于 2021-12-30 19:59 对的,openhpc源里也有。 |
Tanmin 发表于 2021-12-30 19:59 dnf install slurm* 或者查询我的签名信息。 |
monk1077 发表于 2021-12-30 19:49 您说的直接从epel源抓取的意思是添加epel安装源后,采用yum install 等指令直接安装,不需要像Torque那样进行诸多手动设置? |
monk1077 发表于 2021-12-30 19:46 谢谢您提供的宝贵意见,正愁没思路,我去搜搜法子,晚点再来报告! 十分感谢 |
slurm的话:RHEL系系统最简单的可以直接从epel源里抓取 |
Tanmin 发表于 2021-12-30 19:37 默认安装的torque有内存,堆栈等限制,需要手动调整一下。 |
bluewhale 发表于 2021-12-30 17:51 终究懂得的太少,只能一步步学,昨晚的装机虽然成功了,但很奇怪,提交测试任务计算没问题,后面提交的几个任务均报错,显示forrtl: severe (174): SIGSEGV, segmentation fault occurred,但是不用Torque,又都能正常计算,还得找找原因。 之前超算一直用slurm,想不到自己装单机难度这么大。 |
现在比较流行的是SLURM, Torque/maui装机的非常少了。 |
自己来报告一下: 重新参考https://m.bilibili.com/video/BV1d4411r7WF/ 的教程,将自己原本修改的环境变量及文件复原后,安装成功,但有以下几个问题供大家参考: 1. 可能是自己之前安装有所修改,在启动pbs_server和pbs_mom时,没有像视频中出现 Created symlink from /etc/systemd/system/multi-user.target.wants/pbs_server.service to /usr/lib/systemd/system/pbs_server.service. 但后续查看服务状态时,均是激活状态,故认为无碍; 2. 全部安装后,确实可以运行相关指令,也可在普通用户下提交任务,但任务一直在排队。经查资料,可能是任务调度服务没有开启,该服务由pbs_sched负责,可能是由于我之前安装所致,同时我在此番安装过程中确实没有启动pbs_sched,故参考启动pbs_server和pbs_mom的方法启动了pbs_sched. i> 确认是否有该文件:
ii> 为保险起见,参考了之前文件的权限:
iii> 激活服务:
iV> 检查是否激活:
我自己操作记录如下
|
bluewhale 发表于 2021-12-29 20:59 谢谢,后来我自己检查发现了这个错误,但是修改后,每次退出shell,就失效。 后来推倒重来,问题解决了。 |
Tanmin 发表于 2021-12-29 21:01 前一句和后一句没有关系 最后一问,看手册,我记不住细节。 |
abin 发表于 2021-12-29 18:32 abin: 您好,我想请问一下,为何您在编译的时候用的是 make -j 4; 而在设置节点核数时,即 vi /var/spool/torque/server_priv/nodes, 仅写了master np=2, 如果我是两块CPU(18核,共36),此处写master=36 是否有问题? |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-24 02:28 , Processed in 0.175020 second(s), 26 queries , Gzip On.