计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: wxyhgk
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] Ubuntu20.04 安装单机slurm教程

  [复制链接 Copy URL]

197

帖子

1

威望

1104

eV
积分
1321

Level 4 (黑子)

61#
发表于 Post on 2023-8-18 17:34:56 | 只看该作者 Only view this author
请问这个方法在Rocky linux9可以用吗

5

帖子

0

威望

664

eV
积分
669

Level 4 (黑子)

62#
发表于 Post on 2023-9-7 14:05:51 | 只看该作者 Only view this author
paramecium86 发表于 2022-11-11 09:46
谢谢您的回复。我用了这种写法,不过是我没形容好问题。这样写脚本,这样两个任务还是排在同一个slurm的j ...

请问一下您最后解决这个问题了吗

125

帖子

0

威望

1198

eV
积分
1323

Level 4 (黑子)

63#
发表于 Post on 2023-10-22 04:31:16 | 只看该作者 Only view this author
老师好,一个节点请问只能一次运行一个job吗

2

帖子

0

威望

15

eV
积分
17

Level 1 能力者

64#
发表于 Post on 2024-6-1 01:11:04 | 只看该作者 Only view this author
vasp 能用吗

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

65#
 楼主 Author| 发表于 Post on 2024-6-3 09:07:53 | 只看该作者 Only view this author

和软件无关,本质上,就是个把本地软件,通过网络分发到各个机器上用

125

帖子

0

威望

1198

eV
积分
1323

Level 4 (黑子)

66#
发表于 Post on 2024-7-11 01:22:41 | 只看该作者 Only view this author
wxyhgk 发表于 2022-11-9 18:39
到这里自己配置 https://docs.hpc.sjtu.edu.cn/job/slurm.html

感谢大佬的教程,请问关于一次只能跑一个任务的问题怎样解决呢?上面的网址看过了,仍然没有头绪

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

67#
 楼主 Author| 发表于 Post on 2024-7-11 08:34:55 | 只看该作者 Only view this author
本帖最后由 wxyhgk 于 2024-7-11 08:36 编辑
lurensan 发表于 2024-7-11 01:22
感谢大佬的教程,请问关于一次只能跑一个任务的问题怎样解决呢?上面的网址看过了,仍然没有头绪

这个需要改成 mix 模式才会比较好,晚点我更新下

125

帖子

0

威望

1198

eV
积分
1323

Level 4 (黑子)

68#
发表于 Post on 2024-7-11 09:08:26 | 只看该作者 Only view this author
wxyhgk 发表于 2024-7-11 08:34
这个需要改成 mix 模式才会比较好,晚点我更新下

好的,期待大佬的操作

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

69#
 楼主 Author| 发表于 Post on 2024-7-11 13:43:59 | 只看该作者 Only view this author
lurensan 发表于 2024-7-11 09:08
好的,期待大佬的操作

你按照我这个配置文件来修改:

  1. # Slurm.conf file generated by configurator easy.html.
  2. # Put this file on all nodes of your cluster.
  3. # See the slurm.conf man page for more information.
  4. #
  5. SlurmctldHost=master
  6. #
  7. #MailProg=/bin/mail
  8. MpiDefault=none
  9. MailProg=/usr/bin/s-nail
  10. #MpiParams=ports=#-#
  11. ProctrackType=proctrack/cgroup
  12. ReturnToService=1
  13. SlurmctldPidFile=/var/run/slurmctld.pid
  14. #SlurmctldPort=6817
  15. SlurmdPidFile=/var/run/slurmd.pid
  16. #SlurmdPort=6818
  17. SlurmdSpoolDir=/var/spool/slurmd
  18. SlurmUser=slurm
  19. #SlurmdUser=root
  20. StateSaveLocation=/var/spool/slurmctld
  21. SwitchType=switch/none
  22. TaskPlugin=task/affinity
  23. #
  24. #
  25. # TIMERS
  26. #KillWait=30
  27. #MinJobAge=300
  28. #SlurmctldTimeout=120
  29. #SlurmdTimeout=300
  30. #
  31. #
  32. # SCHEDULING
  33. SchedulerType=sched/backfill
  34. SelectType=select/cons_tres
  35. SelectTypeParameters=CR_Core
  36. #
  37. #
  38. # LOGGING AND ACCOUNTING
  39. AccountingStorageType=accounting_storage/none
  40. ClusterName=cluster
  41. #JobAcctGatherFrequency=30
  42. JobAcctGatherType=jobacct_gather/none
  43. #SlurmctldDebug=info
  44. SlurmctldLogFile= /var/log/slurmctld.log
  45. #SlurmdDebug=info
  46. SlurmdLogFile=/var/log/slurmd.log
  47. #
  48. #
  49. # COMPUTE NODES
  50. PartitionName=batch Nodes=master Default=YES MaxTime=INFINITE State=UP
  51. NodeName=master CPUs=192 Boards=1 SocketsPerBoard=2 CoresPerSocket=48 ThreadsPerCore=2 RealMemory=257722
复制代码
其中里面的 master 改成你自己的主机的 hostname,然后就是最后一行中的
  1. NodeName=master CPUs=192 Boards=1 SocketsPerBoard=2 CoresPerSocket=48 ThreadsPerCore=2 RealMemory=257722
复制代码
改成你自己的

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:01 , Processed in 0.194879 second(s), 27 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list