Xander 发表于 2026-4-14 20:29 调度系统可以帮你解决任务排队、绑核等问题,比如slurm就可以直接配置用cgroup绑核,配置合适的numa策略,如果不了解numa是什么的话可以看《NUMA策略对Gaussian运算速度影响的小研究》。 我之前还在EPYC 7C13上观察到类似CP2K这种程序如果同时跑多个任务的话可能会错误的绑到同一个物理内核上,使用slurm的cgroup设了CPU亲和性以后绑核行为正常,效率正常。 slurm本身是apt就能装的,那个版本也够用了。不联网的话需要基于本地包来apt装或者编译安装,折腾一点但也是能装的。 |
Maкишкa_MKK 发表于 2026-4-14 18:36 一般不会去kill任务,那这样看来没必要搞什么调度系统了。之前组里用学校服务器,那个是集群,后来学校服务器宕机了,老师才搞了台这个,组里人都不太会linux,只是惯例地跑任务,拷文件。 |
Maкишкa_MKK 发表于 2026-4-14 18:36 其实超cpu一般也感知不到卡,用户能感知到的系统卡顿一般都是内存爆了 |
|
个人经验,只要内存和外存不爆,超cpu不太多的化顶多算的慢一点、系统卡一点。 是否调度至少要考虑 1. 你是否需要频繁地对任务计算的顺序做改动或者去kill任务等等; 2. 你们组的做事方式。 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2026-4-15 06:16 , Processed in 0.168701 second(s), 25 queries , Gzip On.