计算化学公社

标题: 求助:VASP作业提交后PBS占用了两倍的mpirun核数 [打印本页]

作者
Author:
含光君    时间: 2022-6-16 22:52
标题: 求助:VASP作业提交后PBS占用了两倍的mpirun核数
大家好,请教一个关于VASP作业提交的问题,如图所示,服务器是112核且已启用超线程。我在PBS脚本中使用了56核跑这个任务,但是后面其他使用56核的任务只能排队。


(, 下载次数 Times of downloads: 18)


输入 qstat -answ1 命令检查后,发现该任务申请了112核。

(, 下载次数 Times of downloads: 15)

而输入top查看后,cpu占用率又只有50%左右

(, 下载次数 Times of downloads: 21)

(补充:这个任务 INCAR文件中ncores=28,尝试过换成14不能解决问题)

求大佬指点 ,谢谢!


作者
Author:
abin    时间: 2022-6-16 23:10
集群是你做的吗?
如果是,仔细检查配置文件。
如果不是,谁做的找谁?

提供的信息有限,无法判定。

或者开ssh,我来动手处理。

或者用我的工具,重新刷一遍。
bing.com搜索hpc4you了解更多信息。

作者
Author:
pwzhou    时间: 2022-6-17 07:46
PBS使用多少个节点和多少个核是由#PBS -l nodes=1:ppn=8指定的(1个节点8个核)决定的,而不是mpirun后面的参数决定的,正确的做法是在mpirun后面指定的核数应该从PBS系统获取,比如:
NPROCS=`wc -l < $PBS_NODEFILE`
mpirun -n $NPROCS vasp_std > run.log
这样就是PBS申请了多少个核,你的作业就用了多少个核在运行。不知道你具体提交作业的命令是什么?这个可能是你调用的PBS脚本里面默认指定使用112个核,所以你在mpirun使用56个核,只会让剩余的56核被PBS占用,但实际上没有计算,而后面的作业又没办法运行,这属于典型的资源浪费。
作者
Author:
万里云    时间: 2022-6-17 10:54
这个节点是56个核超成了112个?

那应该当成56个核来用。超线程超出来的核聊胜于无。

这就是为什么建议关闭超线程的原因。
作者
Author:
含光君    时间: 2022-6-17 14:48
谢谢各位的帮助,问题已解决~
作者
Author:
noodles的困惑    时间: 2022-6-17 15:18
含光君 发表于 2022-6-17 14:48
谢谢各位的帮助,问题已解决~

你好,可以分享一下问题是如何解决的吗?谢谢!
作者
Author:
含光君    时间: 2022-6-17 19:29
noodles的困惑 发表于 2022-6-17 15:18
你好,可以分享一下问题是如何解决的吗?谢谢!

你好~如三楼所说,应根据实际需要的核的数量在PBS脚本中添上#PBS -l nodes=1:ppn=8这样的语句。
(我之前康过你问的GaN slab模型结构优化后表面原子弛豫问题,很受启发~)
作者
Author:
noodles的困惑    时间: 2022-6-18 10:25
含光君 发表于 2022-6-17 19:29
你好~如三楼所说,应根据实际需要的核的数量在PBS脚本中添上#PBS -l nodes=1:ppn=8这样的语句。
(我之 ...

感谢分享!也感谢三楼老师!
(那时候在计算表面,由于是新手,有很多的小问题,有些到现在还是存疑。非常开心能够对你有一点点的帮助,当然了,主要是帖子中几位老师的贡献。)




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3