计算化学公社

标题: NVHPC编译VASP6成功,但运行vasp没有任何输出 [打印本页]

作者
Author:
archer    时间: 2023-8-30 16:42
标题: NVHPC编译VASP6成功,但运行vasp没有任何输出
NVHPC 20.9和23.7版本编译VASP6.3 CPU或GPU版本均出现此问题。vasp_std一直运行,没有产生OUTCAR和OSZICAR。

作者
Author:
abin    时间: 2023-8-30 18:39
你用的什么GPU?

鄙人编译过,能跑。

但是加速效果,没有分子动力学那么显著,
可以说,性价比一般。

如需我动手处理,可以直接联系我。

签名有联系方式。
作者
Author:
Aletyx    时间: 2023-8-30 22:37
可以which mpirun,看看调用的mpirun是不是nvhpc里面的。我有一次调用错mpirun了,运行时什么也不输出。
作者
Author:
archer    时间: 2023-8-31 05:14
Aletyx 发表于 2023-8-30 22:37
可以which mpirun,看看调用的mpirun是不是nvhpc里面的。我有一次调用错mpirun了,运行时什么也不输出。

确实是这个问题,如果只用一个核也必须用mpirun才行吗?我现在CPU可以跑了,GPU遇到下面的问题:
slurm-8057405.out  slurm-8057412.out  slurm-8057414.out  slurm-8057426.out  slurm-8057428.out  
(base) jichen@gpu114:~/superconduct/vasp-gpu$ vi slurm-8057426.out

running on    1 total cores
distrk:  each k-point on    1 cores,    1 groups
distr:  one band on    1 cores,    1 groups
Module function not found, error 35
OpenACC runtime initialized ...    1 GPUs detected
-----------------------------------------------------------------------------
|                     _     ____    _    _    _____     _                     |
|                    | |   |  _ \  | |  | |  / ____|   | |                    |
|                    | |   | |_) | | |  | | | |  __    | |                    |
|                    |_|   |  _ <  | |  | | | | |_ |   |_|                    |
|                     _    | |_) | | |__| | | |__| |    _                     |
|                    (_)   |____/   \____/   \_____|   (_)                    |
|                                                                             |
|     internal error in: mpi.F  at line: 897                                  |
|                                                                             |
|     M_init_nccl: Error in ncclCommInitRank                                  |
|                                                                             |
|     If you are not a developer, you should not encounter this problem.      |
|     Please submit a bug report.                                             |
|                                                                             |
-----------------------------------------------------------------------------

作者
Author:
Aletyx    时间: 2023-8-31 12:26
archer 发表于 2023-8-31 05:14
确实是这个问题,如果只用一个核也必须用mpirun才行吗?我现在CPU可以跑了,GPU遇到下面的问题:
slurm- ...

调用一张卡也得用mpirun吧。

这个单看报错应该是NCCL库的问题。可以把提交脚本贴一下,一起讨论下。
作者
Author:
archer    时间: 2023-8-31 16:42
Aletyx 发表于 2023-8-31 12:26
调用一张卡也得用mpirun吧。

这个单看报错应该是NCCL库的问题。可以把提交脚本贴一下,一起讨论下。

#!/bin/bash

#SBATCH -n 1 #
#SBATCH -N 1 # num of node
#SBATCH -t 0-1:30 # max time:  D-HH:MM
#SBATCH -p gpu # list
#SBATCH --mem=40000 # memeory MB
#SBATCH --gres=gpu:1

xxx/mpirun -np 1  ~/software/vasp.6.3.0/gpu/vasp_std





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3