计算化学公社

 找回密码 Forget password
 注册 Register
Views: 3102|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[Quantum ESPRESSO] 求助:QE测试并行报错

[复制链接 Copy URL]

14

帖子

0

威望

355

eV
积分
369

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
目前已在机群安装完成qe-6.4.1与openmpi-4.0.3,在利用pw模块测试并行计算时,报错以下信息:
WARNING: There was an error initializing an OpenFabrics device.

  Local host:   compute-065
  Local device: mlx5_0
--------------------------------------------------------------------------
--------------------------------------------------------------------------
MPI_ABORT was invoked on rank 48 in communicator MPI_COMM_WORLD
with errorcode 1.

NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.
--------------------------------------------------------------------------
[compute-065:37968] 63 more processes have sent help message help-mpi-btl-openib.txt / error in device init
[compute-065:37968] Set MCA parameter "orte_base_help_aggregate" to 0 to see all help / error messages
[compute-065:37968] 31 more processes have sent help message help-mpi-api.txt / mpi-abort

机群的输入脚本如下:
#!/bin/bash
#SBATCH -J test
#SBATCH -p cpu-low
#SBATCH -N 2
#SBATCH -n 64
#SBATCH --ntasks-per-node=32
#SBATCH -t 168:00:00
#SBATCH -o test.out
#SBATCH -o test.err

export OMP_NUM_THREADS=1
mpirun -np 64 neb.x -i neb.in >neb.log
请问这个报错情况该怎么处理?


2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

2#
发表于 Post on 2022-4-22 22:42:17 | 只看该作者 Only view this author
本帖最后由 abin 于 2022-4-22 22:49 编辑

Google openMPI InfiniBand

简单说, openMPI默认编译, 调试不当, 可能导致不支持IB网络.

不过, IntelMPI默认支持IB网络的.

另, conda forge中的cp2k v8.2.0 openMPI版本中, 这里包含的openMPI就是HPC环境的, 比如IB网络. 可以看看编译参数.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

191

帖子

0

威望

2611

eV
积分
2802

Level 5 (御坂)

3#
发表于 Post on 2022-4-23 09:32:58 | 只看该作者 Only view this author
重新编译,用编译出MPI+openmpi版本的

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-19 19:56 , Processed in 0.151912 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list