|
本帖最后由 宸牧羊 于 2025-4-8 14:37 编辑
问题描述:在新买的双路AMD9654 768GB的服务器上跑QE的几何优化任务,并行效率非常低,远没有之前在7950X 128GB Rocky Linux虚拟机上快。
软件版本:qev7.0 按照sob老师这篇博文http://bbs.keinsci.com/forum.php ... 0&highlight=Quantum安装。两台机器的编译过程基本一致。
服务器上使用的命令:
1.export OMP_NUM_THREADS=24
mpirun -np 16 --map-by socket:PE=8 --bind-to core pw.x -in input.xxxx > output.xxxx &
2.export OMP_NUM_THREADS=8
mpirun -np 28 --map-by ppr:14:package:PE=8 --bind-to core pw.x -in input.xxxx > output.xxxx &
在window下虚拟机上运行命令:
mpirun -np 30 -x OMP_NUM_THREADS=1 pw.x -in input.xxxx > output.xxxx &
请问各位老师应当如何优化来提高并行效率,服务器配置问题,还是软件的编译问题?
√√√√√√问题后续:MPI库编译存在问题,导致出现重复输出现象,且消耗内存巨大。解决方案:检查系统的环境变量设置,再重新编译Openmpi、QE,随后并行速度正常,使用192核跑速度提升至51s。
|
|