计算化学公社
标题:
使用 LAMMPS(2023年8月2日版本)配合 Allegro 势函数时遇到了死锁问题
[打印本页]
作者Author:
懒洋洋喜洋洋
时间:
2026-2-5 23:42
标题:
使用 LAMMPS(2023年8月2日版本)配合 Allegro 势函数时遇到了死锁问题
我在使用 LAMMPS(2023年8月2日版本)配合 Allegro 势函数时遇到了死锁问题。成功应用 Allegro 仓库中的补丁文件并编译后,程序运行到以下位置时完全卡住:
```
LAMMPS (2 Aug 2023)
using 1 OpenMP thread(s) per MPI task
Reading data file ...
orthogonal box = (0 0 0) to (11.898254 11.898254 12.912077)
1 by 1 by 1 MPI processor grid
reading atoms ...
135 atoms
read_data CPU = 0.003 seconds
Allegro is using input precision f and output precision d
```
程序在此输出后完全冻结。该问题在使用输入脚本中的 `fix addbornforce` 命令时出现。如果不使用这个 fix,计算可以正常运行。
我通过执行以下命令应用了来自pair-allegro 仓库的补丁文件:
```bash
cd /pair_allegro
./patch_lammps.sh /lammps
cp ./extra/fix_addbornforce.cpp /lammps/src/
cp ./extra/fix_addbornforce.h /lammps/src/
```
环境信息
- LAMMPS 版本:2023年8月2日版
- 操作系统:Linux
- MPI:Open MPI 4.1.2
- PyTorch:1.11(仅CPU)
调试尝试
- 测试单进程运行(无 MPI)——同样出现此问题
- 不使用 `fix addbornforce` 时,计算正常
希望得到解答的问题
1. 是否有其他人遇到过 `fix addbornforce` 导致的死锁问题?
2. Allegro 与 LAMMPS 2023 版本之间是否存在已知的兼容性问题?
3. 对于此类卡死问题,推荐哪些调试方法?
4. 这可能与 PyTorch 初始化或 MPI 通信有关吗?
复现内容为此文献的工作:
仓库地址:
mir-group/allegro-pol
作者Author:
lmch
时间:
2026-2-7 16:10
Aug 02 2023 stable 的update有两个还是三个,没特殊情况试试最新的stable版吧
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3