计算化学公社

 找回密码 Forget password
 注册 Register
Views: 236|回复 Reply: 1
打印 Print 上一主题 Last thread 下一主题 Next thread

[Lammps] 使用 LAMMPS(2023年8月2日版本)配合 Allegro 势函数时遇到了死锁问题

[复制链接 Copy URL]

1

帖子

0

威望

11

eV
积分
12

Level 1 能力者

我在使用 LAMMPS(2023年8月2日版本)配合 Allegro 势函数时遇到了死锁问题。成功应用 Allegro 仓库中的补丁文件并编译后,程序运行到以下位置时完全卡住:
```
LAMMPS (2 Aug 2023)
using 1 OpenMP thread(s) per MPI task
Reading data file ...
orthogonal box = (0 0 0) to (11.898254 11.898254 12.912077)
1 by 1 by 1 MPI processor grid
reading atoms ...
135 atoms
read_data CPU = 0.003 seconds
Allegro is using input precision f and output precision d
```
程序在此输出后完全冻结。该问题在使用输入脚本中的 `fix addbornforce` 命令时出现。如果不使用这个 fix,计算可以正常运行。
我通过执行以下命令应用了来自pair-allegro 仓库的补丁文件:
```bash
cd /pair_allegro
./patch_lammps.sh /lammps
cp ./extra/fix_addbornforce.cpp /lammps/src/
cp ./extra/fix_addbornforce.h /lammps/src/
```
环境信息
- LAMMPS 版本:2023年8月2日版
- 操作系统:Linux
- MPI:Open MPI 4.1.2
- PyTorch:1.11(仅CPU)
调试尝试
- 测试单进程运行(无 MPI)——同样出现此问题
- 不使用 `fix addbornforce` 时,计算正常
希望得到解答的问题
1. 是否有其他人遇到过 `fix addbornforce` 导致的死锁问题?
2. Allegro 与 LAMMPS 2023 版本之间是否存在已知的兼容性问题?
3. 对于此类卡死问题,推荐哪些调试方法?
4. 这可能与 PyTorch 初始化或 MPI 通信有关吗?
复现内容为此文献的工作:
仓库地址:mir-group/allegro-pol

75

帖子

0

威望

1361

eV
积分
1436

Level 4 (黑子)

2#
发表于 Post on 2026-2-7 16:10:54 | 只看该作者 Only view this author
Aug 02 2023 stable 的update有两个还是三个,没特殊情况试试最新的stable版吧

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-16 16:58 , Processed in 0.189492 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list