计算化学公社
标题: wsl2+rocm平台下编译安装kokkos加速的lammps [打印本页]
作者Author: DaMin32767 时间: 2026-1-9 18:09
标题: wsl2+rocm平台下编译安装kokkos加速的lammps
wsl2+rocm平台下编译安装kokkos加速的lammps
0.前言
之前组了台工作机,贪便宜选择了a卡,后面做了几个lammps的工作感觉很好玩,遂挑战自己在a卡上装个lammps,记录下安装过程分享给大家
设备配置 : 9700X+7900gre wsl系统版本 : Ubuntu2204
我参考的博文:
1.ROCm软件栈安装
- sudo apt update
- wget https://repo.radeon.com/amdgpu-install/6.4.2.1/ubuntu/jammy/amdgpu-install_6.4.60402-1_all.deb
- sudo apt install ./amdgpu-install_6.4.60402-1_all.deb
- amdgpu-install -y --usecase=wsl,rocm --no-dkms
复制代码
输入rocminfo检测安装是否成功
- ...
- *******
- Agent 2
- *******
- Name: gfx1100
- Marketing Name: AMD Radeon RX 7900 GRE
- Vendor Name: AMD
- Feature: KERNEL_DISPATCH
- Profile: BASE_PROFILE
- Float Round Mode: NEAR
- Max Queue Number: 128(0x80)
- Queue Min Size: 64(0x40)
- Queue Max Size: 131072(0x20000)
- Queue Type: MULTI
- Node: 1
- Device Type: GPU
- Cache Info:
- ...
复制代码
正常输出gpu信息就装好了
2.lammps编译
确认环境,后面缺什么装什么
- sudo apt install gcc gfortran build-essential cmake make
复制代码
下载lammps包并解压
- wget https://download.lammps.org/tars/lammps-stable.tar.gz
- tar -xvf lammps-stable.tar.gz
- cd lammps*/
复制代码
编辑 cmake/presets/basic.cmake中的安装包,尽可能地写上了,如果有其他好的写法欢迎大家分享
- set(ALL_PACKAGES ASPHERE BOCS BODY BROWNIAN CG-SDK CLASS2 COLLOID CORESHELL DIELECTRIC DIFFRACTION DIPOLE DPD-BASIC DPD-MESO DPD-REACT DPD-SMOOTH DRUDE EFF EXTRA-COMPUTE EXTRA-DUMP EXTRA-FIX EXTRA-MOLECULE EXTRA-PAIR FEP GRANULAR KSPACE MANIFOLD MANYBODY MC MEAM MGPT MISC ML-IAP ML-SNAP MOFFF MOLECULE OPENMP OPT ORIENT PERI PHONON PLUGIN PTM QEQ QTB REACTION REAXFF REPLICA RIGID SHOCK SMTBQ SPH SPIN SRD TALLY UEF YAFF GPU)
复制代码 编辑 cmake/presets/kokkos-hip.cmake 我的gpu架构是gfx1100,这里改成:
- set(Kokkos_ARCH_NAVI1100 on CACHE BOOL "" FORCE)
复制代码
建立编译文件夹并编译
- mkdir build-kokkos && cd build-kokkos
- cmake -C ../cmake/presets/basic.cmake -C ../cmake/presets/kokkos-hip.cmake -D CMAKE_PREFIX_PATH=/opt/rocm -D CMAKE_CXX_COMPILER=hipcc -D GPU_API=HIP -D HIP_ARCH=gfx1100 -D Kokkos_ARCH_RDNA3=ON -D PKG_GPU=on -D PKG_KOKKOS=on ../cmake
- cmake --build . -j16
复制代码
完成了!
注意,如果你还想在wsl上玩ai作画啥的,要注意runtime的路径设置不要修改,如果修改就要重新编译lammps避免报错
进入 bench 目录测试一下速度
- cd ../bench
- ../build-kokkos/lmp -k on g 1 -sf kk -i in.eam
复制代码
可以找到速度测试的结果:
- Performance: 104.278 ns/day, 0.230 hours/ns, 241.385 timesteps/s, 7.724 Matom-step/s
复制代码
OK纯玩具,对比另一台3090速度差远了:
- Performance: 776.628 ns/day, 0.031 hours/ns, 1797.750 timesteps/s, 57.528 Matom-step/s
- 171.9% CPU use with 1 MPI tasks x 6 OpenMP threads
复制代码
应该可以按照熵增焓减大佬的调优办法增强一下,本质玩具就不折腾了。
ps:之前用markdown写的,不太懂怎么转成论坛发帖的格式,有格式奇怪的地方恳请大家批评指正
| 欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |