小葱拌豆腐 发表于 2024-7-5 11:59 lmp -in test_1.in -k on g 1 -sf kk -pk kokkos neigh half newton on 能看见一个lmp进程,类型是C。占用只有1-3%的样子,偶尔会跳一下30多 |
docshen777 发表于 2024-6-29 17:20 run的指令有问题没,开始计算后nvidia-smi能看到lmp进程吗 |
小葱拌豆腐 发表于 2024-6-28 15:03 WSL2 UBUNTU20.04 LAMMPS是 2Aug2023 GCC9.4 CUDA12.5 OPENMPI4.1.5,有cuda-support 体系是一万原子硅钙REAXFF(也测试了其他测试文件,都非常慢,不如CPU。而且远远达不到帖子里给的benchmark)。 折腾了2天,重新编译了无数次,还是不能回复正常速度,请问您还能想到别的问题吗? |
docshen777 发表于 2024-6-27 14:45 详细说下环境和运行的指令还有计算的case等等,要不然这问题没法回答呀 |
请问,我编译了kokkos包的lammps后,4090的性能还没CPU高是怎么回事? |
本帖最后由 小葱拌豆腐 于 2024-6-25 23:50 编辑 另外,用熵大你的脚本中的命令跑REAXFF(lmp -k on g 1 -sf kk -pk kokkos cuda/aware on neigh full comm device binsize 2.8 -var x 8 -var y 4 -var z 8 -in in.* > run.log 2>&1),请问后续的命令是什么意思呢? |
本帖最后由 小葱拌豆腐 于 2024-6-25 21:31 编辑 Entropy.S.I 发表于 2024-6-25 18:21 每个任务只调用一张卡的情况下也会这样吗,我发现在不用
熵大我用你的脚本测试了一下机器跑lammps的速度,9654在有的lammps项目上表现优于13900K,而且原来不能跑的REAXFF也能算了,不知道和更新有没有关系,我用的23的lammps,cuda是12.2,速度测试我更新到上面了,同时参考了你之前做的工作进行了比较 |
多GPU机器必须使用Slurm调度,否则没法用,很容易跑出正常情况不到十分之一的性能 |
第一次发帖,似乎md格式直接粘进来排版有点稀碎 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2025-8-15 10:43 , Processed in 0.276292 second(s), 26 queries , Gzip On.