计算化学公社

 找回密码 Forget password
 注册 Register

LAMMPS中密度不均一体系域分解问题,和性能调优的一点经验

查看数: 2373 | 评论数: 11 | 收藏 Add to favorites 9
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2023-8-7 18:48

正文摘要:

本帖最后由 Graphite 于 2025-5-27 10:48 编辑 1、起因 在用LAMMPS帮别人用多体势算一些无机材料体系时,因为性能调优很是折腾了一阵子。 这些体系包括纳米团簇、金属-液体界面、气相热解等。 共同的特点是性 ...

回复 Reply

Graphite 发表于 Post on 2025-4-3 14:24:40
Tomii 发表于 2025-4-3 10:33
感谢老师回复,我按照您的建议尝试了一下,我的体系要一直调到3才会正常运行,我再试一下均衡效果提升明 ...

我也遇到过,这样计算效果很差,我怀疑算法不是太好,后来我那体系的pair能用gpu还是kokkos的加速,索性拿显卡算了,单线程拉显卡不存在域分解。
Tomii 发表于 Post on 2025-4-3 10:33:14
Graphite 发表于 2025-3-28 20:14
这个根据经验多半是你的域分解算法卡死了,因为找不到一个合适解能够做到负载最大/最小< 110%
密度越大 ...

感谢老师回复,我按照您的建议尝试了一下,我的体系要一直调到3才会正常运行,我再试一下均衡效果提升明显不
Graphite 发表于 Post on 2025-3-28 20:14:56
Tomii 发表于 2025-3-28 15:44
老师您好,请问为什么我用
fix 9 all balance 1000 1.1 shift x 10 1.1
fix 9 all balance 1000 1.1 rcb ...

这个根据经验多半是你的域分解算法卡死了,因为找不到一个合适解能够做到负载最大/最小< 110%
密度越大的部分负载越大,金属纳米团簇是高负载,水分子是低负载,这个体系可能要把不平衡度(换句话说,负载差距系数)调到1.5甚至2。
Tomii 发表于 Post on 2025-3-28 15:44:46
Tomii 发表于 2025-3-28 15:44
老师您好,请问为什么我用
fix 9 all balance 1000 1.1 shift x 10 1.1
fix 9 all balance 1000 1.1 rcb ...

如果可能的话期望老师回复一下
Tomii 发表于 Post on 2025-3-28 15:44:22
老师您好,请问为什么我用
fix 9 all balance 1000 1.1 shift x 10 1.1
fix 9 all balance 1000 1.1 rcb
balance 1.1 shift x 100 1.1
balance 1.1 rcb
均会卡死?
我的体系是中心一个金属纳米团簇,周围随机分布水分子
目前还不会计算 发表于 Post on 2024-5-1 21:13:19
我最近用GPU加速lammps计算,kokkos加速,然后发现计算发现,单卡的适合计算没问题,但是多卡并行计算的时候,发现只一个卡在计算,其他卡基本上出工不出力,功耗很低,,调用不起来,不知道你遇到过没有
lmch 发表于 Post on 2024-2-28 21:52:31
Graphite 发表于 2024-2-27 18:55
节点间mpi通信+节点内部分omp还可以,具体看整个计算系统的架构,要最大化性能得专门调优,找到甜区,比 ...

感谢,测试上4~8 OMP效果上要相对好一些,有些集群很怪,纯MPI居然跑不起来
Graphite 发表于 Post on 2024-2-27 18:55:05
本帖最后由 Graphite 于 2024-2-27 18:56 编辑
lmch 发表于 2024-2-27 15:36
多节点的话OMP包加速的效果怎么样,我自己测感觉要比纯MPI并行的效果好一些

节点间mpi通信+节点内部分omp还可以,具体看整个计算系统的架构,要最大化性能得专门调优,找到甜区,比如4 node× 8 MPI×4 OMP之类。
lmch 发表于 Post on 2024-2-27 15:36:00
Graphite 发表于 2024-1-25 15:09
大部分情况值得一试tiled+rcb,但不绝对:一方面是有些功能/fix只适配第一种最简单划分;另一方面是复杂 ...

多节点的话OMP包加速的效果怎么样,我自己测感觉要比纯MPI并行的效果好一些
Graphite 发表于 Post on 2024-1-25 15:09:47
ggshining 发表于 2024-1-24 22:32
从图中来看是不是表明tiled样式+rcb方式的划分最好?是否推荐用这个样式,还是推荐中间的brick样式+shift方 ...

大部分情况值得一试tiled+rcb,但不绝对:一方面是有些功能/fix只适配第一种最简单划分;另一方面是复杂划分舍弃了空间上的平均均,在如含能材料向真空爆炸、快速的冲击、蒸发等情况下,容易粒子越界崩。(不过这些情况也不用跑太久就是了)
ggshining 发表于 Post on 2024-1-24 22:32:20
从图中来看是不是表明tiled样式+rcb方式的划分最好?是否推荐用这个样式,还是推荐中间的brick样式+shift方式?

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 22:06 , Processed in 0.355905 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list