Tomii 发表于 2025-4-3 10:33 我也遇到过,这样计算效果很差,我怀疑算法不是太好,后来我那体系的pair能用gpu还是kokkos的加速,索性拿显卡算了,单线程拉显卡不存在域分解。 |
Graphite 发表于 2025-3-28 20:14 感谢老师回复,我按照您的建议尝试了一下,我的体系要一直调到3才会正常运行,我再试一下均衡效果提升明显不 |
Tomii 发表于 2025-3-28 15:44 这个根据经验多半是你的域分解算法卡死了,因为找不到一个合适解能够做到负载最大/最小< 110% 密度越大的部分负载越大,金属纳米团簇是高负载,水分子是低负载,这个体系可能要把不平衡度(换句话说,负载差距系数)调到1.5甚至2。 |
Tomii 发表于 2025-3-28 15:44 如果可能的话期望老师回复一下 |
老师您好,请问为什么我用 fix 9 all balance 1000 1.1 shift x 10 1.1 fix 9 all balance 1000 1.1 rcb balance 1.1 shift x 100 1.1 balance 1.1 rcb 均会卡死? 我的体系是中心一个金属纳米团簇,周围随机分布水分子 |
我最近用GPU加速lammps计算,kokkos加速,然后发现计算发现,单卡的适合计算没问题,但是多卡并行计算的时候,发现只一个卡在计算,其他卡基本上出工不出力,功耗很低,,调用不起来,不知道你遇到过没有 |
Graphite 发表于 2024-2-27 18:55 感谢,测试上4~8 OMP效果上要相对好一些,有些集群很怪,纯MPI居然跑不起来 |
本帖最后由 Graphite 于 2024-2-27 18:56 编辑 lmch 发表于 2024-2-27 15:36 节点间mpi通信+节点内部分omp还可以,具体看整个计算系统的架构,要最大化性能得专门调优,找到甜区,比如4 node× 8 MPI×4 OMP之类。 |
Graphite 发表于 2024-1-25 15:09 多节点的话OMP包加速的效果怎么样,我自己测感觉要比纯MPI并行的效果好一些 |
ggshining 发表于 2024-1-24 22:32 大部分情况值得一试tiled+rcb,但不绝对:一方面是有些功能/fix只适配第一种最简单划分;另一方面是复杂划分舍弃了空间上的平均均,在如含能材料向真空爆炸、快速的冲击、蒸发等情况下,容易粒子越界崩。(不过这些情况也不用跑太久就是了) |
从图中来看是不是表明tiled样式+rcb方式的划分最好?是否推荐用这个样式,还是推荐中间的brick样式+shift方式? |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2025-8-14 22:06 , Processed in 0.355905 second(s), 26 queries , Gzip On.