本帖最后由 kotori 于 2024-7-24 22:20 编辑 乐平 发表于 2024-7-21 15:05 感谢您指出问题,这里我表达有误
configure:12787: checking if user requested PMI support 这样编译过程中就能顺利找到pmi.h头文件,就不会出现报错了 |
kotori 发表于 2024-7-21 02:00 谢谢您的讨论 我之前是注释掉了这几行,见 7 楼的内容 http://bbs.keinsci.com/forum.php ... 10&fromuid=1532 另外,您提到
这里返回的 srun 的路径 但是,补充的路径却写着
是不是笔误?或者会造成误解? |
最近在组里新机器上编译也遇到了这个问题 定位了一下问题发现是tools/toolchain/scripts/stage1/install_openmpi.sh里面的第60行
|
也有不用动install_openmpi.sh的解决方案,可以echo $PATH 看看你的$PATH里有啥,然后把slurm的bin和其他没用的path都从path里清出去 |
乐平 发表于 2023-4-23 20:39 很好的解决了问题 谢谢您 |
乐平 发表于 2023-12-20 10:26 你好,之前问的是编译的问题;不过后续我用module采用用集群的gcc9.3.0 然后安装toolchain里的openmpi,就没有报错了;可以正常运行,谢谢回复! |
海鸥 发表于 2023-12-19 16:29 你说的是哪个问题? 编译问题已经解决,看我最后的回复。 测试还是那几个没通过 open mpi 还是有类似的 .log |
楼主现在有解决这个问题吗 |
本帖最后由 乐平 于 2023-4-23 21:13 编辑 pwzhou 发表于 2023-3-30 19:41 专门回来感谢您! 最终还是绕过了 slurm,编译成功。 具体而言是注释掉了 tools/toolchain/scripts/stage1/install_openmpi.sh 里第 58 -- 63 行,以及第 68 -- 69 行。
跳过了 slurm 之后就一切顺利了。 编译完之后运行测试,
经过大约 47 分钟,最终得到测试报告如下:
3933 个测试任务正常完成 3926 个,有 5 个失败,2 个错误。这些内容可以 regtesting/TEST-local-psmp-XXXXX/error_summary(XXXXX 为运行测试的年-月-日_时间),具体错误的算例包括:
从 error_summary 中还可以看到有如下的警告和报错信息:
似乎是内存以及 open mpi 的问题造成的? 单独拿 benchmark/QS/H2O-64.inp 作为测试例子,用 slurm 作业调度系统提交任务,
能运行得到结果。 H2O-64.out 文件似乎是正常的,能正常完成自洽计算(SCF),速度也还算比较快。
不过呢,计算过程中会产生 “任务号.log” 文件,里面也有用 make test 出现的类似的报错信息
不知道这个 open mpi 报错信息应该如何纠正? 或者不理它会不会有什么影响? |
参与人数Participants 2 | eV +10 | 收起 理由Reason |
---|---|---|
John_Tao | + 5 | 谢谢 |
Rosefinch | + 5 | 赞! |
pwzhou 发表于 2023-3-30 19:41 非常感谢您的回复。 我先联系曙光的工程师,把 slurm-devel 包装上试试。 |
pwzhou 发表于 2023-3-30 19:37 另外,安装opnempi时可以不用--with-pmi,后期照样可以用slurm来调度,所以可以在编译的时候把slurm的路径从环境变量里面临时去掉,然后openmpi编译的时候就不会自动加上--with-pmi了。所以,如果slurm-devel这个包的问题解决不了的话,就临时去掉slurm的环境变量再编译。 |
乐平 发表于 2023-3-30 19:20 要正确编译的话需要slurm-devel这个包,这个包里面有需要的头文件。 看你这个目录安装的应该是曙光打包的slurm,问问系统管理员或者曙光的工程师,让把slurm-devel这个包安装上即可。 |
找到slurm的相关文件即可。 如果这个集群采用的是自己修改或者自定义编译的slurm, 处理起来比较麻烦…… 找到安装位置即可。 另,在任何形式的机器上,如有调度器, 当然是编译MPI的时候,要告诉它, 要支持XXX调度器。 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-23 17:07 , Processed in 0.202579 second(s), 27 queries , Gzip On.