计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2651|回复 Reply: 13
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 已解决 | Gaussain16在海光cpu上存在兼容性问题么

[复制链接 Copy URL]

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

本帖最后由 ZZU_SCU 于 2023-8-14 19:00 编辑

初次在超算上安装Gaussian软件,国家超算计算郑州中心的海光CPU和Gaussian16存在兼容性问题么?
通过SSH提交任务后,会出现如下错误。输出文件运行到如下就不再输出

  1. ******************************************
  2. Gaussian 16:  ES64L-G16RevA.03 25-Dec-2016
  3.                  2-Aug-2023
  4. ******************************************
  5. %nprocshared=32
  6. Will use up to   32 processors via shared memory.
复制代码

  1. Error: This program was not built to run on the processor in your system
  2.        Unknown CPU vendor
复制代码


评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
黑色桃花 + 5 赞!

查看全部评分 View all ratings

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

2#
发表于 Post on 2023-8-2 15:13:01 | 只看该作者 Only view this author
你可以在集群的命令行里输入
  1. cat /proc/cpuinfo
复制代码

用于查看 CPU 的型号

当然,最好是 ssh 到计算节点之后再输入上面的命令

846

帖子

16

威望

4634

eV
积分
5800

Level 6 (一方通行)

小屁孩

3#
发表于 Post on 2023-8-2 16:33:11 | 只看该作者 Only view this author
使用C01、C02即可

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
ZZU_SCU + 5 解决了问题

查看全部评分 View all ratings

- 向着虚无前进 -

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

4#
 楼主 Author| 发表于 Post on 2023-8-2 16:35:22 | 只看该作者 Only view this author
乐平 发表于 2023-8-2 15:13
你可以在集群的命令行里输入

用于查看 CPU 的型号

谢谢,我看了所有的CPU型号都是海光的。他们建议用G09

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2023-8-2 16:57:30 | 只看该作者 Only view this author

我试一下然后再联系您

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

6#
 楼主 Author| 发表于 Post on 2023-8-11 11:29:37 | 只看该作者 Only view this author
ZZU_SCU 发表于 2023-8-2 16:57
我试一下然后再联系您

目前,安装C02版本可以计算单点能和几何优化。计算td激发时,有报错。接下来
  1. Error during math dispatch processing...
  2. __nvmath_abort:Math dispatch table is either misconfigured or corrupted.
复制代码

可能是g16 prior to C01 will not run on newer AMD using the AVX2 instruction set of Zen+ architecture.问题。准备尝试C01 AVX版本。

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

7#
发表于 Post on 2023-8-11 23:57:23 | 只看该作者 Only view this author
ZZU_SCU 发表于 2023-8-11 11:29
目前,安装C02版本可以计算单点能和几何优化。计算td激发时,有报错。接下来

可能是g16 prior to C01  ...

看你最后贴的信息,应该是指令集的问题。

这就是我在 2楼说的,请你用 cat /proc/cpuinfo 命令查看 CPU 信息的原因之一。这个命令可以除了看 CPU 型号外,还可以查看 CPU 支持的指令集。

186

帖子

1

威望

505

eV
积分
711

Level 4 (黑子)

8#
发表于 Post on 2023-8-12 16:01:44 | 只看该作者 Only view this author
海光是从amd那儿讨到的zen架构与x86指令集,据网上测试[1],旧的sse向量化指令集能跑、略慢,avx/avx2之类新一点的显示也能跑但实测跑不了,不知道是测试方的问题还是普遍问题。
可以自己搓个汇编小程序验一下指令集可靠性,不行可能得换SSE指令集版乃至完全不带向量化加速的ES64L版;g09发布的年代还没有avx向量化指令集,也就和海光平台不存在兼容问题。
[1] https://www.cnblogs.com/Janly/p/14622286.html

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
ZZU_SCU + 5 感谢专业的回答

查看全部评分 View all ratings

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

9#
 楼主 Author| 发表于 Post on 2023-8-12 16:25:53 | 只看该作者 Only view this author
啊不错的飞过海 发表于 2023-8-12 16:01
海光是从amd那儿讨到的zen架构与x86指令集,据网上测试[1],旧的sse向量化指令集能跑、略慢,avx/avx2之类 ...

我按照不同版本的安装结果回复您
首先g16 C02 AVX2可以跑opt freq不能跑td,报错如下
  1. Error during math dispatch processing...
  2. __nvmath_abort:Math dispatch table is either misconfigured or corrupted.
复制代码

g16 C01 AVX,g16 B 和g09 D直接不识别CPU,报错如下
  1. Error: This program was not built to run on the processor in your system
  2.        Unknown CPU vendor
  3.   --- traceback not available
复制代码

上述软件没有问题,可以在并行超算上运行
目前等工程师安装g09吧,我部署超算的能力差一些,刚着手

186

帖子

1

威望

505

eV
积分
711

Level 4 (黑子)

10#
发表于 Post on 2023-8-12 16:56:53 | 只看该作者 Only view this author
ZZU_SCU 发表于 2023-8-12 16:25
我按照不同版本的安装结果回复您
首先g16 C02 AVX2可以跑opt freq不能跑td,报错如下


按nvidia开发者社区的说法[1],g16 C02 AVX2这个报错应该就是指令集不支持问题,他们在只支持到SSE4.2的机器上用默认开启AVX的NVFortran/NVCC编译的调自带数学库的程序报了一样的错。
也许可以问问管理员有没有开启AVX2的节点?网上有说法称海光CPU是支持AVX2指令集的,但是可以手动关闭,也许郑州超算就是关了一部分(或所有)节点的AVX2的。或者干脆换用ORCA算,ORCA的预编译版指令集优化好像搞得很保守,安装也简单,可以试试。

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

11#
 楼主 Author| 发表于 Post on 2023-8-13 14:18:05 | 只看该作者 Only view this author
啊不错的飞过海 发表于 2023-8-12 16:56
按nvidia开发者社区的说法[1],g16 C02 AVX2这个报错应该就是指令集不支持问题,他们在只支持到SSE4.2 ...

好的,我问一下管理员呢是否关闭了节点的AVX2呢?

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

12#
 楼主 Author| 发表于 Post on 2023-8-14 18:59:36 | 只看该作者 Only view this author
  1. export PGI_FASTMATH_CPU=sandybridge
复制代码


在.sh或者bashrc文件中添加上述命令可以顺利运行C02 AVX2版本的Gaussian。详情请见http://sobereva.com/439

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
fantexi113 + 1 正解

查看全部评分 View all ratings

31

帖子

0

威望

1439

eV
积分
1470

Level 4 (黑子)

13#
发表于 Post on 2023-8-31 12:49:19 | 只看该作者 Only view this author
是有问题的,我们是自己编译了一遍瓜丝c01方才跑起来的。
如果你在这充钱了,我建议用完就跑,这水平不如我们组捡的电子垃圾。

145

帖子

0

威望

2948

eV
积分
3093

Level 5 (御坂)

14#
 楼主 Author| 发表于 Post on 2023-8-31 17:54:59 | 只看该作者 Only view this author
鬼隐 发表于 2023-8-31 12:49
是有问题的,我们是自己编译了一遍瓜丝c01方才跑起来的。
如果你在这充钱了,我建议用完就跑,这水平不如 ...

没有充钱。博士期间用的并行,服务是保姆级别的;以至于我现在用这个不习惯,但是被迫学了更多编译知识。我也不打算用这个,启动,上传任务,下载,查看(没有历史记录),运算速度以及整个界面都不好用,但不得不说免费,有部分软件版权这最大的优点。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:11 , Processed in 0.195994 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list