计算化学公社

标题: 已解决 | Gaussain16在海光cpu上存在兼容性问题么 [打印本页]

作者
Author:
ZZU_SCU    时间: 2023-8-2 13:21
标题: 已解决 | Gaussain16在海光cpu上存在兼容性问题么
本帖最后由 ZZU_SCU 于 2023-8-14 19:00 编辑

初次在超算上安装Gaussian软件,国家超算计算郑州中心的海光CPU和Gaussian16存在兼容性问题么?
通过SSH提交任务后,会出现如下错误。输出文件运行到如下就不再输出

  1. ******************************************
  2. Gaussian 16:  ES64L-G16RevA.03 25-Dec-2016
  3.                  2-Aug-2023
  4. ******************************************
  5. %nprocshared=32
  6. Will use up to   32 processors via shared memory.
复制代码

  1. Error: This program was not built to run on the processor in your system
  2.        Unknown CPU vendor
复制代码



作者
Author:
乐平    时间: 2023-8-2 15:13
你可以在集群的命令行里输入
  1. cat /proc/cpuinfo
复制代码

用于查看 CPU 的型号

当然,最好是 ssh 到计算节点之后再输入上面的命令
作者
Author:
Entropy.S.I    时间: 2023-8-2 16:33
使用C01、C02即可
作者
Author:
ZZU_SCU    时间: 2023-8-2 16:35
乐平 发表于 2023-8-2 15:13
你可以在集群的命令行里输入

用于查看 CPU 的型号

谢谢,我看了所有的CPU型号都是海光的。他们建议用G09
作者
Author:
ZZU_SCU    时间: 2023-8-2 16:57
Entropy.S.I 发表于 2023-8-2 16:33
使用C01、C02即可

我试一下然后再联系您
作者
Author:
ZZU_SCU    时间: 2023-8-11 11:29
ZZU_SCU 发表于 2023-8-2 16:57
我试一下然后再联系您

目前,安装C02版本可以计算单点能和几何优化。计算td激发时,有报错。接下来
  1. Error during math dispatch processing...
  2. __nvmath_abort:Math dispatch table is either misconfigured or corrupted.
复制代码

可能是g16 prior to C01 will not run on newer AMD using the AVX2 instruction set of Zen+ architecture.问题。准备尝试C01 AVX版本。
作者
Author:
乐平    时间: 2023-8-11 23:57
ZZU_SCU 发表于 2023-8-11 11:29
目前,安装C02版本可以计算单点能和几何优化。计算td激发时,有报错。接下来

可能是g16 prior to C01  ...

看你最后贴的信息,应该是指令集的问题。

这就是我在 2楼说的,请你用 cat /proc/cpuinfo 命令查看 CPU 信息的原因之一。这个命令可以除了看 CPU 型号外,还可以查看 CPU 支持的指令集。
作者
Author:
啊不错的飞过海    时间: 2023-8-12 16:01
海光是从amd那儿讨到的zen架构与x86指令集,据网上测试[1],旧的sse向量化指令集能跑、略慢,avx/avx2之类新一点的显示也能跑但实测跑不了,不知道是测试方的问题还是普遍问题。
可以自己搓个汇编小程序验一下指令集可靠性,不行可能得换SSE指令集版乃至完全不带向量化加速的ES64L版;g09发布的年代还没有avx向量化指令集,也就和海光平台不存在兼容问题。
[1] https://www.cnblogs.com/Janly/p/14622286.html
作者
Author:
ZZU_SCU    时间: 2023-8-12 16:25
啊不错的飞过海 发表于 2023-8-12 16:01
海光是从amd那儿讨到的zen架构与x86指令集,据网上测试[1],旧的sse向量化指令集能跑、略慢,avx/avx2之类 ...

我按照不同版本的安装结果回复您
首先g16 C02 AVX2可以跑opt freq不能跑td,报错如下
  1. Error during math dispatch processing...
  2. __nvmath_abort:Math dispatch table is either misconfigured or corrupted.
复制代码

g16 C01 AVX,g16 B 和g09 D直接不识别CPU,报错如下
  1. Error: This program was not built to run on the processor in your system
  2.        Unknown CPU vendor
  3.   --- traceback not available
复制代码

上述软件没有问题,可以在并行超算上运行
目前等工程师安装g09吧,我部署超算的能力差一些,刚着手
作者
Author:
啊不错的飞过海    时间: 2023-8-12 16:56
ZZU_SCU 发表于 2023-8-12 16:25
我按照不同版本的安装结果回复您
首先g16 C02 AVX2可以跑opt freq不能跑td,报错如下


按nvidia开发者社区的说法[1],g16 C02 AVX2这个报错应该就是指令集不支持问题,他们在只支持到SSE4.2的机器上用默认开启AVX的NVFortran/NVCC编译的调自带数学库的程序报了一样的错。
也许可以问问管理员有没有开启AVX2的节点?网上有说法称海光CPU是支持AVX2指令集的,但是可以手动关闭,也许郑州超算就是关了一部分(或所有)节点的AVX2的。或者干脆换用ORCA算,ORCA的预编译版指令集优化好像搞得很保守,安装也简单,可以试试。
作者
Author:
ZZU_SCU    时间: 2023-8-13 14:18
啊不错的飞过海 发表于 2023-8-12 16:56
按nvidia开发者社区的说法[1],g16 C02 AVX2这个报错应该就是指令集不支持问题,他们在只支持到SSE4.2 ...

好的,我问一下管理员呢是否关闭了节点的AVX2呢?
作者
Author:
ZZU_SCU    时间: 2023-8-14 18:59
  1. export PGI_FASTMATH_CPU=sandybridge
复制代码


在.sh或者bashrc文件中添加上述命令可以顺利运行C02 AVX2版本的Gaussian。详情请见http://sobereva.com/439
作者
Author:
鬼隐    时间: 2023-8-31 12:49
是有问题的,我们是自己编译了一遍瓜丝c01方才跑起来的。
如果你在这充钱了,我建议用完就跑,这水平不如我们组捡的电子垃圾。
作者
Author:
ZZU_SCU    时间: 2023-8-31 17:54
鬼隐 发表于 2023-8-31 12:49
是有问题的,我们是自己编译了一遍瓜丝c01方才跑起来的。
如果你在这充钱了,我建议用完就跑,这水平不如 ...

没有充钱。博士期间用的并行,服务是保姆级别的;以至于我现在用这个不习惯,但是被迫学了更多编译知识。我也不打算用这个,启动,上传任务,下载,查看(没有历史记录),运算速度以及整个界面都不好用,但不得不说免费,有部分软件版权这最大的优点。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3