请选择 进入手机版 | 继续访问电脑版

计算化学公社

 找回密码
 现在注册!
查看: 5623|回复: 30

[配置讨论] AMD Zen2架构处理器与linux版Gaussian的兼容性问题?(已解决)

[复制链接]

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

发表于 2020-2-21 20:22:18 | 显示全部楼层 |阅读模式
本帖最后由 pika02 于 2020-2-23 00:51 编辑

我最近装了一台R9 3950x主机,MSI的B450板子,已更新最新bios(2019-11-12),在尝试几个版本的Gaussian时出现了各种问题:

① G09W D.01,直接卡死在l302或l401
g09w卡死.png
我在学校时用过Zen架构的R5 1400跑过此版本,未出现问题。
(20200223更新)并非Zen2的锅,应该是g09w的bug,社长之前的帖子里也提到
测试了一下2696v3、Win10-64bit,G09W和G16W皆32bit,现象相同,都在302永久卡住。无论核数,内存设多少都不过去。半经验的L401同样卡住。应该是程序bug


② linux版G16 A.01,AVX2和SSE4.2版本都直接报错误“Error: illegal instruction , illegal opcode”,这是与CPU不兼容时报的错。
我在Ubuntu 18.04 LTS(WSL,VMWare和实体机)和CentOS7(VMWare)上测试过,都报该错误。

这个问题日本的計算化学.com上也有提到(https://computational-chemistry. ... 9/09/05/zen2-linux/):
Gaussian のインストール
早速 Gaussian16 revB01 を Ryzen 3900x でインストールして動かそうとしましたが、
Error: illegal instruction, illegal opcode
というエラーが出てしまい、うまく行きませんでした。
最初は、どう対処したら良いか全く分からなかったのですが、Gaussian16 revC01 に変えたら動きました!理由は、よく分かりません。
revC01 のリリース日は 7 月なので、ZEN2 に対応しているとも考えづらいです。。。

作者(X570芯片组)用G16 B.01出错,而C.01就没问题,原因尚不清楚。


我目前用G16W A.03和linux版G09 E.01,G16 B.01 SSE4.2没有发现问题,windows版ORCA 4.2.1也没问题。

总之,Zen2的CPU有点奇怪,上文博主也提到3900x刚发售的时候各种linux发行版安装/启动失败的情况,之后通过bios更新部分解决了问题。
如果你们单位的site licence是上述较老版本Gaussian,干脆Intel Yes就完事了。

===========20200222===========
按照楼下的方法,环境变量中添加
  1. export PGI_FASTMATH_CPU=sandybridge
复制代码
G16 A.01 AVX2也成功在3950x上运行起来了。



评分

参与人数 1eV +3 收起 理由
ldatea + 3 谢谢

查看全部评分

539

帖子

0

威望

1310

eV
积分
1849

Level 5 (御坂)

发表于 2020-2-21 23:06:13 | 显示全部楼层
ubuntu18lts在用qs的epyc7702倒是能正常跑g16a03,不知道消费者平台是什么情况
g09w使用在l302卡死乃是bug,什么平台都见过这种情况

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

 楼主| 发表于 2020-2-21 23:13:50 | 显示全部楼层
biogon 发表于 2020-2-21 23:06
ubuntu18lts在用qs的epyc7702倒是能正常跑g16a03,不知道消费者平台是什么情况
g09w使用在l302卡死乃是bug ...

请问你的a03是哪个指令集版本?

539

帖子

0

威望

1310

eV
积分
1849

Level 5 (御坂)

发表于 2020-2-21 23:23:28 | 显示全部楼层
pika02 发表于 2020-2-21 23:13
请问你的a03是哪个指令集版本?

avx2,我没有sse4.2的

2万

帖子

25

威望

3万

eV
积分
60831

管理员

公社社长+计算化学玩家

发表于 2020-2-21 23:34:03 | 显示全部楼层
l302卡死,用64bit windows Gaussian可以避免。不过鉴于速度太慢,没什么实际价值
北京科音自然科学研究中心http://www.keinsci.com  致力于计算化学的发展和传播,长期开办最高水准的各种量子化学、分子动力学、波函数分析与Multiwfn程序等主题的培训,是提升计算化学研究水平的最佳选择。欢迎加入“北京科音”公众号获取培训最新消息和计算化学资讯!培训相关信息见《北京科音办的培训班FAQ》(http://bbs.keinsci.com/thread-5098-1-1.html)。
欢迎加入人气最高、水准最高的综合性理论与计算化学交流QQ群:思想家公社QQ群1号:18616395,2号:466017436。合计6000人。两个群讨论范畴相同,可加入任意其一但不可都加入,申请信息必须注明具体研究方向,否则一定会被拒绝加入。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(最强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

 楼主| 发表于 2020-2-21 23:37:55 | 显示全部楼层
sobereva 发表于 2020-2-21 23:34
l302卡死,用64bit windows Gaussian可以避免。不过鉴于速度太慢,没什么实际价值

确实,linux版g16就算在虚拟机里都能比g16w快一倍

48

帖子

0

威望

895

eV
积分
943

Level 4 (黑子)

发表于 2020-2-22 02:22:40 | 显示全部楼层
本帖最后由 catenarygong 于 2020-2-22 02:33 编辑

好像zen1架构的兼容性略好一些

我1700X和2950X用G16 A.01的SSE版本和AVX2版本都没有遇到问题
ORCA一直没有问题

zen2架构我没有试过计算软件,不知道什么情况
而且有的时候兼容性和Linux内核的版本还有关系,我之前遇到过5820K不能运行ORCA的情况,更新Linux内核之后就好了

QM软件现在大家都用预编译的二进制包,在Linux系统上兼容性真的很难搞

10

帖子

0

威望

629

eV
积分
639

Level 4 (黑子)

发表于 2020-2-22 17:48:09 | 显示全部楼层
朋友新组了一个3900x,试了一把高斯,用的Vmware15虚拟机,centOS-7.6系统,AVX2版本的Gaussian 16, Revision B.01。一开始不识别指令集,报错L302,加了一个环境变量export PGI_FASTMATH_CPU=sandybridge, 就没毛病的运行了,没有报错Error: illegal instruction , illegal opcode。我是正版也就是高斯公司邮寄过来的光盘里的版本去安装的,不知道和这个有没有关系。

评分

参与人数 1eV +4 收起 理由
pika02 + 4 хорошо!

查看全部评分

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

 楼主| 发表于 2020-2-22 20:10:18 | 显示全部楼层
baisl 发表于 2020-2-22 17:48
朋友新组了一个3900x,试了一把高斯,用的Vmware15虚拟机,centOS-7.6系统,AVX2版本的Gaussian 16, Revisi ...

我才知道这个操作,高斯的代理墨灵格官方也提到
Gaussian采用PGI编译,目前无法正确识别新的AMD CPU,因此无法识别Zen+构架的AVX2指令集,导致AVX2指令集的Gaussian无法在Zen+构架下使用,并且报错
……
此时需要额外设定环境变量以解决这个问题:
  1. export PGI_FASTMATH_CPU=sandybridge
复制代码
这是相当于把zen+当作sandybridge了?



539

帖子

0

威望

1310

eV
积分
1849

Level 5 (御坂)

发表于 2020-2-23 00:16:12 | 显示全部楼层
pika02 发表于 2020-2-22 20:10
我才知道这个操作,高斯的代理墨灵格官方也提到
这是相当于把zen+当作sandybridge了?

这个还是第一次听说,我用2600跑都没遇见过这种问题

42

帖子

0

威望

385

eV
积分
427

Level 3 能力者

发表于 2020-2-28 13:07:20 | 显示全部楼层
楼主你的主板是微星的哪个B450? 开PBO了没?散热器用的哪个? 我最近打算整个3950X的主机,选主板纠结X570还是B450,怕B450的供电扛不住PBO

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

 楼主| 发表于 2020-2-29 02:58:10 | 显示全部楼层
天道啊啊 发表于 2020-2-28 13:07
楼主你的主板是微星的哪个B450? 开PBO了没?散热器用的哪个? 我最近打算整个3950X的主机,选主板纠结X570 ...

https://pikakolendo.hatenablog.com/entry/2020/02/20/024006
PBO全自动,电压offset -0.875V,单烤fpu非常稳,不往死里超频的话供电完全没问题
B450的话可以考虑迫击炮以上等级的主板,我在学校有一块战斧导弹,供电非常好,可惜我一时半会也拿不到了

42

帖子

0

威望

385

eV
积分
427

Level 3 能力者

发表于 2020-3-4 10:52:03 | 显示全部楼层
本帖最后由 天道啊啊 于 2020-3-4 11:03 编辑

我前两天上了一个3950X+技嘉x570i,散热利民AXP100纯铜,机箱是乔思伯T8,没降压开FPU开PBO烤鸡160W左右,温度95,觉得散热不是很好。我用WIN10跑ORCA,指定pal16,温度75左右全核心4G,CPU总利用率总体只有50%,觉得有点奇怪

65

帖子

1

威望

340

eV
积分
425

Level 3 能力者

 楼主| 发表于 2020-3-4 13:12:36 | 显示全部楼层
本帖最后由 pika02 于 2020-3-4 14:40 编辑
天道啊啊 发表于 2020-3-4 10:52
我前两天上了一个3950X+技嘉x570i,散热利民AXP100纯铜,机箱是乔思伯T8,没降压开FPU开PBO烤鸡160W左右, ...

任务管理器里看的利用率不准的,具体可以参考社长博文关于超线程的
我试过强行设成32核跑,占用率看着到100%了,但最终速度一点都没变快

乔思伯t8挺闷罐的吧,而且只能上这种很矮的散热器,那肯定不太行,你用什么硅脂?
我不降压全核3.9跑fpu才70多度
哦对,技嘉主板的电压管理有点问题,具体记不清了,最好不要超频

111

帖子

0

威望

761

eV
积分
872

Level 4 (黑子)

发表于 2020-3-4 13:19:12 | 显示全部楼层
天道啊啊 发表于 2020-3-4 10:52
我前两天上了一个3950X+技嘉x570i,散热利民AXP100纯铜,机箱是乔思伯T8,没降压开FPU开PBO烤鸡160W左右, ...

用下压式风冷压3950X?
您需要登录后才可以回帖 登录 | 现在注册!

本版积分规则

手机版|北京科音自然科学研究中心|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949-1号 )

GMT+8, 2020-11-28 06:48 , Processed in 0.167945 second(s), 28 queries .

快速回复 返回顶部 返回列表