abin 发表于 2023-9-19 13:17
提供一个别人报告的事情.
一位不愿意透漏姓名的网友报告:
Janus 发表于 2023-9-19 14:06
这个....您应该免费调优,出个系统的报告出来,后期客户可能源源不断。
这里面涉及的东西,还是有点技术 ...
abin 发表于 2023-9-19 18:19
你来吧……
有人提供这几十万的设备吗?
wypkdhd 发表于 2023-9-21 17:58
就abin大佬说的,amd编译vasp,我正儿八经见人测试过,用amd自己给的方法,完全不如用intel全家桶,用intel ...
Picardo 发表于 2023-9-21 15:30
有一说一,有能力搞那个的,除非是对计算特别有兴趣,肯定不会来搞计算的,大把的米可以挣
Entropy.S.I 发表于 2023-9-21 19:14
9754不必考虑,从架构上来说就有明显缺陷。每1个CCD、2个CCX、16个核心,共享一条GMI链路,并且全核心满载 ...
abin 发表于 2023-9-21 18:43
另,根据VASP官方说法,
使用AoCC套件,需要使用特定的MPI,
否则容易有内存溢出……他们的站点有写的… ...
wypkdhd 发表于 2023-9-21 17:58
就abin大佬说的,amd编译vasp,我正儿八经见人测试过,用amd自己给的方法,完全不如用intel全家桶,用intel ...
Janus 发表于 2023-9-22 13:24
看了看,目前来说,Intel的还是靠谱点。基本上intel了
Entropy.S.I 发表于 2023-9-25 16:21
测试结果出来了,VASP6.4.2,AOCC4.1+AOCL4.1,双路EPYC 9654(192个Zen4内核,实际频率3.7GHz)速度是双 ...
abin 发表于 2023-9-25 18:03
192/80=2.4
实际2.3倍……
Entropy.S.I 发表于 2023-9-25 16:21
测试结果出来了,VASP6.4.2,AOCC4.1+AOCL4.1,双路EPYC 9654(192个Zen4内核,实际频率3.7GHz)速度是双 ...
Janus 发表于 2023-9-25 23:09
按照您的这个结果,可能单路的EPYC 96 core 效益可能更优
chrinide 发表于 2023-9-26 14:42
正解,单路并行效率应该会更高一些,牙膏厂的U并行效率一直比按摩店低一些
Entropy.S.I 发表于 2023-9-26 15:39
这是什么经验?我印象里intel Xeon由于核间延迟低且均匀,并行效率比AMD EPYC高很多,单颗CPU里甚至不需 ...
Entropy.S.I 发表于 2023-9-26 15:39
这是什么经验?我印象里intel Xeon由于核间延迟低且均匀,并行效率比AMD EPYC高很多,单颗CPU里甚至不需 ...
Weldingspock 发表于 2023-9-26 21:17
有没有大佬之后会测9554,刚好实验室买了这个型号
Entropy.S.I 发表于 2023-9-25 18:45
又做了一些tuning,现在是2.75倍
chrinide 发表于 2023-9-26 16:06应该是中古时代的经验,当时还是皓龙的U,我记得测试过当时很多程序的并行效率,确实AMD比同时代的X ...
Entropy.S.I 发表于 2023-9-26 15:09
VASP等@KiritsuguPapa 的分析吧。目前看来纯泛函(https://github.com/hpc-uk/archer ... in/others/VASP/T ...
renzhogn424 发表于 2023-9-27 14:24
请教一下,如何进行map-by l3cache? MPI*OMP=64*3是export OMP_NUM_THREADS=3 ,然后mpirun -n 64....对 ...
renzhogn424 发表于 2023-9-27 14:24
请教一下,如何进行map-by l3cache? MPI*OMP=64*3是export OMP_NUM_THREADS=3 ,然后mpirun -n 64....对 ...
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) | Powered by Discuz! X3.3 |