sobereva 发表于 2018-6-25 19:59 明白啦 |
xiaowandouer 发表于 2018-6-25 16:42 跟这个没关系。 AVX2比AVX版也快不了太多,不要把这个当做关键性因素 |
五十八 发表于 2018-5-1 10:03 可以给下配置单和价格吗? 另外,小白想请教各位,如果高斯的指令集还是AVX,是不是用高配的服务器其速度也无法得到最大提升;而指令集是AVX2的,在高配服务器上会比AVX快? |
根据黎书华的说法,天朝包括他在内,好像只有两个课题组向高斯买过源代码。(我现在才知道原来有人从国外向高斯买源代码。。。) |
本帖最后由 五十八 于 2018-6-18 11:29 编辑 binarec 发表于 2018-6-17 22:18 额 我们确实是16个核心的 实在抱歉,可能是因为我一直记着配置单上是2697 v3 刚刚看了下 应该是2698 v3 另外所使用的VASP 不是5.4.1 查看,此外 ibm官方测试的环境如下 AVX512: Intel® Compiler 17.0.1.132, Intel® MPI 2017u1, ELPA 2016.05.004. Optimization Flags: “-O3 -xCORE-AVX512“. AVX2: Intel® Compiler 17.0.1.132, Intel® MPI 2017u1, ELPA 2016.05.004. Optimization Flags: “-O3 -xCORE-AVX2“. E5-2697 v4: 2S Intel® Xeon® processor E5-2697 v4 2.3 GHz , 18 Cores/Socket, 36 Cores, 72 Threads, HT on, turbo off, BIOS 86B0271.R00, 128GB total memory, 2400 MT/s DDR4 RDIMM, Red Hat Enterprise Linux* 7.2 kernel 3.10.0-327. Gold 6148: Dual Socket Intel® Xeon® processor Gold 6148 2.4 GHz , 20 Cores/Socket, 40 Cores, 80 Threads, HT on, turbo off, BIOS 86B.01.00.0412, 192GB total memory, 2666 MT/s / DDR4 RDIMM, Red Hat Enterprise Linux* 7.2 kernel 3.10.0-327. |
另外2697v3是14核心28线程,如果用16核心32线程已经是用了两块cpu了 |
五十八 发表于 2018-5-1 10:03 AVX512是和哪个预编译指令相比快了6倍多?AVX或AVX2吗? 之前看博客上有人测试,AVX2编译的Haswell处理器比AVX编译的SandyBridge处理器大概只快了百分之十几,博主说VASP(版本大概是5.3.5还是5.4.1?)只针对AVX指令集作了优化,对AVX2并没有特别的优化 |
heguscu 发表于 2018-5-30 14:19 对呀 但是不是从天朝买的 |
五十八 发表于 2018-5-29 17:42 貌似天朝不卖源代码啊 |
heguscu 发表于 2018-5-29 13:58 可以买源码呀 光盘里WKSSRC.TGZ解压缩之后就是源码了 |
五十八 发表于 2018-5-1 10:03 gaussian09 怎么搞到源代码来编译的?不是只能买预编译好的文件吗 |
hakuna 发表于 2018-5-2 20:36 是的 |
qchem 发表于 2018-5-2 16:19 是的 是总效率 因为6140是18个核心 而2697是16个 |
五十八 发表于 2018-5-1 19:05 一颗6140轻松干掉了两颗2697v3,真的很强悍!不过6140价格也挺强悍的^-^ 不过,编VASP时是否也可以加类似xCORE-AVX来提高执行效率呢? |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-27 11:11 , Processed in 0.780593 second(s), 24 queries , Gzip On.