|
注1:以下测试仅仅代表我个人机器,个人的任务,不具有代表性;
注2:该贴主要是回馈网友,回馈论坛,从该论坛学到太多,也十分感谢网友的耐心解答,整理出来为该论坛添砖加瓦;
背景:
10月份的时候,差不多结余10万经费,犹豫是采购9654还是8336C。当时在论坛问过,感兴趣的可以去查阅相关帖子。租了机器做了相关测试后,决定采购单路9654。12月中旬,3台单路9654采购上架。
运行情况:
1. 软件兼容性,我是直接dd克隆的8336C上的系统盘,ubuntu server 2204 LTS,update & upgrade,没有任何bug,运行半个月也没出现兼容性问题;
2. 稳定性,和intel 的机器无任何区别,干了半个月重活,一切正常;
3. 速度,VASP任务,算已经优化好结构的能量,只有一个离子步骤,电子步在13-16s波动。9654,96core,export OMP_NUM_THREADS=4,KPAR = 4,耗时:309s;双路8336C 365s。性能提升18%。双路9242 96核心,耗时 277s。
注:最开始拿到机器后,考虑过各类调优,目前的这个参数,已经是我测试的最优;再调整,区别不大,就把这套参数写入到提交脚本中去了;
PS:上周末intel oneapi更新到了2024,我也就赶了个时髦,更新了哈。
复制了一个makefile.inxx_intel_omp的脚本,用intel的mpi编译了,结果速度和AOCC AOCL Openmpi编译的基本上没啥区别,对300s左右的任务,区别在5s,可以忽略了。
机器价格分享:
双路8336(3200 三星 512G内存,1T硬盘)价格是2.7万出头,单路9654(4800三星 384G内存)是4.2万出头,没过4.3万。所有的机器都含税,都走正规的央采、或者地方采购流程。
总结一下:
1. 9654这块U在AVX 512指令集的加持下,软件生态上的劣势在逐步压缩;
2. intel openapi在9654平台上编译VASP,基本上没问题了;
3. 至于96核性能和64核 性能差异为啥只有不到20%:主要原因在于计算瓶颈可能不在CPU性能上,在内存读取速度、数据传输等;
4. 9004系列的CPU,相较于intel 三代,构架上大概率是不利于VASP等计算的,但通过高主频、高内存带宽及AVX 512指令集得以弥补;
5. 拿到这个机器之前,有空就会逛逛论坛,看看测评啥的。上周编译vasp时,突然想通:amd 不就是把几个CPU Die贴到一起,这个某种意义上就类似多块Intel CPU并行的,CPU Die内的集中起来干一件事情或者两件事情,用上openmp编译绝对会有优势。比较通俗,纯属个人愚见。
|
评分 Rate
-
查看全部评分 View all ratings
|