本帖最后由 Entropy.S.I 于 2024-6-5 02:47 编辑
Computex 2024上intel公布了Xeon 6的一系列SKU,分LGA-4710和LGA-7529两种Socket,对应6700系列和6900系列,命名有很大变化,不过命名在技术上并不重要,重要的是Xeon 6900P分支(Granite Rapids-AP, GNR-AP)的Top SKU有希望追上AMD EPYC Turin Classic。
Xeon GNR-AP的内核微架构是Redwood Cove,与Meteor Lake P-core的Redwood Cove不同,前者的Process Node是intel 3,而后者是intel 4,且前者的per-core L3 cache多0.75 MiB。
Xeon GNR-AP的Top SKU有128核,480 MiB L3 cache,12-Ch DDR5内存,搭配传统DIMM支持到DDR5-6400MT/s,搭配MCR DIMM支持到DDR5-8800MT/s。EPYC Turin Classic的Top SKU也是128核、12-Ch DDR5内存,L3 cache稍高,为512 MiB,但内存频率可能只有6000MT/s(尚不清楚是否支持MCR DIMM以进一步提升频率/带宽),因此Xeon GNR-AP在内存带宽上有望领先。
Xeon GNR-AP的die-to-die connection和前两代一样是EMIB,其效率远高于EPYC Turin的直接走PCB的方案,因此本世代Xeon的core-to-core latency依然领先于EPYC。
上述性能指标对于HPC应用非常重要。
另外,关于PCIe通道数量:Xeon GNR-AP单路为136 lanes Gen5,双路为2*96 lanes Gen5。EPYC Turin大概率沿用Genoa的IO Die,Genoa单路128 lanes Gen5 + 8 lanes Gen3,双路2*80 or 2*64 lanes Gen5 + 2*8 lanes Gen3。综上,Xeon GNR-AP有望领先。
值得注意的是,Xeon 6900P和EPYC Turin Classic的正式发布时间都是24Q3,两者可能会形成正面竞争,我认为AMD EPYC的处境没有以前那么乐观了。
EPYC Turin在绝对性能方面的最后一道希望是per-core performance。AMD的PPT显示128-core Zen5 EPYC Turin跑NAMD的性能达到了Xeon 8592+ (64-core Raptor Cove)的3.1倍,这说明前者的per-core performance是后者的~1.55倍。Intel的PPT显示128-core Xeon GNR-AP跑OpenFOAM和HPCG benchmark的性能是Xeon 8592+的2.3倍。虽然两项测试的软件不一样,但我倾向于推测EPYC Turin的per-core performance依然领先。
希望采用全新封装、die-to-die互联性能大幅改善、单CCX达到32核的EPYC Venice赶快问世,目前EPYC最大的弱势就是die-to-die互联性能。
|