提供一个别人报告的事情.
一位不愿意透漏姓名的网友报告:
Intel平台
9242双路 + 12*32GB, 关闭超线程
通过10Gb OPA连接起来,
得到
- 48*4=192个处理器核心
- 384G + 384G内存
- 两个节点, 通过100Gb OPA通讯
AMD测试平台
9654双路+ 24*32GB, 关闭超线程
- 192个处理器核心
- 24个内存通道,
- 节点内通讯
这位网友报告说:
测试软件是VASP6.
Intel平台采用Intel OneAPI.
AMD平台分别使用Intel OneAPI, AOCC编译器, MKL+GCC等等组合方式.
结果, 同样的测试算例, AMD平台比Intel慢很多.
原话是“Intel平台上, 需要7个小时算完; 在AMD平台上, 需要15到16个小时”.
另, 为何说是不愿意透漏姓名的网友呢?
就是直接微信聊天, 我问, 您高姓大名, 如何称呼? 对方从来未回复.
对方也没有废话, 直接讲了他遇到的问题, 问我能否调优?
我说可以试试.
从性能参数评估, 至少能把AMD平台弄的和你手里的Intel平台一样快, 这一步实现后, 再考虑其他调优.
如有效果, 需要支付酬金.
然后就失联了.
|