计算化学公社

标题: 8173M or 8175M [打印本页]

作者
Author:
damao4361556    时间: 2020-7-27 17:45
标题: 8173M or 8175M
本帖最后由 damao4361556 于 2020-7-27 17:47 编辑

代理商报价,提供的配置清单说 并行计算要求CPU是6的倍数,且 主频和核心数8173M:2.0X28=56,8175M:2.5X24=60
因而代理商说 8175比8173性能好

纠结选哪个。。。

谢谢







作者
Author:
monoyu    时间: 2020-7-27 20:47
1.性能不是你那么算的吧,看CPU频率也要看满载时的全核睿频,没有看默频的。
2.配置单里的三块硬盘看不太明白,其实参考社长贴中的顶级配置即可。
3.这报价坑你1w
作者
Author:
abin    时间: 2020-7-27 22:05
三硬盘方案,是鄙人推荐的。

另,全程CPU密集型计算,还能指望全核心睿频?
能100%保证标称频率就不错了。

如果主要面向单机计算。
推荐24核心,而非28核心。
如果你用vasp,
你晓得根据不同计算规模而设定
注入NCORE,NPAR,KPAR数值、
你可以发现,28核心因为存在7这个因子,
在某些计算阶段,有部分核心处于等待状态。

24核心,最小可以划分为六个一组,
是偶数个核心。
配合MPI+openMP方案,可能有额外15%的性能提升。

如果对于上面提到的bands 划分没有任何概念,
请忽略以上信息。

作者
Author:
abin    时间: 2020-7-27 22:07
价格没啥纠结的,
看钱下单呗。

要想知道哪一个好,对比测试一下就行。

作者
Author:
qinzhong605    时间: 2020-7-27 22:29
半斤八两的性能,哪个便宜要哪个。还有,参考社长硬件的那个帖子,别被坑那么多钱。
作者
Author:
abin    时间: 2020-7-27 23:10
关于通过合理调整
NCORE KPAR NPAR
最大化优化VASP并行效率, 可以参考这里提到的视频: https://www.bilibili.com/video/BV1DK411J7tN/

如果不仅仅是一台机器,建议做集群来计算。
硬盘的钱,可以置换为万兆网卡和线缆(两台机器不用交换机)。
可以参考这个视频里的内容:https://www.bilibili.com/video/BV1eg4y1v7HM

多说一句,
三硬盘方案,先后有两次,在不同的平台,受邀做经验分享,
我有提过这个方案。

最先提供的是,1TB HDD做系统; 4 x 1TB RAID0读写加速;4TB HDD做数据。当时,SDD比较贵,1TB HDD大概300元不到。

后来,推荐采用120GB SDD SATA接口做系统,因为便宜,大概100元。
NVME硬盘价格也开始降低,所以推荐采用1TB做读写,可以根据实际需要更换容量。

所有方案中,均是推荐数据硬盘,采用独立的硬盘来处理。

这种方案有如下的好处,
1  不用花太多的钱,可以取得更好的性能和安全性,包括抵御脑残操作删除数据,或者重装系统时候抹掉数据。
2  如果在系统构建之处,额外多话了120元,对系统盘做DD备份,一旦发现系统因为误操作而挂了,那么直接更换系统盘就可以工作。
如果你的硬件服务商,不是本地的,如果系统出现因为自己操作失误导致无法启动之类的,商家几乎不可能上门维修的。

当然,如果认为,任何时候,硬盘对于自己的计算没有任何影响,
所有的机器配置中,直接用HDD就行了。

另外,固态硬盘的另一个有点是,不怕突发停电;相反,机械硬盘,如果会遭遇频繁的突发停电事故,要当心你的数据哦。

作者
Author:
damao4361556    时间: 2020-7-28 00:26
abin 发表于 2020-7-27 23:10
关于通过合理调整
NCORE KPAR NPAR
最大化优化VASP并行效率, 可以参考这里提到的视频: https://www.bil ...

谢谢您详细的解答
作者
Author:
sobereva    时间: 2020-7-28 06:34
“并行计算要求CPU是6的倍数”根本没这回事,完全是奇谈怪论,除非特殊应用场合。居然卖服务器的人能说出这样的话,真行,若不是不懂,就是刻意坑你
另外,问配置的时候应当说清楚平时主要都跑什么程序。诸如跑动力学,用固态没意义。

2*8175M性能高过2*8173M这是毫无疑问的

用三硬盘完全没必要。系统装机械上就完了,240G固态完全是个鸡肋。

报价明显太高了。对比http://sobereva.com/444文章便知



作者
Author:
abin    时间: 2020-7-28 09:11
本帖最后由 abin 于 2020-7-28 10:51 编辑

你看看,
说什么来什么?
看图片。
如果遭遇突发断电, 机械硬盘可能出现故障。
当然问题很简单,扫描硬盘维护一下就可以了。

但是对于装系统都不会的,做磁盘扫描维护肯定很难。
(, 下载次数 Times of downloads: 73)


不过对于当前的案列,首先BIOS设定时间,而后扫描磁盘就解决了。

如果这里提到的方案,
你都不会,
那么如果当初有dd了系统硬盘,直接换一下硬盘就可以了。 大概耗时10分钟就搞定了。

补充一下:
在机器维护的角度讲,
如果系统盘是独立的而且有备份,那么更换系统盘,(开机箱,拔掉硬盘,接上新硬盘),大概4分钟,
注意,由于数据和系统是独立硬盘,那么开机后,系统直接可用。

如果是一个硬盘,所有都在一起。
万一某一天出现如上的故障,
你自己又不会弄,找一个本地上门维修的,出场费至少200元起价吧?
修机器的估计只管装系统,至于软件,数据,你自己弄吧。
这个场景熟悉吧?

而采用额外的独立系统盘,资费可能多300元,可以避免将来不必要的麻烦。

当然,机器未必就那么倒霉,会坏掉。

作者
Author:
damao4361556    时间: 2020-7-28 11:07
sobereva 发表于 2020-7-28 06:34
“并行计算要求CPU是6的倍数”根本没这回事,完全是奇谈怪论,除非特殊应用场合。居然卖服务器的人能说出这 ...

卢老师,服务器厂商推荐了8179M,这个相对于8173M 8175M 价格更低 性能更好。。。
因而,8179M性价比更高?
作者
Author:
monoyu    时间: 2020-7-28 11:33
damao4361556 发表于 2020-7-28 11:07
卢老师,服务器厂商推荐了8179M,这个相对于8173M 8175M 价格更低 性能更好。。。
因而,8179M性价比更 ...

8179M会更便宜么?不会是拿8179M的正显跟8175M的正式去比较的吧
作者
Author:
damao4361556    时间: 2020-7-28 14:55
monoyu 发表于 2020-7-28 11:33
8179M会更便宜么?不会是拿8179M的正显跟8175M的正式去比较的吧

8179m 正式版的  卢老师推荐的那个淘宝卖家
作者
Author:
ChemG    时间: 2020-7-28 15:40
damao4361556 发表于 2020-7-28 14:55
8179m 正式版的  卢老师推荐的那个淘宝卖家

专门跟他说的要8175M么,我们也想买一台呢,不知道有没有必要将8173M换为8175M.想按sob老师推荐的顶配整一台
作者
Author:
abin    时间: 2020-7-28 16:29
作为旁观者,
建议选择超微主板。
一般这个主板,默认带有IPMI接口,
配置了之后,通过一根网线可以做所有事情了,
包括但不限于,开机,关机,重启,进入BIOS,重装系统等。
如果你对于机器的管理维护,还停留在,接鼠标、键盘、显示器去看看的阶段,
你可以尝试使用一下这个方案。

某些主板也叫做BMC。

其他主板也有该功能,但是默认需要额外购买模块来实现哦。
作者
Author:
sobereva    时间: 2020-7-29 03:18
damao4361556 发表于 2020-7-28 14:55
8179m 正式版的  卢老师推荐的那个淘宝卖家

8179M价格合适的话可以买
作者
Author:
damao4361556    时间: 2020-7-29 08:54
本帖最后由 damao4361556 于 2020-7-29 09:04 编辑
sobereva 发表于 2020-7-29 03:18
8179M价格合适的话可以买

8179M 卖家报价4500左右。基于2颗 8179M的机器,一套下来 26000左右。。。。
卖家说的是 8179M 正式版




作者
Author:
akang    时间: 2020-7-29 10:25
damao4361556 发表于 2020-7-28 14:55
8179m 正式版的  卢老师推荐的那个淘宝卖家

我也是看了推荐去询问的那家,那家TB卖家产品写的库存有货,想下单一问没货。不知道是因为做不成生意了,还是就是这么厉害您问问题爱答不理的,消息看完也不回复。
作者
Author:
damao4361556    时间: 2020-7-29 11:17
akang 发表于 2020-7-29 10:25
我也是看了推荐去询问的那家,那家TB卖家产品写的库存有货,想下单一问没货。不知道是因为做不成生意了, ...

你问的是哪家淘宝店啊
作者
Author:
akang    时间: 2020-7-29 14:37
damao4361556 发表于 2020-7-29 11:17
你问的是哪家淘宝店啊

嘉*科技
作者
Author:
qinzhong605    时间: 2020-7-29 14:46
服务态度的确不怎么样,哈哈。
作者
Author:
abin    时间: 2020-7-30 21:37
一个组装服务器的商家,能对于VASP并行,用24核心和28核心处理器,
讲出来6的倍数之类的话,应该是看过关于VASP并行效率的资料的。
不过他可能无法准确描述,为何24核心28核心处理器最比较的时候,6的倍数之类的多重要,
然后表述的语句可能有歧义。

做一个分析。
首先说明,如果你用VASP,但是对于以下提到的概念没有任何概念,那你就慢慢算吧,没必要去研究如何算的快,
反正算的慢,就有更多的时间来划水了。

VASP的并行分好几个维度,
想要更深入了解,自己看手册好了。

假定一个计算中,指定完基组后,VASP报告NBANDS 180个,也许和你自己数的不同,但是程序一般会弄成偶数个。

想算的快呢,合理划分一下并行设定呗。

如果是双路24核心,合计有48个核心。
180 bands,分4组,每一个组有45bands,每一个band用12个核心计算。
完成一组计算,先后跑三个12核心,再跑1个9核心,那么某个时间段内,空闲3个核心。

如果是双路28核心,合计有56个核心。
同样4组,每一个组45bands,每一个band需要14核心,会需要3趟14核心,最后一趟3核心,空闲11核心。
如果分8组,每一个band需要7核心,4趟7核心,最后一趟2核心,空闲5核心。

看到没有,28核心中,会有更多的核心不干活。

那么回头来卡看干活的核心中,
14核心,会比12核心快很多吗? 不一定过,CPU密集型的计算,和主频高低有很大关系。
一般而言,核心越多的处理器,主频可能稍微低一些。

可以推测,中等尺度,比如180bands这个例子,24核心处理器会比较快。
其他情形可以自己推理哦。

那么56核心平台上,可以采用其他分组吗?
分5, 6组,核心数不能整除,然后,程序会立即报错哦。  
分2组,可能比较慢哦。

一般而言,对于核心数做分解,如果因子存在类似7这样的(只能被自身和1整除,鄙人才疏学浅,搞不清楚是素数还是质数),
在规划高效率并行计算的时候,就比较麻烦。

当然,如果你对于高效率计算,没有兴趣,
只要能算就行,那就请忽略如上信息。

特别留意,以上言论来自于我个人的有限的测试结果,不代表适用于其他情形。

另,适当设置分组数目,并行核心数目,可以十分明显提升VASP效率。
这种提升会打破传统的认识。
传统认识是,8个核心,需要10小时;16核心,最快需要5小时。
VASP中合理设定,可以实现,24核心,需要8小时;48核心,可能需要3小时不到。

以下视频中,提到一个案例。
视频链接:https://www.bilibili.com/video/BV1DK411J7tN
在双路24核心处理器,合计48CPU核心机器上,
采用默认输入文件,24核心,耗时1万多秒;
根据硬件,做合理调整后,48核心,耗时310秒。
加速效果如何,你细品。

特别留意,以上加速效果,未必对所有案例都适用。
我自己不会用VASP,只会把别人给我的输入文件,放进去运行。


特别留意
这里提到的针对硬件的并行优化方案,
仅仅适用于VASP纯MPI版本,以及VASP MPI+OpenMP混合并行版本。
其他程序是否适用,未知。

目测对高斯必定不适用。

目测,对于高斯,
G09使用12~16核心,效率最佳,注意,不是所有核心哦;
G16,使用所有核心,效率最佳。
对于以适用G16的场景,核心越多越好了。



作者
Author:
damao4361556    时间: 2020-8-1 00:50
abin 发表于 2020-7-27 22:05
三硬盘方案,是鄙人推荐的。

另,全程CPU密集型计算,还能指望全核心睿频?

个人已亲测,合适地调节NCORE NPAR 可显著提高计算速度。
作者
Author:
风飞    时间: 2020-8-1 02:35
本帖最后由 风飞 于 2020-8-1 10:38 编辑
abin 发表于 2020-7-30 21:37
一个组装服务器的商家,能对于VASP并行,用24核心和28核心处理器,
讲出来6的倍数之类的话,应该是看过关 ...

请问8171m呢?8171m应该比8175m 和8173m都好吧,   咋感觉很少人用8171m

作者
Author:
sobereva    时间: 2020-8-1 04:28
风飞 发表于 2020-8-1 02:35
请问8171m呢?8171m应该比8175m 和8173m都好吧咋感觉很少人用8171m

性能是如此。
但需要华擎板子
作者
Author:
sobereva    时间: 2020-8-1 04:36
提醒一下看回帖者,勿把跑VASP的情况当做普遍情况。
量化类程序、MD类程序都绝对没有核数必须是6的倍数最优的情况。例如并行核数对Gaussian不同类型任务速度的影响测试见http://bbs.keinsci.com/thread-4841-1-1.html
基于平面波的第一性原理类程序,并行涉及到k点分配、band分配、平面波分配、FFT格点的分配等,故而并行方式的控制对性能影响可调余地大,尤其是核很多的情况、跨节点的情况(例如对于QE看User's Guide for Quantum ESPRESSO和Notes on parallel computing的ppt)。对于不同情况怎么设置性能最优,和买服务器的时候买多少核的机子合适不能混为一谈。

作者
Author:
abin    时间: 2020-8-1 08:43
风飞 发表于 2020-8-1 02:35
请问8171m呢?8171m应该比8175m 和8173m都好吧咋感觉很少人用8171m

不了解,不清楚。
也许正如卢大侠提到,需要特殊的主板适配。

就我个人而言,
我一般指定超微主板,因为有IPMI or BMC管理。
一两台机器,而且是放在脚边用的场景,就无所谓了。

如果是好几台,还放在机房,机房又不能随便出入,
那么有IPMI/MBC接口,就很好用了。

对了,戴尔的貌似叫做iDrac,需要额外付费的。
作者
Author:
风飞    时间: 2020-8-1 10:39
abin 发表于 2020-8-1 08:43
不了解,不清楚。
也许正如卢大侠提到,需要特殊的主板适配。

请问使用华擎主板会降低其性能吗?
作者
Author:
abin    时间: 2020-8-2 00:20
风飞 发表于 2020-8-1 10:39
请问使用华擎主板会降低其性能吗?

不清楚 不了解。
问懂行的人吧。
作者
Author:
sobereva    时间: 2020-8-9 05:25
风飞 发表于 2020-8-1 10:39
请问使用华擎主板会降低其性能吗?

不会
服务器主板是永擎,是以前从华擎分出去的。华擎目前做的是消费级产品。

作者
Author:
wuzhiyi    时间: 2020-8-22 04:40
sobereva 发表于 2020-7-28 06:34
“并行计算要求CPU是6的倍数”根本没这回事,完全是奇谈怪论,除非特殊应用场合。居然卖服务器的人能说出这 ...

我觉得6的倍数这应该是因为7是一个素数不利于openMP层面的并行计算,于是取6,传到后面就变成是6的倍数了
作者
Author:
abin    时间: 2020-8-22 21:43
上船需谨慎啊。
8175M是很不错。目前看来需要借助华擎主板。
不过貌似该主板有bug,可能会翻船哦。

前几天用一周时间,解决了一台华擎+8175M的机器,
处理后,满负荷24小时,放置48小时,故障未再现,
暂时认为Bug解决掉。
如再次出现故障,我会及时更新在这里。

Bug主要体现在,机器空闲的时候,或死机,或网卡丢失而后无法再次正常启动。

追求高性价比,要当心翻船哦。

听闻,用技嘉的某一个主板可以,不过成本略高。  <---- 这句是朋友讲的,具体不清楚,不评价。
作者
Author:
CrysLantZ    时间: 2020-8-27 12:33
abin 发表于 2020-8-22 21:43
上船需谨慎啊。
8175M是很不错。目前看来需要借助华擎主板。
不过貌似该主板有bug,可能会翻船哦。

你好,我用的2696 v3 + X10DRL-I,即使重装系统,也有类似现象。
不知道您是怎么解决的?恳请指教,谢谢。

机器连接的智能插座显示,空闲时约100W功率;隔一定时间,功率变成170W或340W左右,搞不清楚什么程序在运转,这时网卡掉线且机器无法正常使用(路由器里看不到该机器)。
强制重启就好了
电脑水平有限,不知道哪里出问题了
作者
Author:
sobereva    时间: 2020-8-28 03:59
wuzhiyi 发表于 2020-8-22 04:40
我觉得6的倍数这应该是因为7是一个素数不利于openMP层面的并行计算,于是取6,传到后面就变成是6的倍数了

从原理上看,我认为不是OpenMP层面的事,只是特定程序算法在并行化层面的事
作者
Author:
abin    时间: 2020-8-28 10:35
CrysLantZ 发表于 2020-8-27 12:33
你好,我用的2696 v3 + X10DRL-I,即使重装系统,也有类似现象。
不知道您是怎么解决的?恳请指教,谢谢 ...

谁买给你的机器,找谁啊。

你的机器不会是静电问题吧?
接个地线试试。
作者
Author:
CrysLantZ    时间: 2020-8-28 19:25
abin 发表于 2020-8-28 10:35
谁买给你的机器,找谁啊。

你的机器不会是静电问题吧?

我一直以为是系统问题
我试试,谢谢
作者
Author:
wyf4725801    时间: 2020-11-4 16:45
abin 发表于 2020-8-22 21:43
上船需谨慎啊。
8175M是很不错。目前看来需要借助华擎主板。
不过貌似该主板有bug,可能会翻船哦。

EP2C621D12 WS这个板子,我卖了1000多片,没听闻个人客户或者次级代理反映过此问题,你可以详细描述问题,然后你的简单处理方法,发我邮箱yuanfang@iway-tech.com
作者
Author:
abin    时间: 2020-11-4 18:57
wyf4725801 发表于 2020-11-4 16:45
EP2C621D12 WS这个板子,我卖了1000多片,没听闻个人客户或者次级代理反映过此问题,你可以详细描述问题 ...

故障和解决方案,
找他们问去,
KF上海景丰。

我协助别人先后调试过七台,
两台出现轻微故障,散热正常,低于80度,
一台严重故障,但是散热正常。
还有一台,也是严重故障,不过散热不好,
温度能攀升到96度。

货不是我拿的,我仅仅是调试软件还有系统。

我没功夫做具体描述,
等遇到故障的时候,你就晓得了。


作者
Author:
OIrH    时间: 2021-9-28 23:21
请问8173m和8175m在其它配置相同的条件下,运行相同的任务,实际功耗会差很多吗?
作者
Author:
ghost    时间: 2021-9-30 08:18
8175m的性价比并不高,而且还挑主板,还不如8163,3w以内的价格是稳的




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3