计算化学公社

 找回密码 Forget password
 注册 Register
Views: 16722|回复 Reply: 47
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 求教同样的资金买两台E5-2696 v3的机器好还是买一台8173M的机器好呢?

[复制链接 Copy URL]

81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

本帖最后由 mgqqlwq 于 2020-6-1 18:04 编辑

从论坛和卢老师的博文分享中学到很多,看到最近卢老师又更新了推荐的配置清单,正好自己有购买的需求,想请教下卢老师和各位坛友,我想购置4-6台机器做一个小的集群,博文里面E5-2696 v3的机器大概是15000,8173M的机器大概是30000,请问下同样的资金是购买两台E5-2696 v3的机器呢还是购买一台8173M的机器呢?比如8173M的机器买四台和E5-2696 v3的机器买八台两个应该怎么考虑呢?主要是用来做分子动力学LAMMPS计算,后续可能会用VASP,请大家多给些建议,谢谢啦!

PS: 我在Ubuntu下的Firefox和Chrome上登录论坛会遇到输入用户名和密码后登录论坛无反应的现象,就是点击后跳一下没有错误但是并没有登录,请问其他朋友有类似的问题吗?


81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

48#
 楼主 Author| 发表于 Post on 2021-2-8 18:51:25 | 只看该作者 Only view this author
fineren 发表于 2020-6-25 21:23
我最近买的8173M的主机,用56核计算的时候,CPU-Z显示的时钟有多数运行在3.2G,一部分运行在2.7G,但有几个 ...

您用得什么程序呢?和程序本身的并行效率可能有关系,我猜的

125

帖子

0

威望

2268

eV
积分
2393

Level 5 (御坂)

47#
发表于 Post on 2020-6-25 21:23:45 | 只看该作者 Only view this author
我最近买的8173M的主机,用56核计算的时候,CPU-Z显示的时钟有多数运行在3.2G,一部分运行在2.7G,但有几个核心在1G,而且经常在变化。这种情况是否说明CPU的体质不太好?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

46#
发表于 Post on 2020-6-11 23:41:55 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-11 19:50
非常感谢您详细的回复!我自己查一下了解一下,不好意思,我登陆论坛有点问题,回复晚了。
请问如果是请 ...

并非都在一个CPU上。系统会自动调度,如果没有设置内核绑定,会由所有核心共同负载

相关信息看
通过设置CPU内核绑定降低ORCA同时做多任务的耗时
http://sobereva.com/553http://bbs.keinsci.com/thread-17751-1-1.html
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

45#
发表于 Post on 2020-6-11 20:34:18 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-5 09:13
谢谢您的解答!具体是什么原因造成的我不是很清楚,请问LAMMPS您有用过吗?LAMMPS想跨节点的话最低需要什 ...

规模不是很大的话,
比如一个计算涉及两个节点并行, 总体也就8台左右机器,
可以考虑使用万兆网络。

新品采用便宜的TP-Link,
或者采用拆机货,也能用。

我自己购买的是拆机的交换机和网卡,
效果呢,我的设计目标是读写至少达到500MB/s以上,目前完全满足要求。

如果需要再快的网络,可能就没有那么便宜了。

另外,对于多节点之间的并行读写,
性能分析可能存在偏差。
比如两节点,合计112核心计算,
如果采用MPI方式,大概是112和读写进程。
根据一般科学计算的特点,是写的多,读的少。
计算过程中,是累积方式的小数据读写,
就是每一次可能写一部分,然后累积为一个大文件。

所以,只要保证磁盘在应对112或者120进程同时4K随机读写稳定就可以了。
这个时候,实际要求的读写大概在200MB/s左右。
万兆光纤网络足够用了。

以上数据,来自于我在自己的机器上,采用fio做的读写测试和网路带宽分析。

为了保证并发读写性能,
使用廉价的多硬盘组RAID0足够应付了。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

44#
发表于 Post on 2020-6-11 20:27:14 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-11 19:55
谢谢您的回复!抱歉回复晚了。
我们这之前有个小的集群,是供应厂家帮我们弄得系统和初始的并行等环境。 ...

我可以搭建集群。

我自己搭建的有几套在运行。

靠谱的朋友是google + manuals + time。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

43#
 楼主 Author| 发表于 Post on 2020-6-11 19:56:47 | 只看该作者 Only view this author
sobereva 发表于 2020-6-6 10:49
自身机子的问题。我这里CentOS系统用firefox登录论坛反正没遇到问题。
此类问题的反馈请发到本论坛的“ ...

好的,谢谢卢老师!我去那重新发个帖子

81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

42#
 楼主 Author| 发表于 Post on 2020-6-11 19:55:47 | 只看该作者 Only view this author
abin 发表于 2020-6-5 09:43
系统和存储分开,

系统出现问题,直接换盘就搞定了。

谢谢您的回复!抱歉回复晚了。
我们这之前有个小的集群,是供应厂家帮我们弄得系统和初始的并行等环境。我感觉靠普的会搭建集群的人还是有点难找,如果是从淘宝上买卢老师推荐的高性价比的机器,请问下怎样能找到靠谱的朋友帮着做集群的环境呢?

81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

41#
 楼主 Author| 发表于 Post on 2020-6-11 19:50:05 | 只看该作者 Only view this author
zyn792102916 发表于 2020-6-5 09:24
这种情况是有可能的,因为使用不同核心数时的运行频率并不一样。您可以百度搜“wikichip 8173M”,里面有 ...

非常感谢您详细的回复!我自己查一下了解一下,不好意思,我登陆论坛有点问题,回复晚了。
请问如果是请求不超过28个核心,任务肯定会提交在一个cpu上是吧?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

40#
发表于 Post on 2020-6-6 10:49:09 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-4 18:11
谢谢卢老师!您找到的这个讨论,问题就是我之前问的,但是了解的比较少,问完还是不太清楚怎么选
卢 ...

自身机子的问题。我这里CentOS系统用firefox登录论坛反正没遇到问题。
此类问题的反馈请发到本论坛的“公社大厅”板块,当前问题和帖子无关
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

39#
发表于 Post on 2020-6-5 09:43:26 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-5 09:16
嗯嗯,单独的几台机器感觉提交任务下载数据还是会麻烦一点,不过每个人都有自己喜欢的方式,谢谢您的分享 ...

系统和存储分开,

系统出现问题,直接换盘就搞定了。

数据,无论是共享模式存储,还是单独存储,都是一样的存储介质,都存在坏的可能性。

集群搭建,要么自己玩,也很刺激的。
要么找别人做。

我这里的使用体验是,集群一旦搭建好之后,
然后就一直用了,没啥需要维护的。
用了几年后,几乎都忘记了这玩意怎么搭建的。

集群一旦搭建好,你不需要管理。
Linux工作站,搭建好之后,也不需要管理。

作为用户级别的管理员,顶多需要添加一下新用户而已。

至于集群搭建时候,所需要的并行环境等,应该是由负责搭建集群的技术负责处理的。
除非你自己想从头撸一遍。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

28

帖子

0

威望

2769

eV
积分
2797

Level 5 (御坂)

38#
发表于 Post on 2020-6-5 09:24:47 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-4 17:45
了解了,谢谢!登录论坛有点问题,抱歉回复晚了
请问下我这边试的一台机器上56个核心和36个核心速度并不 ...

这种情况是有可能的,因为使用不同核心数时的运行频率并不一样。您可以百度搜“wikichip 8173M”,里面有详细的8173M在非avx模式、avx2模式和avx512模式下使用不同核心数时对应的频率,我这边网络卡那个频率表一直加载不出来,这贴一张8176在普通模式下的频率(8176比8173M高0.1GHz的频率)。我师弟之前跑lammps模型时也发现,如果是2万原子的那种小体系,不用满核心(好像他当时就是因为记错了核心数用的36个)跑跟使用满核心的时候速度好像差不多,另外跑MS Dmol时满核心反而比较慢,除非体系比较大时满核心优势才明显。另外,2个cpu的效率这么说吧,我们有一台单路的8173M,当然计算效率还是看体系大小,如果是类似的体系,双路大概比单路提高90%左右,差不错接近1倍吧。



81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

37#
 楼主 Author| 发表于 Post on 2020-6-5 09:16:38 | 只看该作者 Only view this author
niobium 发表于 2020-6-4 18:25
集群的优点你说了,就是数据都在一起,不用倒来倒去,软件也装一次就行。缺点是万一共享的存储坏了,就完 ...

嗯嗯,单独的几台机器感觉提交任务下载数据还是会麻烦一点,不过每个人都有自己喜欢的方式,谢谢您的分享!也是一种可参考的方式
不过从我目前使用的感觉来讲,我个人还是更喜欢集群的方式,不过我觉得集群最开始整个环境的配置和后续的管理会麻烦一些。

81

帖子

0

威望

367

eV
积分
448

Level 3 能力者

36#
 楼主 Author| 发表于 Post on 2020-6-5 09:13:30 | 只看该作者 Only view this author
abin 发表于 2020-6-4 18:07
 厂家推荐的56G带宽的,是IB网络低配版本。
那玩意,交换机、线缆、卡,配四台机器,价格可能比你 ...

谢谢您的解答!具体是什么原因造成的我不是很清楚,请问LAMMPS您有用过吗?LAMMPS想跨节点的话最低需要什么样的网络呢?
您千兆网络并行计算用的是VASP?

516

帖子

1

威望

5052

eV
积分
5588

Level 6 (一方通行)

35#
发表于 Post on 2020-6-4 18:25:26 | 只看该作者 Only view this author
mgqqlwq 发表于 2020-6-4 17:48
多台服务器组成小集群的话,网络用一个就可以了,数据也是在一起,好像更方便一些。
多台机器单独使用我 ...

集群的优点你说了,就是数据都在一起,不用倒来倒去,软件也装一次就行。缺点是万一共享的存储坏了,就完蛋,计算节点基本就跟着用不了了。
单独使用,可能有些东西麻烦点,数据要从主节点传到计算节点上做计算。(如果你们网络允许,也可以每一台都是登录节点,也没啥不方便的)软件可能也要在每台机器上都装一遍,但这都是一次性劳动,也就机器买回来时装一下。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 19:06 , Processed in 0.189550 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list