计算化学公社

 找回密码 Forget password
 注册 Register
Views: 8158|回复 Reply: 16
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 预算30-40万购买GPU服务器开展MD模拟应如何配置?

[复制链接 Copy URL]

21

帖子

0

威望

97

eV
积分
118

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
请教各位大神,课题组目前有30~40万预算扩充GPU服务器,根据学校政策肯定要招标,经销商报价大约是5-6万一台(主要配置要求是2块2080ti+ 2颗超过12核心的CPU),我们组主要用gromacs跑MD,通常同时跑多个体系,每个体系开展多条平行模拟,计算量很大。现在问题有几个:

1:GPU基本决定用2080ti,但是CPU用哪种呢?组内之前配了几台GPU服务器,GPU是1080ti,CPU是2696v3(18核心)或4669 v4(22核心)。现在升级GPU了,CPU需要换成新一代的CPU吗,或仍用老版本的CPU,有什么推荐吗,看到大家在其他帖子里推荐过8175M等,也看到大家讨论新一代CPU有时性能还不如之前的CPU,还请各位大佬提供宝贵意见。

2:30-40万可配6-8台服务器了,这么多服务器有必要组成集群吗?由于gromacs在多个GPU之间并行效率很低,我们都是1个GPU跑1个作业,同时在多个服务器开展多条模拟,这样似乎没必要组成集群。现在的体系大小也适合这么搞,1个GPU可以在可忍受时间内完成模拟任务。但也在其他帖子看到有人建议淘二手的IB交换机,搞一个集群。不知道GPU并行效率后面会不会有大的改进,这还是未知,值得期待吗,否则搞一个集群是不是没有意义呢。如果现在不组成集群,后面想要连接时可以再改造吗。

3. 拟用固态硬盘装软件,机械硬盘存MD数据,机械硬盘需要做RAID吗,推荐哪种RAID。

4. 下面附上经销商的配置,请各位大神看看如何。是不是内存条配的不对,应该保持和CPU通道数一致?还有其他要注意或更改的吗,谢谢!

2 X Intel Xeon CPU E5-2680v3/12C/24T/2.5GHz

2 X Intel Xeon CPU 4216/16C/32T/2.1GHz

2 X Intel Xeon CPU Glod 5220/18C/36T/2.2GHz

2 X Intel Xeon CPU Glod 5218/16C/32T/2.3GHz

2 X 32GB DDR4 2666MHz ECC Reg
1 X数据中心级SSD 480G
1 X 企业级 4TB SATA 7200RPM 3.5’’
2 X  RTX2080Ti

1093

帖子

6

威望

6269

eV
积分
7482

Level 6 (一方通行)

2#
发表于 Post on 2020-4-30 10:03:09 | 只看该作者 Only view this author
如果你跑平衡模拟的话GPU可以好点,如果需要做增强采样的话,CPU性能还是决速步,GPU倒是可以稍微省点

IB没有任何必要,你要想并行还不如配双路的GPU服务器

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

3#
发表于 Post on 2020-4-30 10:25:13 | 只看该作者 Only view this author
本帖最后由 abin 于 2020-4-30 10:37 编辑

多节点并行没有必要。

建议采用“分布式存储”(专家术语)。
每台机器上,采用至少2个HDD做RAID0读写,如果性能要求更高,可以修改为一个NVME协议固态硬盘(温控好,不掉速的大概2400左右1TB),或者两个NVME固态做RAID0。

建议组集群。
板载千兆连起来就行。
好处是,用户数据和软件数据都是唯一镜像,
使用方面,无需记录在哪一个机器运行计算。
只需要登陆一个服务器,提交计算,查看计算就可以。

CPU不太懂。
我用到的计算中,是CPU主频高算的快,其他应用场景不明确。
如果板载两个GPU卡,不做NVlink,还不如单CPU配单个GPU来的划算。

我同事有用Gromacs,测试发现,貌似采用i7配合一个2080Ti跑得挺快乐的。具体CPU型号没记住。
补充一下,我同事用GPU跑分子动力学,namd,发现,使用i7之类高主频,配合一个2080Ti,NVME高速硬盘,单机,算的非常快哦。
对比的是E5服务器配GPU卡。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2020-4-30 10:35:56 | 只看该作者 Only view this author
fhh2626 发表于 2020-4-30 10:03
如果你跑平衡模拟的话GPU可以好点,如果需要做增强采样的话,CPU性能还是决速步,GPU倒是可以稍微省点

I ...

IB网络那句,
我顺路提一下。

某些并行计算,如果读写配置不当,
会出现,一个主板上的两个CPU,跑不过两个节点,每一个节点都用一个CPU的情形。
我有遇到过。

测试服务器是,浪潮的。
双路机器,E5-2692 v2。板载SCSI磁盘,12krpm企业盘。
千兆交换机连接。存储采用RAID5阵列,有24个磁盘组成,走千兆网。

测试发现,
VASP 采用两个节点,每个节点调用一个cpu,计算快于使用一个节点上的两个CPU。
同时发现ADF也存在同样的效率问题。
未测试高斯,因为没有Linda授权。

至于IB网络,和普通的以太网是有区别。不仅仅是体现在带宽不同。
而是IB网络可以提供“和CPU直接通讯”级别的数据交换能力,
因而带来的读写性能提升,是十分明显的。

其实很多时候,限制计算效率的,最大的问题在I/O方面。
CPU,内存都很快了。磁盘是个问题。

常见的NVME磁盘,读写当然高,但那个测试是针对顺序读写的。
并行计算,要的是并发读写。

所以应该测试磁盘的随机读写性能。

以上言论,基于我个人的使用场景。
不代表适用于其他未测试的应用场景。
所以,仅供参考。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

5#
发表于 Post on 2020-4-30 21:10:13 | 只看该作者 Only view this author
cpu可以不换,要换的话就用6254 8275CL这类高频的

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

6#
发表于 Post on 2020-5-1 02:21:26 | 只看该作者 Only view this author
GPU加速的MD对CPU没那么敏感,稍微用个像样的CPU就已经饱和了,不要在这方面投入过多
看测试DOI: 10.1002/jcc.26011
花那么多钱在CPU上还不如多来几台节点

硬盘没必要Raid,在MD过程中硬盘I/O很不频繁,读写量也不大。用SSD也意义不大。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

279

帖子

0

威望

2271

eV
积分
2550

Level 5 (御坂)

7#
发表于 Post on 2020-5-3 15:25:58 | 只看该作者 Only view this author
fhh2626 发表于 2020-4-30 10:03
如果你跑平衡模拟的话GPU可以好点,如果需要做增强采样的话,CPU性能还是决速步,GPU倒是可以稍微省点

I ...

“双路的GPU服务器” 是说一个节点上两张GPU卡?

279

帖子

0

威望

2271

eV
积分
2550

Level 5 (御坂)

8#
发表于 Post on 2020-5-3 15:35:25 | 只看该作者 Only view this author

硬盘没必要Raid

sobereva 发表于 2020-5-1 02:21
GPU加速的MD对CPU没那么敏感,稍微用个像样的CPU就已经饱和了,不要在这方面投入过多
看测试DOI: 10.1002/ ...

硬盘没必要Raid”,做raid能让数据更安全些不?比如一共6块硬盘,做raid后能用5块;但这6块里硬盘坏掉任意一块,数据都不受影响?

1093

帖子

6

威望

6269

eV
积分
7482

Level 6 (一方通行)

9#
发表于 Post on 2020-5-4 12:03:51 | 只看该作者 Only view this author
bobosiji 发表于 2020-5-3 15:25
“双路的GPU服务器” 是说一个节点上两张GPU卡?

是的,infiniband光路由器就要三四万了,这些钱甚至都够买一个小节点了

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

10#
发表于 Post on 2020-5-5 08:11:47 | 只看该作者 Only view this author
bobosiji 发表于 2020-5-3 15:35
“硬盘没必要Raid”,做raid能让数据更安全些不?比如一共6块硬盘,做raid后能用5块;但这6 ...

从数据安全性考虑可以做Raid
但企业级机械硬盘也没那么容易坏
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

279

帖子

0

威望

2271

eV
积分
2550

Level 5 (御坂)

11#
发表于 Post on 2020-5-5 15:32:00 | 只看该作者 Only view this author
fhh2626 发表于 2020-5-4 12:03
是的,infiniband光路由器就要三四万了,这些钱甚至都够买一个小节点了

一个节点配GPU的话,一般都是2张起步吧 除非节点上的CPU太挫

21

帖子

0

威望

97

eV
积分
118

Level 2 能力者

12#
 楼主 Author| 发表于 Post on 2020-5-8 14:49:04 | 只看该作者 Only view this author
sobereva 发表于 2020-5-1 02:21
GPU加速的MD对CPU没那么敏感,稍微用个像样的CPU就已经饱和了,不要在这方面投入过多
看测试DOI: 10.1002/ ...

谢谢您! cpu用5118如何,服务器cpu(长时间开启)是不是不太建议上i9?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

13#
发表于 Post on 2020-5-9 10:02:42 | 只看该作者 Only view this author
金水河的春天 发表于 2020-5-8 14:49
谢谢您! cpu用5118如何,服务器cpu(长时间开启)是不是不太建议上i9?

i9完全没问题。消费级CPU和XEON在稳定性上并没有区别
5118的性能没问题
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

21

帖子

0

威望

97

eV
积分
118

Level 2 能力者

14#
 楼主 Author| 发表于 Post on 2020-5-19 16:06:59 | 只看该作者 Only view this author
sobereva 发表于 2020-5-9 10:02
i9完全没问题。消费级CPU和XEON在稳定性上并没有区别
5118的性能没问题

老师您好!现在经销商给我们报了个配置,是intel Xeon GOLD 6138/45系列,20核心, 2.0Ghz。价格很实惠,但我没有在英特尔的官网上找到,这个CPU是不是有什么问题?

21

帖子

0

威望

97

eV
积分
118

Level 2 能力者

15#
 楼主 Author| 发表于 Post on 2020-5-19 16:07:26 | 只看该作者 Only view this author
bobosiji 发表于 2020-5-5 15:32
一个节点配GPU的话,一般都是2张起步吧 除非节点上的CPU太挫

是的 现在准备配两张cpu

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 19:29 , Processed in 0.198270 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list