计算化学公社»论坛首页 › 计算机软硬件 (Software and Hardware) › 硬件配置与采购 (Hardware Configuration and Procurement) › 厂家给的配置方案是否可取—主要做VASP和QE方面的计算

厂家给的配置方案是否可取—主要做VASP和QE方面的计算

查看数: 2725 | 评论数: 17 | 收藏 Add to favorites 2

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

linuxprobe

发布时间: 2024-3-13 17:11

正文摘要:

主要做VASP和QE方面的计算，厂家给了一个如下图的配置。暂时先买两台计算服务器，后续还会购置几台。

回复 Reply

abin 发表于 Post on 2024-4-7 17:42:45

gog 发表于 2024-4-7 14:55
呜呜，用的 8 张卡。不掏电费可以这么玩。家庭用电，顶多2千瓦的配电。

楼上的意思是，
他提供的方案，是高度定制的专用机器，
跑特定的应用，效率应该不错。

不过请留意，这是专用硬件。

另外，做计算用的机器，
配置硬件的时候，传统的游戏主机那种搭配思路和经验，
几乎没啥太大的参考价值。

gog 发表于 Post on 2024-4-7 14:55:58

Entropy.S.I 发表于 2024-4-5 12:08
UKHPC的1080原子TiO2，在去年9月的benchmark里用RTX 6000 Ada跑OOM，但是用8块V100 16G SXM2跑起来没有问 ...

呜呜，用的 8 张卡。不掏电费可以这么玩。家庭用电，顶多2千瓦的配电。

Entropy.S.I 发表于 Post on 2024-4-5 12:08:41

本帖最后由 Entropy.S.I 于 2024-4-5 12:34 编辑

gog 发表于 2024-4-5 09:01
16 GB, 跑小体系可以。但科研课题，催化方面的，都是几十个，上百个原子。

UKHPC的1080原子TiO2，在去年9月的benchmark里用RTX 6000 Ada跑OOM，但是用8块V100 16G SXM2跑起来没有问题，速度是双路9654的3倍。VRAM不够用，多GPU就行了，P2P和NVLink就是给多GPU并行用的。顺便提醒一下，现在4090经过特殊设置后也有P2P了。没有自己实践过就泼冷水，不是科研人员该有的素质。

gog 发表于 Post on 2024-4-5 09:01:53

Entropy.S.I 发表于 2024-3-18 12:18
使用V100 SXM2，性价比是你这些机器的10倍。目前我开发的整机已经可以出货（5U高度，8x V100 SXM2 16G）， ...

16 GB, 跑小体系可以。但科研课题，催化方面的，都是几十个，上百个原子。

Entropy.S.I 发表于 Post on 2024-3-22 23:04:57

本帖最后由 Entropy.S.I 于 2024-3-22 23:06 编辑

linuxprobe 发表于 2024-3-22 19:29
感谢感谢~请问你这边是怎么出货的，在哪里可以找到呢？

http://bbs.keinsci.com/thread-34411-5-1.html

先找我分析好具体需求，再确定配置方案，最后移交给合作方走商务流程

linuxprobe 发表于 Post on 2024-3-22 19:29:29

Entropy.S.I 发表于 2024-3-18 12:18
使用V100 SXM2，性价比是你这些机器的10倍。目前我开发的整机已经可以出货（5U高度，8x V100 SXM2 16G）， ...

感谢感谢~请问你这边是怎么出货的，在哪里可以找到呢？

Entropy.S.I 发表于 Post on 2024-3-18 12:18:35

本帖最后由 Entropy.S.I 于 2024-3-18 12:28 编辑

使用V100 SXM2，性价比是你这些机器的10倍。目前我开发的整机已经可以出货（5U高度，8x V100 SXM2 16G），只不过由于被奸商扫货涨价，现在V100价格和2周前相比接近翻倍，不过跑VASP和QE的性价比依然远高于CPU-only。已经做过大量测试（找多个不同的课题组一起做benchmark），还没遇到过不能跑的体系，超过1000原子的体系（例如去年9月双路9654评测中所用的1080原子TiO2算例），用纯PBE也跑得动，并且性能遥遥领先于CPU-only（双路9654的3倍以上，如果是Hybrid DFT，则有5倍以上）。经过我的硬件+固件+软件联合调优，每个4卡模组的性能超过任何其他4卡V100机器，不谦虚地说，我测出的性能可以作为作为这类配置的性能标杆。

评分 Rate

参与人数 Participants 1	eV +2	收起理由 Reason
卡开发发	+ 2	我很赞同

查看全部评分 View all ratings

renzhogn424 发表于 Post on 2024-3-17 12:17:49

gog 发表于 2024-3-14 18:25
对的啊，intel mkl

也是，mkl挺重要，好像AMD也能用，就是效率低不少。

gog 发表于 Post on 2024-3-14 18:25:02

renzhogn424 发表于 2024-3-14 16:33
加速库是指intel mkl么？？？请教下，amd4代用什么加速库？

对的啊，intel mkl

renzhogn424 发表于 Post on 2024-3-14 16:33:22

gog 发表于 2024-3-14 10:11
要做QE，要么用intel的机器，要么用amd4代。3代2代，加速库没法搞

加速库是指intel mkl么？？？请教下，amd4代用什么加速库？

AIchaosuan666 发表于 Post on 2024-3-14 13:28:58

9654更合适

gog 发表于 Post on 2024-3-14 10:11:13

要做QE，要么用intel的机器，要么用amd4代。3代2代，加速库没法搞

abin 发表于 Post on 2024-3-14 09:21:29

本帖最后由 abin 于 2024-3-14 09:34 编辑

如果要单独的管理和登录机器，这么小的集群规模，
鉴于当前计算任务特点，
可以使用配置更低的处理器做管理节点。

我推测, 当前的设计目标是, 单节点多核心并行.

我这里有十三个节点，使用一台8核心机器做管理和存储。

具体例子是: https://gitee.com/hpc4you/redstar

至于价格, 应该和你查询到的硬件裸价不同的.
如果要求做成集群, 也是需要成本的.

janstao 发表于 Post on 2024-3-13 21:05:29

抛开配置不谈来说说价格，主节点的CPU、主板要比计算节点便宜很多，而且是单路，多的6T硬盘和1G的阵列卡价格并不贵，没有理由比计算节点还贵4000多啊，理应便宜才对。

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register