Picardo 发表于 2022-12-22 22:13
楼主也测下cpu计算时间呗
szp12345 发表于 2022-12-22 23:15
上面测试结果里面有,双路2696V3共36核,每电子步平均时间40秒
Picardo 发表于 2022-12-23 09:23
好的,羊了之后,眼神有点问题,抱歉。请教一下,vasp算aimd的时候主要用单精度嘛
ghifi37 发表于 2022-12-25 10:15
VASP不能跨卡分配显存,32G的黄卡超过2万块一张,不知啥时候能再腰折一次!
abin 发表于 2022-12-23 19:03
楼主, 用简单的测试数据,
再次论证了,
对于VASP等依赖双精度的计算任务,
KiritsuguPapa 发表于 2023-1-1 18:32
能否分享一下任务文件和编译参数?
szp12345 发表于 2023-1-3 11:12
已上传贴子附件,欢迎一同探讨
KiritsuguPapa 发表于 2023-1-3 17:39
52核8272CL的结果:
$ grep -m 1 F= OSZICAR
KiritsuguPapa 发表于 2023-1-3 19:51
请问用GPU跑VASP时,CPU只能使用1个核 对吗?我之前还测试过OpenMP+OpenACC来着,不过还是只能用一个核,并 ...
szp12345 发表于 2023-1-3 21:28
running 4 mpi-ranks, with 4 threads/rank
distrk: each k-point on 4 cores, 1 groups ...
KiritsuguPapa 发表于 2023-1-4 14:26
对我的意思是每个GPU用一个CPU核。你这个是4个P100的吧,我测的是一个GPU来着,待会试试多个GPU。
另 ...
szp12345 发表于 2023-1-4 16:25
编译文件使用makefile.include.nvhpc_ompi_mkl_omp_acc
需要使用intel-oneapi和nvidia hpc-sdk
sun35mr 发表于 2023-1-8 00:17
请问P100是主动散热还是被动散热呢?机箱风道如何构建,噪音大吗?
hhl276 发表于 2023-2-8 09:51
谢谢楼主测试。想问一下P100显卡被动散热,没有风扇,这个会导致显卡效率低吗,您在使用时如何解决这个问题 ...
zhaovic 发表于 2023-2-23 18:24
单p100用vasp6.3.2的gam版的算这个算例要130电子步才算完1个离子步。然后稍微调低encut到350避免爆显存用st ...
wolfli369 发表于 2023-2-24 09:20
能测试一下cp2k的GPU加速性能吗?
szp12345 发表于 2023-2-24 09:39
我没用过cp2k
回头搞搞试试吧
KiritsuguPapa 发表于 2023-1-4 18:39
上面3090是用nvhpc_omp_acc测的,不过OMP_NUM_THREADS=1
如果设置OMP_NUM_THREADS=4,虽然vasp输出里显 ...
qinfei 发表于 2023-11-6 20:27
我的vasp6 gpu,并行两张卡可以计算。但,当我并行两张以上的卡的时候,就一直卡在FFT: planning ... GRIDC ...
bblovelp 发表于 2023-12-1 08:49
老师,您好,我想问下这个服务器跑deepmd怎么样。
szp12345 发表于 2023-12-1 09:36
能跑,之前用2.1.5版本的对比过,速度是A100的1/5。
P100这个卡架构比较老,好像没有张量核心,机器学习 ...
szp12345 发表于 2023-12-1 09:36
能跑,之前用2.1.5版本的对比过,速度是A100的1/5。
P100这个卡架构比较老,好像没有张量核心,机器学习 ...
Picardo 发表于 2023-12-1 14:38
兄弟,v100和2080ti,跑deepmd的话推荐哪个
szp12345 发表于 2023-12-1 18:49
没有对比过这两个卡,我对比过p100和2080s,p100稍微快一点,20系列的架构是要比p100新的。
另外显存也 ...
1984901858 发表于 2023-12-20 11:02
双卡跑vasp纯泛函和杂化泛函,加速情况怎么样,显存会爆吗?
szp12345 发表于 2023-12-21 23:08
看你体系和精度了,ENCUT设置太大的话容易爆显存,不爆显存的前提下GPU速度非常快
1984901858 发表于 2023-12-25 14:31
谢谢。我想升级我的电脑(7950x,64g,主板最多能插三张显卡)。现在titan v(12g,2000元)和 v100(16g ...
Songchi 发表于 2023-12-27 19:16
我大约是在今年三月份搞得p100做DFT。
我的思路跟楼主有点不一样。
szp12345 发表于 2023-12-25 20:06
没有NVLINK,显存是不能共用的。
而且VASP每个计算线程占用一个GPU,每张GPU的显存消耗量是一样的。
你 ...
1984901858 发表于 2024-1-2 11:09
谢谢。我找到一个典型的案例,麻烦你用GPU版分别跑一下纯泛函和杂化泛函。谢谢了。
szp12345 发表于 2023-12-29 09:08
我后来加机器也考虑过2637V4,最后放弃了。
2696V3单核睿频能达到3.8G,我实测使用四个核心频率能维持在 ...
Songchi 发表于 2024-1-4 14:23
E5 2637v4 主频3.5.睿频3.7。我测试了下,跑vasp的时候,全核睿频在3.6G。
1984901858 发表于 2024-1-2 11:09
谢谢。我找到一个典型的案例,麻烦你用GPU版分别跑一下纯泛函和杂化泛函。谢谢了。
Songchi 发表于 2023-12-27 19:16
我大约是在今年三月份搞得p100做DFT。
我的思路跟楼主有点不一样。
Songchi 发表于 2023-12-27 19:16
我大约是在今年三月份搞得p100做DFT。
我的思路跟楼主有点不一样。
目前还不会计算 发表于 2024-2-26 10:53
你好,大佬,你这个8卡的机器装的是ubuntu系统嘛,,我们主板上没有那个集成显卡接口 ,然后装多卡的ubun ...
gaozx 发表于 2024-3-21 18:13
想问一下是否采用单核较强的CPU而不是楼主这种E5处理器搭配GPU加速算力更强?
gaozx 发表于 2024-3-21 18:13
想问一下是否采用单核较强的CPU而不是楼主这种E5处理器搭配GPU加速算力更强?
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...
szp12345 发表于 2024-3-22 19:17
大佬好,请教个问题,SXM2版本的V100与CPU通信时会不会产生抢PCIE带宽问题?
最近关注超微的一个四卡SXM ...
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...
szp12345 发表于 2024-3-22 17:56
是的,这套配置,跑VASP,单核性能是瓶颈。
这套配置可以说是万元内的最佳选择。2696V3单核睿频3.8G,使 ...
szp12345 发表于 2024-3-22 17:56
是的,这套配置,跑VASP,单核性能是瓶颈。
这套配置可以说是万元内的最佳选择。2696V3单核睿频3.8G,使 ...
目前还不会计算 发表于 2024-3-27 09:18
大佬,你的P100 4卡运行时候,,每张卡的功耗是多少啊,我是用的处理器和你一样,但是速度比你整体要慢 ...
Entropy.S.I 发表于 2024-3-23 13:51
先找我分析好具体需求,再确定配置方案,最后移交给合作方走商务流程。价格比不了全用二手且不含税的DIY ...
Picardo 发表于 2024-3-27 21:12
私信你嘛,还是直接帖子回复,还是什么其他方法
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...
Entropy.S.I 发表于 2024-3-23 13:51
先找我分析好具体需求,再确定配置方案,最后移交给合作方走商务流程。价格比不了全用二手且不含税的DIY ...
Songchi 发表于 2024-3-27 23:42
你们动作真快,我也在做类似的东西,机箱刚刚回来第一版。电路板我自己还在画,还在调。
gaozx 发表于 2024-4-4 15:25
老哥,我按照你的推荐买了超微7048GR,但是发现电源线出来是6+6+2pin,p100转接出来应该是6+6+2+2,少了2pi ...
szp12345 发表于 2024-4-5 11:10
6+6+2足够了,少两个不影响
szp12345 发表于 2024-4-5 11:10
6+6+2足够了,少两个不影响
szp12345 发表于 2024-3-27 14:47
功耗不是固定的,每个卡的最大功耗在150W左右,GPU温度基本在50度左右。
另外我的测试结果是独占GPU节点 ...
Entropy.S.I 发表于 2024-3-21 18:44
per-core性能影响很大,过去两个月我用4/8卡V100 SXM2的平台做了大量benchmark,用了很多课题组的算例,9 ...
ddddnight 发表于 2024-4-21 22:18
请问大佬,我是4090的显卡,13900K的CPU,跑vaspGPU版本,用命令mpirun np 1 vasp_std跑一个测试文件,看 ...
喝杯热水 发表于 2024-4-22 09:20
4090的FP64算力不高的。
ddddnight 发表于 2024-4-21 22:18
请问大佬,我是4090的显卡,13900K的CPU,跑vaspGPU版本,用命令mpirun np 1 vasp_std跑一个测试文件,看 ...
喝杯热水 发表于 2024-4-22 09:20
4090的FP64算力不高的。
Entropy.S.I 发表于 2024-4-23 01:51
信息不足,无法判断
ddddnight 发表于 2024-4-23 11:20
老师,我编译makefile.include和测试已经上传,您有空可以看一下吗,另外我用楼主的测试文件也是不如48核 ...
Entropy.S.I 发表于 2024-4-24 21:06
体系过小,只有4个原子,显然不适合用GPU跑。单块V100 SXM2配某神秘CPU耗时190s,比你的4090慢
ddddnight 发表于 2024-4-25 14:44
感谢老师的测试,体系越大,GPU跑的相对越快吗
Entropy.S.I 发表于 2024-4-25 18:07
在我测试过的范围内是如此
Entropy.S.I 发表于 2024-3-27 23:59
加入我们一起搞就不用重复造轮子了,前提是不能以赚钱为导向
目前还不会计算 发表于 2024-5-25 16:53
大佬,你有用过8卡A100 跑过楼主的案例嘛,按照A100速度,估计能达到200s左右的时间。
Entropy.S.I 发表于 2024-5-25 19:15
下图架构的节点(HGX A100-80G-8GPU,购买成本1,200,000 ~ 1,400,000),4GPU 246s (78 LOOPs),8GPU 139 ...
目前还不会计算 发表于 2024-7-12 10:44
大佬,就是我看你之前发的帖子有说到这个pcie转接线连接到pcie口的时候很松,容易掉驱动。目前不知道你们 ...
Entropy.S.I 发表于 2024-7-12 13:59
我自己开发的整机,PCIe转接线是专门定制的,有可靠固定措施,在生产环境连续运行80天,没有任何问题,论 ...
目前还不会计算 发表于 2024-7-12 15:29
好滴好滴,那看来我还是没买到合适的PCIE线,所以才会目前这个问题,我得再多找找啦。2月份的时候,看你 ...
Entropy.S.I 发表于 2024-7-12 16:16
目前市面上能长期稳定运行的只有我设计的整机解决方案
目前还不会计算 发表于 2024-8-22 21:49
目前这个4卡的gpu扩展板好像都卖完了,都没地方买了,好像都被买完了
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) | Powered by Discuz! X3.3 |