beowulf 发表于 2023-1-23 17:30 H100,货值太高,要申报海关。如果出关方允许转售到大陆,就方便多了。私货的风险太大。 |
gog 发表于 2022-10-18 21:33 A100都有官方的A800作为替代了,到时候H100去越南、马来西亚一带洗个澡一样的。 办法总比困难多的。 |
Picardo 发表于 2022-10-21 11:11 应该是只剩下3090和3090TI是游戏卡带nvlink的绝唱了 |
gog 发表于 2022-10-18 21:33 我的意思是游戏显卡有支持nvlink的嘛, |
Picardo 发表于 2022-10-15 10:31 用不用nvlink,都不重要了。高端计算加速卡,不准销往中国。得绕道了。玩游戏和办公,以及lammps计算,支持国产。 |
Entropy.S.I 发表于 2022-10-13 18:57 没有啥误导,我也不是很清楚,我自己没测试过,听油管上别人说的 |
Picardo 发表于 2022-10-9 17:31 最近亲自试了Lammps,确实是用1核带1卡比较合适,误导你了,抱歉… |
Entropy.S.I 发表于 2022-9-29 18:39 谢谢赐教,具体我也不太清楚, |
Picardo 发表于 2022-9-29 13:43 GPU加速GMX,启用-update gpu后,CPU负载主要是每n(n为正整数,通过mdp文件指定)步收集一次GPU上跑出来的数据,经过计算后把能量、坐标信息写入硬盘。此时一般使用1个MPI Rank,其中每个OpenMP线程都会参与通信和计算,算是一种特殊的IO密集型任务,对PCIe总线带宽/延迟、核间通信带宽/延迟以及多核浮点性能同时有需求。但实际上根据我以前用5950X+3080Ti进行的测试,PCIe带宽是跑不满的,CPU功耗也比较低,即CPU浮点计算压力不大。这2项可探测的关键负载都没有跑满,但增加核数(从12核到16核)还是能明显提升GPU使用率和任务运行速度,所以目前不清楚到底是哪个环节出现了瓶颈。 带4090具体选什么CPU需要仔细测试,比如intel 8375C全核性能略弱于AMD 7950X,但前者核心数量多一倍,需测试实际用来带4090跑GMX时到底哪个能发挥出更多的GPU性能。 至于Lammps,如果我没记错,这不是采用“纯GPU”方案的程序,不应该只用1个CPU核心。 |
Entropy.S.I 发表于 2022-9-21 05:33 请问这个cpu的瓶颈是主频还是核数还是带宽什么的,没用过gromacs,lammps的话,用gpu跑的话,我参照别人的意见,还是用的cpu 单核 |
八月的雨季 发表于 2022-9-26 11:04 这次不一定哦 |
翻不了倍的,很直观的对比,我的膜蛋白体系10W原子左右,Amber纯GPU跑,2080ti 70~80 ns一天,1080ti 40~50 ns一天,3090非ti 100~110 ns一天。 |
sun35mr 发表于 2022-9-25 21:49 是。也建议使用最新版驱动,并用最新版CUDA Toolkit编译较新版Lammps。 |
Entropy.S.I 发表于 2022-9-21 05:33 我今年换成 3060Ti,结果用gpu跑lammps的速度也就比之前的960 4g快了不到1倍,cpu是R5 2600,是因为CPU到了瓶颈吗? |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-23 15:00 , Processed in 0.244340 second(s), 33 queries , Gzip On.