计算化学公社

 找回密码 Forget password
 注册 Register
Views: 9194|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[Amber] 求助AMBER-18测试GPU加速问题

[复制链接 Copy URL]

97

帖子

0

威望

1261

eV
积分
1358

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 hhhnano 于 2020-6-17 11:23 编辑

按照AMBER官方提供的测试软件包测试GPU加速运算速度,两块2080TI计算速度与官方数据接近,但也出现了4个GPU,还有其他问题,仔细检测了AMBER-18安装,并作了测试,发现没有问题,是否官方提供的测试脚本需要结合自己的机器进行修改?官方测试数据。
http://ambermd.org/GPUPerformance.php#RCWBenchmarks

附上计算脚本SH文件

JAC_PRODUCTION_NVE - 23,558 atoms PME 4fs
-----------------------------------------

CPU code 16 cores: |         ns/day =      62.73   seconds/ns =    1377.23
      [0] 1 x GPU: |         ns/day =     990.84   seconds/ns =      87.20
      [1] 1 x GPU: |         ns/day =     974.12   seconds/ns =      88.70
      [2] 1 x GPU: cudaGetDeviceCount failed no CUDA-capable device is detected
|         ns/day =     974.12   seconds/ns =      88.70
      [3] 1 x GPU: cudaGetDeviceCount failed no CUDA-capable device is detected
|         ns/day =     974.12   seconds/ns =      88.70
cudaGetDeviceCount failed no CUDA-capable device is detected
cudaGetDeviceCount failed no CUDA-capable device is detected
Multiple Single GPU Run Performance
      [0] 1 x GPU: |         ns/day =     972.28   seconds/ns =      88.86
      [1] 1 x GPU: |         ns/day =     967.99   seconds/ns =      89.26
      [2] 1 x GPU: grep: mdinfo.1GPU_2: No such file or directory
      [3] 1 x GPU: grep: mdinfo.1GPU_3: No such file or directory
cudaMemcpy GpuBuffer::Download failed an illegal memory access was encountered
          2 x GPU: |         ns/day =     364.00   seconds/ns =     237.36
          4 x GPU: |         ns/day =     192.91   seconds/ns =     447.87
cudaGetDeviceCount failed no CUDA-capable device is detected
cudaMemcpy GpuBuffer::Download failed an illegal memory access was encountered
Multiple 2xGPU Run Performance
      [0,1] 2 x GPU: grep: mdinfo.2GPU_0: No such file or directory
      [2,3] 2 x GPU: grep: mdinfo.2GPU_2: No such file or directory



run_bench_CPU+GPU.sh

12.09 KB, 下载次数 Times of downloads: 25

183

帖子

4

威望

1599

eV
积分
1862

Level 5 (御坂)

2#
发表于 Post on 2020-6-17 13:01:04 | 只看该作者 Only view this author
修改脚本前面的GPU数和CPU核数啊。

97

帖子

0

威望

1261

eV
积分
1358

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2020-6-17 15:10:56 | 只看该作者 Only view this author
谢谢liuyuje714,我是双CPU(每个CPU28核),两个20280TI显卡,修改了参数如下:
GPU_COUNT=2
CPU_COUNT=28(这里是否修改为56,两颗CPU,56核心),
但是还是有错误出现,而且两个GPU加速计算远比单个GPU加速计算慢,这是什么原因?

JAC_PRODUCTION_NPT - 23,558 atoms PME 4fs
-----------------------------------------

CPU code 28 cores: |         ns/day =      68.90   seconds/ns =    1253.92
      [0] 1 x GPU: |         ns/day =     838.67   seconds/ns =     103.02
      [1] 1 x GPU: |         ns/day =     886.49   seconds/ns =      97.46
Multiple Single GPU Run Performance
      [0] 1 x GPU: |         ns/day =     857.28   seconds/ns =     100.78
      [1] 1 x GPU: |         ns/day =     886.67   seconds/ns =      97.44
          2 x GPU: |         ns/day =     285.90   seconds/ns =     302.21
Multiple 2xGPU Run Performance
      [0,1] 2 x GPU: |         ns/day =     297.59   seconds/ns =     290.33

JAC_PRODUCTION_NVE - 23,558 atoms PME 2fs
-----------------------------------------

CPU code 28 cores: |         ns/day =      38.30   seconds/ns =    2256.10
      [0] 1 x GPU: |         ns/day =     510.40   seconds/ns =     169.28
      [1] 1 x GPU: |         ns/day =     513.35   seconds/ns =     168.31
Multiple Single GPU Run Performance
      [0] 1 x GPU: |         ns/day =     508.17   seconds/ns =     170.02
      [1] 1 x GPU: |         ns/day =     509.15   seconds/ns =     169.69
cudaMemcpy GpuBuffer::Download failed an illegal memory access was encountered
          2 x GPU: |         ns/day =     153.21   seconds/ns =     563.94
Multiple 2xGPU Run Performance
      [0,1] 2 x GPU: |         ns/day =     148.43   seconds/ns =     582.08

JAC_PRODUCTION_NPT - 23,558 atoms PME 2fs
-----------------------------------------

CPU code 28 cores: |         ns/day =      38.49   seconds/ns =    2244.69
      [0] 1 x GPU: |         ns/day =     460.04   seconds/ns =     187.81
      [1] 1 x GPU: |         ns/day =     462.64   seconds/ns =     186.76
Multiple Single GPU Run Performance
      [0] 1 x GPU: |         ns/day =     459.35   seconds/ns =     188.09
      [1] 1 x GPU: |         ns/day =     453.62   seconds/ns =     190.47
          2 x GPU: |         ns/day =     139.81   seconds/ns =     617.96
Multiple 2xGPU Run Performance
      [0,1] 2 x GPU: |         ns/day =     134.95   seconds/ns =     640.26

FACTOR_IX_PRODUCTION_NVE - 90,906 atoms PME

213

帖子

1

威望

2232

eV
积分
2465

Level 5 (御坂)

4#
发表于 Post on 2020-6-18 10:14:09 | 只看该作者 Only view this author
hhhnano 发表于 2020-6-17 15:10
谢谢liuyuje714,我是双CPU(每个CPU28核),两个20280TI显卡,修改了参数如下:
GPU_COUNT=2
CPU_COUNT= ...

2个gpu间的数据交换要通过cpu来完成。
如果没有NCCL,建议就是单任务,单显卡(也是amber推荐的)。

97

帖子

0

威望

1261

eV
积分
1358

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2020-6-18 10:51:12 | 只看该作者 Only view this author
谢谢abdoman, NCCL安装需要配NVlink吗?还是直接装NCCL就可以?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 18:54 , Processed in 0.202144 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list