kyuu 发表于 2017-11-18 14:05
我们昨天刚买了225块P100,可是并没有卵用
laoman 发表于 2017-11-18 18:28
目前的超算资源没有P100,你们组真土豪啊~~
不知道P100要是拿来跑MD(单精度就够),速度上会不会比1080 ...
P100 for PCIe-Based Servers | P100 for NVLink-Optimized Servers | |
Double-Precision Performance | 4.7 TeraFLOPS | 5.3 TeraFLOPS |
Single-Precision Performance | 9.3 TeraFLOPS | 10.6 TeraFLOPS |
Half-Precision Performance | 18.7 TeraFLOPS | 21.2 TeraFLOPS |
NVIDIA NVLink™ Interconnect Bandwidth | - | 160 GB/s |
PCIe x16 Interconnect Bandwidth | 32 GB/s | 32 GB/s |
CoWoS HBM2 Stacked Memory Capacity | 16 GB or 12 GB | 16 GB |
CoWoS HBM2 Stacked Memory Bandwidth | 732 GB/s or 549 GB/s | 732 GB/s |
Enhanced Programmability with Page Migration Engine | ||
ECC Protection for Reliability | ||
Server-Optimized for Data Center Deployment |
kyuu 发表于 2017-11-19 07:17
PERFORMANCE SPECIFICATION FOR NVIDIA TESLA P100 ACCELERATORS
单卡单精度与1080Ti持平 但单机上 ...
niobium 发表于 2017-11-18 05:36
不知道GPU在运算的时候能不能指定运行所用的核心数,如果可以的话,不知道楼主可不可以给个数据,或者测试 ...
kyuu 发表于 2017-11-18 14:05
我们昨天刚买了252块P100,可是并没有任何卵用
wgbigfatcat 发表于 2017-11-17 17:10
就现在来说,波函数求解需要迭代这个限制了量化类的程序GPU不是太合适。
万里云 发表于 2017-11-17 21:08
正好最近在学MPI,基于mpi4py写了个手动并行版:
kyuu 发表于 2017-11-19 07:17
PERFORMANCE SPECIFICATION FOR NVIDIA TESLA P100 ACCELERATORS
单卡单精度与1080Ti持平 但单机上 ...
sky 发表于 2017-11-19 21:20
你这张图我才注意到P100单精度就比1080好一点,看样子钱都用来堆双精度了
kyuu 发表于 2017-11-18 14:05
我们昨天刚买了252块P100,可是并没有任何卵用
bluewhale 发表于 2017-11-26 22:36
这种卡多少米?
sky 发表于 2017-11-19 21:15
迭代每一步照样也得求矩阵,没什么不合适的。vasp用GPU之后提速明显。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) | Powered by Discuz! X3.3 |