计算化学公社

标题: Dalton的并行计算效率如何呢? [打印本页]

作者
Author:
abin    时间: 2018-8-13 14:35
标题: Dalton的并行计算效率如何呢?
各位朋友,
在计算电子结构方面,Dalton的并行计算效率如何呢?

不考虑多节点并行情况,
在一台多CPU服务器上,
Dalton并行效率如何?

能开到很多评价Gaussian09/16在单节点内的并行效率的;但是很少看到评估dalton并行效率的。


作者
Author:
sobereva    时间: 2018-8-13 15:45
发帖时应看清板块,给你移动了

Dalton属于小众向程序,自然也基本没人去做这个测试。
不管并行效率如何,若你打算用Dalton,那就只能接受。并行效率好坏实际一测便知,这和体系、具体任务有密切关系。

作者
Author:
beefly    时间: 2018-8-13 17:49
dalton的DFT节点内并行效率还可以,没做过跨节点并行。
lsdalton不了解。
作者
Author:
abin    时间: 2018-8-13 22:03
beefly 发表于 2018-8-13 17:49
dalton的DFT节点内并行效率还可以,没做过跨节点并行。
lsdalton不了解。

多谢回复。

我目前做了QR-TD-B3LYP下计算所谓的SOCME,
发现效率不怎么好。

我当前的编译配置如下:
Compilation information
-----------------------

Who compiled             | root
Host                     | node1
System                   | Linux-2.6.32-573.el6.x86_64
CMake generator          | Unix Makefiles
Processor                | x86_64
64-bit integers          | OFF
MPI                      | ON
Fortran compiler         | /opt/intel/compilers_and_libraries_2019.0.046/linu
                          | x/mpi/intel64/bin/mpiifort
Fortran compiler version | unknown
C compiler               | /opt/intel/compilers_and_libraries_2019.0.046/linu
                          | x/mpi/intel64/bin/mpiicc
C compiler version       | unknown
C++ compiler             | /opt/intel/compilers_and_libraries_2019.0.046/linu
                          | x/mpi/intel64/bin/mpiicpc
C++ compiler version     | unknown
BLAS                     | /opt/intel/compilers_and_libraries_2019.0.046/linu
                          | x/mkl/lib/intel64/libmkl_intel_lp64.so;/opt/intel/
                          | compilers_and_libraries_2019.0.046/linux/mkl/lib/i
                          | ntel64/libmkl_sequential.so;/opt/intel/compilers_a
                          | nd_libraries_2019.0.046/linux/mkl/lib/intel64/libm
                          | kl_core.so;/usr/lib64/libpthread.so;/usr/lib64/lib
                          | m.so
LAPACK                   | /opt/intel/compilers_and_libraries_2019.0.046/linu
                          | x/mkl/lib/intel64/libmkl_lapack95_lp64.a;/opt/inte
                          | l/compilers_and_libraries_2019.0.046/linux/mkl/lib
                          | /intel64/libmkl_intel_lp64.so
Static linking           | OFF
Last Git revision        | 2d1d7ae9769172b7d94e970e995c6245d5051585
Git branch               | master
Configuration time       | 2018-08-11 20:24:50.299557
作者
Author:
abin    时间: 2019-4-19 22:35
测试了一下。
PC-cluster, 千兆网络, E3-1245,5个节点,合计20cpu核心
双路服务器,E5-2690 v3,合计24cpu核心。

同样的计算, PC-cluster比双路E5-2690V3快大约10%。

计算期间,观测到,PC-cluster,网络流量很低,峰值20M/s。所以千兆网络不是问题。

成本方面考虑,能以低廉的价格,实现商用服务器的性能;不过占地方。
用紧凑型机箱可能会更好。

以上测试,仅仅针对dalton。其他情况不了解。  




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3