计算化学公社

 找回密码 Forget password
 注册 Register
Views: 490|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] 求助,在集群的网络共享目录跑STEOM-DLPNO-CCSD计算任务比在本地硬盘目录慢6倍

[复制链接 Copy URL]

5

帖子

0

威望

259

eV
积分
264

Level 3 能力者

Orca 5.0.4,openMPI 4.1.1
inp文件:
  1. ! RHF STEOM-DLPNO-CCSD cc-pVDZ cc-pVDZ/C TightSCF CPCM(toluene)

  2. %MaxCore 5000

  3. %pal nprocs 24 end

  4. %mdci
  5.   nroots      20
  6.   DOSOC       true
  7.   DoTriplet   false
  8.   DoSOLV      true
  9.   OThresh     0.0001
  10.   VThresh     0.0001
  11.   DoEOMMP2    true
  12.   DLPNOLINEAR true
  13.   NEWDOMAINS  true
  14.   DoCOSXEOM   true
  15.   DoAOX3e     true
  16.   KCOpt       KC_AOBLAS
  17.   MaxIter     500
  18.   DoRootwise  true
  19.   Printlevel  3
  20. end

  21. * xyz   0   1
  22. C                  1.20368800    3.29499500   -0.00002600
  23. C                  0.00000100    3.99610000    0.00001300
  24. C                 -1.20368500    3.29499900    0.00005400
  25. C                 -1.17824800    1.86296200    0.00005700
  26. C                 -0.00000100    1.12923300    0.00006000
  27. C                  1.17824500    1.86296200   -0.00002300
  28. ......
复制代码


浪潮工程师测试的结论如下:
通过测试在任意节点的本地硬盘目录(含SATA和SSD硬盘)跑您提供的orca算例均在1小时22分内完成,通过网络共享目录(NFS和BeegFS等)测试均在6小时以上;通过iozone测试对比BeegFS和NFS目录实际读写性能要高于本地单块硬盘,目前不确定为何orca跑在网络共享目录会变慢,但从手册中看到如下解释,请帮忙确认orca是否支持网络共享目录运行,如果使用NFS或BeegFS等网络共享目录是否有参数优化,谢谢。
请问这个慢六倍的问题如何解决?

516

帖子

1

威望

5052

eV
积分
5588

Level 6 (一方通行)

2#
发表于 Post on 2024-5-8 19:26:21 | 只看该作者 Only view this author
没有办法。CC计算过程中本来就有大量的文件读写过程,而且是并行读写。所以他测试的读写性能如果只是串行的,那不能说明问题。

5万

帖子

99

威望

5万

eV
积分
112374

管理员

公社社长

3#
发表于 Post on 2024-5-8 20:31:04 | 只看该作者 Only view this author
硬盘速度与内存容量对量子化学计算速度影响的测试
http://sobereva.com/397

耦合簇计算对硬盘I/O速度敏感
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

2301

帖子

1

威望

5475

eV
积分
7796

Level 6 (一方通行)

4#
发表于 Post on 2024-5-9 14:34:47 | 只看该作者 Only view this author
本帖最后由 abin 于 2024-5-9 14:46 编辑

这套机器/集群的配置在这里:
https://cgglzx.jlu.edu.cn/provider/#/publish/20LBKM4KT89MED76

整理后的配置信息在这里:
https://gitee.com/hpc4you/grand-ram-gpu

数位专职管理员都不接手该集群管理/运维, 理由是, (机器/集群)跑起来很困难.

某位领导指出,  “说这套集群配置是垃圾的人, 就是白痴”.

浪潮技术也说了, 测试数据达标呀.
我说, 达不达标我不懂, 可是用户说:“跑啥都慢”, 你们和领导以及用户沟通就行了.
的确有用户, 实名通过电邮反馈, ORCA慢17倍, NAMD.GPU慢2~3倍.
(大家都是读过书的博士, 肯定是和性能相近的硬件做比对的).

100Gbps带宽, I/O测试可以跑到11GB/s, 是数据达标. (100/8=12.5GB/s, 跑到11GB/s性能不差的呀).

不过, 我这个外行认为, I/O测试的那些参数, 并不能反映并行计算集群中的I/O的实际需求.
结果就是, 如果计算涉及磁盘I/O, 肯定慢.



另, 你没有猜错, 我这个外行倒霉鬼, 在暂时运维管理这套(两套)集群.
领导说“你做的这些个管理集群的工作, 在学校无法考核衡量工作量, 所以没有津贴补助, 也没有酬劳.”
对, 我是友情提供协助, 原则是, 保持浪潮交付的“固定资产”原样运行.

不要动不动就骂集群管理员是白痴/不干活, 先问, 有没有给管理员付薪水,
问问领导给管理员定的工作内容和职责.



High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

5

帖子

0

威望

259

eV
积分
264

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2024-5-11 09:10:53 | 只看该作者 Only view this author
niobium 发表于 2024-5-8 19:26
没有办法。CC计算过程中本来就有大量的文件读写过程,而且是并行读写。所以他测试的读写性能如果只是串行的 ...

感谢解惑

5

帖子

0

威望

259

eV
积分
264

Level 3 能力者

6#
 楼主 Author| 发表于 Post on 2024-5-11 09:39:41 | 只看该作者 Only view this author
sobereva 发表于 2024-5-8 20:31
硬盘速度与内存容量对量子化学计算速度影响的测试
http://sobereva.com/397

感谢sob老师解惑

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 21:55 , Processed in 0.173596 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list