计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1210|回复 Reply: 12
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] 疑惑:量子分块算CCSD,固态硬盘写入量特别大,但读取量几乎没有?

[复制链接 Copy URL]

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

某师兄用Fortran写的量子分块程序(?)接在Gaussian上算CCSD(?),小白不太懂他具体怎么实现的,但看程序名是这样的。

这条nvme 1t的固态才装上 56 天,期间只一直算他的程序,写入量就到了 1 PB ??

另外,读取量才 31.2 M ??如果是缓存,怎么会只写不读呢?

请问这是Gaussian本身计算的特性吗,还是他自己外接的Fortran程序写的有问题呢?


1万

帖子

0

威望

9886

eV
积分
22130

Level 6 (一方通行)

2#
发表于 Post on 2023-3-17 15:11:03 | 只看该作者 Only view this author
把这个分块程序上传上来(最好有源码)
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

1245

帖子

1

威望

3860

eV
积分
5125

Level 6 (一方通行)

3#
发表于 Post on 2023-3-17 15:27:49 | 只看该作者 Only view this author
高斯算CCSD也不可能读这么少,另外这写入量如果是真的,盘也快要报废了

928

帖子

1

威望

8263

eV
积分
9211

Level 6 (一方通行)

4#
发表于 Post on 2023-3-17 15:34:41 | 只看该作者 Only view this author
为什么不问问你师兄本人呢……

144

帖子

0

威望

2543

eV
积分
2687

Level 5 (御坂)

5#
发表于 Post on 2023-3-17 15:48:19 | 只看该作者 Only view this author
hebrewsnabla 发表于 2023-3-17 15:34
为什么不问问你师兄本人呢……

我猜师兄毕业了

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2023-3-17 17:28:53 | 只看该作者 Only view this author
wzkchem5 发表于 2023-3-17 15:11
把这个分块程序上传上来(最好有源码)

他目录没给我们开权限,我去问问他能不能共享一份;
我题目可能没写清楚,是这个师兄在算,不是我算,我是定期检查各节点状况时偶然发现的;
先谢谢老师!

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

7#
 楼主 Author| 发表于 Post on 2023-3-17 17:30:01 | 只看该作者 Only view this author
biogon 发表于 2023-3-17 15:27
高斯算CCSD也不可能读这么少,另外这写入量如果是真的,盘也快要报废了

是的,另一个节点已经报废一条了;其他几个也是 900+T 写入,但读取很少量

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

8#
 楼主 Author| 发表于 Post on 2023-3-17 17:35:07 | 只看该作者 Only view this author
hebrewsnabla 发表于 2023-3-17 15:34
为什么不问问你师兄本人呢……

是的,已经毕业很久,独立工作了,但还是在组里机器上算

211

帖子

0

威望

572

eV
积分
783

Level 4 (黑子)

9#
发表于 Post on 2023-3-17 18:41:07 | 只看该作者 Only view this author
本帖最后由 wjc404 于 2023-3-17 19:02 编辑

有可能是nvme驱动的问题,可以用两个方向的dd命令来测一下看smart报告的读数本身是否正常。

如果读数本身没问题,则有可能是服务器的大内存缓存了Gaussian的rwf文件。如果服务器的可用内存明显多于Gaussian任务的rwf大小(后者可以在输出文件的结尾看到)(或者在Gaussian运行过程中通过free命令看发现虽然buffer/cached增加了大概rwf文件的大小但free那一栏一直都有很多),则基本上是操作系统将Gaussian的rwf缓存到了DRAM里面,这时读取可以完全不通过磁盘,但写入操作到磁盘只是受到了延迟而不是省略。
话说这平均200MB/s的写入,如果只是算能量不太会这么大,是不是涉及了算密度矩阵?

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

10#
 楼主 Author| 发表于 Post on 2023-3-17 19:03:36 | 只看该作者 Only view this author
本帖最后由 王尔德 于 2023-3-17 19:07 编辑
wjc404 发表于 2023-3-17 18:41
有可能是nvme驱动的问题,可以用两个方向的dd命令来测一下看smart报告的读数本身是否正常。

如果读数本 ...

非常感谢老师,应该就是这个原因!
smart读数是对的;
看了rwf文件大小,几乎时时刻刻都在重新生成,加起来有几十g(远小于500g的内存),基本上对的上 buff/cache 的数值,free的数值保持在 400+ g;
确实是高斯同时将rwf文件写入了内存、固态,但读取只读取内存的,导致固态读取量几乎没有。

不知道能不能只缓存到内存里
密度矩阵倒不太清楚,没跟我们介绍过他具体算什么

211

帖子

0

威望

572

eV
积分
783

Level 4 (黑子)

11#
发表于 Post on 2023-3-17 19:09:18 | 只看该作者 Only view this author
可以的,不过应该要等到所有任务都算完或杀掉后再操作。用Linux的tmpfs(请自行搜索相关操作方法)作为GAUSS_SCRDIR的位置,然后重新启任务。

7

帖子

0

威望

67

eV
积分
74

Level 2 能力者

12#
 楼主 Author| 发表于 Post on 2023-3-17 19:12:55 | 只看该作者 Only view this author
wjc404 发表于 2023-3-17 19:09
可以的,不过应该要等到所有任务都算完或杀掉后再操作。用Linux的tmpfs(请自行搜索相关操作方法)作为GAUSS_ ...

好的,我去查一下,谢谢老师

538

帖子

1

威望

5769

eV
积分
6327

Level 6 (一方通行)

13#
发表于 Post on 2023-3-18 10:12:02 | 只看该作者 Only view this author
量子分块。。。好高大上的感觉

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-24 02:23 , Processed in 0.197626 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list