sobereva 发表于 2023-10-26 08:23 很有帮助,谢谢sob老师 |
w5326178 发表于 2023-10-25 15:16 谢谢指导! |
啊不错的飞过海 发表于 2023-10-25 13:59 明白了,谢谢! |
|
“28个核计算效率最高”只是对当前任务,体系大小明显不同的时候结论又可能明显不一样。体系越小并行效率往往越低,因此所有核只跑一个越不划算。然而跑一个很大任务就没必要同时跑好几个,否则还可能因为内存带宽争抢等问题导致速度反倒拖沓。如果是涉及到硬盘读写厉害的任务,同时跑多个很容易由于硬盘I/O成为瓶颈导致哪个都跑不顺利。 这类问题必须拿具体体系具体任务说事 |
| 具体还是要看任务要求的内存量,有些计算任务、泛函基组选择要求很高的内存,这时候需要降低使用的核数,提高每个核分配到的内存。 |
|
ORCA的并行效率、内存使用都做得一般,后HF任务读写硬盘负载很重,需要分任务讨论。可以试着测测多任务并行工况下的表现。 一般而论的话就是4核/任务或8核/任务地投,兼顾单任务时长与运行效率;如果任务量够多的话1核/任务理论上效率更高,但没有实测过不知道会不会卡在访存之类非计算环节上。 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2026-2-26 11:50 , Processed in 0.194966 second(s), 25 queries , Gzip On.