本帖最后由 Entropy.S.I 于 2025-9-23 00:26 编辑
SAI的故事
ENTROPY-YU | Sep-2025
这是科学计算基础设施被LLM“夺舍”之后科研人员中的有志之士通过拾取鲸落进行的“屯粮过冬”运动。
AI的技术栈基于传统HPC和科学计算发展而来,自LLM爆发之后,AI占据了GPU和高速网络的主流需求。由于数值精度以及数据吞吐带宽和延迟需求的差异,如今最新的GPU和高速网络已不再适配科学计算需求。恰逢上一次AI爆发前夕诞生的GPU和高速网络都已批量退役,而彼时的它们在被设计时充分考虑了科学计算的需求,在如今最新的产品面前依然有强劲的竞争力。
经过多年发展,科学计算行业的各种基础软件和应用终于落入对当年的GPU和高速网络的利用效率的最优化区间。同时,科学计算自古以来的核心影响因素——CPU单线程性能——已有了长足的进步。
因此,当最新的CPU和软件栈搭配廉价而高效的旧时代GPU和高速网络,将产生神奇的效果。
在此基础上,为了实现超级计算机的大规模互联需求,我们创新了互联架构:将小范围高速域和大范围扩展域耦合,在同一拓扑中巧妙地打通了不同互联协议,同时结合已被世界顶级超级计算机验证的最先进Fabric组网拓扑(Dragonfly+),实现了无与伦比的高性能互联。
至此,一型优雅的超级计算机应声降世。它的使命,是在科学计算的重要意义被重新发现之前的寒冬,为被AI革命暂时遗弃的自然科学研究者提供最合胃口的粮食和最实惠的燃料。我们将其命名为赛先生。这个名字不仅蕴含着对科学的敬意,更指向其核心目标:推动科学计算积极拥抱AI方法,助力开发与实践,最终实现先进科学智能(Scientific Advanced Intelligence, SAI)。“赛先生(SAI)”即由此得名。
鲸落终会耗尽。而那时,科学计算通过与AI融合已实现质的飞跃,重新获得重视;支撑其继续发展的国产生态体系也已在时代浪潮的推动下成熟壮大,处理最复杂的科学计算任务不再像今日般力不从心。春天终将来临。
|