大普微先进存力赋能系列 | 存算协同计算系统
在智算兴起的当下,用户普遍面临“软件多样、算力昂贵、数据繁杂”三大痛点 :
• 中心侧: AI、大数据、HPC 等多类框架并存,硬件被割裂成孤岛,资源碎片化严重 。
• 企业侧: 新 AI 技术堆栈更新快、业务增效难量化,试错成本陡增 。
• 数据侧: 数据特征杂、IO 模式乱,数据管道常因 IO 瓶颈拖垮算力 。
为应对挑战,大普微作为领先存储制造商和先进存力提供商,创新实践“存算协同的理念”,并支持极道科技开发出灵枢计算系统,弥补存算协同理念中“算”这关键一环 。

01 灵枢:瞄准智算核心症结的操作系统
灵枢是一款智算中心的操作系统,也是一款AI赋能的应用程序运行方式。灵枢可以在资源整合的基础上兼容多种异构计算资源、异构硬件(例如CPU、内存、SSD、 GPU 、FPGA 等)、异构数据进行统一调度。这些虚拟资源(计算节点、CPU、GPU等等)可以任意组合,成为调度域。调度域承载用户的应用和计算任务,具备丰富的调度策略,支持资源配额、资源预留、弹性预留、任务优先级和用户访问权限等等,既能最大化资源利用率,又兼顾多元化的计算需求。

02 灵活性与易用性:重构部署与运行体验
灵枢系统极大简化了软件部署与环境配置流程,为用户提供了高度的灵活性和易用性。
• 软件环境方面: 系统原生支持 Conda、Mamba 及 Modules 等主流环境管理工具,实现命令行快速部署。同时,支持 Java、C++ 源码直接编译至共享存储,Docker 与 Singularity 容器镜像可实现便捷运行,并可通过 ISO 挂载即时生成虚拟机。此外,系统公共区已预置 DeepSeek R1、Qwen3 等常用模型权重文件,用户可直接复制用于推理或微调。
• 任务运行方面: 灵枢兼容不同用户的工作习惯。习惯传统调度的用户可继续使用 qsub、sbatch 等命令,快速拉起大规模进程;系统支持秒级启动数万个一次性容器进行批量计算;需要裸机环境的用户可直接获取 Ubuntu 或 CentOS 系统权限进行管理;需要独占硬件的用户,则可通过 KVM 虚拟机获取完整的 CPU、内存及 GPU 资源。对于流程化任务,系统还兼容 Cromwell、Nextflow、SnakeMake 等工作流,支持一键批量提交与失败自动重试。


03 自优化机制:一次部署,长期受益
灵枢为用户提供“一次部署,长期受益”的独特价值:同样的硬件,用户的应用会越跑越快;批量任务的资源利用率和吞吐量持续提升;集群在峰值时保持高利用率,在空闲时自动节能,从而实现运营成本的稳步下降。
这一能力源于其内置的 7x24 小时自优化机制。系统会持续收集运行数据、动态调整资源分配,并自动关闭空闲节点,如同配备了一位全天候在线的“性能工程师”。
用户提交任务时,也无需精确配置资源。用户只需提供一行命令,包含一个类似 cpus=2:mem=16G 的资源“提示”。系统会将其作为参考而非硬性指标,并依据后台积累的数据模型,自动识别、分类和建模该程序,为其动态匹配最优的资源。
灵枢的定位是“系统领域的自优化专家”:只拿运行数据做燃料,靠内置模型识别负载特征、预测资源需求,自动调整调度、缓存和功耗,让各类程序在通用硬件上越跑越快,显著降低IT总成本。
04 全域协同:八大核心优势
• 三大异构计算资源统一调度: 支持异构硬件(CPU/GPU/BPU)、异构计算框架及异构存储的统一调度,打破壁垒,最大化资源利用率。
• 超越传统调度系统: 采用创新性的存/管/算协同感知,一体化设计的超算调度系统,极大提升使用体验。
• 100%共享硬件: 无需划分集群,容器、虚拟机等完全共享硬件 ,按需获取资源,用完释放。
• 完全自研可控: 灵枢系统每一行代码都完全可控,完全自主;核心技术均具有专利或软著证书。
• 多场景: 适用于生命科学、机器/深度学习、地理能源、智能制造等,可作为K8S/SGE替代、私有云,容器云。
• 性能卓越: 调度能力大幅超越K8S, SGE等开源计算系统20%以上;覆盖CPU、内存、GPU、FPGA及存储空间调度。
• 易构建、易扩展: 出厂集成调试,内置超算行业所需环境和分析工具;极速交付;可通过添加节点方式横向扩展,自动发现和部署。
• 易管理: 全图形化管理界面;智能辅助管理(用户/任务画像等);自动采样,提供性能卡点优化建议;多种安全及容错机制。
以存储为基石,构建存算协同新生态
───────────────────────────────
灵枢计算系统与SSD的深度融合,是“存算协同”理念的具体落地,实现了数据存储与计算的高效协同。灵枢作为“算”的调度核心与大普微高性能“存”的底座相结合 ,可智能分配数据并精准优化存取路径。这一协同架构,有效推动算力资源最大化释放、加速数据价值高效变现,并持续优化整体成本结构,是大普微在智算存储领域的创新与实践。
