入选国际顶会ASPLOS’26 | CEMU:打破硬件桎梏,让计算存储研究“起飞”
近日,由大普微吕涛博士担任共同通讯作者、联合华中科技大学与之江实验室完成的重磅论文——《CEMU: Enabling Full-System Emulation of Computational Storage beyond Hardware Limits》被国际计算机体系结构顶会ASPLOS’26 正式录用。
CEMU仿真平台聚焦计算存储(Computational Storage Drive, CSD)基础设施建设,旨在打破硬件桎梏,解决行业痛点,推动存算一体技术的仿真验证与生态发展。

01.为什么我们需要 CSD仿真平台?
CSD研究不缺天才的想法,缺的是验证想法的“跑道”。计算存储的逻辑很清晰:把计算任务推到 SSD 内部去处理,减少数据搬运,实现性能与能效的双重提升。但现实很骨感,研究门槛高得吓人:
·太贵: 一块 SmartSSD 动辄 2400 美元,想组建多盘系统?预算直接爆炸。
·太假: 现有的模拟器往往只模拟单一环节,丢失了全系统的真实交互行为。
·太慢: 无法模拟未来更先进、更高性能的硬件。
CEMU 的使命很清晰:让CSD研究能跨越昂贵的硬件门槛,打造一个零硬件依赖、全系统、可扩展的研究平台。
02.CEMU 是什么?
CEMU是一个纯软件实现的全系统 CSD 仿真平台,它包含“CSD 设备仿真器”与“CSD 系统软件栈”两部分;它既符合 SNIA/NVMe 行业标准,又能与现有的 I/O 栈无缝共存。
实现方面,CEMU 包含两大关键技术创新:
创新1:VM-Freezing (虚拟机冻结) —— 突破物理时间的限制
痛点: 用普通的 CPU 去模拟高性能的 FPGA/ASIC 加速器,速度跟不上怎么办?
CEMU 解决方案:
既然跑得不够快,那就让时间“停”下来。该平台引入了一种VM-Freezing机制:
1. 当仿真任务开始时,冻结虚拟机(VM)内的时间。
2. 宿主机 CPU 全力处理计算任务。
3. 任务完成后,根据预设的数学模型,估计任务在目标硬件上执行所需的时间,以此设置VM感知的应用执行时间,然后恢复虚拟机时钟。
技术价值: 该机制使得普通的 CPU 也能模拟远超自身性能的硬件加速器。
创新2:FDMFS 文件系统 —— 让 CSD “好用”且“标准”
痛点: 各家厂商接口不统一,平台碎片化严重。
CEMU 解决方案:
拥抱标准,构建生态。CEMU实现了FDMFS (File-Descriptor-Managed File System),包含如下特性:
1. 文件抽象: 以文件抽象来管理设备内存。
2. 标准兼容性: 遵循 SNIA 与 NVMe 标准,支持 POSIX 接口,能与现有的 I/O 栈共存。
3. P2P 传输支持: 支持多盘之间直接传输数据,大幅提升多 CSD 系统效率。
技术价值:该系统解决了CSD软件栈和传统I/O栈的兼容性问题。

图:CEMU 仿真平台总体架构
03.效果验证:不仅“能跑”,而且“保真”
模拟器最怕“自嗨”。为了验证平台的可靠性,研究团队将 CEMU 与真实的 CSD 硬件进行了端到端的性能对齐。
结论:平均精度高达 94% 以上。
此外,在 LLM(大语言模型)训练 和LevelDB 两个全系统案例中,CEMU 展现了它独特的价值:该平台揭示了过去难以观测的“系统级真相”(如 Offload 带来的缓存失效、多盘 P2P 的隐藏开销等),也证明了单点的算力提升并不等于系统整体收益,全链路的优化才是关键。
为AI时代定义先进存储
━━━━━━━━━━━━━━━━━━━━━━━━━━━
计算存储要真正走向产业化,需要的不仅仅是硬件,更是标准、软件栈和可复现的研究范式。 CEMU 是大普微贡献给社区的一块基石,并计划在论文正式发表后开源代码。大普微希望用开源和标准,降低学术界与产业界的沟通成本,让更多新奇的 Idea 能在 CEMU 上“先跑起来”。
ASPLOS介绍
━━━━━━━━━━━━━━━━━━━━━━━━━━━
ASPLOS,全称 ACM International Conference on Architectural Support for Programming Languages and Operating Systems,是面向多学科计算机系统研究的顶级学术会议,覆盖硬件、软件及二者交互。会议重点关注 计算机体系结构、编程语言、操作系统,以及 网络、存储 等相关领域。
作者信息
Qiuyang Zhang, Jiapin Wang, You Zhou, Peng Xu, Kai Lu, Jiguang Wan, Fei Wu, and Tao Lu. 2026. CEMU: Enabling Full-System Emulation of Computational Storage beyond Hardware Limits. In Proceedings of (ASPLOS’26). ACM, New York, NY, USA
