大普微先进存力赋能系列 | AI存算融合解决方案
昂贵的GPU算力因存储性能瓶颈而大量闲置,是当前AI基础设施的核心痛点。由于“存力”与“算力”存在百倍性能鸿沟,GPU超过一半时间都在“空等”数据。为解决此问题,大普微与弈安云联合生态伙伴推出“北辰”先进存、运力解决方案,通过协同优化存力与运力,打破I/O瓶颈,为AI应用提供高性能、低延迟的完整基础设施。
一、先进运力:为数据流转铺设“高速公路”
AI训练中,海量参数需要在GPU集群间高频交换,传统网络延迟高、易丢包,是造成GPU闲置的首要瓶颈。
北辰方案的先进运力系统,依托弈安云在先进计算基础设施领域的整合能力与技术支持,采用高性能交换机,构建了一张超低延迟的“数据高速公路” 。其核心的RDMA技术能绕过操作系统内核,让数据在网络与应用内存间直接传输 ,从而实现0.6μs的微秒级端到端延迟 ,为分布式AI训练提供了高效协同的基础。同时,通过拥塞控制算法保障数据零丢包 ,并支持GPU Direct Storage技术,让大普微NVMe SSD与GPU显存直接通信,彻底解放主机CPU资源。
二、先进存力:大普微高性能SSD,打通数据供给瓶颈
数据存取是AI工作流的起点,存储性能直接决定了数据供给GPU的效率。为此,大普微以其基于自研DP系列主控的J5060/R63系列企业级NVMe SSD,为北辰方案提供了可靠的存力核心,从源头解决数据瓶颈。
大普微 R63 系列:
01 接口与性能:搭载PCIe Gen5接口,顺序读写速度高达14.5GB/s,4K随机写达890K IOPS 。
02 核心技术:搭载自研DP800主控,支持NVMe 2.0与ZNS(可将闪存写寿命提升40%)。
03 数据安全:支持硬件加速AES-256加密及SR-IOV隔离 。
大普微 J5060 系列:
01 容量与接口:单盘提供高达122.88TB容量,采用PCIe Gen4接口 。
02 能效表现:在13W的低功耗下即可达到7300MB/s的读取速度 。
03 性能对比:在AI场景下,其随机读性能为传统HDD的9000倍,顺序写性能为其10倍。
三、场景化存储:软件定义,精准适配AI负载
除了卓越的硬件性能,北辰方案还通过先进的软件定义存储层,为不同AI应用场景提供精准优化的数据服务。
01 低延迟块存储:针对推理与数据库等延时敏感场景,通过创新的SDS 2.0无锁架构,将端到端延迟降至100μs以下。
02 统一数据平台:针对AI与通用存储的融合场景,提供一站式平台,可统一承载从KV Cache、RAG等AI应用到核心数据库等通用业务。
03 并行文件系统:针对海量图片、文本等小文件处理场景,提供高吞吐的元数据处理能力,并支持冷热数据分层以降低50%的TCO。
大普微先进存力 x 弈安云生态整合:重塑AI基础设施价值
通过深度系统融合,北辰方案将GPU利用率从50%提升至85%以上,以超过90%的国产化率保障供应链安全,同时在5年周期内降低60%的TCO,综合成本仅为同类国际方案的一半,实现了性能、安全与成本的全面优化。
依托大普微先进存力与弈安云的生态整合与技术能力,该方案为AI算力的高效释放提供了坚实支撑。作为先进存力的引领者,大普微将持续以高性能、高可靠的企业级SSD产品,携手生态伙伴,共同推动AI产业创新。