验证高海拔下极致可靠性:大普微SSD完成中子辐射实验
随着“东数西算”战略的深入推进,我国算力网络正加速向西部延伸。基于西部地区拥有得天独厚的能源与气候优势,数据中心集群在西部高海拔地区陆续落地, 但高海拔带来的“隐形杀手”——宇宙射线中子辐射,却给精密电子设备带来了前所未有的挑战,大气中子特别是中高能中子引起的单粒子效应对这些系统可靠性的影响正变得不可忽视。
近日,大普微在中国散裂中子源对旗下多款企业级NVMe SSD完成了中子辐射实验测试,对产品在模拟高海拔环境下的抗辐射能力进行了全面验证。
01 中子辐射效应及其对SSD可靠性的挑战
相比我国东部较低的海拔,西部地区普遍海拔较高,中子辐射的强度也高于东部低海拔地区。中子辐射是一种高能粒子,穿透能力强,能够直接穿透电子设备的封装和外壳,是地面上影响电子元器件的主要因素之一。
中子辐射对SSD的威胁主要来自两方面:
• 单粒子效应 (SEE): 中子辐射可能会撞击电子设备中的晶体管等敏感元件,导致电荷状态翻转,引起数据错误或逻辑错误,也就是通常所说的比特翻转。
• 总剂量效应 (TDE): 中子辐射会逐渐累积在电子设备的材料中,引起材料的性质变化,导致器件性能下降甚至失效。
SSD由SoC主控、NAND Flash和DRAM等精密半导体部件构成。然而,技术的进步在带来高性能的同时,也使得中子辐射对器件的影响变得更为显著。 相比传统存储设备,先进工艺下的SSD面临着更严峻的挑战,主要源于两大技术演进趋势:
• 制程微缩(针对SoC/DRAM): 随着半导体工艺向更先进制程(如12nm、7nm等)演进,晶体管尺寸大幅缩小,这意味着,即使是能量较低的中子撞击,也足以引发电荷状态翻转导致比特翻转。
• 3D堆叠(针对NAND): 现代企业级SSD普遍采用高层数3D NAND技术。更高密度的存储单元意味着在同等辐射通量下,发生比特翻转的潜在风险点更多。
综上所述,伴随SSD容量与性能的提升,中子辐射引发数据错误的概率也随之增加,这对SSD在复杂环境下的容错能力与数据完整性保障提出了更高要求。
02 CSNS:高强度中子辐射加速实验详解
为了验证产品在极端环境下的可靠性,大普微选择了位于广东东莞的中国散裂中子源(CSNS),这是继英国、美国和日本之后世界第四台散裂中子源。本次实验依托反角白光中子实验装置(Back-n)开展,反角白光中子源的束流强度达到了 6.85 * 10⁶ n/(cm² * s),相当于海平面自然环境的17亿倍。这意味着测试中的几分钟相当于自然界中数千年的累积效应。

反角白光中子实验装置(Back-n)
03 直面高能粒子:大普微SSD抗辐射实测
本次实验中,大普微对旗下PCIe Gen4 (R510X/J5100系列) 和PCIe Gen5 (H5100/R6100系列) 的典型容量点产品进行了严苛测试。大普微本次参测的NVMe SSD涵盖了自研主控与业界领先的第三方主控方案,具备完善的DRAM/SRAM ECC纠错功能,以及NAND LDPC纠错能力,芯片和固件均具备一定的抗中子辐射能力。

待实验的大普微NVMe SSD
本次实验通过高强度中子辐射加速实验,评估大普微NVMe SSD在西宁、拉萨地区这样高海拔、自然中子辐射较强的环境下是否可以稳定运行。
测试环境设定:
• 辐射源: 中子束流强度6.85*10⁶/cm²/s,束流直径Φ50mm
• 工作负载: 照射时长35分钟,期间所有盘片持续运行 50-50 4K 随机混合读写I/O。

测试结果分析:
以下是基于JEDEC JESD89A标准大气中子通量模型的计算结果,包括故障截面(Cross Section)、不同海拔下的FIT值(Failures In Time,每10亿小时故障数)以及年化故障率(AFR)。FIT 表示每 10⁹ 小时运行中预期的故障次数,数值越小越可靠。

根据 JEDEC JESD89A 标准,全球软错误率(SER)测试的统一基准环境为海平面,中子通量为14n/cm²/h(0.0039n/cm²/s)。拉萨地区海拔为3650米,JEDEC模型根据海拔高度计算的加速因子约为11.4倍,计算得出中子通量为266n/cm²/h。按本次实验束流强度换算,仅需 1.70秒 的照射,即相当于SSD在拉萨地区运行了整整5年 的中子辐照累积量。

数据表明:大普微企业级NVMe SSD具备优秀的抗辐射能力,满足在高海拔地区批量部署所需的可靠性。
04 深耕存储技术,守护数据可靠性
从平原到高原,从边缘到核心,大普微致力于为全球客户提供高可靠性的存储解决方案。本次参与测试的PCIe Gen4 及PCIe Gen5系列产品,通过中子辐射等高要求环境的验证,展现了在极端工况下的稳定性与数据可靠性。在算力持续攀升、应用边界不断拓展的背景下,大普微将持续深耕存储领域,以扎实的技术能力,为复杂应用环境提供坚实的数据存储支撑。
