外媒测评:大普微Gen5 E3.S SSD搭载SupremeRAID,全速驱动 AI 与 HPC应用
本文翻译摘选自StorageReview网站文章。StorageReview.com是一家世界领先的独立存储研究机构,通过深入的新闻报道、详细评论、SMB/SME咨询和实验室服务,专业提供包括存储阵列、硬盘驱动器、SSD 以及相关的硬件和软件方面的存储解决方案。
随着数据价值日益提升,愈加凸显高性能、高可靠性和低能耗的存储解决方案的重要性。DapuStor E3.S SSD - Haishen5 H5100以先进技术与精心工程设计,完美契合这一需求。本次测试,我们将使用16块H5100 SSD来评估最新的 Gen5 SSD 的速度与性能。
01 DapuStor H5100 E3.S SSD
▼ 性能
相较于DapuStor Gen4 SSD,H5100实现了性能的显著提升。该产品采用最新的Marvell™ Bravera™PCIe Gen5 企业级控制器、3D eTLC NAND Flash以及DapuStor专业固件,使其吞吐量相比Gen4产品提升了两倍。Haishen5 H5100的连续读取速度高达14,000 MB/s,写入速度高达9,500 MB/s,极大缩短了数据访问时间和延迟,这种性能提升对人工智能、高性能计算等现代工作负载至关重要。
H5100随机读/写IOPS分别高达280万和38万,4K随机读取延迟低于54μs,而写入延迟低于8μs。SSD性能的提升使系统能够加快数据处理和响应速度,并应对更密集的工作负载,使其成为高速数据传输和高效存储应用的理想选择。
▼ 能效
现代数据中心和云服务商不仅面临性能挑战,能效问题也变得愈加重要。通过结合3D eTLC NAND Flash与MarvellTM BraveraTM控制器,H5100实现了高容量与高能效的优势。3D NAND垂直堆叠技术支持高达32TB的容量,同时降低功耗;而BraveraTM SC5控制器的动态电源管理和高效数据处理能力,确保在提供最高性能的同时保持最低能耗,非常适用于有严苛要求的企业级应用。
▼ 外形
外形设计的多样性也同样重要。随着服务器平台逐渐从U.2接口迁移至E3.S,以及云服务商和英伟达推出了多种基于E1.S的应用,SSD厂商需支持更多的外形尺寸。DapuStor H5100的一大优势在于它在Gen5平台中不仅支持传统的U.2外形,也支持E3.S和E1.S EDFFF外形,容量包括3.84TB和7.68TB。与U.2相比,E3.S和E1.S在密度和能效方面具备优势。
▼ 自研固件
DapuStor H5100的另一亮点在于其出色的固件设计。凭借全面的固件自研能力,DapuStor可以更好地加强硬盘内部各组件的协作。这种能力优势体现在多个方面,如从更严格的QoS管理以及支持灵活数据放置 (FDP) 等高级功能。对于有标准框架之外要求的客户,DapuStor还可提供定制化固件,以满足特定应用场景。可定制功能涵盖固件适配、安全配置、性能优化和电源管理。
H5100 SSD的高级服务质量(QoS)功能,能够确保在各种工作负载下性能的一致性和数据完整性。通过QoS功能,硬盘可以有效管理I/O操作并对其进行优先排序,即使在严苛条件下仍保持低延迟和高吞吐量。
▼ FDP
DapuStor H5100的FDP技术优化了盘内数据管理方式。FDP允许将数据写入到不同的物理空间,从而提高了性能、耐用性和整体存储效率。这一高级功能减少了写放大现象,增强SSD处理混合工作负载的能力。尽管目前FDP只应用于云服务商,但由于其提升了SSD耐用性,在OCP的发展迅猛,预计很快将有更多主流应用利用 FDP 技术这一优势。
02 性能展示
为深入了解H5100 E3.S SSD 的性能表现,16块7.68TB H5100搭配 Graid的SupremeRAID™ GPU RAID,在Supermicro 1U服务器进行测试。
「Supermicro Storage A+ ASG-1115S-NE316R 是一款高性能 1U 机架式服务器,适用于数据密集型应用。它支持 16 个热插拔 E3.S NVMe 驱动器,是固态硬盘的理想测试平台。该服务器采用单个 AMD EPYC 9634 84 核 CPU 和 384GB DDR5 ECC 内存。」
在数据传输大小为1MB时,我们看到该RAID组的读取带宽峰值达到了惊人的205GB/s。在16盘 RAID5 的组合中,平均每块SSD的读取速度为12.8GB/s。在顺序写入中,我们测得总带宽为105GB/s,平均每块SSD的写入速度为6.6GB/s,这一表现非常接近 SSD规格表中14GB/s读带宽和8.8GB/s写带宽。
我们通过4K随机传输速度来衡量峰值吞吐量。测试结果显示,4K随机读的最高速度为1810 万IOPS和 74.3GB/s,而4K随机写的最高速度为187.3万IOPS 和7.7GB/s。
在测试峰值带宽或吞吐量时,虽然单一负载下的读写测试非常重要,但不同block size的混合I/O 性能测试可以展示SSD在实际应用中的表现。
我们从 4K block size开始,测试从70%到90%的读比例。在混合70% 读、30% 写的负载测试中,我们测得的吞吐量为 417.3万 IOPS 和 17.1GB/s,平均延迟仅为 0.644 ms。当读负载比例提高到 80% 时,吞吐量提升至 576.2 万 IOPS 和 23.6GB/s。在读90%的混合负载中,性能进一步提升至736 万 IOPS 和 30.1GB/s。
在8K block size 时,测试场景更接近传统的数据库和 OLTP 工作负载。在这种场景下,16个 Gen5 SSD RAID 组的性能表现依然令人印象深刻。在 70% 读混合负载下,吞吐量为 295.6 万 IOPS和24.3GB/s。在 80% 的读混合负载下,吞吐量增至 402.4 万 IOPS,带宽升至 33GB/s。在 90% 的读混合负载下,吞吐量进一步提升至 593.9 万 IOPS,带宽为 48.7GB/s,平均延迟仅为 0.452ms。
在随机工作负载测试中,16K block size测试取得了最佳成绩。通过 GPU 加速的RAID 将 16 块 H5100 Gen5 SSD 组成 RAID5,提高了平台的可用带宽。首先,在 70% 读取的混合负载下,我们测得 193.8 万 IOPS 和 31.7GB/s。在 80% 读取的混合负载下,性能提升至 248.4 万 IOPS 和 40.6GB/s,平均延迟接近 1 毫秒。在 90% 读取峰值时,该存储阵列的性能达到了 363 万 IOPS 和 59.4GB/s 的总带宽,这一数字在随机 I/O 测试中堪称惊人。
03 测试结论
大普微高性能固态硬盘Gen5 SSD H5100在高级应用中起着重要的作用。在人工智能和机器学习领域,H5100能够加速数据处理,加快模型训练和实时分析。在大数据分析领域,H5100保证数据快速检索和分析,为明智的业务决策提供支持。在高频交易场景中,H5100以低延迟和高速性能满足交易环境需求。此外,H5100 E3.S还为虚拟化和云计算提供一致、快速的数据访问,这对于维持虚拟化环境的高效性和可靠性非常重要。无论是哪种使用场景,都能从 Gen5 SSD所带来的出色性能和效率中受益。
LOOKING FORWARD
测试中,H5100 SSD在高密度的1U服务器中表现出色。H5100适用于各种高性能应用的多功能解决方案,帮助企业满足不断变化的数据存储需求。我们通过Graid SupremeRAID的配置方案,重点测试了GPU加速的硬件RAID性能,既能在服务器中保持16个 PCIe Gen5 SSD的强劲性能,同时避免如JBOD或RAID0的配置那样影响存储数据的完整性。该方案的亮点包括惊人的205GB/s 顺序读取和105GB/s 顺序写入带宽(传输大小为1MB)。随机I/O性能同样强劲,在4K传输测试中读取和写入分别达到了惊人的1810 万IOPS和190万IOPS。
与本地性能同样令人兴奋的是其跨网络共享数据的潜力。虽然现在还为时尚早,但我们正在尝试使用 DapuStor与Broadcom 400GbE OCP网卡的配置方案。在1U机箱中配备两张网卡,预计可以实现大约 80GB/s的共享存储性能。对于AI训练或实时数据可视化等任务而言,快速网络和快速存储是使GPU利用率最大化的关键,我们期待在这个卓越的平台上取得更多进展。
Brian Beeler
the chief analyst and President of StorageReview