外媒ServeTheHome评测:对标Optane, 100 DWPD 的新一代 SLC 产品X2900P
近日,海外权威存储评测网站ServeTheHome(简称:STH)针对DapuStor大普微PCIe 4.0存储级内存Xlenstor2 SCM系列其中的X2900P型号进行了整体评测。STH是为IT专业人士提供了解服务器、存储、网络和高端工作站硬件以及优秀开源项目的指南,致力于帮助专业人士和爱好者掌握最新的服务器、存储和网络趋势。本文内容摘选自STH官方发布。
DapuStor Xlenstor2 X2900P 标签
”
自英特尔宣布 Optane 停产以来已经过去了一年多,存储级内存(SCM)固态硬盘成为高端 SSD 市场中的空白,业界需要能够稳定处理大量写入的SSD。今天,我们来看看 DapuStor Xlenstor2 X2900P。这是一款 800GB 的固态硬盘,使用 SLC NAND实现了每天高达100次全盘写入数据量(DWPD)的耐久度和稳定性能。
01 DapuStor Xlenstor2 X2900P 800GB 介绍
作为DapuStor最高端SSD产品之一,DapuStor Xlenstor2 X2900P 是一款最高容量达800GB 的 PCIe Gen4 NVMe 固态硬盘,尺寸为 2.5 英寸。
DapuStor Xlenstor2 X2900P 斜视图
这款固态硬盘的容量为800GB,对于目前的固态硬盘来说并不是很大,因为我们在此前的视频中简要展示了 30.72TB 到 61.44TB 的固态硬盘。但这款固态硬盘并不是为了追求容量而设计,而是为了处理大量写入压力的应用程序,例如日志记录、某些数据库功能等,以及所有要求稳定的低延迟的应用。因为数据中心固态硬盘供应商正在瞄准硬盘市场,许多厂商已经转向大容量的TLC和QLC固态硬盘。而DapuStor当前所做的这类产品是完全不同的。
DapuStor Xlenstor2 系列产品规格说明
我们测试的是 800GB 的 DapuStor X2900P。“P” 是指具有更高写入耐久度和更高性能的版本,其最高容量低于X2900,但具有更极致性能的SSD。
这款SSD基于KIOXIA的XL-FLASH NAND,是一种用于提升性能的SLC NAND。
Kioxia FL6 Why XL-FLASH
当每个单元存储一个bit位时,XL-FLASH NAND 存储的数据量相对于常见的TLC和QLC固态硬盘只有三分之一到四分之一。虽然这降低了容量,但SLC拥有更强的电荷保持能力。因此,Xlenstor2有更高的写入寿命和更高的性能,这是这款产品的两个特色。
DapuStor Xlenstor2 X2900P 侧面图
接下来让我们看看实际评测的内容。
02 DapuStor Xlenstor2 X2900P 800GB基本性能
我们将运行多个工作负载,以查看 DapuStor Xlenstor2 的性能。我们还会提供一些易于使用的桌面工具截图,以便您可以快速轻松地将结果与其他SSD进行比较。
CrystalDiskMark 8.0.4 x64
这里是 DapuStor Xlenstor2 800GB(D:代表 DapuStor)和 Intel Optane DC P5800X 800GB(O:代表 Optane)的对比:
800GB Drives CrystalDiskMark
在 4K 随机写, Q1T1的配置下 ,我们观察到了最令人意外的一点。我们没有预料到 DapuStor 会在这里取得小小的胜利,但它确实做到了。在读性能方面,Optane 在低队列深度配置时领先。
ATTO Disk Benchmark
对于想了解在ATTO Disk Benchmark下,DapuStor X2900P与Intel Optane DC P5800X 对比情况的读者,请看下方测试结果:
800GB Drives Atto Disk Benchmark 4
我们使用4KB作为最小值,因为这个数值与Optane SSD的规格对齐。在DapuStor的测试结果中值得注意的是它表现出来的一致性。在连续变化的测试负载下,1GB和8GB的每个测试例的读/写性能结果几乎相同,这是大多数SSD无法做到的。这可能是我们在这次测试中看到的最特别的一点。
AS SSD Benchmark
这里我们可以再次看到两个SSD之间相当接近的对比。Optane在四个测试的时延指标中赢得了三场胜利,但DapuStor也赢得了一场。通常,低时延就是SCM类产品的优势所在。
800GB Drives AS SSD
接下来,让我们看看linux 系统下的性能测试。
03 DapuStor Xlenstor2 X2900P 性能
我们的第一个测试是查看DapuStor Xlenstor2 X2900P的顺序传输速率和4K随机IOPS性能。请原谅我们使用了比通常情况下更小的厂商产品集合来进行比较。在下一节中,您将看到为什么我们只比较了少量厂商产品。主要原因是我们切换到了一个拥有众多CPU架构的测试环境(导致CPU和SSD的组合可能过多)。按照惯例,让我们看看各类SSD的性能。
DapuStor Xlenstor2 X2900P Four Corners Sequential Performance
DapuStor Xlenstor2 X2900P Four Corners 4K Random Read Write IOPS Performance
SCM SSD与普通NAND SSD之间的明显区别在于4K随机写入。这正是SCM SSD的设计目的。虽然普通NAND已经在4K随机读取方面做得相当好了,但写入方面总是表现不佳。在这里,我们可以看到DapuStor、Optane与今年的Micron 9400 Pro等高性能NAND SSD之间拉开的巨大差距。
总体而言,DapuStor和P5800X的4K随机写入延迟非常相似。最大的区别在于读延迟,Optane在这方面非常快,只有DapuStor的40-60%(但是两者都比TLC/QLC NAND SSD低得多)。
04 DapuStor Xlenstor2 X2900P在不同应用场景下的性能比较
对于我们的应用性能测试,我们仍在使用AMD EPYC平台。我们已经将所有这些测试工作部署在x86上,但还没有放在Arm和POWER9上,因此这仍然是基于x86工作负载下的评测。
DapuStor Xlenstor2 X2900P Application Testing Performance
正如你所看到的, DapuStor对应用性能产生的影响方面存在很多变量。让我们逐一进行讨论并探讨性能的驱动因素。
在NVIDIA T4 MobileNet V1脚本上,我们几乎看不到硬盘对AI工作负载的性能影响,虽然确实存在一些。关键在于NVIDIA T4的性能在很大程度上限制了我们,存储不是瓶颈。我们有一个NVIDIA L4,将来会使用更新的模型做些测试。在这个场景下,我们可以看到新型SSD在性能方面的好处,但并不是很大。存储是整个系统的一部分。大多数存储产品的评测主要集中在线路上,看到顺序吞吐量从PCIe Gen3翻倍到PCIe Gen4可能很令人兴奋,但在许多实际工作负载中,系统的压力并不仅仅在于存储。
Adobe Media Encoder测试脚本中,我们计时了对固态硬盘的复制,然后是视频文件的转码,接着是从固态硬盘传输出来。在这个场景里,存储系统对性能有更大的影响,因为涉及到一些较大的顺序读/写,但主要的性能影响因素是编码速度。从这些测试中可以得出的关键结论是:如果应用的性能主要受计算资源限制,但仍需要在工作流程的某些部分中使用存储,则SSD可以使端到端的性能得到一定程度的提升。
在KVM虚拟化测试中,我们看到系统性能更多地依赖于存储。KVM虚拟化Workload 1比Workload 2或VM Boot Storm workload更受CPU限制,因此我们在这个测试中虽然看到了配置SCM系统的强大性能,但是不如其他两个明显。这个测试是基于KVM虚拟化的工作负载,测试指标是看客户端在完成目标SLA的情况下可以同时在线的VM数量。每个VM都施加一个独立的工作负载。再来看看Workload 2,由于使用了数据库,因此根据我们的性能分析,当使用高速存储设备或Optane PMem时可以很好地提升性能。但是如果数据集更大,则PMem无法支持容量增长;并且这项技术正在退出市场导致技术供应断层。基于这些分析,也解释了为什么我们在其它CPU评测文章中使用Workload 1的原因。另一方面,DapuStor的高速随机IOPS性能在Workload 2和VM Boot Storm的测试场景上能够真正提供帮助。我们可以看到新型固态硬盘的性能真的很出色,速度非常快。
转到file server和nginx CDN测试场景,我们看到DapuStor在QoS和吞吐量指标上的表现要比其它SSD好得多。如果我们将PCIe Gen4上的SSD视为具有较低延迟的链接,这可能是有道理的。由于其更快的顺序速度,DapuStor在file server测试场景上领先。在nginx CDN测试中,我们使用了STH网站的旧快照和访问模式,并禁用了缓存,以显示在这种情况下性能的情况。下图是测试结果分布的概览:
DapuStor Xlenstor2 X2900P STH NGINX Web Hosting Nginx CDN Latencies
这里我们可以真正看到SCM级SSD和以容量为重点的SSD之间的巨大差距。在99%时差距并不明显,但到了五个“9”时,差距变得巨大。总体而言,这是非常出色的性能。需要明确的是,Intel Optane P5800X在其中一些方面击败了DapuStor,但由于Optane即将退出市场,或许可以将其视为一种性能水平类似的替代品。因为STH网站没有占用大量容量,在过去五年中我们一直用SCM托管网站的数据。
现在,对于接下来的大项目:我们使用了每个PCIe Gen4架构和我们所能找到的新PCIe Gen5架构进行了这些SSD的测试,不仅仅是x86,甚至不仅仅限于在美国可用的服务器。
05 DapuStor Xlenstor2 X2900P 800GB在不同CPU架构下的性能比较
如果你看过我们最近的文章《2022-2023年AMD Arm和Intel服务器CPU - 核越多越好》,《Supermicro ARS-210ME-FNR Ampere Altra Max Arm服务器评测》、《华为海思鲲鹏920 Arm服务器》等,你可能已经看到我们一直在扩大我们的测试平台以及更多的架构。这是除了Ampere Altra 80核心CPU之外的另一个架构,这些CPU来自于Oracle Cloud、Microsoft Azure和Google Cloud使用的家族。我们还设法在最新一代的AMD EPYC Bergamo和Genoa-X SKU上进行了测试。
DapuStor Xlenstor2 X2900P Four Corners Average Performance To AMD EPYC 7002 Rome
因为图不好看清楚,我们做了一个局部放大的视图,去掉了x坐标的0点。
DapuStor Xlenstor2 X2900P Four Corners Average Performance To AMD EPYC 7002 Rome Zoom
总体看,这款SSD在较新的PCIe Gen4和Gen5 x86控制器上表现良好。Arm和IBM Power9控制器通常较慢,正如我们在这里看到的。所以测试结果没有什么意外。
Falcon Northwest RAK Intel Xeon W 3495X Edition 9
与Sapphire Rapids部分上看到的情况类似,Intel Xeon W-3400系列和W-2400系列上的表现也很好。因为它们是相同的基础芯片,唯一的区别是:当处于全功率模式时,我们发现顶级的56核Intel Xeon w9-3495X在Falcon Northwest服务器/工作站中表现更好。
06 总结
英特尔Optane DC P5800X是一款出色的固态硬盘,但现在已经停产。更重要的是,Optane作为一项技术已经被淘汰,这意味着想在2.5英寸的尺寸中获得持久性存储,NAND固态硬盘实际上是唯一的选择。为此,DapuStor推出了一款800GB的PCIe Gen4 NVMe固态硬盘,具备出色的性能,填补了Optane淘汰后留下的空白。
我们之所以称之为Optane替代品,是有充分的理由的。它们的尺寸相同,性能特点也相似,除了在4K随机读取方面稍有不同。这两款固态硬盘都是100 DWPD的,这简直是令人难以置信的数字。这意味着在800GB的固态硬盘上,每天可以进行80TB的随机写入,持续五年。与此同时,市场上的大部分产品已经转向了更高容量的TLC/QLC NAND固态硬盘,这使得DapuStor Xlenstor2 X2900P成为一个更为特定的产品。尽管如此,仍有很多应用程序正在寻找Optane的替代方案,而DapuStor在这里提供了一个非常强大的选择。"
——ServeTheHome