更高效的Gen5 SSD如何赋能AI PC?铠侠EXCERIA PLUS G4 VD10固态硬盘评测
更新于:2025-03-27 01:23:18

在 DeepSeek R1 等大语言模型引发的 AI 应用热潮下,许多用户不满足于通过软件、网页接入的“云侧” AI,而是尝试将模型与参数部署至“端侧”,实现离线化,或者满足微调、训练、隐私、保密等更多复杂的应用需求。

可以说在 AI 时代,巨量数据的存储与读写愈发成为 PC 用户与企业级客户的紧迫需求。在刚刚过去的闪存市场峰会 CFMS 2025 上,就有诸多存储厂商从多角度探讨了端侧 AI 加速落地对存储行业格局的影响。

而在面向个人的消费级领域,固态硬盘的容量、性能依旧是最需要我们关注的要素。在 AI PC 时代,如何选择一块能够满足包括本地部署 AI 在内多种需求的固态硬盘?近期我们就对铠侠推出的 EXCERIA PLUS G4 VD10 固态硬盘展开体验,看它如何为我们展示 PCIe 5.0 时代的“新解法”。

外观设计 & 硬件信息

外观设计上,铠侠 EXCERIA PLUS G4 VD10 固态硬盘 ( 以下简称铠侠 VD10 ) 延续了铠侠消费级固态硬盘系列产品的简约风格,外包装采用蓝黑撞色,主要展示产品外观,同时凸显品牌、容量、速率、通道、尺寸规格、协议支持等具体信息。

从包装中取出硬盘本体,我们也可以看到铠侠 VD10 继续使用标志性蓝色 PCB,搭配风格简洁的表面标签。值得一提的是,铠侠 VD10 作为 PCIe 5.0 固态硬盘,其标签也采用了特殊材质设计,以增强颗粒、主控核心元件的散热效果。

铠侠 VD10 为单面颗粒设计,背面没有布置其它元件,仅有一张印有更多产品信息、认证标识的标签,本次我们体验的是 2TB 版本。

撕下正面带有散热效果的标签,我们可以看到铠侠 VD10 表面的主要元件,包括 1 颗主控芯片与 2 颗闪存颗粒。铠侠 VD10 配备了群联推出的 PCIe 5.0 DRAM-less 主控 E31,采用 TSMC 7nm 制程工艺,4CH 16CE 设计,支持单颗粒速率达 3600MT/s,并支持 NVMe 2.0 协议。

作为自产颗粒的存储原厂,铠侠在 VD10 上采用了自家第 8 代 BiCS FLASH TLC 闪存颗粒,由双颗粒组成 2TB 容量。新锐主控与原厂颗粒加持下,铠侠 VD10 2TB 版标称最高达到 10000MB/s 顺序读取速度与 8200MB/s 顺序写入速度,4K 随机读写速度分别达到 1300K IOPS 与 1400K IOPS,同时耐久度达到 1200TBW。

接下来,我们就将这块铠侠 VD10 固态硬盘安装至 PC 测试平台,分别从本地部署 AI 大语言模型与常规性能两个角度进行体验。

本地部署 AI 模型体验

体验的开头我们就准备给铠侠 VD10 “上点强度”,在一套双路至强处理器的服务器平台上,结合 512GB 内存与最新的 RTX 5090 D 消费级旗舰显卡,以混合架构尝试本地部署并运行 Q4 量化版的 DeepSeek R1-671b。

可以看到,即使在 Q4_K_M 量化下,6710 亿参数的满血 DeepSeek-R1 模型也需要在本地占据 404GB 的硬盘空间。

而在启动模型进行提问的过程中,固态硬盘需要持续进行读取工作,过程中我们能够看到内存与显存的占用率快速提升。经过我们数次 AI 测试,铠侠 VD10 在 CrystalDiskInfo 中显示的总读取已经来到 3TB 以上。

在模型运行中,我们观察到固态硬盘结束读取工作,同时 RTX 5090 D 显卡的显存占用已满,平台配备的 512GB 内存也使用了 373GB。

即使经过量化处理,671B 参数量对我们的测试平台而言依旧过于庞大,在对话生成速度方面受限于处理器与内存性能,其中主要是 8 通道 DDR4 内存的速率瓶颈,RTX 5090 D 在平台中起到的作用也只能是杯水车薪。不过依旧能够验证铠侠 VD10 在存储、加载此类超大规模本地 AI 模型时的能力表现。

接下来,我们将切换至更贴近消费级 PC 的测试平台,体验铠侠 VD10 在更轻量本地 AI 模型部署和使用中的表现。此外,也将在这一平台上进行常规性能测试。

测试使用的平台,部分配置如下:

测试采用阿里开源的推理模型通义千问 QwQ-32B,同样使用 Q4_K_M 量化,328 亿参数下在本地仅需占用 20GB 存储空间。

在体验中,可以看到小参数模型在消费级 PC 平台的加载过程更加快速顺畅,模型运行中分别占据 14.8GB 显存与 13GB 内存,同时在 token 数量,token 生成速度,内容细节方面相比此前的 671B 大模型表现都更好。

这也从一个侧面表明,虽然参数量的绝对数值越大,可能意味着 AI 模型的能力越强,但考虑到每个人的硬件平台性能各有参差,选择适合自己的模型进行本地部署更具可行性。经过 Q4_K_M 量化的 671B 大模型每次加载都会产生超过 400GB 的读取量,较其它常规应用而言对存储的压力更大,也可能会导致用户的固态硬盘寿命快速损耗。

常规性能实测

同样在消费级 PC 测试平台上,我们通过各种软件对这块铠侠 VD10 2TB 固态硬盘进行性能实测。

首先通过 CrystalDiskInfo 查看固态硬盘本身的属性与更多信息,可以看到铠侠 VD10 固态硬盘的实际容量为 2000.3GB,运行在标准的 PCIe 5.0x4 通道,支持 NVMe2.0 标准和 TRIM 等功能。

铠侠 VD10 2TB 版标称最高达到 10000MB/s 顺序读取速度与 8200MB/s 顺序写入速度,4K 随机读写速度分别达到 1300K IOPS 与 1400K IOPS。接下来我们在空盘状态下使用 CrystalDiskMark 进行读、写、混合的三项性能测试。

测试结果显示,这块铠侠 VD10 固态硬盘的顺序写入速度达到 10263.36MB/s,顺序读取速度达到 8726.86MB/s,在 70% 读 30% 写的混合场景下表现不错。同时低队列深度随机 4K 读取的表现也十分突出,达到 83.93MB/s

切换至 IOPS 显示,铠侠 VD10 在多队列多线程的随机 4K 读写中分别测得超过 1400K IOPS 与 1800K IOPS 的结果,混合测试同样接近 1400K IOPS,表现出色。可以说,铠侠 VD10 在 CrystalDiskMark 的各项测试结果中都达到超越标称的水平。

此外我们也单独进行了 4 队列 4 线程的随机 4K 测试,铠侠 VD10 测得 1114.17MB/s 随机读取与 2225.45MB/s 随机写入,混合读写达 1354.94MB/s,性能表现甚至超过我们此前测试的 PCIe 5.0 满血旗舰。

在同样环境下我们也进行了 ASSSDBenchmark 测试,FUTURES 固态硬盘测得顺序读取性能为 7597.86MB/s,顺序写入性能为 7644.94MB/s,整体评分为 12289 分。

近期我们新增了 3DMark 软件内的存储基准测试项目,通过游戏加载、录制、安装、保存、移动多个项目,模拟硬盘在实际游戏负载中的表现,并形成量化可参考的结果。铠侠 VD10 在这一测试中获得 3837 分。

最后为了验证铠侠 VD10 的模拟 SLC 缓存策略,我们在完全格式化固态硬盘并静置一段时间后,使用白眼软件进行全盘稳定性测试,测试过程中同时使用 HWiNFO 软件检测硬盘活动与温度表现。

白眼软件呈现出的红色写入曲线可见比较典型的三段台阶形态,第一段在模拟 SLC 缓存空间内,整体速率维持在 7500MB/s 以上,持续至写入容量超过 370GB 离开 SLC 缓存。

第二段均速降低至约 1500MB/s,推测是 TLC 颗粒的直写阶段,并持续至约 1120GB。最后铠侠 VD10 进入边写入边释放 SLC 缓存的状态,此时主控同时处于多种工作负载,因此均速再次降低,与 500MB/s-1000MB/s 之间波动,直至满盘。

全盘读取方面表现平稳,速率维持在约 6000MB/s。此外,测试全程软件显示铠侠 VD10 的温度最高仅为 53 ℃,即使在主板自带散热装甲的覆盖下,这一温度表现对高性能的 PCIe 5.0 固态硬盘而言也可以说是极致“冷酷”了。

总结

在这块铠侠 EXCERIA PLUS G4 VD10 2TB 固态硬盘,我们首次尝试了在本地 AI 应用的场景下体验存储产品性能。想必随着 AI 时代的发展与更多形态各异的终端产品诞生,从行业级到消费级的用户,对于存储的性能、容量、稳定性需求将会再次激增。

铠侠 VD10 固态硬盘在 PCIe 5.0 时代的开端为我们带来了不错的参考。采用 DRAM-less 设计的固态硬盘,由于在性价比、能效与散热等方面表现更优而深受 DIY 玩家喜爱,铠侠 VD10 将这一特点与优越的顺序与随机读写性能结合起来,在 AI PC 时代将会更加适应笔记本、小主机甚至个人 AI 超算等各式桌面小体型设备的需求。

如何构思一个产品
如何构思一个产品
2025-03-25 17:18:47