當AI大模型的本地部署從“錦上添花”變?yōu)?ldquo;剛需標配”,存儲性能的瓶頸愈發(fā)凸顯。百億參數(shù)的大模型動輒上百GB,傳統(tǒng)PCIe 4.0 SSD在加載時讓人“望眼欲穿”,而高端PCIe 5.0產(chǎn)品又往往與高功耗、高成本綁定。如何兼顧速度與效率?憶聯(lián)給出了自己的答案——AM6D1 DRAMLess PCIe 5.0 SSD。這款采用4通道主控、無獨立緩存設計的固態(tài)硬盤,能否在模型加載及日常應用中實現(xiàn)突破?知名硬件評測專業(yè)機構MicroComputer評測室從大模型實測到全盤讀寫,到游戲載入與功耗溫控,對AM6D1 2TB SSD進行了全面驗證。以下為詳細評測原文。
隨著AI大模型從云端向終端加速落地,本地部署大語言模型(LLM)正成為開發(fā)者和企業(yè)的剛需——無需依賴網(wǎng)絡、無延遲響應、數(shù)據(jù)隱私零泄露,且可靈活微調模型參數(shù)。然而,當模型參數(shù)膨脹至百億甚至千億級,Token吞吐量便成為衡量本地AI體驗的核心指標:從模型加載到首個Token生成,再到連續(xù)推理過程中的Token流暢度,每一個環(huán)節(jié)都依賴于存儲性能。

以Qwen3-235B-A22B為例,其109.25GB的龐大體量,若存儲帶寬不足,不僅模型加載耗時數(shù)分鐘,更會導致Token生成卡頓、推理延遲飆升,讓本地AI形同虛設。傳統(tǒng)PCIe 4.0 SSD早已捉襟見肘,而高端PCIe 5.0產(chǎn)品又普遍存在成本高、功耗大的痛點。
正是在這樣的市場需求驅動下,國產(chǎn)存儲領軍企業(yè)憶聯(lián)推出了兼顧性能與成本的AM6D1 DRAMLess PCIe 5.0 SSD。那么,它在實際測試中表現(xiàn)如何,能否實現(xiàn)“秒加載、高吞吐”?我們一測究竟。
產(chǎn)品規(guī)格
接口:PCIe 5.0 x4
主控:PCIe 5.0 4通道主控
閃存:3D堆疊TLC閃存芯片
緩存:N/A
板型:M.2 2242/M.2 2280
可選容量:512GB、1TB、2TB
耐久度:200TBW(512GB)、400TBW(1TB)、800TBW(2TB)
基于PCIe 5.0 DRAMLess高性價比解決方案
由于需要達成高速度、低成本與低功耗的目標,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤與那些基于8通道主控芯片、獨立緩存的PCIe 5.0產(chǎn)品不同,它采用PCIe 5.0 4通道DRAMLess主控,相比8通道方案有效降低了SSD的功耗、發(fā)熱量與成本。同時這款產(chǎn)品支持ASPM L1.2低功耗模式,在深度休眠模式下的標稱功耗可降至3mW以下,能夠顯著延長筆記本電腦、游戲掌機等移動設備的電池續(xù)航時間。DRAMLess無獨立緩存主控芯片的采用還意味著,無須配備價格高高在上的內存顆粒,固態(tài)硬盤將通過HMB主機高速緩沖技術,占用少量系統(tǒng)內存作緩存來臨時保存已從閃存讀取的數(shù)據(jù)、要寫入閃存的數(shù)據(jù),以及地址映射表,從而有效提升SSD的I/O性能——其標稱順序讀寫速度分別可達11400MB/s、10900MB/s,隨機4K讀寫性能分別為1600K IOPS、1150K IOPS。

圖注:本次我們對M.2 2242板型的憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB產(chǎn)品進行了測試
同時該產(chǎn)品還采用了高性能、高密度的3D堆疊TLC閃存顆粒。目前憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤有512GB、1TB與2TB三種容量,以及M.2 2242、M.2 2280兩種板型供用戶選擇,可以分別適配移動平臺與臺式機。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB產(chǎn)品上只有1顆主控、1顆閃存芯片與1顆PMIC電源管理芯片。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的PCB背面沒有任何元器件
接下來我們特別搭建了基于AMD銳龍9 9950X、32GB DDR5 6000雙通道內存、X870E主板與Radeon RX 9070XT顯卡的測試平臺,對憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB進行了測試。需要提及的是,在進行3DMark存儲性能測試、PCMark完整系統(tǒng)盤測試時,為更好地發(fā)揮固態(tài)硬盤的隨機性能,我們則換用基于酷睿i9-14900K、Z790主板與GeForce RTX 5070顯卡的英特爾平臺。

圖注:像ROG主板這類產(chǎn)品擁有相關扣具,也能在臺式機主板上輕松安裝憶聯(lián)AM6D1 M.2 2242板型的產(chǎn)品。
測試平臺
主板:ROG CROSSHAIR X870E DARK HERO主板
處理器:AMD銳龍9 9950X
內存:DDR5 6000 CL28 32GB內存套裝
硬盤:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB
顯卡:藍寶石RX 9070XT極地OC顯卡
電源:ROG THOR 1200W
操作系統(tǒng):Windows 11 25H2
超越標稱規(guī)格
首先從基準測試來看,憑借采用高性能PCIe 5.0 4通道DRAMLess主控、3D堆疊TLC閃存顆粒,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的確有非常不錯的表現(xiàn)。在CrystalDiskMark測試中,它的順序讀取速度突破了11400MB/s的標稱規(guī)格,測試成績?yōu)?1481.24MB/s。其順序寫入速度則達到10961.49MB/s,也超過了10900MB/s的標稱順序寫入速度,相比PCIe 4.0 SSD的確有很大的提升。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的CrystalDiskMark測試成績
在隨機性能測試中,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB在隨機4K Q32T16讀寫測試中的成績分別達到6737.16MB/s、7335.72MB/s。換算過來,其隨機4K讀寫性能分別可達1664K IOPS、1790K IOPS。而這款固態(tài)硬盤的標稱隨機4K讀寫性能分別為1600K IOPS、1150K IOPS,其讀取成績小幅超越標稱規(guī)格,寫入性能則大幅超過標稱的1150K IOPS。

圖注:以IOPS為單位顯示的CrystalDiskMark測試成績
僅需10.52s載入32B模型,不到55s載入235B大模型
目前大語言模型已經(jīng)成為用戶越來越離不開的生產(chǎn)工具。在本地部署、應用大語言模型時,通常有兩大特點:這類模型會占用很大的存儲空間;同時,在載入、調用大模型時,也需要固態(tài)硬盤具有較高的讀取速度,才能快速地將模型數(shù)據(jù)傳輸給內存與顯存,以減少載入耗時。首先,我們在僅有32GB內存配置的環(huán)境下,體驗了DeepSeek-R1-Distill-Qwen-32B模型,該模型容量為19.97GB。由于模型容量接近20GB,所以加載這個模型之后留給系統(tǒng)的可用內存并不多,很可能會影響電腦的運行速度。不過,好在憑借憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB強勁的傳輸性能,它僅需10.52s就能將模型數(shù)據(jù)傳輸?shù)絻却嬷校覝y試平臺以9.01tok/s的詞元生成速度完成用戶的任務。

圖注:借助憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB,測試平臺載入32B模型耗時僅需10.52s。
接下來,我們加大難度,通過采用128GB DDR5 6000內存,來測試搭配憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB載入Qwen3-235B-A22B大模型的表現(xiàn),這款模型的容量高達109.25GB。它是一個擁有235B總參數(shù)和22B激活參數(shù)的MoE(混合專家)模型,在代碼、數(shù)學和通用能力等基準測試中與DeepSeek-R1、OpenAI-o1、OpenAI-o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比擁有極具競爭力的表現(xiàn)。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB只需要53.99s就能載入容量達109.25GB的Qwen3-235B-A22B大語言模型
結果同樣令人滿意,盡管模型容量高達109.25GB,但借助憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB較高的讀取速度,測試平臺只需53.99s就能載入該模型。我們使用該模型來撰寫一首14行英文詩,也能實現(xiàn)5.42tok/s的詞元生成速度,讓普通電腦具備使用超大規(guī)模參數(shù)大語言模型的能力。
4K分辨率下也能帶來秒開游戲的體驗
鑒于像憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤這類兼顧性能、功耗與成本的產(chǎn)品,在未來也很可能被臺式機游戲電腦、游戲本與游戲掌機采用,那么它的游戲性能表現(xiàn)如何呢?首先在《最終幻想14:拂曉之途》中,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB載入5個場景的總耗時僅有5.683s,單個場景的加載耗時大多不到1s。在4K分辨率、最高畫質設置下能取得這樣的成績難能可貴,其耗時甚至低于很多采用2.5K分辨率或1080p分辨率進行測試的固態(tài)硬盤,不少產(chǎn)品在該測試中的總耗時達6.5s~8s。

圖注:在游戲《最終幻想14:拂曉之途》的4K分辨率設置下,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB載入5個場景的總耗時僅5.683s。
在支持DirectStorage技術的《Forspoken魔咒之地》測試中,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB在7個場景中的最長加載時間也不到2s,只有1.989s,其中3個游戲場景的加載耗時甚至不到1s。比如測試中第1個場景的加載耗時只有0.59s,第7個場景的加載耗時只有0.927s,加載速度極快。這主要得益于DirectStorage技術可以將SSD上的游戲數(shù)據(jù)直接發(fā)送給GPU進行處理,無須再經(jīng)過處理器中轉。總體來看,在《最終幻想14:拂曉之途》《Forspoken魔咒之地》中,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤帶來的就是秒開游戲的體驗。

圖注:在游戲《Forspoken魔咒之地》的4K分辨率設置下,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB在部分場景中的加載時間不到1s。
PCMark 10、3DMark專業(yè)測試表現(xiàn)突出
如前文所述,以上測試都是基于AMD銳龍9 9950X處理器的平臺進行的。考慮到還有不少整機使用英特爾處理器,且英特爾處理器可以更好地發(fā)揮出SSD的隨機讀寫性能,因此我們還在基于英特爾酷睿i9-14900K處理器的英特爾平臺上,運行了考察日常應用性能的PCMark 10完整系統(tǒng)盤測試、聚焦產(chǎn)品游戲表現(xiàn)的3DMark存儲性能測試。
而憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的PCMark 10完整系統(tǒng)盤測試總分高達5642,平均傳輸帶寬為880.57MB/s,優(yōu)于不少同樣基于PCIe 5.0 DRAMLess主控的PCIe 5.0固態(tài)硬盤,以及高端PCIe 4.0固態(tài)硬盤。在我們的測試中,后面兩類產(chǎn)品的得分大多在4900~5200分之間。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的PCMark 10完整系統(tǒng)盤測試總分高達5642,超越不少同樣基于PCIe 5.0 DRAMLess主控的PCIe 5.0固態(tài)硬盤。
3DMark存儲性能測試中,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB同樣有優(yōu)秀的表現(xiàn),其總分高達5893分,平均傳輸帶寬達993.85MB/s。而高端PCIe 4.0 SSD在3DMark存儲性能測試中則難以超過4500分,我們測過的同類PCIe 5.0 DRAMLess固態(tài)硬盤得分未超過5200,平均傳輸帶寬僅873.05MB/s。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的3DMark存儲性能測試高達5893分
全盤讀寫性能測試
那么憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤在長期使用,進行超大容量數(shù)據(jù)的表現(xiàn)如何呢?我們使用Txbench進行了全盤讀寫測試。首先在全盤順序讀取測試中,SSD輕松地完成了任務,全盤平均順序讀取速度高達14116.17MB/s,遠超標稱的11400MB/s順序讀取速度。全盤順序寫入測試中,我們發(fā)現(xiàn)AM6D1 PCIe 5.0固態(tài)硬盤2TB的SLC緩存容量較大,SLC固定容量緩存設置在574GB左右。在這個容量范圍內寫入,其寫入速度能保持在10900MB/s~11000MB/s。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的全盤平均順序讀取速度可達14116.17MB/s,讀取完2TB數(shù)據(jù)時的溫度僅30℃。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的固定SLC緩存容量設置在574GB左右
最終其全盤平均順序寫入速度能達到2208.65MB/s。我們認為其全盤平均寫入性能在SSD中屬于較好的水準,不少固態(tài)硬盤因為SLC緩存容量小、全盤平均順序寫入速度往往不到2000MB/s。

圖注:憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的全盤平均順序寫入速度可達2208.65MB/s,寫入2TB數(shù)據(jù)后的溫度為57℃。
SSD功耗測試
在進行全盤讀寫測試的同時,我們也對這款產(chǎn)品的功耗進行了測量。首先當電腦進入到睡眠狀態(tài)時,由于所用功耗測量儀最小只能顯示到10mW,而憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB在睡眠狀態(tài)下的標稱功耗只有3mW,因此功耗測量儀直接給出了0.00W的顯示結果。

圖注:由于所用功耗測量儀最小只能顯示10mW,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB在睡眠狀態(tài)下,我們的功耗顯示儀給出了0.00W的數(shù)值。
在最重要的負載功耗上,憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB的表現(xiàn)也很優(yōu)秀,其進行全盤順序讀取時的功耗在2.79W~2.82W之間波動,最大功耗不超過2.82W。在全盤順序寫入場景下,其功耗控制也相當優(yōu)秀,滿載功耗僅略高于高性能PCIe 4.0固態(tài)硬盤。

圖注:進行全盤順序讀取時,我們捕捉到的憶聯(lián)AM6D1 PCIe 5.0固態(tài)硬盤2TB最大讀取功耗為2.82W。
寫在最后
綜合全文測試不難發(fā)現(xiàn),憶聯(lián)AM6D1 PCIe 5.0 SSD正是為破解AI大模型本地部署存儲瓶頸而生的理想方案。面對龐大的大語言模型文件,它以11400MB/s+的傳輸速度、突破1600K IOPS的隨機性能,將32B模型加載壓縮至10.52s,235B超大模型載入僅需53.99s,讓本地AI應用告別漫長等待。其DRAMLess無緩存架構+4通道主控設計,兼顧高性能與低能耗,適配從臺式工作站到AI筆記本、掌機的全場景部署需求。配合2TB大容量與M.2 2242/2280雙板型兼容性,該產(chǎn)品能完美滿足各類計算平臺的大模型存儲、多任務調度與隱私數(shù)據(jù)本地化的核心訴求。憶聯(lián)AM6D1以PCIe 5.0時代的平衡之道,將成為本地部署大語言模型的首選存儲基石,從而實現(xiàn)超大規(guī)模AI能力在終端設備的高效落地。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
