專題:2026年度國際消費(fèi)電子展(CES)
新浪科技訊 1月6日上午消息,在國際消費(fèi)電子產(chǎn)品展覽會(CES 2026)上,NVIDIA宣布,NVIDIA BlueField-4數(shù)據(jù)處理器作為全棧NVIDIA BlueField平臺的一部分,為NVIDIA推理上下文記憶存儲平臺提供支持,這是一種新型AI原生存儲基礎(chǔ)設(shè)施,專為AI新前沿而打造。
隨著AI模型擴(kuò)展到數(shù)萬億參數(shù)和多步驟推理,它們會生成大量的上下文數(shù)據(jù),并以鍵值(Key-Value,KV)緩存表示,這對準(zhǔn)確性、用戶體驗(yàn)和連續(xù)性至關(guān)重要。鍵值(KV)緩存無法長期存儲在GPU上,因?yàn)檫@會成為多智能體系統(tǒng)中實(shí)時(shí)推理的瓶頸。AI原生應(yīng)用需要一種新型的可擴(kuò)展基礎(chǔ)設(shè)施來存儲和共享這些數(shù)據(jù)。
據(jù)悉,NVIDIA推理上下文記憶存儲平臺通過擴(kuò)展GPU內(nèi)存容量為上下文記憶提供基礎(chǔ)設(shè)施,實(shí)現(xiàn)跨節(jié)點(diǎn)的高速共享,與傳統(tǒng)存儲相比,可將每秒處理的token數(shù)量和能效提升高達(dá)5倍。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI正在徹底改變整個(gè)計(jì)算堆棧,現(xiàn)在,存儲也加入了這場變革。AI不再是那種單次交互的聊天機(jī)器人,而是能夠理解物理世界、進(jìn)行長期推理、基于事實(shí)、使用工具完成實(shí)際工作并兼具短期和長期記憶的智能協(xié)作伙伴。借助BlueField-4,NVIDIA及其軟硬件合作伙伴正在為AI新前沿重塑存儲堆棧?!?/p>
NVIDIA推理上下文記憶存儲平臺可提升鍵值(KV)緩存容量,并加速機(jī)架規(guī)模AI系統(tǒng)集群之間的上下文共享,同時(shí)為多輪AI智能體的上下文持久地提高響應(yīng)速度和AI工廠吞吐量,并支持長上下文、多智能體推理的高效擴(kuò)展。(文猛)