專題:2026年度國(guó)際消費(fèi)電子展(CES)
新浪科技訊 1月6日上午消息,一年一度的CES展會(huì)期間,黃仁勛在英偉達(dá)新品發(fā)布會(huì)上把一臺(tái)2.5噸重的AI服務(wù)器機(jī)架搬上了舞臺(tái),并首次展示其Vera Rubin計(jì)算平臺(tái),黃仁勛表示,其命名是以發(fā)現(xiàn)暗物質(zhì)的天文學(xué)家而命名,目標(biāo)是加速AI訓(xùn)練的速度,讓下一代模型提前到來(lái)。
黃仁勛表示,伴隨著摩爾定律的放緩,傳統(tǒng)性能提升方式已經(jīng)跟不上AI模型每年10倍的增長(zhǎng)速度,所以英偉達(dá)選擇了極致協(xié)同設(shè)計(jì),即在所有芯片、整個(gè)平臺(tái)各個(gè)層級(jí)上同時(shí)創(chuàng)新。
Vera CPU具備88個(gè)NVIDIA定制Olympus核心,采用NVIDIA空間多線程技術(shù),支持176個(gè)線程,NVLink C2C帶寬1.8 TB/s,系統(tǒng)內(nèi)存1.5TB(為Grace的3倍),LPDDR5X帶寬1.2 TB/s,2270億個(gè)晶體管。
Rubin GPU的NVFP4推理算力50PFLOPS,是前代Blackwell的5倍,擁有3360億晶體管,比Blackwell晶體管數(shù)量增加了1.6倍,搭載第三代Transformer引擎,能根據(jù)Transformer模型需求動(dòng)態(tài)調(diào)整精度。
ConnectX-9網(wǎng)卡則基于200G PAM4 SerDes的800 Gb/s以太網(wǎng),可編程RDMA與數(shù)據(jù)通路加速器,通過了CNSA與FIPS認(rèn)證,晶體管數(shù)量達(dá)到230億。
還有專為新一代AI存儲(chǔ)平臺(tái)而構(gòu)建的端到端的引擎BlueField-4 DPU,是一款具備面向SmartNIC與存儲(chǔ)處理器的800G Gb/s DPU,搭配ConnectX-9的64核Grace CPU,晶體管數(shù)量1260億。
還有NVLink-6交換芯片,連接18個(gè)計(jì)算節(jié)點(diǎn),支持最多72個(gè)Rubin GPU像一個(gè)整體協(xié)同運(yùn)行,在NVLink 6架構(gòu)下,每個(gè)GPU可獲得3.6 TB每秒的all-to-all通信帶寬,采用400G SerDes,支持In-Network SHARP Collectives,可在交換網(wǎng)絡(luò)內(nèi)部完成集合通信操作。
第六款是Spectrum-6光以太網(wǎng)交換芯片,其擁有512通道,每通道200Gbps,實(shí)現(xiàn)更高速數(shù)據(jù)傳輸,集成臺(tái)積電COOP工藝的硅光子技術(shù),配備共封裝光學(xué)接口(copackaged optics),晶體管數(shù)量達(dá)到3520億。
黃仁勛介紹道,通過6款芯片的深度整合,Vera Rubin NVL72系統(tǒng)性能比上一代Blackwell實(shí)現(xiàn)了全方位的提升。在NVFP4推理任務(wù)中,該芯片達(dá)到了3.6 EFLOPS 的驚人算力,相比上一代Blackwell架構(gòu)提升了5倍。在NVFP4訓(xùn)練方面,性能達(dá)到 2.5 EFLOPS,實(shí)現(xiàn)3.5倍的性能提升。
存儲(chǔ)容量方面,Vera Rubin NVL72配備了54TB的LPDDR5X內(nèi)存,是前代產(chǎn)品的3倍。HBM(高帶寬內(nèi)存)容量達(dá)到20.7 TB,提升1.5倍。在帶寬性能上,HBM4帶寬達(dá)到1.6 PB/s,提升2.8倍;Scale-Up帶寬更是高達(dá)260 TB/s,實(shí)現(xiàn)了2倍增長(zhǎng)。(羅寧)