記者丨董靜怡 倪雨晴編輯丨駱一帆
英偉達(dá)2026年的首場(chǎng)重頭戲比以往來得更早。
當(dāng)?shù)貢r(shí)間1月5日,在美國CES上,黃仁勛出乎意料地提前發(fā)布了下一代AI芯片平臺(tái)“Rubin”,打破了英偉達(dá)通常在每年3月GTC大會(huì)上集中公布新一代架構(gòu)的傳統(tǒng)。
AI競(jìng)賽進(jìn)入推理時(shí)代,英偉達(dá)決定加速出擊。
Vera Rubin已投產(chǎn)
Rubin并非空降。
早在2025年3月的GTC大會(huì)上,黃仁勛就已預(yù)告了代號(hào)“Vera Rubin”的超級(jí)芯片,并明確其將于2026年量產(chǎn)。
此次在CES上,黃仁勛對(duì)Rubin平臺(tái)進(jìn)行了系統(tǒng)性發(fā)布,Rubin成為英偉達(dá)最新GPU的代號(hào)。
“Rubin的到來正逢其時(shí)。無論是訓(xùn)練還是推理,AI對(duì)計(jì)算的需求都在急劇攀升?!秉S仁勛表示,“我們堅(jiān)持每年推出新一代AI超級(jí)計(jì)算機(jī),通過六顆全新芯片的極致協(xié)同設(shè)計(jì),Rubin正在向AI的下一個(gè)前沿邁出巨大一步?!?/p>
Rubin平臺(tái)采用極端協(xié)同設(shè)計(jì)理念,整合了6顆芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交換芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太網(wǎng)交換芯片,覆蓋了從計(jì)算、網(wǎng)絡(luò)到存儲(chǔ)與安全的多個(gè)層級(jí)。
相比前代Blackwell架構(gòu),Rubin加速器在AI訓(xùn)練性能上提升3.5倍,運(yùn)行性能提升5倍,并配備擁有88個(gè)核心的新款中央處理器(CPU)。
相比英偉達(dá)Blackwell平臺(tái),Rubin平臺(tái)實(shí)現(xiàn)推理token成本最高可降低10倍,訓(xùn)練MoE(專家混合)模型所需GPU數(shù)量減少4倍。
同時(shí),Vera Rubin NVL72機(jī)柜級(jí)系統(tǒng)和平臺(tái)同步發(fā)布,命名上非外界預(yù)計(jì)的NVL144。對(duì)此,英偉達(dá)高管在溝通會(huì)上向21世紀(jì)經(jīng)濟(jì)報(bào)道等記者指出,NVL72指的是72個(gè)GPU封裝單元,每個(gè)封裝內(nèi)部包含2個(gè)Rubin Die,因此系統(tǒng)中實(shí)際包含144個(gè)Rubin Die,這并不意味著系統(tǒng)規(guī)模變化。
在生態(tài)層面,Rubin已獲得頭部云廠商和模型公司的集中響應(yīng)。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名單。
Rubin在CES的提前亮相,也引發(fā)了外界對(duì)英偉達(dá)產(chǎn)品發(fā)布節(jié)奏變化的關(guān)注。對(duì)此,英偉達(dá)高管回應(yīng)稱,目前構(gòu)成Vera Rubin平臺(tái)的六顆芯片已經(jīng)全部到位,相關(guān)系統(tǒng)已在運(yùn)行真實(shí)應(yīng)用負(fù)載,并取得了積極結(jié)果。
此次在CES上提前披露Rubin,主要是為了盡早向生態(tài)伙伴提供工程樣品,方便其為后續(xù)部署和規(guī)模化應(yīng)用做準(zhǔn)備。英偉達(dá)同時(shí)強(qiáng)調(diào),Rubin仍將按照既定節(jié)奏推進(jìn),計(jì)劃在今年下半年進(jìn)入量產(chǎn)爬坡階段,這一時(shí)間安排與此前披露的路線圖保持一致。
全棧AI布局
隨著AI進(jìn)入推理階段,黃仁勛展示的不只是Rubin平臺(tái)。
在CES演講中,英偉達(dá)還發(fā)布了一系列AI體系產(chǎn)品,包括開源模型、AI存儲(chǔ)、物理AI等。這是英偉達(dá)的全棧AI布局,同時(shí)也是其在繼續(xù)釋放信號(hào):AI重心繼續(xù)從“訓(xùn)練規(guī)模”轉(zhuǎn)向“推理系統(tǒng)”。
具體來看,英偉達(dá)發(fā)布了推理上下文存儲(chǔ)平臺(tái)(Inference Context Memory Storage Platform),這是一個(gè)專為推理場(chǎng)景設(shè)計(jì)的AI原生存儲(chǔ)平臺(tái)。該平臺(tái)由BlueField-4 DPU與Spectrum-X以太網(wǎng)支撐,在GPU與傳統(tǒng)存儲(chǔ)之間引入新的存儲(chǔ)層,用于高效管理和共享KV Cache,減少重復(fù)計(jì)算帶來的算力浪費(fèi)。
同時(shí),黃仁勛特別強(qiáng)調(diào)了物理AI。在更長(zhǎng)期的布局上,英偉達(dá)圍繞物理AI推進(jìn),發(fā)布了一系列開源模型、開發(fā)框架和硬件平臺(tái),將AI能力從數(shù)據(jù)中心延伸至機(jī)器人、自動(dòng)駕駛與工業(yè)邊緣場(chǎng)景。
黃仁勛表示:“AI已經(jīng)不再是一次性問答的聊天機(jī)器人,而是能夠理解物理世界、進(jìn)行長(zhǎng)期推理、使用工具完成真實(shí)工作,并同時(shí)保有短期和長(zhǎng)期記憶的智能協(xié)作者?!?/p>
面向機(jī)器人領(lǐng)域,英偉達(dá)發(fā)布了Cosmos與GR00T系列開源模型,用于機(jī)器人學(xué)習(xí)、推理與動(dòng)作規(guī)劃。
其中,Cosmos Reason 2是一款推理型視覺語言模型(VLM),使機(jī)器能夠“看見、理解并在物理世界中行動(dòng)”;GR00T N1.6 則是一款面向類人機(jī)器人的推理型視覺-語言-動(dòng)作(VLA)模型,用于解鎖全身控制能力。
“機(jī)器人領(lǐng)域的ChatGPT時(shí)刻已經(jīng)到來,”黃仁勛表示,“能夠理解現(xiàn)實(shí)世界、進(jìn)行推理并規(guī)劃行動(dòng)的物理AI模型,正在解鎖全新的應(yīng)用場(chǎng)景。英偉達(dá)覆蓋Jetson、CUDA、Omniverse 以及開源物理AI模型的完整技術(shù)棧,正在賦能全球合作伙伴,通過AI驅(qū)動(dòng)的機(jī)器人重塑各個(gè)行業(yè)?!?/p>
在自動(dòng)駕駛領(lǐng)域,英偉達(dá)發(fā)布了Alpamayo開源模型家族,定位為面向“長(zhǎng)尾場(chǎng)景”的推理型自動(dòng)駕駛基礎(chǔ)模型。該體系配套發(fā)布了AlpaSim高保真仿真框架以及覆蓋1700多小時(shí)駕駛數(shù)據(jù)的開源數(shù)據(jù)集,用于訓(xùn)練和驗(yàn)證基于推理的自動(dòng)駕駛系統(tǒng)。黃仁勛表示,英偉達(dá)的首款A(yù)V車將于第一季度在美國推出,其他地區(qū)緊隨其后。
從Rubin平臺(tái)的提前亮相,到推理存儲(chǔ)與物理AI的同步推進(jìn),英偉達(dá)正在將AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)推向“系統(tǒng)工程能力”。
在這一階段,真正拉開差距的,已不只是芯片算力本身,而是從架構(gòu)、系統(tǒng)到生態(tài)的整體交付。
查看更多《直擊2026CES:萬物AI》
21世紀(jì)經(jīng)濟(jì)報(bào)道新年寵粉福利來啦
2026年1月1日—2026年1月10日,點(diǎn)贊、分享及評(píng)論21世紀(jì)經(jīng)濟(jì)報(bào)道原創(chuàng)文章后,截圖發(fā)至后臺(tái)并私信“新年快樂+姓名+手機(jī)號(hào)”。小編每天隨機(jī)抽10位粉絲,每人贈(zèng)送一份新年禮物。
獎(jiǎng)品隨機(jī)6選1(國風(fēng)新年糖桶、低糖蛋黃酥禮盒、黃油蛋卷、5L菜籽油、果然有福混合包、秋月梨米酒),免費(fèi)快遞到家。
SFC
來源丨21財(cái)經(jīng)客戶端 21世紀(jì)經(jīng)濟(jì)報(bào)道
編輯丨曾靜嬌