人工智能巨頭英偉達(dá)(NVDA)于周一在拉斯維加斯舉辦的 2026 年國(guó)際消費(fèi)電子展(CES)上,正式發(fā)布其新一代超級(jí)芯片 “Vera Rubin”。該芯片是英偉達(dá)全新推出的魯賓平臺(tái) 所包含的六款芯片之一,在單一處理器中集成了一顆薇拉中央處理器(CPU)與兩顆魯賓圖形處理器(GPU)。
英偉達(dá)稱,魯賓平臺(tái)是智能體人工智能、高級(jí)推理模型以及混合專家模型(MoE) 的理想算力支撐。混合專家模型整合了一系列 “專精型” 人工智能模型,可根據(jù)用戶提出的問(wèn)題,將查詢指令分配至對(duì)應(yīng)的專業(yè)模型進(jìn)行處理。
英偉達(dá)首席執(zhí)行官黃仁勛在一份聲明中表示:“魯賓平臺(tái)的推出恰逢其時(shí),當(dāng)前人工智能模型訓(xùn)練與推理的算力需求正呈爆發(fā)式增長(zhǎng)?!?/p>
“我們始終以每年迭代一代人工智能超級(jí)計(jì)算機(jī)的節(jié)奏穩(wěn)步推進(jìn),并通過(guò)對(duì)六款全新芯片的深度協(xié)同設(shè)計(jì),讓魯賓平臺(tái)朝著人工智能的下一個(gè)前沿領(lǐng)域?qū)崿F(xiàn)跨越式邁進(jìn)?!?/p>
除薇拉 CPU 與魯賓 GPU 外,魯賓平臺(tái)還包含另外四款面向網(wǎng)絡(luò)與存儲(chǔ)的芯片,分別是:英偉達(dá) NVLink 6 交換機(jī)、英偉達(dá) ConnectX-9 超級(jí)網(wǎng)絡(luò)接口卡、英偉達(dá) BlueField-4 數(shù)據(jù)處理器以及英偉達(dá) Spectrum-6 以太網(wǎng)交換機(jī)。
上述所有芯片均可集成至英偉達(dá)的Vera Rubin NVL72 服務(wù)器中,該服務(wù)器可在單一系統(tǒng)內(nèi)整合 72 顆 GPU。多臺(tái) NVL72 服務(wù)器互聯(lián)后,便能構(gòu)建出英偉達(dá)DGX SuperPOD 超級(jí)計(jì)算集群—— 一種具備強(qiáng)大算力的人工智能超級(jí)計(jì)算機(jī)。微軟、谷歌、亞馬遜等超大規(guī)模云計(jì)算服務(wù)商,以及社交媒體巨頭元宇宙平臺(tái)公司(META),正斥資數(shù)十億美元采購(gòu)此類大型算力系統(tǒng)。
英偉達(dá)同時(shí)還重點(diǎn)推介了其人工智能存儲(chǔ)方案 ——英偉達(dá)推理情境內(nèi)存存儲(chǔ)。該公司表示,對(duì)于存儲(chǔ)和共享萬(wàn)億參數(shù)規(guī)模模型以及多步驟推理人工智能模型所產(chǎn)生的數(shù)據(jù),這套存儲(chǔ)方案不可或缺。
魯賓平臺(tái)的整體設(shè)計(jì)旨在實(shí)現(xiàn)比英偉達(dá)上一代產(chǎn)品格蕾絲?布萊克威爾平臺(tái)更高的運(yùn)行效率。
英偉達(dá)稱,相較于布萊克威爾系統(tǒng),使用魯賓平臺(tái)訓(xùn)練相同的混合專家模型,所需的 GPU 數(shù)量可減少 75%(即僅需原來(lái)的 1/4)。
減少 GPU 的使用量,意味著企業(yè)可將富余的芯片調(diào)配至其他任務(wù)中,從而提升整體運(yùn)營(yíng)效率。英偉達(dá)還指出,魯賓平臺(tái)能將推理階段的令牌成本降低 90%(即僅需原來(lái)的 1/10)。
在人工智能模型中,令牌可指代單詞、句子片段、圖像及視頻等各類信息單元。模型會(huì)通過(guò)令牌化處理,將這些信息拆解為更易于運(yùn)算的單元。
但令牌的處理過(guò)程十分耗費(fèi)算力,進(jìn)而導(dǎo)致能耗居高不下,在處理超大規(guī)模人工智能模型時(shí),這一問(wèn)題尤為突出。與前代產(chǎn)品相比,令牌成本的降低有助于優(yōu)化魯賓平臺(tái)的總擁有成本。
英偉達(dá)表示,魯賓平臺(tái)已向合作伙伴提供樣品測(cè)試,目前已進(jìn)入全面量產(chǎn)階段。
憑借在芯片領(lǐng)域的領(lǐng)先優(yōu)勢(shì),英偉達(dá)已登頂全球市值最高企業(yè)寶座,當(dāng)前估值約達(dá) 46 億美元。去年 10 月,該公司市值曾一度突破 5 萬(wàn)億美元,但此后市場(chǎng)對(duì)人工智能領(lǐng)域投資過(guò)熱的擔(dān)憂加劇,疊加對(duì)人工智能生態(tài)系統(tǒng)可能存在泡沫的持續(xù)恐慌,其市值回落至當(dāng)前水平。
與此同時(shí),英偉達(dá)正面臨來(lái)自競(jìng)爭(zhēng)對(duì)手超威半導(dǎo)體(AMD)以及自身客戶的雙重競(jìng)爭(zhēng)壓力。超威半導(dǎo)體已推出自研的太陽(yáng)神機(jī)架式算力系統(tǒng),與英偉達(dá)的 NVLink 72 系統(tǒng)展開直接競(jìng)爭(zhēng)。
去年 10 月,谷歌(GOOG、GOOGL)與亞馬遜(AMZN)共同宣布,人工智能公司 Anthropic 將擴(kuò)大對(duì)兩家企業(yè)自研定制芯片的使用規(guī)模。Anthropic 目前已采用這些芯片為其 Claude 大模型平臺(tái)提供算力支持,且谷歌與亞馬遜均持有該公司的股份。
此外,據(jù)《信息》雜志報(bào)道,谷歌正與元宇宙平臺(tái)公司(META)及其他云計(jì)算企業(yè)洽談合作,探討在這些企業(yè)的數(shù)據(jù)中心部署谷歌自研芯片的可能性。
盡管競(jìng)爭(zhēng)日趨激烈,但無(wú)論是超威半導(dǎo)體還是英偉達(dá)的客戶,短期內(nèi)都難以撼動(dòng)英偉達(dá)在人工智能芯片領(lǐng)域的霸主地位。而如果英偉達(dá)能夠持續(xù)保持每年迭代一代產(chǎn)品的節(jié)奏,競(jìng)爭(zhēng)對(duì)手想要實(shí)現(xiàn)趕超,將會(huì)變得愈發(fā)困難。