非負(fù)矩陣分解是挖掘高維數(shù)據(jù)潛在結(jié)構(gòu)的核心技術(shù),廣泛應(yīng)用于推薦系統(tǒng)、生物信息學(xué)、圖像處理等多個領(lǐng)域。北京大學(xué)人工智能學(xué)院孫仲研究員團(tuán)隊瞄準(zhǔn)這一技術(shù),設(shè)計了一種模擬計算芯片,為大規(guī)模數(shù)據(jù)處理提供了全新高效方案。和當(dāng)前先進(jìn)數(shù)字芯片相比,計算速度可提升約12倍,能效比提升超過228倍,相關(guān)成果已于近日發(fā)表于《自然·通訊》。
孫仲1月22日告訴科技日報記者,非負(fù)矩陣分解是一種強(qiáng)大的“數(shù)據(jù)降維”技術(shù)。它能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特征,在圖像分析、信息聚類、個性化推薦等領(lǐng)域具有廣泛應(yīng)用。但面對如今動輒百萬級規(guī)模的數(shù)據(jù)集,傳統(tǒng)數(shù)字硬件受計算復(fù)雜度和內(nèi)存瓶頸限制,難以滿足實時處理需求。
孫仲團(tuán)隊一直研究模擬計算。模擬計算直接利用物理定律實現(xiàn)并行運(yùn)算,延時低、功耗低,在算力瓶頸背景下,具有先天優(yōu)勢。團(tuán)隊此次研制出了基于阻變存儲器(RRAM)的非負(fù)矩陣分解模擬計算求解器,并創(chuàng)新性設(shè)計了一種可重構(gòu)緊湊型廣義逆電路,通過電導(dǎo)補(bǔ)償原理,用最少的計算單元實現(xiàn)相同運(yùn)算功能,對非負(fù)矩陣分解過程中最核心的計算步驟進(jìn)行了優(yōu)化,實現(xiàn)一步求解,極大優(yōu)化了芯片的面積與能耗表現(xiàn)。
為驗證芯片性能,研究團(tuán)隊搭建了測試平臺,在典型場景中進(jìn)行驗證。在圖像壓縮任務(wù)中,和在全精度數(shù)字計算機(jī)上運(yùn)行的結(jié)果相比,圖片精度損失相差無幾,還節(jié)省了一半的存儲空間;在推薦系統(tǒng)應(yīng)用中,其預(yù)測誤差率和數(shù)字芯片計算結(jié)果高度相近。在MovieLens 100k數(shù)據(jù)集推薦系統(tǒng)訓(xùn)練任務(wù)中,與主流可編程數(shù)字硬件相比,該模擬計算器實現(xiàn)了212倍的速度提升和4.6萬倍的能效提升;在網(wǎng)飛(Netflix)規(guī)模數(shù)據(jù)集的推薦系統(tǒng)訓(xùn)練任務(wù)中,其計算速度較先進(jìn)數(shù)字芯片提升約12倍,而能效比提升超過228倍。
“這項工作為非負(fù)矩陣分解這類約束優(yōu)化問題的實時求解開辟了新路徑,展現(xiàn)了模擬計算處理現(xiàn)實復(fù)雜數(shù)據(jù)的巨大潛力?!睂O仲表示,該研究可為實時推薦系統(tǒng)、高清圖像處理、基因數(shù)據(jù)分析等場景帶來技術(shù)革新,助力人工智能應(yīng)用向更高效、更低功耗方向發(fā)展。(記者張蓋倫)