新浪科技訊 1月16日上午消息,智譜聯(lián)合華為開源新一代圖像生成模型GLM-Image,宣布基于昇騰Atlas 800T A2設(shè)備和昇思MindSpore AI框架完成從數(shù)據(jù)到訓(xùn)練的全流程。
據(jù)悉,該模型開源不到24小時(shí)即沖上全球知名AI開源社區(qū)Hugging Face榜單的全球第一。不同于開源常用的LDM方案,GLM-Image采用了創(chuàng)新的“自回歸+擴(kuò)散解碼器”混合架構(gòu),兼顧全局指令理解與局部細(xì)節(jié)刻畫,克服了海報(bào)、PPT、科普?qǐng)D等知識(shí)密集型場(chǎng)景生成難題,尤其擅長(zhǎng)漢字生成任務(wù),向探索以Nano Banana Pro為代表的“知識(shí)+推理”的認(rèn)知型生成模型邁出了重要一步。
從訓(xùn)練過程看,GLM-Image實(shí)現(xiàn)了基于昇騰Atlas 800T A2設(shè)備和昇思MindSpore AI框架的全流程訓(xùn)練及推理適配,實(shí)際訓(xùn)練性能足以達(dá)到相應(yīng)計(jì)算設(shè)備的匯報(bào)性能上限,驗(yàn)證了在國產(chǎn)全棧算力底座上訓(xùn)練前沿模型的可行性。