中新社北京12月26日電 (記者 劉亮)中國(guó)國(guó)家市場(chǎng)監(jiān)管總局26日公布,《人工智能大模型》系列國(guó)家標(biāo)準(zhǔn)近日正式實(shí)施,標(biāo)志著中國(guó)大模型產(chǎn)業(yè)進(jìn)入“科學(xué)權(quán)威、統(tǒng)一規(guī)范”新階段。
國(guó)家市場(chǎng)監(jiān)管總局介紹,作為首部聚焦通用大模型的國(guó)家標(biāo)準(zhǔn),該系列填補(bǔ)了技術(shù)評(píng)價(jià)體系空白,明確性能、安全與服務(wù)能力要求,配套評(píng)測(cè)能力已獲中國(guó)合格評(píng)定國(guó)家認(rèn)可委員會(huì)認(rèn)可。
基于此構(gòu)建的“求索”-LMBench評(píng)測(cè)基準(zhǔn),整合方法、數(shù)據(jù)集與自動(dòng)化平臺(tái),成為行業(yè)公認(rèn)的“能力標(biāo)尺”。評(píng)測(cè)體系已形成主流大模型白名單,為央企、國(guó)企選型提供依據(jù),并支撐中國(guó)石化、南方電網(wǎng)等建設(shè)行業(yè)大模型,完成對(duì)華為盤(pán)古、訊飛星火、中國(guó)移動(dòng)“九天”等模型的場(chǎng)景驗(yàn)證。
截至目前,標(biāo)準(zhǔn)工具完成千余項(xiàng)評(píng)測(cè)任務(wù),調(diào)用大模型超95萬(wàn)次,精準(zhǔn)識(shí)別幻覺(jué)控制、內(nèi)容安全等共性問(wèn)題,助力近30家廠(chǎng)商技術(shù)迭代,推動(dòng)形成“研發(fā)—評(píng)測(cè)—應(yīng)用—升級(jí)”閉環(huán)。
標(biāo)準(zhǔn)國(guó)際化也同步推進(jìn)。面向東盟編制英語(yǔ)、老撾語(yǔ)、高棉語(yǔ)版本,填補(bǔ)了區(qū)域空白;中國(guó)開(kāi)源模型架構(gòu)已被新加坡等國(guó)項(xiàng)目采用,彰顯標(biāo)準(zhǔn)引領(lǐng)下的全球影響力。(完)