欧美精品成人a在线观看_无码无遮挡av毛片内射亚洲_涩涩免费无码视频在线观看_国产AV一区二区大屁屁

首頁  ?  新聞頻道  ?  國內新聞

國內多數模型訓練使用中文數據占比超60%

2025-08-19 08:42:00

來源:人民網-人民日報

  本報北京8月18日電  (記者王云杉)記者從國家數據局獲悉:中文數據在國內大模型的訓練性能提升方面發(fā)揮著重要作用。國內多數模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能快速提升。

  在人工智能時代,Token(通常所說的詞元)是處理文本的最小數據單元。國家數據局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,反映了我國人工智能應用規(guī)模的快速增長。

  《 人民日報 》( 2025年08月19日 06 版)

  • 相關閱讀
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。