欧美精品成人a在线观看_无码无遮挡av毛片内射亚洲_涩涩免费无码视频在线观看_国产AV一区二区大屁屁

首頁  ?  新聞頻道  ?  國際新聞

國際期刊發(fā)表DeepSeek大規(guī)模推理模型訓(xùn)練方法 揭示AI背后的科學(xué)

2025-09-18 10:34:21

來源:中國新聞網(wǎng)

  中新網(wǎng)北京9月18日電 (記者 孫自法)作為一家專注于大語言模型(LLM)和通用人工智能(AGI)技術(shù)的中國公司,DeepSeek(深度求索)今年早些時候發(fā)布的開源人工智能(AI)模型DeepSeek-R1采用的大規(guī)模推理模型訓(xùn)練方法,頗受關(guān)注。

  北京時間9月17日夜間,該訓(xùn)練方法在國際知名學(xué)術(shù)期刊《自然》上線發(fā)表,其揭示AI技術(shù)背后的科學(xué)研究表明,大語言模型的推理能力可通過純強化學(xué)習(xí)來提升,從而減少增強性能所需的人類輸入工作量。訓(xùn)練出的模型在數(shù)學(xué)、編程競賽和STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域研究生水平問題等任務(wù)上,比傳統(tǒng)訓(xùn)練的大語言模型表現(xiàn)更好。

  論文通訊作者為DeepSeek創(chuàng)始人梁文鋒,他領(lǐng)導(dǎo)的DeepSeek-AI團隊表示,讓AI模型像人類一樣進行推理一直是難題,雖然大語言模型已顯示出一些推理能力,但訓(xùn)練過程需要大量計算資源。通過人工提示引導(dǎo)可改進這類模型,促使其生成中間推理步驟,從而大為強化其在復(fù)雜任務(wù)中的表現(xiàn)。不過,這個方法會導(dǎo)致計算成本過高,并限制其擴展?jié)摿Α?/p>

  DeepSeek-AI團隊介紹說,DeepSeek-R1包含一個在人類監(jiān)督下的深入訓(xùn)練階段,以優(yōu)化推理過程。該模型使用了強化學(xué)習(xí)而非人類示例來開發(fā)推理步驟,從而減少了訓(xùn)練成本和復(fù)雜性。DeepSeek-R1在被展示優(yōu)質(zhì)的問題解決案例后,會獲得一個模板來產(chǎn)生推理過程。這一模型通過解決問題獲得獎勵,從而強化學(xué)習(xí)效果。

  在評估AI表現(xiàn)的數(shù)學(xué)基準測試中,DeepSeek-R1-Zero和DeepSeek-R1得分分別為77.9%和79.8%。此外,該模型在編程競賽及研究生水平的生物學(xué)、物理和化學(xué)問題上同樣表現(xiàn)優(yōu)異。

  《自然》同期發(fā)表國際同行專家的“新聞與觀點”文章指出,當前版本的DeepSeek-R1有一些能力限制,希望能在未來版本中得到改進。例如,該模型有時會混合語言,目前只針對中文和英文做了優(yōu)化;它對提示詞也很敏感,需要精心設(shè)計的提示詞工程,在某些任務(wù)上沒有展現(xiàn)出明顯提升,例如軟件工程任務(wù)。

  DeepSeek-AI團隊總結(jié)認為,未來研究可以聚焦優(yōu)化獎勵過程,以確保推理和任務(wù)結(jié)果可靠。(完)

  • 相關(guān)閱讀
  • 外交部:奉勸美方停止脅迫拉美國家選邊站隊

    新華社北京9月18日電(記者馬卓言、王慧慧)針對外媒稱美國脅迫拉美國家減少甚至中斷同中國發(fā)展關(guān)系,外交部發(fā)言人林劍18日表示,拉美和加勒比不是誰的“后院”,有權(quán)自主選擇發(fā)展道路和合作伙伴,奉勸美方停止脅迫拉美國家選邊...

    時間:09-19
  • 通訊丨美國關(guān)稅沖擊下巴西咖啡產(chǎn)業(yè)尋新機

    新華社里約熱內(nèi)盧9月18日電 通訊|美國關(guān)稅沖擊下巴西咖啡產(chǎn)業(yè)尋新機新華社記者周永穗 王天聰正值旱季,巴西東南部米納斯吉拉斯州天氣干燥。大片咖啡樹采摘已結(jié)束,農(nóng)機駛過,紅土飛揚??Х葮潇o靜佇立,等待來年的豐收。巴西...

    時間:09-19
  • 通訊|一部?。何⒍虅⊥卣怪刑┪幕c產(chǎn)業(yè)合作新空間

    新華社南寧/曼谷9月19日電 通訊|一部?。何⒍虅⊥卣怪刑┪幕c產(chǎn)業(yè)合作新空間新華社記者趙歡 夏康靜曼谷地鐵早高峰,不少年輕人刷著手機,屏幕上播放著來自中國的微短劇,“豪門恩怨”、職場逆襲、古裝奇緣等故事情節(jié)扣人心弦...

    時間:09-19
  • 特朗普稱美方正試圖收回阿富汗巴格拉姆空軍基地

    新華社倫敦9月18日電(記者趙家淞)美國總統(tǒng)特朗普18日在英國首相鄉(xiāng)村官邸契克斯別墅會晤英國首相斯塔默時表示,美方正試圖收回阿富汗巴格拉姆空軍基地。特朗普在記者會上批評美國前政府關(guān)于美軍撤離阿富汗的決定和行動。...

    時間:09-19
  • 中國代表三問美國否決聯(lián)合國安理會加沙問題決議草案

    新華社聯(lián)合國9月18日電 聯(lián)合國安理會18日就加沙問題決議草案進行表決。安理會15個成員中14個投了贊成票,常任理事國美國行使了否決權(quán),導(dǎo)致決議草案未獲通過。中國常駐聯(lián)合國代表傅聰在表決后作解釋性發(fā)言,對美國濫用否決...

    時間:09-19
  • 報告:結(jié)構(gòu)性問題難解  歐盟持續(xù)面臨藥品短缺

    新華社北京9月19日電 歐盟審計機構(gòu)歐洲審計團17日發(fā)布報告指出,由于供應(yīng)鏈脆弱、內(nèi)部市場分割等結(jié)構(gòu)性問題,歐盟至今未能找到有效解決方案,常用抗生素、疫苗等藥品短缺現(xiàn)象仍將持續(xù)存在。亟待“診治” 關(guān)乎“歐盟戰(zhàn)略自...

    時間:09-19
  • 2025環(huán)球人物年度盛典在四川瀘沽湖畔舉行

    人民網(wǎng)訊 “梨花開,春帶雨。梨花落,春入泥?!币磺独婊灐穼h(huán)球人物年度盛典推向高潮。盡管現(xiàn)場下起綿綿細雨,觀眾依然熱情高漲,紛紛為著名京劇表演藝術(shù)家胡文閣的表演喝彩?!拔乙獔猿职褌鞒芯﹦∷囆g(shù)作為使命,讓國粹...

    時間:09-19
  • 是什么,讓一檔美國著名脫口秀突然停播?

    新華社北京9月18日電 美國廣播公司(ABC)17日宣布,將“無限期”停播主持人吉米·基梅爾的深夜脫口秀節(jié)目,原因是基梅爾在節(jié)目中對美國知名保守派活動人士查理·柯克遭槍殺事件發(fā)表的言論引發(fā)爭議。停播決定得到美國總統(tǒng)...

    時間:09-19
  • 商務(wù)部:中方絕不會以犧牲原則立場、企業(yè)利益和國際公平正義為代價尋求達成任何協(xié)議

    新華社北京9月18日電(記者謝?,帲┥虅?wù)部新聞發(fā)言人何亞東18日表示,關(guān)于TikTok問題,中方立場是一貫的。我們反對將科技和經(jīng)貿(mào)問題政治化、工具化、武器化,絕不會以犧牲原則立場、企業(yè)利益和國際公平正義為代價,尋求達成任何...

    時間:09-19
  • 中國詩人亮相第十五屆布加勒斯特國際詩歌節(jié)朗誦會

    新華社布加勒斯特9月18日電(記者張改萍)當?shù)貢r間16日晚至17日晚,在第十五屆布加勒斯特國際詩歌節(jié)期間,中國詩人參與的大型詩歌朗誦會在羅馬尼亞國家文學(xué)博物館和中央圖書館舉行。在朗誦會上,中國詩人與來自羅馬尼亞、葡萄...

    時間:09-19
免責(zé)聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。