欧美精品成人a在线观看_无码无遮挡av毛片内射亚洲_涩涩免费无码视频在线观看_国产AV一区二区大屁屁

首頁  ?  財(cái)經(jīng)  ?  經(jīng)濟(jì)觀察

如何讓AI“識(shí)破”AI?這項(xiàng)研究給出答案

2025-08-25 09:25:00

來源:科技日?qǐng)?bào)

隨著大模型逐漸變成學(xué)習(xí)、工作中不可或缺的生產(chǎn)力工具,其伴生的問題也日益凸顯。AI經(jīng)常會(huì)“一本正經(jīng)地胡說八道”,生成看似合理的虛假信息;一些人利用AI工具代寫作業(yè)甚至畢業(yè)論文,極大沖擊著學(xué)術(shù)誠信和規(guī)范;AI生成內(nèi)容的流暢性和邏輯性越來越強(qiáng),人類識(shí)別困難,但論文AI率檢測系統(tǒng)有待完善,論文被誤判的問題時(shí)有發(fā)生……如何精準(zhǔn)識(shí)別AI生成內(nèi)容,成為亟待解決的問題。

南開大學(xué)計(jì)算機(jī)學(xué)院媒體計(jì)算實(shí)驗(yàn)室近日取得的一項(xiàng)研究成果,或?yàn)榻鉀Q這些難題提供可行方案。該成果創(chuàng)新性地提出直接差異學(xué)習(xí)(DDL)優(yōu)化策略,教會(huì)AI用“火眼金睛”辨別人機(jī)不同,實(shí)現(xiàn)AI檢測性能的巨大突破。相關(guān)成果論文已被ACM MM 2025(第33屆ACM國際多媒體會(huì)議)接收。

目前AI生成內(nèi)容檢測主要有兩種路線。一種是基于訓(xùn)練的檢測方法,使用特定數(shù)據(jù)訓(xùn)練一個(gè)專用的分類模型;另一種是零樣本檢測方法,直接使用一個(gè)預(yù)訓(xùn)練的語言模型并設(shè)計(jì)某種分類標(biāo)準(zhǔn)進(jìn)行分類。多項(xiàng)研究表明,現(xiàn)有檢測方法在應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)場景時(shí)面臨困境。

為何現(xiàn)有的AI檢測工具會(huì)“誤判”?“如果把AI文本檢測看作一場考試,那么現(xiàn)有檢測方法就好比機(jī)械刷題、死記硬背答案的固定套路,難以學(xué)會(huì)答題邏輯,一旦遇到全新難題,準(zhǔn)確率就會(huì)顯著下降?!闭撐牡谝蛔髡?、南開大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)科學(xué)卓越班2023級(jí)本科生付嘉晨解釋道,“要想實(shí)現(xiàn)通用檢測,理論上需收集所有大模型的數(shù)據(jù)進(jìn)行訓(xùn)練,但這在大模型迭代飛速的今天幾乎不可能。”

讓檢測器學(xué)會(huì)“舉一反三”,提升其泛化性能,是增強(qiáng)AI文本檢測能力的關(guān)鍵。為此,研究團(tuán)隊(duì)另辟蹊徑,提出DDL方法,通過直接優(yōu)化模型預(yù)測的文本條件概率差異與人為設(shè)定的目標(biāo)值之間的差距,幫助模型學(xué)習(xí)AI文本檢測的內(nèi)在知識(shí)。這種方法可精準(zhǔn)捕捉人機(jī)文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。

“使用DDL訓(xùn)練得到的檢測器如同有了‘火眼金睛’,即便只‘學(xué)習(xí)’過DeepSeek-R1的文本,也能精準(zhǔn)識(shí)別像GPT-5這樣最新大模型生成的內(nèi)容?!备都纬空f。

團(tuán)隊(duì)還提出了一個(gè)全面的測試基準(zhǔn)數(shù)據(jù)集MIRAGE,該數(shù)據(jù)集使用13種主流的商用大模型以及4種先進(jìn)的開源大模型,生成了接近10萬條“人類—AI”文本對(duì)。

“MIRAGE是目前唯一聚焦商用大語言模型檢測的基準(zhǔn)數(shù)據(jù)集。如果說之前的基準(zhǔn)數(shù)據(jù)集是由少且能力簡單的大模型命題出卷,那么MIRAGE則是由17個(gè)能力強(qiáng)大的大模型聯(lián)合命題,形成一套高難度、又有代表性的檢測試卷。”論文通訊作者、南開大學(xué)計(jì)算機(jī)學(xué)院副教授郭春樂說。

在MIRAGE的測試結(jié)果顯示,現(xiàn)有檢測器的準(zhǔn)確率從在簡單數(shù)據(jù)集上的90%驟降至約60%;而使用DDL訓(xùn)練的檢測器仍保持85%以上的準(zhǔn)確率。與斯坦福大學(xué)提出的AI生成文本檢測工具DetectGPT相比,使用DDL方法訓(xùn)練的檢測器性能提升71.62%;與馬里蘭大學(xué)、卡內(nèi)基梅隆大學(xué)等共同提出的AI生成文本檢測方法Binoculars相比,性能提升68.03%。

“AIGC發(fā)展日新月異,我們將持續(xù)迭代升級(jí)評(píng)估基準(zhǔn)和技術(shù),致力于實(shí)現(xiàn)更快、更準(zhǔn)、更低成本的AI生成文本檢測?!毖芯繄F(tuán)隊(duì)負(fù)責(zé)人、南開大學(xué)計(jì)算機(jī)學(xué)院教授李重儀說。

  • 相關(guān)閱讀
  • 服務(wù)“銀發(fā)一族” 養(yǎng)老金融繪就“老有頤養(yǎng)”新畫卷

    家住北京市朝陽區(qū)的王女士,最近在銀行工作人員指導(dǎo)下,開通了個(gè)人養(yǎng)老金賬戶。“個(gè)人養(yǎng)老金賬戶能享受稅收優(yōu)惠,這一點(diǎn)很吸引我?!彼f,自己打算再買一些養(yǎng)老金融產(chǎn)品,讓養(yǎng)老“錢包”越來越“鼓”。 金融監(jiān)管總局此前發(fā)布...

    時(shí)間:08-25
  • 科技賦能長江上游生態(tài)保護(hù)

    原標(biāo)題:科技賦能長江上游生態(tài)保護(hù)用嘉陵江水制冷需要幾步?重慶的答案是三步:第一步用水泵把江水抽取到樓宇下層的能源站,第二步通過熱泵技術(shù)利用夏季江水與空氣的溫差為樓宇空間降溫,第三步將江水排回大江。這就是重慶市江...

    時(shí)間:08-25
  • 文旅市場熱鬧非凡 暑期消費(fèi)乘“熱”而上

    避暑納涼、夜間游覽、火熱賽事、絕美演藝……今年夏天,各地加大文旅消費(fèi)供給,不斷創(chuàng)新消費(fèi)場景,推動(dòng)文旅消費(fèi)持續(xù)增長。 “當(dāng)前,不同群體的消費(fèi)需求不同,催生出差異化、多樣性的旅游方式,文旅市場呈現(xiàn)出‘百花齊放’的狀態(tài)...

    時(shí)間:08-25
免責(zé)聲明:本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。