界面新聞記者 | 陸柯言 佘曉晨
界面新聞編輯 | 文姝琪
1月10日,一場關于AI的頂級對話在北京中關村悄然上演。
這場對話由清華大學基礎模型北京市重點實驗室、智譜AI共同發(fā)起。最重要的是,它罕見地集結了中國大模型領域最受關注的幾位“頂流”人物。他們分別是:
唐杰:清華大學教授、智譜創(chuàng)始人,三天前剛剛帶領智譜在港股敲鐘,造就“中國基模第一股”。
姚順雨:前OpenAI研究員,27歲的他現為騰訊CEO辦公室首席科學家、AI Infra 部及大語言模型部負責人。這也是入職騰訊后的公開首秀。
林俊旸:阿里巴巴通義千問大模型負責人,阿里最年輕P10級技術專家,掌舵著全球開源生態(tài)中下載量第一的阿里通義系列。
楊植麟:大模型“六小虎”之一——月之暗面創(chuàng)始人,公司剛剛官宣5億美元融資。
幾位平均年齡不到35歲的年輕人,幾乎握著中國AGI賽道上最貴的一批籌碼。 如此規(guī)格的同臺向來罕見,不僅因為他們背后代表著大廠與創(chuàng)業(yè)公司的生態(tài)博弈,更因為在“Chat(對話)范式”已成存量的今天,他們對下一代 AGI 路線圖的任何一次押注,都可能決定未來十年的行業(yè)座次。
從大模型的下一個“奇點時刻”,到對模型分化的觀察;從AI Agent的未來,到中國AI的勝算,這場萬字交鋒試圖在現實算力與商業(yè)落地的抉擇之中,尋找中國AGI最真實的突圍路徑。
Chat之后,大模型的下一個“奇點”在哪?
與會者的一個共識是,關于 AGI 的演進路線,Chat(對話)的競爭已經終結,大模型的未來應該向深水區(qū)更進一步,即解決問題與自主學習。
對于下一代范式的預測,一個高票答案是自主學習。林俊旸認為,2026 年最關鍵的“Bet(賭注)”在于 AI 的主動性。目前的 AI 范式是被動的,必須由人類通過 Prompt 啟動。他構思的未來范式是:環(huán)境直接 Prompt 模型,讓 AI 根據環(huán)境反饋自主思考、自主決策,而不僅僅是響應指令。
但他也表達了這種主動性可能會帶來的風險:“我最擔心的是他做一些不該做的事。比如主動產生一個想法,往會場里扔一顆炸彈。”他認為,培養(yǎng) AI 就像培養(yǎng)小孩,必須注入正確的方向指引,這是主動學習范式下不可回避的命題。
姚順雨也認為, AGI 接下來最重要的點就是自主學習。
在他看來,自主學習是一個漸變的過程。它不是一種孤立的方法論,而是由數據和任務驅動的場景演進。
他舉例,目前Claude 95%的代碼已經是由Claude自己編寫的,這本身就是一種自我優(yōu)化的循環(huán)。同時,像 ChatGPT 利用用戶數據風格,以及光標修改每隔幾小時就根據用戶數據進行更新,都是自主學習的早期信號。
姚順雨提出,自主學習最大的問題是想象力的限制:“現在大家很容易想象強化學習或者推理范式的未來。但如果 2026 年或者 2027 年,一個新的模型或者新的系統(tǒng)實現了自我學習,它應該是一個賺錢的交易系統(tǒng)?還是解決了人類之前沒法解決的科學問題?我們可能需要先想象到它長什么樣?!?/p>
談及哪家公司會引領下一代范式創(chuàng)新,姚順雨認為,盡管 OpenAI 內部因商業(yè)化等因素導致創(chuàng)新受損,但在全球范圍內,OpenAI 仍然是最有可能的那一家。
Scaling Law 還有用嗎?
Scaling Law(規(guī)模法則)是大模型領域的一個經驗公式。它默認,只要不斷地增加訓練數據量、模型參數量、和算力投入,模型性能就會越來越好,并且這種提升是可以預測的。
唐杰指出了當前 Scaling Law 面臨的效率困境。從 2025 年初的 10T 數據,到現在的 30T 甚至未來的 100T,單純增加數據量的收益正在遞減。“如果你不創(chuàng)新,花掉 10 個億、20 個億,收益卻很小,這就不值得了。
他提出了一個新的衡量標準:Intelligence Efficiency(智能效率)。
唐杰認為,提升智能上限“最笨”的方法是 Scaling,而更聰明的做法應該是定義智能效率——即如何用更少的算力投入、更小的 Scaling 規(guī)模,獲得同等甚至更高的智能提升。他預判,在持續(xù)學習、Memory(記憶)以及多模態(tài)領域,這種追求效率的范式變革一定會發(fā)生。
楊植麟則認為,Scaling Law 還遠未到達終點,但其內涵發(fā)生了變化。Scaling 不僅僅意味著堆算力,而是在架構、優(yōu)化器、數據層面做技術改進,目的是為了讓模型,擁有更好的“Taste(品味)”,這正是模型之間形成護城河的關鍵。他認為,Token 效率與長文本將是決定 AI 智力水平的核心因素。
林俊旸觀察到,人類與AI 不斷交互,只會讓它上下文變得越來越長,導致AI 變得越來越笨,這件事“很煩人”。
他提出的一種思路是“測試時擴展” (Test-time Scaling)。與其在訓練階段死磕數據量,他認為 o1 系列證明了另一條路:即在推理時就投入更多計算資源,讓模型變強。
對模型分化的觀察
模型分化是本次會議的一個焦點問題。它指的是,大模型不再試圖做一個樣樣精通但卻樣樣都平庸的通用工具,而是根據場景、產品形態(tài)和技術特性,裂變成不同的方向。
作為在硅谷和中國都擁有經驗的研究者,姚順雨認為,模型的分化首先發(fā)生在商業(yè)邏輯上。
他認為,在 B 端(企業(yè))場景,智能直接等同于收益。美國市場用戶愿意為強模型支付數倍溢價,因為強模型能將任務正確率從 60% 提升到 90%,大幅降低了人工監(jiān)控成本。因此在 To B 領域,強弱模型的分化會越來越極端。
相反,To C (用戶)的分化不在于模型變大,而在于 Context(上下文)的厚度。他認為,To C 產品應通過垂直整合,讓模型感知用戶的實時環(huán)境,如天氣、聊天記錄等,而非盲目 Scaling。因此,To C 應用必須走“垂直整合”路線,讓模型與產品強耦合。
被問及“千問在未來 AGI 的生態(tài)位”時,林俊旸認為這與公司基因關系并不大。在他看來,今天To B 和 To C 都是在服務真實的人類。這個問題本質是,應該怎么讓人類世界變得更好。
他以 Anthropic 為例,指出其在 Coding(編程) 領域的成功是由于頻繁與 B 端客戶交流,發(fā)現了真實場景中巨大的 Token 消耗,而在中國,Coding的Token消耗還沒有那么大。
人工智能科學家、加拿大皇家科學院院士楊強提出,當大模型進入穩(wěn)態(tài),學術界應研究智能上限和幻覺平衡”——即投入多少資源能換取多少錯誤率的降低,這是一種類似經濟學的風險收益平衡。
他建議,大模型研究應借鑒人類的睡眠機制——晚上睡覺,事實上是在清理噪音,使得第二天學習的準確率持續(xù)的提升,不至于是兩個錯誤率的疊加,大模型的持續(xù)學習中,同樣需要類似的噪音清理。
“價值”決定Agent的未來
2026年,市場普遍對 Agent 的價值爆發(fā)充滿信心。但在與會嘉賓被問及“ Agent 真的能幫人類自動化1-2周的工作嗎?”這一問題時,大家的觀點也透露出對于不同方向的期待。
姚順雨認為,To B 方面,Agent 正處在不斷上升的曲線上,目前沒有變慢的趨勢。但是在 To C 場景下, DAU 和模型智能很多時候不僅不相關,甚至會相反。他指出,除了模型本身還有兩個瓶頸,一個是環(huán)境和部署(Deployment)問題;另一個是教育問題。因此他認為,在今天的中國,想要擴大 To C Agent 的機會,教育大家如何更好地使用 AI 產品是一個最大的、最有意義的事情。
在通用 Agent 的創(chuàng)業(yè)機遇上,林俊旸用了Peak( Manus 聯合創(chuàng)始人)的一句話表達他的觀點:“通用 Agent 最有意思的事情在于解決長尾問題,或者是說今天 AI 更大的魅力是在長尾?!?/p>
他較為認同“模型即產品”這個觀點,同時認為Agent的未來應當不僅僅出現在電腦里,而是和真實物理世界交互——那才是 Agent 能做長時間工作的情景。對于未來 Agent 的發(fā)展場景,林俊旸預判稱,一些在電腦環(huán)境里做的,今年很快就可以完成;但接下來三到五年要完成的 Agent 任務,可能和具身智能會結合起來。
楊強將Agent 的出現分為四個階段,而他判斷認為,我們現在處在最初級的階段:目標是人定義的,規(guī)劃也是人做的。在他的預測中,未來會出現這樣一個階段:大模型會觀察人的工作,把人的過程數據利用起來,最終實現目標和規(guī)劃都由大模型來定義, Agent 應該是由大模型內生的一個系統(tǒng)。
關于Agent能否真正爆發(fā),唐杰的觀點則相對務實而尖銳。他認為,有幾個方面決定了 Agent 未來的走勢,首先是 Agent 這個事情的價值、能不能真正幫助人;第二是成本;第三是做應用的速度。在他看來,現在的大模型更多是拼速度、拼時間,“也許我們代碼正確了,也許我們就會在這方面走的更遠一點,但也許失敗以后就半年,半年就沒了?!?/p>
創(chuàng)新將成為中美競爭的關鍵詞
在這場會議中,唐杰顯露出對于中美之間差距的保守態(tài)度。他認為,雖然中國模型在快速迭代,但差距可能并沒有縮小,因為美國還有大量未開源的閉源模型。參會嘉賓均認同“差距”的存在,同樣也在如何縮小差距上有不少共識。
作為剛剛從美國公司加入騰訊的前 OpenAI 研究員,姚順雨在這個話題上著重提到了范式創(chuàng)新。他認為,中國要從今天的跟隨者變成未來的引領者,有幾個比較關鍵的點,第一個是算力突破,第二個是除了 To C 之外,能不能有更成熟或者更好的 To B 的市場,或者有沒有機會在國際的商業(yè)環(huán)境競爭。
他坦言,今天很多做生產力或者做 To B 的模型和應用還是會誕生在美國,原因是美國的支付意愿更強,文化更好。更重要的是,主觀上有更多有創(chuàng)業(yè)精神或者冒險精神的人,真的想要去做前沿探索或者新的范式突破的事情。
“目前來看,一個范式一旦發(fā)生,我們可以用很少的卡、很高的效率去局部做得更好,我們到底能不能引領新的范式?這可能是今天中國唯一要解決的問題。”姚順雨指出,希望大家能走出“榜單的束縛”,堅持自己覺得是不是正確的過程。
林俊旸和姚順雨提到的關鍵詞類似,同樣強調了冒險和創(chuàng)新的重要性。
不過,會議的最后,唐杰也在“差距”之外指出了一些中國市場的趕超機會。他認為,首先要承認中國和美國之間的差距,但現在國內的情況正在慢慢變好,尤其體現在90后、00后身上。
在他的總結中,中國的機會可能出現在三個方面,一是一群聰明人真的敢做特別冒險的事;二是更好的環(huán)境,包括營商環(huán)境;第三,回到個人身上,能不能堅持的問題?!拔覀兡懿荒茉敢庠谝粭l路上敢做、敢冒險,而且環(huán)境還不錯。”