衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“我們沒有能力一會(huì)兒金融、一會(huì)兒娛樂、一會(huì)兒醫(yī)療,只能深耕一條主線?!?/p>
百川智能CEO王小川用這樣一句話,給過去兩年被外界不斷拉扯的路線畫下一條清晰的邊界。
與此同時(shí),百川發(fā)布并開源新一代醫(yī)療大模型Baichuan-M3。
在OpenAI推出的醫(yī)療AI評(píng)測(cè)HealthBench上,Baichuan-M3以65.1分位列第一;在不依賴工具或檢索增強(qiáng)的純模型設(shè)置下,其醫(yī)療幻覺率降至3.5,達(dá)到當(dāng)前世界最低。
王小川表明公司賬上有約30億元資金,意味著百川可以在一條賽道里持續(xù)投入。
他說,百川智能成立那天起,他就已經(jīng)在全員信中寫道:
談及近期備受關(guān)注的AI大模型企業(yè)上市,王小川表示“他們主要還是踩在通用模型技術(shù)紅利和政策支持的基礎(chǔ)上”,醫(yī)療AI成熟會(huì)晚一點(diǎn),還有一、兩年的時(shí)間。
“百川預(yù)計(jì)在2027年啟動(dòng)IPO上市?!?/p>
百川智能模型技術(shù)負(fù)責(zé)人鞠強(qiáng)透露,百川目前約80%的算力都投入到強(qiáng)化學(xué)習(xí)相關(guān)訓(xùn)練,M3正是在這一訓(xùn)練策略下成型的階段性成果。
除了強(qiáng)推理和低幻覺,端到端的問診能力是M3另一項(xiàng)突出能力。
模型之外,百川也同步給出了產(chǎn)品側(cè)的時(shí)間表——
今年上半年,百川將陸續(xù)發(fā)布兩款to C的醫(yī)療產(chǎn)品。初期免費(fèi)開放,后續(xù)可按模塊引入付費(fèi)能力,重點(diǎn)服務(wù)于患者的輔助決策與居家健康看護(hù)場(chǎng)景。
“和最近市面上大家看到很多的泛健康醫(yī)療AI產(chǎn)品不一樣?!蓖跣〈ㄕf。
80%的算力投入強(qiáng)化學(xué)習(xí),有了M3模型
和去年5月發(fā)布的Baichuan-M2相比,Baichuan-M3在模型的訓(xùn)練重心發(fā)生了根本變化。
其核心關(guān)鍵詞可以用一句話概括:fact-aware的強(qiáng)化學(xué)習(xí)。
鞠強(qiáng)表示,醫(yī)療大模型普遍面臨一個(gè)難以回避的問題:推理能力越強(qiáng)的模型,越容易在醫(yī)療場(chǎng)景中產(chǎn)生幻覺;而一味壓制幻覺,又會(huì)讓模型在復(fù)雜問題面前變得過于保守。
Baichuan-M2時(shí)期,百川更多依賴工具鏈和后處理方式來兜底,Baichuan-M3則選擇了把幻覺問題前移到訓(xùn)練階段解決。
鞠強(qiáng)進(jìn)一步解釋:
當(dāng)模型給出看似合理、但缺乏事實(shí)依據(jù)的醫(yī)療判斷時(shí),這類輸出會(huì)在訓(xùn)練中被明確懲罰;與此同時(shí),模型在推理鏈條中的探索空間并沒有被壓縮。
這種對(duì)事實(shí)一致性的感知能力,是fact-aware強(qiáng)化學(xué)習(xí)的關(guān)鍵所在。
圍繞這一目標(biāo),Baichuan-M3在訓(xùn)練和算法層面做了幾處關(guān)鍵調(diào)整。
第一項(xiàng)變化發(fā)生在強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)性上。
Baichuan-M2階段,患者狀態(tài)是動(dòng)態(tài)的,但負(fù)責(zé)打分的“醫(yī)生評(píng)價(jià)模型”相對(duì)固定;到了Baichuan-M3這里,評(píng)價(jià)模型本身也會(huì)隨主模型能力提升而迭代,避免模型在后期訓(xùn)練中提前撞上能力天花板。
第二項(xiàng)升級(jí)體現(xiàn)在幻覺控制方式的轉(zhuǎn)變。
Baichuan-M3不再依賴外部循證工具去修正輸出,而是在模型內(nèi)部完成幻覺壓制,這使得問診過程可以保持連續(xù)性,而不會(huì)頻繁被工具調(diào)用打斷。
第三項(xiàng)變化針對(duì)的是醫(yī)療場(chǎng)景特有的長(zhǎng)對(duì)話結(jié)構(gòu)。
鞠強(qiáng)提到,現(xiàn)有通用強(qiáng)化學(xué)習(xí)算法在多輪問診中容易不穩(wěn)定,百川為此專門對(duì)算法結(jié)構(gòu)做了改造,使模型能夠在較長(zhǎng)對(duì)話中保持目標(biāo)一致性。
以上技術(shù)調(diào)整讓Baichuan-M3具備了“原生的、端到端的嚴(yán)肅問診能力”。王小川強(qiáng)調(diào),這和通過prompt讓大模型扮演醫(yī)生完全不一樣。
明確“嚴(yán)肅醫(yī)療”,重視“院外需求”
聊完技術(shù)后,王小川花了相當(dāng)多時(shí)間講“為什么醫(yī)療必須重做一遍”。
在他看來,當(dāng)下國(guó)內(nèi)醫(yī)療方面有四個(gè)長(zhǎng)期的結(jié)構(gòu)性不足。
首先是醫(yī)生數(shù)量始終無法匹配需求;其次,醫(yī)患關(guān)系高度不對(duì)等,患者是信息最少的一方,卻要承擔(dān)決策后果;第三,國(guó)內(nèi)沒有家庭醫(yī)生體系,大量病人被動(dòng)涌向三甲醫(yī)院;最后,醫(yī)學(xué)本身仍然存在認(rèn)知盲區(qū),醫(yī)生也有不確定和不了解的情況。
基于此,百川想讓普通人都明明白白地看病。
因此,百川選擇把更多精力放在院外診療場(chǎng)景,尤其是患者在家中面對(duì)不確定癥狀時(shí)的輔助決策能力。
在王小川的敘述里,百川這么做的重要原因是團(tuán)隊(duì)相信:未來真正的醫(yī)療增量本來就不在醫(yī)院里。
在王小川看來,醫(yī)院更多承擔(dān)的是執(zhí)行功能。
“你已經(jīng)決定要做什么了,來醫(yī)院,是做檢查、做手術(shù)、用藥、監(jiān)護(hù)。真正影響患者路徑的判斷往往發(fā)生在更早的時(shí)候。癥狀出現(xiàn)時(shí)要不要重視?先去哪里?是否需要再確認(rèn)一次?這些決定,很多時(shí)候是在醫(yī)生不在場(chǎng)的情況下完成的。”
這一選擇也直接決定了其商業(yè)化方向——是“嚴(yán)肅醫(yī)療”,是“院外需求”。
雖然產(chǎn)品還未亮相,但根據(jù)其回應(yīng),所推出的產(chǎn)品不會(huì)越過監(jiān)管邊界給出診斷或處方,主要功能還是幫助用戶理解信息、整理癥狀,并明確下一步行動(dòng)。
王小川表示,在能力層面,Baichuan-M3已經(jīng)足夠發(fā)揮這樣的作用,但不意味著百川會(huì)急于把模型推向所有場(chǎng)景。
百川的醫(yī)療AI產(chǎn)品理念上覆蓋全病種,但也給了明確重點(diǎn):
第一步,兒科和腫瘤。
目前,已與北京兒童醫(yī)院和中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院合作,推進(jìn)真實(shí)場(chǎng)景驗(yàn)證。
—?歡迎AI產(chǎn)品從業(yè)者共建?—