千問C端應(yīng)用團隊四篇論文入選ICML、ACL:一篇擠進前2.2%,推理提速36%
近日,頂級學(xué)術(shù)會議ICML 2026和ACL 2026相繼公布論文接收結(jié)果。千問C端應(yīng)用團隊共計四篇論文被收錄,其中ECHO框架入選比例僅占2.2%的ICML Spotlight(重點推薦論文),MARCH框架入選ACL主會。
ICML(國際機器學(xué)習(xí)大會)與ACL(國際計算語言學(xué)年會)分別是機器學(xué)習(xí)與自然語言處理領(lǐng)域歷史最悠久、影響力最大的頂級學(xué)術(shù)會議,每年錄用的論文代表著相關(guān)方向的前沿突破。今年ICML投稿量翻倍,Spotlight入選比例僅2.2%;ACL主會論文接收率僅19%。
千問C端應(yīng)用團隊入選的四篇論文均從實際應(yīng)用痛點出發(fā),覆蓋推理加速、幻覺治理、架構(gòu)優(yōu)化與結(jié)構(gòu)化推理四個方向。
大模型高并發(fā)時的“卡頓”,本質(zhì)是算力沒花在刀刃上。入選ICML Spotlight的ECHO框架,獨創(chuàng)“稀疏門控”與“彈性預(yù)算調(diào)度”機制,把投機解碼變成一道“算力怎么花最劃算”的調(diào)度題——系統(tǒng)不再盲目驗證所有預(yù)測,而是精準瞄準模型深度的“甜蜜點”進行關(guān)鍵核驗,并根據(jù)實時置信度動態(tài)向高確定性任務(wù)傾斜算力。在Qwen3-235B等工業(yè)級模型實測中,ECHO端到端吞吐比EAGLE-3等現(xiàn)有最優(yōu)方法提升最高36%。
比“答得快”更難的,是“答得準”。入選ACL主會的MARCH框架,專攻大模型的“幻覺”難題。傳統(tǒng)核查容易“順著錯誤自圓其說”,MARCH引入“刻意的信息不對稱”機制,構(gòu)建解答者、提案者與審查員的三位一體流水線,強制審查員在“信息隔離艙”內(nèi)依據(jù)客觀文檔獨立“盲審”。該機制驅(qū)使大模型必須在每個校驗環(huán)節(jié)拿出真憑實據(jù),徹底切斷了自我幻覺確認的偏誤循環(huán)。同時配合多智能體強化學(xué)習(xí)的交叉懲罰機制,讓模型能力在多Agent交互過程中自我進化。在金融研報、合同審查等場景中,MARCH為大模型自動筑起事實防線,確保每條結(jié)論都鏈接到底層數(shù)據(jù)支撐,有效幫助用戶阻斷微小幻覺引發(fā)的“錯誤雪崩”。
模型想“穩(wěn)”就容易“笨”,想“靈”又容易“飄”。入選ICML的SiameseNorm架構(gòu),直擊大模型“穩(wěn)定性與表達力難以兼得”的痛點。它采用參數(shù)共享的雙流設(shè)計,一條流負責(zé)穩(wěn)住梯度回傳,另一條流負責(zé)釋放表達潛能,在不增加參數(shù)負擔(dān)的前提下,讓模型獲得更強的復(fù)雜邏輯推導(dǎo)能力。
而面對沒有標(biāo)準答案的復(fù)雜任務(wù),大模型又容易“想得多卻想不精”。入選ACL Findings的RiT框架,給模型的“內(nèi)心思考”裝上了質(zhì)量把控器。通過細粒度評價準則(Rubric)和門控融合獎勵機制,引導(dǎo)AI在處理深度行業(yè)分析、營銷推演等任務(wù)時,嚴格遵循專業(yè)思維框架步步推演,而不是在黑盒里隨意發(fā)散,確保最終交付成果具備極高的邏輯密度與專業(yè)可信度。
這四項成果覆蓋了用戶體驗上的“最后一公里”,也觸及了制約模型能力上限的底層機制。隨著四篇論文代碼的陸續(xù)開源,相關(guān)技術(shù)將為行業(yè)提升AI可靠性、實用性提供參考。
關(guān)注我們


