國產(chǎn)大模型的出路在哪里?

每次國產(chǎn)AI模型發(fā)布之時,人們總是說,國模即將崛起,追趕Anthropic指日可待。然而現(xiàn)實(shí)總是在反復(fù)打臉,模型之間的差距不僅越來越大,若是翻開GitHub上各種排行榜,有一個橙色頭像的作者已經(jīng)幾乎隨處可見。

然而,主動使用也好,不得不用也罷,隨著AI開始擺脫實(shí)驗(yàn)室走向企業(yè)級生產(chǎn)環(huán)境,一種深刻的商業(yè)現(xiàn)實(shí)已經(jīng)顯現(xiàn):最聰明的模型,一定是最貴的模型。Fable和GPT固然好,但每天24小時無間斷使用,誰也用不起。值此之際,人們似乎又看到了國產(chǎn)模型的一線生機(jī)。
要想真正利用AI發(fā)揮生產(chǎn)力,并使其產(chǎn)出的產(chǎn)品具備可落地的商業(yè)價值,單一的前沿旗艦?zāi)P驼媾R嚴(yán)峻的ROI拷問。
與此同時,能力略遜一籌但具備價格優(yōu)勢的國產(chǎn)模型,急需撕掉“玩具”的刻板標(biāo)簽。
而更深層次的沖突在于:大模型廠商正試圖構(gòu)建封閉的智能體生態(tài)建立壟斷,而企業(yè)用戶和中立第三方則在拼命尋求生態(tài)的開放與解耦。
因此,本文將從多模型動態(tài)路由(Fusion)和智能體元框架(Omnigent)這兩種全新的工程范式來解析這個技術(shù)與商業(yè)交織的復(fù)雜圖景,將AI產(chǎn)業(yè)正在經(jīng)歷的一場從“算力霸權(quán)”向“架構(gòu)分權(quán)”的歷史性演進(jìn)公之于眾。
01 算力成本陷阱與真?zhèn)涡枨?/strong>
在討論國際模型與國產(chǎn)模型到底該怎么用之前,人們首先應(yīng)該理解一個核心的AI經(jīng)濟(jì)學(xué)前提:token是一種智能決定價值的計算資源。
此前出現(xiàn)的桌面端AI代理,通過接管用戶電腦來執(zhí)行任務(wù),雖然結(jié)果令人失望,但仍然揭示了一個現(xiàn)象:許多個人和企業(yè)用戶,都處于“不知道如何規(guī)模化消耗token產(chǎn)生價值”的困境。
通過不完善的底層結(jié)構(gòu)進(jìn)行低效的任務(wù)窮舉來消耗token,創(chuàng)造出來的必然是偽需求。這一點(diǎn),三個月來各種代理的默默無聞已經(jīng)足以驗(yàn)證。想讓企業(yè)愿意用真金白銀買單,就絕對不能為了消耗算力而消耗算力,必須用最小的算力成本撬動最大的任務(wù)閉環(huán)。
這就是擺在所有人面前、當(dāng)前單一前沿模型面臨的算力成本陷阱。
像是深度行業(yè)研究、數(shù)萬行代碼的重構(gòu),任何一項(xiàng)復(fù)雜的商業(yè)任務(wù),其難度都呈現(xiàn)出典型的長尾分布。
其中,可能只有很少的環(huán)節(jié)需要Fable 5這種極致智商的模型出馬,而剩下的大部分環(huán)節(jié),只需要極其基礎(chǔ)的邏輯能力。像是網(wǎng)頁內(nèi)容抓取、基礎(chǔ)代碼翻譯、格式化JSON輸出、后期檢查校對,殺雞焉用牛刀。
如果用御三家的旗艦?zāi)P腿グ鼣埶腥蝿?wù)流程,無異于大炮打蚊子,而高昂的成本也會讓任何試圖商業(yè)化的SaaS產(chǎn)品在經(jīng)濟(jì)模型上面臨破產(chǎn)。
這種性能與成本之間的巨大撕裂,正是當(dāng)前AI應(yīng)用難以跨越試用期到“深水區(qū)”的根本原因之一。要解決這個矛盾,只靠等待前沿模型打價格戰(zhàn)恐怕已經(jīng)是無稽之談。因此,必須采用一種全新的系統(tǒng)工程思路:按難度與需求進(jìn)行任務(wù)分配。
02 Fusion機(jī)制與國模的“非對稱競爭”
國產(chǎn)模型的出路在哪?
這個問題,無論是AI的圈內(nèi)還是圈外人士都有所關(guān)注。
針對這個尖銳的問題,傳統(tǒng)的回答往往是在特定垂直領(lǐng)域用私有數(shù)據(jù)微調(diào),但效果并不顯著,因?yàn)樗⑽从|及系統(tǒng)架構(gòu)的本質(zhì)。當(dāng)下更直接的解法,是用極致的性價比來搶占“國產(chǎn)替代”的定位,這也是OpenRouter推出Fusion技術(shù)作為破局之道的本質(zhì)。
Fusion技術(shù),即多模型動態(tài)路由與合成,核心邏輯非常簡單但有效:將一個復(fù)雜問題并行分發(fā)給多個不同的模型,然后由一個評判模型將各方結(jié)果進(jìn)行融合。
用一個程序員圈子里的使用方法舉例:讓GPT-5.5和Opus 4.8寫程序架構(gòu),讓DeepSeek V4 Pro寫具體代碼。
太過簡單的思路反而讓人有些懷疑,就憑借這種“小伎倆”就能給國產(chǎn)模型帶來出路嗎?
在DRACO深度研究基準(zhǔn)測試中,一個令人信服的數(shù)據(jù)打消了懷疑:由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro組成的“預(yù)算型模型組”,不僅擊敗了單一的GPT-5.5,得分還逼近了頂級的前沿模型組合,而成本僅為其50%。


組合里三個模型中,有兩個性能與GPT-5.5存在明顯差距的國產(chǎn)模型。然而,它們卻給出了國產(chǎn)模型最現(xiàn)實(shí)也最具有商業(yè)價值的破局路徑:成為強(qiáng)大異構(gòu)系統(tǒng)中最具性價比的“四肢”和“感官”。
與各式各樣的桌面端代理創(chuàng)造出來的偽需求相反,在真金白銀的商業(yè)考量面前,Anthropic和OpenAI的定價使得“智能分配”成為了絕大部分用戶和企業(yè)的剛需。
我們已經(jīng)知道,多Agent協(xié)作是AI的必然趨勢,而在企業(yè)級Agent架構(gòu)中,也不應(yīng)該是一個強(qiáng)大的模型單打獨(dú)斗,這就是所謂的“混合智能體架構(gòu)(MoA)”,由兩部分組成:
一是調(diào)度與評判的“大腦”:占據(jù)不到一半的token份額,由Anthropic和OpenAI的旗艦?zāi)P蛽?dān)任,負(fù)責(zé)最終的共識提取、矛盾分析和復(fù)雜推理。
二是執(zhí)行與干活的“主力”:占用超過一半的token份額,由DeepSeek、GLM、Kimi等國產(chǎn)或開源模型擔(dān)任,負(fù)責(zé)海量文檔閱讀、大規(guī)模網(wǎng)頁并行搜索和基礎(chǔ)代碼編寫。
這只是理想情況,具體的token分配還是因任務(wù)難度而異。但重要的是,通過這種“高低搭配”,國產(chǎn)模型就不需要在所有維度上硬剛御三家,尤其是極限推理這種受硬件算力影響極為嚴(yán)重的領(lǐng)域。
只要能在長文本處理、基礎(chǔ)代碼生成或特定語言理解等領(lǐng)域達(dá)到及格線以上,并維持極具競爭力的API或訂閱服務(wù)定價,就能在這套多模型路由系統(tǒng)中占據(jù)不可或缺的地位,進(jìn)而獲得更為龐大的訂閱量。
如此一來,國產(chǎn)模型的定位就會有所變化:從前沿模型的“國產(chǎn)替代”,轉(zhuǎn)變?yōu)榍把啬P偷?ldquo;算力杠桿”。
融入這種多模型協(xié)作的生態(tài),國產(chǎn)模型也就正式告別了單一測試集上的跑分游戲,并作為基礎(chǔ)設(shè)施的底層齒輪,真正進(jìn)入全球企業(yè)的生產(chǎn)流轉(zhuǎn)之中。
03 主場優(yōu)勢與生態(tài)封閉
Fusion這種按需分配的架構(gòu)是企業(yè)用戶和個人用戶都夢寐以求的,但對于提供大模型的科技巨頭來說,這無疑是在削弱其利潤和控制力。
這就引出了當(dāng)前行業(yè)的另一個明顯趨勢:智能體時代的“主場優(yōu)勢”構(gòu)建。
觀察近期的產(chǎn)品發(fā)布:國外,Anthropic與OpenAI分庭抗禮,Claude Code與Codex針鋒相對;國內(nèi),前有小米MiMo Code加強(qiáng)對MiMo的綁定,后有智譜更新ZCode 3.0專情于GLM。
這種模型與調(diào)用環(huán)境(IDE/CLI)的強(qiáng)綁定,不僅是出于商業(yè)排他性的本能,背后也有著深刻的工程邏輯與戰(zhàn)略企圖。
從工程邏輯的角度來看,這是在用環(huán)境掩蓋模型缺陷。
模型與智能體環(huán)境的關(guān)系,正如編程語言與IDE的關(guān)系。任何一個通用大模型都有其獨(dú)特的失效模式(Failure Modes)。
當(dāng)Anthropic構(gòu)建Claude Code時,除了開發(fā)一個命令行工具,還要在底層硬編碼海量專門針對Claude優(yōu)化的隱藏系統(tǒng)提示詞、錯誤重試邏輯以及特定的工具調(diào)用格式。
若是在一個外部通用的智能體框架中,Anthropic的模型可能會因?yàn)檩敵龈袷讲粯?biāo)準(zhǔn)等意外錯誤而導(dǎo)致任務(wù)失敗;但回到其專屬的主場,IDE或CLI就能在后臺靜默糾正這些錯誤。這種主場優(yōu)勢,能讓模型在指定環(huán)境中表現(xiàn)得異常順滑,從而給用戶一種“模型絕對領(lǐng)先”的錯覺。
從戰(zhàn)略企圖的角度來看,這是要建立難以掙脫的供應(yīng)商“鎖定”。
從Prompt,到Skills,再到Harness,都充分說明了記憶和環(huán)境的重要性。一旦用戶習(xí)慣了在特定的智能體框架中工作,大量積累的上下文、自定義配置和工作流都會讓他們無法輕易離開底層的模型。
單純的API價格戰(zhàn)只能解決一時的問題,而極致打磨過的封閉智能體環(huán)境意味著能將模型能力升級為產(chǎn)品體驗(yàn)。
這就是Anthropic的成功秘訣:當(dāng)企業(yè)中程序員的核心業(yè)務(wù)流被固化在某個專屬的智能體中,哪怕OpenAI推出了新的一款讓Altman“看到原子彈、癱倒在地”的模型,亦或是DeepSeek和小米推出了便宜十倍甚至百倍的模型,企業(yè)也無法做到一鍵切換,因?yàn)楣ぷ髁魇遣患嫒莸摹?/p>
這種封閉的孤島策略,就是巨頭們抵御Fusion這種多模型路由技術(shù)和開源平替沖擊的最強(qiáng)護(hù)城河。
04 元框架的崛起與第三方的反擊
應(yīng)對開源技術(shù),巨頭們尚有余力,但多Agent協(xié)作的潮流終歸不可抵擋。當(dāng)企業(yè)發(fā)現(xiàn)自己被迫在好幾個互不兼容的智能體孤島之間復(fù)制粘貼,并且因?yàn)闊o法切換底層模型而不得不承擔(dān)高昂成本時,基礎(chǔ)設(shè)施層的革命就不可避免地爆發(fā)了。
這就是Databricks開源Omnigent的歷史背景。Databricks給Omnigent定位為“元框架(Meta-Harness)”,一個比單一智能體更高維度的抽象層。
回顧計算機(jī)科學(xué)史,最大的躍遷往往來自于新的抽象層。當(dāng)工程師們苦于同時管理數(shù)十個不同的服務(wù)器時,Google開發(fā)的Kubernetes橫空出世,將底層硬件抽象為統(tǒng)一的資源池。而如今的AI行業(yè)正處于完全相同的節(jié)點(diǎn),各個智能體及其框架(Harness),就是那些難以完全兼容的服務(wù)器。

Omnigent的核心價值,就在于剝奪巨頭們的主場優(yōu)勢,將控制權(quán)交還給用戶。它通過構(gòu)建統(tǒng)一的API,實(shí)現(xiàn)了三種顛覆性的功能:
首先是類似“一鍵熱插拔”的組合性。
用戶可以在一個統(tǒng)一的工作流中,用僅僅一行代碼將負(fù)責(zé)邏輯的節(jié)點(diǎn)從Claude切換為其他自定義模型,或是在一個項(xiàng)目中同時調(diào)用Codex和多個自建智能體,直接瓦解了巨頭們的供應(yīng)商鎖定(Vendor Lock-in)策略。
然后是兼顧安全與成本的絕對策略控制。
在封閉的生態(tài)中,模型能不能用、能怎么用、能用多久完全由巨頭們的黑箱定義。但在元框架中,用戶可以自由設(shè)置硬性上限,例如當(dāng)某個會話的token消耗達(dá)到100美元時立刻凍結(jié)并請求人工確認(rèn),而無需去每個AI供應(yīng)商那里查詢消耗量。
由于控制層上浮到了元框架,即使底層使用不同的模型,企業(yè)用戶最重視的安全審查和成本策略也能得到統(tǒng)一執(zhí)行。
最后是消除上下文的孤島。
會話狀態(tài)不再留存于某一家廠商的服務(wù)器上,而是由中立的元框架接管。無論是人機(jī)協(xié)作還是多Agent協(xié)作,都會擁有一個統(tǒng)一的工作臺。
也因此,無論是Fusion技術(shù)還是Omnigent框架,這些工具都必須也只能出自第三方。
正如前面所說,Anthropic、OpenAI以及一眾國產(chǎn)AI廠商都存在嚴(yán)重的資本導(dǎo)向偏向性。只要不是自家模型實(shí)在拿不出手,它們就絕對不可能推出一個框架來允許企業(yè)和個人用戶將任務(wù)無縫分發(fā)給競爭對手以節(jié)省成本。
Fusion誕生于OpenRouter,一個中立的模型聚合API平臺;Omnigent誕生于Databricks,一家以“數(shù)據(jù)多云中立”為核心戰(zhàn)略的底層基礎(chǔ)設(shè)施供應(yīng)商。只有與特定模型徹底解綁的第三方,才有動力去打造這種打破壁壘的工具。
這就代表了廣大企業(yè)開發(fā)者最核心的利益:AI應(yīng)該是一種可商品化、可替代的計算資源,而不是一種被巨頭裹挾的特權(quán)。
05 重塑AI智能體的價值鏈
過去的三年,全球的人們都處于“模型中心主義”階段,所有人都在尋找那個能解決一切問題的全知全能的神。
但現(xiàn)實(shí)已經(jīng)告訴我們,F(xiàn)able 5做不到,GPT-5.5做不到,DeepSeek V4 Pro也做不到,我們只能進(jìn)入“架構(gòu)中心主義”階段。
在這個新的階段中,單一模型或單一智能體的封閉玩法注定會被邊緣化。而未來的企業(yè)級AI生產(chǎn)力系統(tǒng),必將呈現(xiàn)出高度分化的層級結(jié)構(gòu):
在最底層,即算力執(zhí)行層,國產(chǎn)模型將憑借極致的性價比承接下大量的基礎(chǔ)“搬磚”工作,徹底擺脫玩具的命運(yùn),成為不可或缺的基石。
在中間層,即認(rèn)知評判層,御三家的旗艦?zāi)P蛯⑼司佣,不再處理瑣碎的細(xì)節(jié),而是作為高高在上、總攬全局的工程師,在Fusion這樣的動態(tài)路由機(jī)制下,負(fù)責(zé)那些難度最大的核心收斂工作。
在最上層,即管控交互層,依托于Omnigent這樣的元框架,各大廠商的主場封閉也會被逐漸打破,實(shí)現(xiàn)跨模型、跨框架的無縫協(xié)作、成本預(yù)算管控以及企業(yè)級安全隔離。
真正的智能,不僅存在于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)內(nèi)部,更存在于鏈接這些網(wǎng)絡(luò)的宏觀架構(gòu)之中。
當(dāng)算力、智力、成本與中立的基礎(chǔ)設(shè)施實(shí)現(xiàn)完美的系統(tǒng)化匹配時,AI才算真正完成了從“科技盲盒”到工業(yè)流水線的跨越。
原文標(biāo)題 : 國產(chǎn)大模型的出路在哪里?
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月30日立即報名>> 【直播】 AI X 6G無線智能與下一代通信測試論壇
-
6月30日立即申請?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
推薦專題
- 1 人形機(jī)器人“第一股”來了!宇樹科技即將上會
- 2 Agnes AI 發(fā)布三大模態(tài)核心模型:文本、圖像、視頻
- 3 騰訊云宣布調(diào)價:DeepSeek-V4降價97%
- 4 SpaceX上市拒絕中港投資者:資本開啟地緣政治時代
- 5 2026上半年具身智能復(fù)盤,瘋狂融資潮背后誰才是“印鈔機(jī)”
- 6 支付寶推出全球首個Token Pay服務(wù),AI時代的支付要變天了?
- 7 我們體驗(yàn)了胡彥斌Vibe Coding的App:方向是對的,細(xì)節(jié)有點(diǎn)糙
- 8 AI生態(tài)之戰(zhàn)打響:微信做入口,騰訊來托底
- 9 3000字深度|物理AI有何魔力?讓孫正義、黃仁勛、孫宇晨同時“上頭”
- 10 SpaceX計劃今日確定IPO條款,6月12日掛牌上市,AI業(yè)務(wù)成增長新引擎
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













