訂閱
糾錯
加入自媒體

告別價格戰,大模型共迎通脹時代

2026-04-24 16:59
鋅刻度
關注

圖片

 價值創造比成本控制更重要

 

撰文陳鄧新

編輯李   季

排版/ Annalee  

眼下,漲價成為大模型的關鍵詞。 

邁入2026年,大模型不再是優惠縮水,而是毫不掩飾地開啟了漲價模式,大大小小的廠商紛紛入局,智普甚至在短短三個月之內兩次提價。 

以至于,國產大模型定價首次與海外頭部廠商對齊。 

大模型漲價,是曇花一現還是曠日持久?降價爭奪市場的打法,是否走到了盡頭?價值戰會成為未來競爭的核心敘事嗎?   

不愿賤賣成為行業的共識

曾幾何時,降價才是大模型的競爭基調。

“全線降價”“兩款產品免費”“百萬Token一分錢”“比行業同類產品便宜90%”“免費、全面免費、永久免費”……

這一系列動作的背后,則是大模型為了長遠發展選擇犧牲短期利益。 

通俗易懂地說,為了AI普惠需要不斷降低大模型的Token價格,唯有此才可以在B端賦能千行百業、在C端成為標配的日常工具。

 

圖片

Token成為大模型的重中之重 

畢竟,將市場蛋糕越做越大才可以吃到規模化的紅利,從而獲得更大的勢能。 

阿里云資深專家朱迅垚曾表示:“阿里云大模型降價,是希望讓更多的使用者和中小企業用上大模型,加速AI應用市場的提前爆發。” 

百度智能云AI與大模型平臺總經理忻舟亦表示:“大模型仍處于市場培育階段,企業只有在認識到大模型帶來的巨大價值后,才能將其應用于更大規模、更復雜的業務場景中。” 

需要注意的是,大模型并非一味追求降價,也通過創新進行讓利。 

以2025年6月發布的豆包大模型1.6為例,一改行業之前的定價慣例:深度思考或多模態能力無需為Token額外買單,且Token的價格隨著0—32K、32K—128K和128K—256K這三個輸入長度的增長而增加,進行了分區定價,性價比更高。

 

圖片

分區定價打破常規

不曾想,大模型價格只降不升的傳統被打破了。

邁入2026年之后,GLM、Seedance、HY2.0 Instruct等大模型或多或少有了提價的動作,特別是GLM-5.1在Coding場景的緩存命中Token價格接近Anthropic旗下大模型Claude Sonnet,這是國產大模型首次在核心場景實現與海外頭部廠商的價格對齊。

這意味著,大模型越來越不愿意賤賣Token了。

MiMo大模型負責人羅福莉表示:“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前,不要盲目地競相壓低價格。以極低的價格出售Token,同時對第三方敞開大門,這看起來對用戶很有吸引力,但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”

簡而言之,打價格戰不如打價值戰。 

Token價格低,不意味著模型能力強,如若模型能力不足則會消耗更多的Token,進而導致更大的浪費,最終用戶與大模型雙輸。 

如此一來,大模型回歸價值博弈成為一道必答題。 

 

競爭焦點出現了轉向

 大模型從價格戰走向價值戰,背后的緣由有三。

首先,供不應求。

智能體時代,Token的長度從十萬級向百萬級、千萬級躍遷,與此同時消耗量也實現了上百倍增長,成為大模型提高獲客量的關鍵抓手。 

之所以如此,與思考鏈路延長息息相關。

一問一答模式的Token消耗是線性增長,而智能體模式可以進行長鏈路思考、執行多重任務、完成循環調用等,Token消耗是指數級增長。 

關于此,從智譜的數據就可見一斑。 

2026年第一季度,智譜大模型的API調用定價提升了83%,而Token消耗量增長了400%,提高定價并未抑制需求,反而出現了供不應求的現象。 

智譜CEO張鵬表示:“AGI時代的商業價值可以歸結為一個簡潔的公式:智能上界 × Token消耗規模,智能上界決定了定價權,Token消耗規模決定了價值體量。未來,衡量一個個體或組織價值的標準,不再是掌握了多少信息,而是其作為Token架構師,在給定預算下構建復雜 Agent系統并驅動大模型完成復雜Agent系統的自主運行。” 

正因為如此,大模型的競爭焦點出現了轉向。 

大模型不再圍繞參數、數量、打榜等指標比拼,而是轉向拼應用、拼生態,因而性價比不再是唯一的關鍵指標,價值創造站到了C位。 

譬如,混元3D世界模型2.0可以理解文字、圖片、視頻等不同類型的輸入,自動生成3D場景,無縫對接游戲開發、AI漫劇等工作流。

 

圖片

一句話生成3D世界 

再譬如,GLM-5.1能夠在一次任務中獨立、持續工作超過8小時,成為當下唯一具備此能力的開源模型。 

其次,分擔成本。

 大模型落地離不開云計算的鼎力相助,但云計算的成本肉眼可見的在不斷增長,如此漲價成為必然。 

以數據中心為例,一方面存儲芯片等成為賣方市場,持續抬高新建成本;另外一方面由于是耗電大戶,在能源價格高企的背景之下,運營成本被迫不斷抬升。 

不難看出,大模型服務比傳統的互聯網服務成本更貴。 

更為關鍵的是,由于AI技術不斷迭代,大模型也需要推陳出新,進一步推高了開支,亟須探索良性的、合理的商業化路徑。 

火山引總裁譚待曾有言:“對于企業級市場來說,商業模式是建立在可持續發展的基礎上,任何商品必須是盈利的,不能靠補貼來降價。如果降價是虧損的,規模越大虧得越多,這就不是合理的商業模式。” 

再次,勝者為王。 

隨著“百模大戰”的演進,不少實力欠佳的玩家選擇退場,即便是實力強勁的玩家也難以面面俱到,選擇聚焦主航道。 

Sora,就是最好的明證。

作為OpenAI旗下的AI視頻生成工具,Sora誕生之初備受好評,視為AI生成視頻賽道的顛覆性產品。

 卻不想,由于入不敷出,成為OpenAI的棄子。

 

圖片

Sora壽終正寢 

公開數據顯示,Sora商用級內容的生成命中率僅5%~10%,生成一分鐘高質量視頻的推理成本為30~50美元,因而30天用戶留存率為1%,60天留存率為0%。

簡而言之,Sora并沒有成為生產力工具。

其實,Sora不行,不意味著AI生成視頻不行,Seedance、可靈等中國AI生成視頻大模型不但技術過硬,更是不缺應用場景,最終上演了彎道超車。 

“藍鯨科技”報道:“Seedance 2.0出來前,大多數模型每次只能生成一個5秒的視頻,5秒里可能3秒都是廢片,一個完整的鏡頭需要幾個視頻拼接,而Seedance 2.0能夠生成完整的15秒視頻,運鏡切換自如。”

Seedance之外,可靈的表現也可圈可點。 

財報數據顯示,2025年第一季度至第四季度,可靈的營業收入分別為1.5億元、2.5億元、3億元、3.4億元,雖然增速有所放緩,但整體依然處于增長的勢態。 

總而言之,大模型走過了采取低價甚至免費策略進行AI普惠的階段,邁入了價值創造的階段,為了更好地釋放生產力,既要比拼模型的高效,也要比拼場景的適配。 

那么,大模型競速進入“深水區”。

       原文標題 : 告別價格戰,大模型共迎通脹時代

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號