DeepSeek出題，小米交卷

2026-05-28 11:46

硅基星芒

關注

昨天凌晨，小米MiMo大模型的一則公告，在開發(fā)者圈子里激起了不小的水花。

公告的主題很簡單：降價，而且是大幅降價。

MiMo-V2.5系列API永久調(diào)整價格，最高降幅達到驚人的99%，而且不再區(qū)分上下文窗口長度。此前計費體系引入的Credits積分制仍然保留，套餐可用量提升大約5-8倍。

如果這件事從一個更高的視角來看，那就不僅僅是一次促銷活動：這是在DeepSeek V4刷新行業(yè)價格底價僅僅四天后，國產(chǎn)大模型陣營發(fā)生的第一次“光速”跟進。

而在這場名為普惠的陽謀背后，藏著國產(chǎn)模型生存現(xiàn)狀的冷酷真相，以及關于token價值的深刻誤區(qū)。

01 DeepSeek出題，小米交卷

很多AI行業(yè)關注者第一時間感嘆小米的動作之快。梁文鋒的DeepSeek剛剛“用小石子”擊落API價格，小米后腳就完全對標了V4 Pro和V4 Flash兩款模型的價格。

這傳遞出了一個極其明確的信號：此前我堅持認為國產(chǎn)AI行業(yè)必將發(fā)生的第二次價格戰(zhàn)早已降臨，而且已經(jīng)悄悄進入了“紅海肉搏”階段。

客觀來說，所有人都必須承認一個事實：現(xiàn)階段的國產(chǎn)模型，與GPT-5.5和Opus 4.7比起來，依然存在難以在短時間內(nèi)逾越的代差。個人認為，這個代差在未來還會繼續(xù)擴大。

在“最頂尖的智能”領域，國產(chǎn)模型還在全力追趕；但在“非復雜任務”的規(guī)模化應用場景下，國產(chǎn)模型之間的智能水平其實拉不開絕對差距。

當智能水平無法產(chǎn)生代差時，性價比（ROI）就成為了唯一的護城河。

梁文鋒帶領的DeepSeek用激進的定價策略和連續(xù)幾次降價公告已經(jīng)證明，在性能仍處國內(nèi)第一梯隊的基礎之上，低價就是獲取流量并讓用戶產(chǎn)生“替代依賴”的最有效手段。

而小米的迅速跟進，驗證了另一個邏輯：在這場競賽中，誰不跟進，誰就得坐等用戶流失。國內(nèi)模型性能領先的兩家企業(yè)都進行了如此大幅度的降價，足以證明部分廠商的訂閱服務和API價格虛高。這已經(jīng)不是“想不想降價”的問題，而是“不降價就出局”的生存問題。

02 110億Credits背后的數(shù)學游戲

價格雖然發(fā)生了驚天動地的變化，但是小米推出訂閱服務時采用的Credits計費單位卻不動如山。

從營銷角度來看，這確實是一次簡單而聰明的操作：99元買13億token，聽起來很劃算；而99元買110億Credits，聽起來簡直就是在發(fā)福利。

這種高額數(shù)字帶來的沖擊力，能極大地對沖用戶對“降價是否縮水”的焦慮。不過，人們?nèi)匀粦摾潇o下來算一筆賬，看看背后的商業(yè)玄機。

API價格上，小米之所以能喊出最高降幅99%的口號，更多是因為其原始定價在DeepSeek的沖擊之下顯得過于傳統(tǒng)和保守。為了實現(xiàn)對標，以及不讓用戶被瞬間奪走，API必須進行這種毀滅式的降價。

訂閱服務上，小米在國內(nèi)首創(chuàng)Token Plan，這種透明性和可解釋性更強的計費方式逐漸開始成為全球主流，官方宣稱容量提升幅度約為5-8倍。

以訂閱量最大、最常用且最便宜的Lite檔位訂閱為例，token可用量從60M提升至500M，折算下來單位成本降幅約88%，略低于API降價幅度。更高檔位的訂閱服務，成本下降幅度則更小一些。

這種差異不難理解，因為訂閱服務本身就是一種“批發(fā)價”，此前已經(jīng)比直接使用API劃算得多。無論是國內(nèi)還是國外，用戶在有訂閱服務的情況下都會優(yōu)先選擇訂閱。

因此，小米的這一系列措施的目的已然明晰：通過把API價格打到與DeepSeek一致來吸引流量，再通過訂閱服務鎖定高頻用戶。即便訂閱服務的折扣力度沒有API那般夸張，但由于DeepSeek不提供訂閱服務，作為第二個“吃螃蟹的人”，小米的Token Plan已經(jīng)是目前市面上最劃算的“算力包”。

這種差異化的設計，實際上也是在引導行為：它鼓勵用戶去做高頻、重復的智能體調(diào)用，因為只有在這類場景下，小米的成本最低、用戶的體感也最便宜。

03 同樣的價格，不一樣的含金量

當價格被抹平到同一水平線時，決定勝負的唯一指標就變成了token的生產(chǎn)力價值。

根據(jù)Artificial Analysis的測評以及實測效果反饋，小米的MiMo V2.5 Pro和DeepSeek V4 Pro呈現(xiàn)出了不同的價值取向。

DeepSeek更像是一個偏科型選手，編程和邏輯推理能力略顯領先，而且占據(jù)用戶心智更為成功，目前是不少個體開發(fā)者或小型開發(fā)企業(yè)的首選。然而，DeepSeek在多模態(tài)領域的缺失，嚴重影響了應用場景擴張，目前的專家模式識圖也只是聊勝于無。

小米打造的則是一個全能型選手，模型發(fā)布時就明確標注了“全模態(tài)”。在同樣的API定價下，小米的token能夠處理圖像、音頻和視頻等復雜交互形式，相比只能處理文本的DeepSeek，在智能體應用上會更有優(yōu)勢。

這也是此前我反復強調(diào)過的觀點：多模態(tài)能力在智能體時代絕不能忽視，反而應該得到更多重視。

既然如此，小米降價的底氣何在？公告中提到的技術細節(jié)，隱隱約約透露出了小米如何壓低單位token的物理成本。

SGLang HiCache和SWA（滑動窗口注意力）這兩個詞值得重點關注。簡單來說，小米認為在大模型的推理過程中，成本最昂貴的環(huán)節(jié)就是GPU顯存中的KV Cache。

SWA技術讓模型不再需要為了記住幾萬字前的廢話而消耗掉海量的內(nèi)存，這就能解釋為什么小米這次取消了上下文窗口長度的階梯計費。而多級存儲優(yōu)化，將數(shù)據(jù)在顯存、內(nèi)存和SSD之間的搬運量降到了原先的七分之一。

技術的領先，最終轉(zhuǎn)化成了定價的自由度。

當小米能把緩存命中的開銷降低到上一代模型的十分之一甚至百分之一時，降價99%就不再是做慈善和單純的營銷，而是在釋放技術紅利，順便清理掉那些技術架構陳舊、成本降不下來的競爭對手。

04 警惕token貨幣化，智能才是真價值

最后，無論是DeepSeek還是小米的降價，AI行業(yè)的所有人都應該關注一個深層次的行業(yè)亂象。

現(xiàn)在的AI市場，token這個詞似乎被異化成了一種“本位貨幣”。在過去的兩個月內(nèi)，有些企業(yè)開始考核員工“每個月消耗了多少token”，開發(fā)者們也開始炫耀自己的token用量。

但這本身就是一個誤區(qū)：token不是貨幣，不同模型的token價值也完全不同。

像是GPT-5.5和Opus 4.7這樣的頂級模型，它們的token價值高，是因為用少量的token就能完成復雜的任務，具備極高的生產(chǎn)力密度。

而低智能水平模型的token，哪怕按億供給，如果無法解決問題，生產(chǎn)力價值依然趨近于零。

而前段時間，國內(nèi)外有不少廠商趁著編程代理軟件的火爆，紛紛上調(diào)訂閱服務和API的價格，本質(zhì)上都是在利用token概念的模糊性混水摸魚，讓不熟悉AI的用戶誤以為所有模型的token都是同一種原材料。

如今，DeepSeek掀了桌子，小米焊死了門。兩家企業(yè)動作的本質(zhì)，是讓token回歸了它的真實價值：作為一種廉價的“賽博工業(yè)耗材”，它必須足夠便宜，才能支撐起大規(guī)模的AI應用。

大模型的第二次價格戰(zhàn)已經(jīng)悄然開始，而這次價格一旦被打下來，絕不會像上一次價格戰(zhàn)結(jié)束后那么容易就漲價回去。對于那些依舊抱著高昂定價不放、卻拿不出頂尖智能水平的廠商來說，寒冬可能比預想的要更近。

最后，小米在公告中的結(jié)語值得分享給每個人：技術的價值，最終要體現(xiàn)在被使用的廣度上。

當token不再昂貴，國產(chǎn)大模型才能真正從實驗室中的樣本轉(zhuǎn)變成每個人都能按需取用的水和電。

而關于這場智能價值的洗牌，才剛剛拉開序幕。

原文標題 : DeepSeek出題，小米交卷

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發(fā)表評論

登錄