算力荒,會把中國 AI 燒成一場泡沫嗎?
被稱為“AI 教父”之一的楊立昆,最近說了一個很可怕的預測,他認為:AI泡沫的破裂沒有想象中那么遠,它隨時可能爆。這個推論,也適用于中國AI產業。
他的觀點也很通透——泡沫并不是AI沒有價值,而是太有價值了。但如果AI的需求無法用足夠低的算力成本支撐,那很多公司的營收也就無法達到預期,就會出市值崩塌,進而引發泡沫。
所以,這篇文章真正想追問的,不是智譜和 Kimi 誰更聰明,也不是 DeepSeek 的路子是不是更高明,而是一個更現實的問題:當所有人都在排隊等 Token 的時候,中國能不能為自己的AI供應鏈,建起一套自由、充沛、能持續降價的產能兜底。
如果我們在算力大爆炸到來時擁有足夠多、足夠便宜的Token產能,那么,今天的限購,只是黎明前的擁擠。如果建不起這條鏈,被算力逼出來的,就不再是某一種產品性格——而是一場泡沫,以及它炸開的那一聲。
——導語
01 AI泡沫,并非遙不可及
被稱為“AI 教父”之一的楊立昆,最近說了一個很可怕的預測,他認為:AI泡沫的破裂沒有想象中那么遠,它隨時可能爆。這個推論,也適用于中國AI產業。
6 月 18 日的 CNBC 訪談里,他算的是極其簡明的一筆經濟賬:高端AI產品的價格雖然一直在漲,可運行它們的Token成本降得太慢了,慢到幾乎所有公司都在用投資人的錢在替用戶買單。
他的推論很簡單,如果Token的成本賬本始終無法改善,那超級估值-超級市值-收入快速增加的閉環就走不通,如果整個行業都陷入這種死循環,都在證明最前沿的AI換不來足夠的收入,泡沫就會“撐不了多久”。
這并非危言聳聽。
馬斯克的 xAI,和 SpaceX 合并后估值沖到 2 萬億美元,一個季度卻虧掉 25 億,收入才 8 億出頭;做 Claude 的 Anthropic 每月掏 12.5 億美元,租馬斯克的卡來跑自己的模型;連一向嘴硬的 OpenAI,奧爾特曼也松了口,承認成本如今是“一個巨大的問題”。
這本是互聯網時代的老套路——拿投資人的錢補貼用戶,先把規模沖上天,再尋找商業化變現機會,找不到,泡沫就會破。而AI 這局賭得更大:所有人都押注推理的成本會一路降下去,降到某天能跑贏燒掉的速度。如果賭贏了,AI的新時代就來了;如果賭輸了,和互聯網泡沫后是同一種一地雞毛。
關鍵就在有足夠又便宜的Token產能,但眼下,中國AI似乎已經撞上了這道算力產能墻。
這個 6 月,中國最強的幾款編程大模型扎堆問世:13 日智譜開源 GLM-5.2,代碼能力一度全球第二、只輸給 Claude;Kimi 端出專攻編程的 K2.7 Code,MiniMax 甩出主打智能體的 M3。可幾乎同時,這幾家公司在干一件正相反的事——攔著你別買。
現在,智譜的套餐天天得搶、一年漲三次價;Kimi、MiniMax 的接口接連過載,開發者排著隊“等 Token”;巨頭們的情況略好,但高端線同樣算力吃緊,多次對用戶發出預警信息。
最該以無限供給的形式去支撐未來市值的東西,變成了經濟匱乏時代的“憑票供應”,這本身很諷刺。
但警報信號是真實且明確的——如果一個賣數字產品的公司開始限制購買,等于承認它賣的早已不是能無限復制的軟件,而是一種有產能上限的工業品,這是中國 AI 產能池底發出的第一聲警報。
更嚴重的是,如果運行成本要是始終降不下來,等在這聲警報后面的,就不再是限購——是楊立昆說的那場泡沫,和它炸開的那一聲。
02 股東金主為什么也靠不住了?
眼下這場算力荒,不是豆包那種 C 端日活燒出來的。真正把需求頂上天的,是今年中國大模型乃至全球大模型集體押注的 AI 編程和智能體調度框架。
聊天再貧,一次也就幾萬個 Token;一個編程智能體卻要啃下整個代碼庫,反復跑命令、改文件、自檢——MiniMax 演示 M3 時讓它獨立復現一篇論文,自主跑了將近 12 個小時。這類任務吃 Token 的胃口,是聊天的幾十上百倍。

于是, MiniMax 發布 M3 的同一天,干脆把用了多年的包月計費改成按 Token 計費,重度用戶實測成本漲了一兩倍。
美國的業者算出的比例更極致——一個開發者計算自己使用Claude、ChatGPT的200美金套餐燒掉的Token,最后得出了2048美元這個精確的十倍數字。
“幾十塊錢包月隨便跑”的好日子,目前看來已經一去不復返。而且,這不會是它一家要這么做——可無限復制的軟件的定價邏輯已經被認為不適合AI,它正被基于產能的定價邏輯取代,往后這將是行業通例。
按理說,這些公司不該缺算力。智譜背后站著騰訊、阿里、螞蟻、美團、小米;Kimi 的最大股東是阿里,占股四成,騰訊也跟投了。按理說,抱著這樣有龐大云計算資源的金主,限購怎么也不該輪到它們。
問題是,金主自己也沒余糧。
2026 年的算力荒不是某個零件斷貨,而是芯片、存儲、封裝、網絡、數據中心整條鏈一起見底,這種緊張,業內判斷至少還要緊兩年。
一位 ICT 廠商的人士說得很直白:從前兩百萬能買八臺 GPU 服務器,現在只夠買四五臺,廠商寧可毀約也不交貨。
于是,3 月,騰訊云率先給自家混元的部分產品漲價、個別飆到四倍,阿里云、百度云幾小時內跟進。連有厚實的AI云業務底座的大模型公司都缺貨——這才是當前中國 AI 產能的基本面。
當然,價格這件事,倒不是一邊倒地漲。DeepSeek 把 V4-Pro 的接口永久降到原價的四分之一,小米 MiMo 跟著砍掉九成,騰訊云干脆把自家平臺上托管的 DeepSeek 一刀劈掉九成七——緩存命中的調用價壓到每百萬 token 兩分五,比打一通電話還便宜。
這聽起來和“產能缺乏”似乎很矛盾,但實則和限購困局并不矛盾,而是同一場短缺的兩頭:降價的是 DeepSeek、小米這些效率派,靠把緩存和稀疏架構榨到極致,把廉價檔的成本真摁了下來;漲價限購的是智譜那種緊俏的編程高端檔,越能干活越供不應求。連騰訊都在兩頭下注——漲自己的混元,貼別人的 DeepSeek。價格不是齊漲齊跌,是在按檔位分化。
更有張力的是,初創模型公司和資本金主的默契,發生了微妙的變化。
互聯網巨頭屬性的金主當初投這些模型公司,尤其是那些自己也做 AI 的巨頭,本就揣著兩個心思:技術上押個外部團隊,給自研加道保險繩;商業上用資本綁一個長期客戶——你拿了我的錢,轉頭來買我的算力,我出錢又收回算力收入,看著兩全其美。
可算力一旦變稀缺,這個本該是 VIP 的被投客戶,就嘗到了綁定的另一面:已經有云巨頭公開放話,要把緊缺算力優先留給自家的高價值業務,被投的創業公司,往后排。說穿了,你的房東、你的債主、和你的對手,常常是同一個人。
于是接口照樣過載,套餐照樣限購,錢卻一分不少燒。據招股書口徑,智譜七成研發投入花在買算力上,三年半虧掉六十二億;MiniMax 同樣七成研發買算力,三年半虧約九十二億,它跟阿里云的年度采購上限還在逐年往上抬。
這說明,綁定換不來優先級已是共識。剩下的只是一道無解難題:產能就這么多,誰掏得起、扛得住,誰活下去。
被逼到這份上,一個新思路出現了:金主既然靠不住,能不能靠自己?
03 覺醒者
模型公司和投資人之間,本是一樁你情我愿的默契:你投錢進來,我拿錢買你的算力,我得算力,你得利潤,各取所需,看著很美。可金主的池子一旦不夠深,這默契就兜不住。模型公司只能從這場看似雙贏的美夢里驚醒,自己找活路。
能走的路就兩條:把效率摳到極致,和擁抱國產產能。
前者,下一節再說,先說適配國產芯片——這條路上,大方向其實一致。智譜把 GLM-5 的訓練集群交給華為昇騰,由神州數碼用昇騰加鯤泰的服務器獨家交付,又把年初的 GLM-Image 做成第一個全程在國產芯片上訓出來的頂級多模態模型。
DeepSeek 走得更遠。4 月發布的 V4,不惜拖期也要在華為昇騰首發,底層代碼從英偉達的 CUDA 整個重寫為華為的 CANN,目的就是在釋放產能可控的信號。

智譜適配昇騰,和 DeepSeek 適配昇騰,本質是一回事。可再往前一步,兩家就分了岔。
智譜仍把算力的源頭托給云廠和股東;DeepSeek 卻開始直奔上游:一邊放風短期不追盈利,一邊瘋了似的招聘數據中心建設和管理人才,這種做法直指自建吉瓦級的算力基地。
最見性格的是 6 月那輪首輪融資——創始人梁文鋒自掏約兩百億當最大出資方,把投資人擋在董事會門外。我認為,他這么決絕,要的就是希望這個激進計劃別被股東拉扯。因為這條路一旦走通了,它會是中國第一家自建龐大算力基建的純模型公司,在初創和巨頭之外趟出第三條路。
可惜,醒了是一回事,走得通是另一回事,這一切都壓在國產硬件這個底座上——它到底有多硬?
只看市場份額,確實提氣:2025 年國產 AI 芯片在國內的出貨份額已經爬到四成,華為出貨第一、占了近一半,寒武紀營收一年翻了二十多倍。
但把鏡頭推近,沒那么好看。論單顆高端芯片,英偉達旗艦在多項指標上仍是華為昇騰的四到六倍;華為得把上百顆芯片用光模塊全互聯堆成超節點,才在集群層面追平甚至反超,代價是接近四倍的功耗。
國產硬件如今交出的是“能跑”的平替,離性能更優、讓人主動掏錢的優替,還差一大截。何況整個盤子還供不應求——覺醒者認清了方向,可這條擁抱國產產能的路,本身就卡在產能上。
04 被算力荒改變的產品性格
自建基礎設施,持續往上游走,是遠水。而眼前的近渴,只能靠把效率用軟硬件協同的工程化能力提上去。某種意義上,算力一不自由,最先變的,是一家公司的產品性格。
Kimi 的答案,是把效率摳進架構。
它的推理跑在一套叫 Mooncake 的架構上——以緩存為中心,把“預填充”和“解碼”兩個階段拆開分別調度,再把算過的 KV 緩存在整個集群里池化、復用,讓同一批 GPU 多服務出幾成的請求。核心環節,它依然深度綁定阿里云,用彈性的算力組合把任務穩定性和利用率頂上去,又自研安全網關,省掉自建機房的重負擔。
為此,月之暗面創始人楊植麟常把一個詞掛在嘴邊——Token 效率,還把團隊那套讓學習效率翻倍的 MUON 優化器擺出來作證。他的確很清醒——競爭的勝負手,早從堆資源挪到了推理系統的效率本身。
智譜的答案,是把效率直接做成能賣的產品,工程上近乎暴力。它的高速推理引擎 TileRT,在編譯期就把整張計算圖靜態編排成一個常駐 GPU 的內核,把旗艦模型的吐字頂到每秒約 400 個 Token;它和清華合做的 ZCube 網絡架構,不加一塊 GPU、不改一行代碼,就把同一批硬件的推理吞吐提了一成半、把網絡設備的錢省下三分之一、首字響應的尾延遲壓低四成;它的 GLM-5 集成了一套稀疏注意力,在保住百萬級上下文的同時把推理成本摁下去。這些省出來的本事,它打包成能直接搬進客戶機房的私有化設備,賣給政企。
兩家摳的地方不同,指的是同一件事:中國頭部公司,早已不只在比模型誰更聰明,而是在比單位 Token 的生產效率。
稀缺逼出了新技術,是好事。我認為,這可能是中國公司會持續走的一條路,但這并非全局最優解,死摳效率是有一定性能代價的,而絕非毫無代價——一種被約束逼出來的優點,終究帶著約束的胎記。
05 美國也有兩條路,但美國有底
把目光挪到太平洋對岸,美國的前沿公司,也基本不自己蓋機房。所以,DeePSeek這次,抄的絕不是美國的作業。
OpenAI 干的是攢局的活。它的 Stargate 計劃,四年五千億美元、十吉瓦,機房由甲骨文、軟銀這些伙伴出錢建,建好了專供 OpenAI;微軟繼續供云,甲骨文、CoreWeave 并行,它自己還拉上博通設計專屬芯片。它要的不是有一個金主,是讓一群供應商、融資方、電力商,全都圍著它的產能需求轉。這是一種強控制型的基礎設施聯盟。
Anthropic 走的是多云、多伙伴、多份長約。它綁定亞馬遜云為主要訓練伙伴,那座專給它訓 Claude、塞了一百多萬顆芯片的超級集群,產權在亞馬遜手里、算力卻為它獨留;它一邊跟亞馬遜簽十年超千億美元、最高五吉瓦,一邊跟谷歌簽數百億美元、想買下足足一百萬顆 TPU,它甚至不惜每月掏 12.5 億去租馬斯克閑著的卡。最后的結果是,它可以橫跨多種芯片、不跟任何一家云公司簽排他協議,這樣才可以把模型權重和定價牢牢攥在手里。這是一種多伙伴的合同型算力池。

兩條路看著不同,前提只有一個: AI 產業鏈最值錢的那截——先進芯片、成熟云平臺、自研加速器、能撬動千億融資的數據中心、能采購的電力、覆蓋全球的客戶——大多落在本土或盟友體系里。所以美國公司操心的從來不是有沒有算力,而是算力天花板能抬多高:聯盟越搭越大,天花板就一路往上頂。目前,這道天花板比中國公司的高太多。
雖然,中國公司也能抱金主,也能合縱連橫。但關鍵差別在于,它們抱住的那條腿,自己也站在同一條受限的供應鏈里排隊。
06 真正的窄門:會不會燒成泡沫?
需求那頭的故事,已經講得夠了——智能體一爆發,Token 消耗每兩周翻一倍;按 IDC 的預測,到 2030 年,全球年度 Token 消耗會比 2025 年漲超過三億倍。幾乎每篇樂觀文章都在算同一筆賬:中國未來每天燒多少 Token,仿佛燒得越多就越繁榮。
可很少有人回頭問一句:這些 Token 誰來生產?用什么芯片?在哪個機房?誰付電費?當編程智能體占了一半的生產力場景,誰來保證服務不會突然限流、排隊、漲價?
Token 消耗是需求側的繁榮,產能池底是供給側的現實——只盯前者,是一種虛假的繁榮。真正的關鍵詞從來不是“算力”,而是“產能”:芯片、顯存、互聯、電力、機房、調度、價格機制,是這一整套東西,才能把智能持續地、而且越來越便宜地生產出來。
繞了一圈,又回到楊立昆那句判斷——限購也好,省卡也好,擁抱國產產能也好,說到底都是在一個賽道里賽跑:成本能不能跑在錢燒光之前降下來。
降成本太重要了,對于今年的中國大模型市場來說,無論是抬高前沿模型的價格,還是通過降價讓便宜夠用的模型去搶市場,本質上仍然考驗一件事——無論是價格臺上天,還是把價格砸到地板,只要公司還在失血,就顯示出泡沫破裂并不是樂觀者認為的囈語。
這道南墻,中國撞得最早、也最痛。別人是在算力充裕里摳成本,中國是在算力稀缺里摳成本。時間和短缺這兩件事,對中國AI行業都更不友好。但如果這題要是解不開,崩掉的就不只是一兩家公司的市值,而是支撐整輪 AI 的那個循環——用戶用著投資人的錢補貼的服務,投資人等著成本下降來兌現回報——那個下降一旦遲遲不來,循環就會整個塌下去。到那天,所謂的繁榮,不過是又一片更貴的單車墳場。
所以這篇文章真正想追問的,不是智譜和 Kimi 誰更聰明,也不是 DeepSeek 的路子是不是更高明,而是一個更現實的問題:當所有人都在排隊等 Token 的時候,中國能不能為自己的智能,建起一套自由、充沛、能持續降價的產能兜底。
建得起,今天的限購,只是黎明前的擁擠。建不起,被算力逼出來的,就不再是某一種產品性格——而是一場泡沫,以及它炸開的那一聲。
原文標題 : 算力荒,會把中國 AI 燒成一場泡沫嗎?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 人形機器人“第一股”來了!宇樹科技即將上會
- 2 3000字深度|物理AI有何魔力?讓孫正義、黃仁勛、孫宇晨同時“上頭”
- 3 SpaceX計劃今日確定IPO條款,6月12日掛牌上市,AI業務成增長新引擎
- 4 Agnes AI 發布三大模態核心模型:文本、圖像、視頻
- 5 深度 | 一天燒1億:第一次“Token大撤退”,來了
- 6 騰訊云宣布調價:DeepSeek-V4降價97%
- 7 海清智元即將登陸港交所:收入大增利潤承壓,經營現金流惡化
- 8 SpaceX上市拒絕中港投資者:資本開啟地緣政治時代
- 9 2026上半年具身智能復盤,瘋狂融資潮背后誰才是“印鈔機”
- 10 支付寶推出全球首個Token Pay服務,AI時代的支付要變天了?


分享













