算力荒，會把中國 AI 燒成一場泡沫嗎？

2026-06-23 10:04

被稱為“AI 教父”之一的楊立昆，最近說了一個很可怕的預測，他認為：AI泡沫的破裂沒有想象中那么遠，它隨時可能爆。這個推論，也適用于中國AI產業。

他的觀點也很通透——泡沫并不是AI沒有價值，而是太有價值了。但如果AI的需求無法用足夠低的算力成本支撐，那很多公司的營收也就無法達到預期，就會出市值崩塌，進而引發泡沫。

所以，這篇文章真正想追問的，不是智譜和 Kimi 誰更聰明，也不是 DeepSeek 的路子是不是更高明，而是一個更現實的問題：當所有人都在排隊等 Token 的時候，中國能不能為自己的AI供應鏈，建起一套自由、充沛、能持續降價的產能兜底。

如果我們在算力大爆炸到來時擁有足夠多、足夠便宜的Token產能，那么，今天的限購，只是黎明前的擁擠。如果建不起這條鏈，被算力逼出來的，就不再是某一種產品性格——而是一場泡沫，以及它炸開的那一聲。

——導語

01 AI泡沫，并非遙不可及

6 月 18 日的 CNBC 訪談里，他算的是極其簡明的一筆經濟賬：高端AI產品的價格雖然一直在漲，可運行它們的Token成本降得太慢了，慢到幾乎所有公司都在用投資人的錢在替用戶買單。

他的推論很簡單，如果Token的成本賬本始終無法改善，那超級估值-超級市值-收入快速增加的閉環就走不通，如果整個行業都陷入這種死循環，都在證明最前沿的AI換不來足夠的收入，泡沫就會“撐不了多久”。

這并非危言聳聽。

馬斯克的 xAI，和 SpaceX 合并后估值沖到 2 萬億美元，一個季度卻虧掉 25 億，收入才 8 億出頭；做 Claude 的 Anthropic 每月掏 12.5 億美元，租馬斯克的卡來跑自己的模型；連一向嘴硬的 OpenAI，奧爾特曼也松了口，承認成本如今是“一個巨大的問題”。

這本是互聯網時代的老套路——拿投資人的錢補貼用戶，先把規模沖上天，再尋找商業化變現機會，找不到，泡沫就會破。而AI 這局賭得更大：所有人都押注推理的成本會一路降下去，降到某天能跑贏燒掉的速度。如果賭贏了，AI的新時代就來了；如果賭輸了，和互聯網泡沫后是同一種一地雞毛。

關鍵就在有足夠又便宜的Token產能，但眼下，中國AI似乎已經撞上了這道算力產能墻。

這個 6 月，中國最強的幾款編程大模型扎堆問世：13 日智譜開源 GLM-5.2，代碼能力一度全球第二、只輸給 Claude；Kimi 端出專攻編程的 K2.7 Code，MiniMax 甩出主打智能體的 M3。可幾乎同時，這幾家公司在干一件正相反的事——攔著你別買。

現在，智譜的套餐天天得搶、一年漲三次價；Kimi、MiniMax 的接口接連過載，開發者排著隊“等 Token”；巨頭們的情況略好，但高端線同樣算力吃緊，多次對用戶發出預警信息。

最該以無限供給的形式去支撐未來市值的東西，變成了經濟匱乏時代的“憑票供應”，這本身很諷刺。

但警報信號是真實且明確的——如果一個賣數字產品的公司開始限制購買，等于承認它賣的早已不是能無限復制的軟件，而是一種有產能上限的工業品，這是中國 AI 產能池底發出的第一聲警報。

更嚴重的是，如果運行成本要是始終降不下來，等在這聲警報后面的，就不再是限購——是楊立昆說的那場泡沫，和它炸開的那一聲。

02 股東金主為什么也靠不住了？

眼下這場算力荒，不是豆包那種 C 端日活燒出來的。真正把需求頂上天的，是今年中國大模型乃至全球大模型集體押注的 AI 編程和智能體調度框架。

聊天再貧，一次也就幾萬個 Token；一個編程智能體卻要啃下整個代碼庫，反復跑命令、改文件、自檢——MiniMax 演示 M3 時讓它獨立復現一篇論文，自主跑了將近 12 個小時。這類任務吃 Token 的胃口，是聊天的幾十上百倍。

于是， MiniMax 發布 M3 的同一天，干脆把用了多年的包月計費改成按 Token 計費，重度用戶實測成本漲了一兩倍。

美國的業者算出的比例更極致——一個開發者計算自己使用Claude、ChatGPT的200美金套餐燒掉的Token，最后得出了2048美元這個精確的十倍數字。

“幾十塊錢包月隨便跑”的好日子，目前看來已經一去不復返。而且，這不會是它一家要這么做——可無限復制的軟件的定價邏輯已經被認為不適合AI，它正被基于產能的定價邏輯取代，往后這將是行業通例。

按理說，這些公司不該缺算力。智譜背后站著騰訊、阿里、螞蟻、美團、小米；Kimi 的最大股東是阿里，占股四成，騰訊也跟投了。按理說，抱著這樣有龐大云計算資源的金主，限購怎么也不該輪到它們。

問題是，金主自己也沒余糧。

2026 年的算力荒不是某個零件斷貨，而是芯片、存儲、封裝、網絡、數據中心整條鏈一起見底，這種緊張，業內判斷至少還要緊兩年。

一位 ICT 廠商的人士說得很直白：從前兩百萬能買八臺 GPU 服務器，現在只夠買四五臺，廠商寧可毀約也不交貨。

于是，3 月，騰訊云率先給自家混元的部分產品漲價、個別飆到四倍，阿里云、百度云幾小時內跟進。連有厚實的AI云業務底座的大模型公司都缺貨——這才是當前中國 AI 產能的基本面。

當然，價格這件事，倒不是一邊倒地漲。DeepSeek 把 V4-Pro 的接口永久降到原價的四分之一，小米 MiMo 跟著砍掉九成，騰訊云干脆把自家平臺上托管的 DeepSeek 一刀劈掉九成七——緩存命中的調用價壓到每百萬 token 兩分五，比打一通電話還便宜。

這聽起來和“產能缺乏”似乎很矛盾，但實則和限購困局并不矛盾，而是同一場短缺的兩頭：降價的是 DeepSeek、小米這些效率派，靠把緩存和稀疏架構榨到極致，把廉價檔的成本真摁了下來；漲價限購的是智譜那種緊俏的編程高端檔，越能干活越供不應求。連騰訊都在兩頭下注——漲自己的混元，貼別人的 DeepSeek。價格不是齊漲齊跌，是在按檔位分化。

更有張力的是，初創模型公司和資本金主的默契，發生了微妙的變化。

互聯網巨頭屬性的金主當初投這些模型公司，尤其是那些自己也做 AI 的巨頭，本就揣著兩個心思：技術上押個外部團隊，給自研加道保險繩；商業上用資本綁一個長期客戶——你拿了我的錢，轉頭來買我的算力，我出錢又收回算力收入，看著兩全其美。

可算力一旦變稀缺，這個本該是 VIP 的被投客戶，就嘗到了綁定的另一面：已經有云巨頭公開放話，要把緊缺算力優先留給自家的高價值業務，被投的創業公司，往后排。說穿了，你的房東、你的債主、和你的對手，常常是同一個人。

于是接口照樣過載，套餐照樣限購，錢卻一分不少燒。據招股書口徑，智譜七成研發投入花在買算力上，三年半虧掉六十二億；MiniMax 同樣七成研發買算力，三年半虧約九十二億，它跟阿里云的年度采購上限還在逐年往上抬。

這說明，綁定換不來優先級已是共識。剩下的只是一道無解難題：產能就這么多，誰掏得起、扛得住，誰活下去。

被逼到這份上，一個新思路出現了：金主既然靠不住，能不能靠自己？

03 覺醒者

模型公司和投資人之間，本是一樁你情我愿的默契：你投錢進來，我拿錢買你的算力，我得算力，你得利潤，各取所需，看著很美。可金主的池子一旦不夠深，這默契就兜不住。模型公司只能從這場看似雙贏的美夢里驚醒，自己找活路。

能走的路就兩條：把效率摳到極致，和擁抱國產產能。

前者，下一節再說，先說適配國產芯片——這條路上，大方向其實一致。智譜把 GLM-5 的訓練集群交給華為昇騰，由神州數碼用昇騰加鯤泰的服務器獨家交付，又把年初的 GLM-Image 做成第一個全程在國產芯片上訓出來的頂級多模態模型。

DeepSeek 走得更遠。4 月發布的 V4，不惜拖期也要在華為昇騰首發，底層代碼從英偉達的 CUDA 整個重寫為華為的 CANN，目的就是在釋放產能可控的信號。

智譜適配昇騰，和 DeepSeek 適配昇騰，本質是一回事。可再往前一步，兩家就分了岔。

智譜仍把算力的源頭托給云廠和股東；DeepSeek 卻開始直奔上游：一邊放風短期不追盈利，一邊瘋了似的招聘數據中心建設和管理人才，這種做法直指自建吉瓦級的算力基地。

最見性格的是 6 月那輪首輪融資——創始人梁文鋒自掏約兩百億當最大出資方，把投資人擋在董事會門外。我認為，他這么決絕，要的就是希望這個激進計劃別被股東拉扯。因為這條路一旦走通了，它會是中國第一家自建龐大算力基建的純模型公司，在初創和巨頭之外趟出第三條路。

可惜，醒了是一回事，走得通是另一回事，這一切都壓在國產硬件這個底座上——它到底有多硬？

只看市場份額，確實提氣：2025 年國產 AI 芯片在國內的出貨份額已經爬到四成，華為出貨第一、占了近一半，寒武紀營收一年翻了二十多倍。

但把鏡頭推近，沒那么好看。論單顆高端芯片，英偉達旗艦在多項指標上仍是華為昇騰的四到六倍；華為得把上百顆芯片用光模塊全互聯堆成超節點，才在集群層面追平甚至反超，代價是接近四倍的功耗。

國產硬件如今交出的是“能跑”的平替，離性能更優、讓人主動掏錢的優替，還差一大截。何況整個盤子還供不應求——覺醒者認清了方向，可這條擁抱國產產能的路，本身就卡在產能上。

04 被算力荒改變的產品性格

自建基礎設施，持續往上游走，是遠水。而眼前的近渴，只能靠把效率用軟硬件協同的工程化能力提上去。某種意義上，算力一不自由，最先變的，是一家公司的產品性格。

Kimi 的答案，是把效率摳進架構。

它的推理跑在一套叫 Mooncake 的架構上——以緩存為中心，把“預填充”和“解碼”兩個階段拆開分別調度，再把算過的 KV 緩存在整個集群里池化、復用，讓同一批 GPU 多服務出幾成的請求。核心環節，它依然深度綁定阿里云，用彈性的算力組合把任務穩定性和利用率頂上去，又自研安全網關，省掉自建機房的重負擔。

為此，月之暗面創始人楊植麟常把一個詞掛在嘴邊——Token 效率，還把團隊那套讓學習效率翻倍的 MUON 優化器擺出來作證。他的確很清醒——競爭的勝負手，早從堆資源挪到了推理系統的效率本身。

智譜的答案，是把效率直接做成能賣的產品，工程上近乎暴力。它的高速推理引擎 TileRT，在編譯期就把整張計算圖靜態編排成一個常駐 GPU 的內核，把旗艦模型的吐字頂到每秒約 400 個 Token；它和清華合做的 ZCube 網絡架構，不加一塊 GPU、不改一行代碼，就把同一批硬件的推理吞吐提了一成半、把網絡設備的錢省下三分之一、首字響應的尾延遲壓低四成；它的 GLM-5 集成了一套稀疏注意力，在保住百萬級上下文的同時把推理成本摁下去。這些省出來的本事，它打包成能直接搬進客戶機房的私有化設備，賣給政企。

兩家摳的地方不同，指的是同一件事：中國頭部公司，早已不只在比模型誰更聰明，而是在比單位 Token 的生產效率。

稀缺逼出了新技術，是好事。我認為，這可能是中國公司會持續走的一條路，但這并非全局最優解，死摳效率是有一定性能代價的，而絕非毫無代價——一種被約束逼出來的優點，終究帶著約束的胎記。

05 美國也有兩條路，但美國有底

把目光挪到太平洋對岸，美國的前沿公司，也基本不自己蓋機房。所以，DeePSeek這次，抄的絕不是美國的作業。

OpenAI 干的是攢局的活。它的 Stargate 計劃，四年五千億美元、十吉瓦，機房由甲骨文、軟銀這些伙伴出錢建，建好了專供 OpenAI；微軟繼續供云，甲骨文、CoreWeave 并行，它自己還拉上博通設計專屬芯片。它要的不是有一個金主，是讓一群供應商、融資方、電力商，全都圍著它的產能需求轉。這是一種強控制型的基礎設施聯盟。

Anthropic 走的是多云、多伙伴、多份長約。它綁定亞馬遜云為主要訓練伙伴，那座專給它訓 Claude、塞了一百多萬顆芯片的超級集群，產權在亞馬遜手里、算力卻為它獨留；它一邊跟亞馬遜簽十年超千億美元、最高五吉瓦，一邊跟谷歌簽數百億美元、想買下足足一百萬顆 TPU，它甚至不惜每月掏 12.5 億去租馬斯克閑著的卡。最后的結果是，它可以橫跨多種芯片、不跟任何一家云公司簽排他協議，這樣才可以把模型權重和定價牢牢攥在手里。這是一種多伙伴的合同型算力池。

兩條路看著不同，前提只有一個： AI 產業鏈最值錢的那截——先進芯片、成熟云平臺、自研加速器、能撬動千億融資的數據中心、能采購的電力、覆蓋全球的客戶——大多落在本土或盟友體系里。所以美國公司操心的從來不是有沒有算力，而是算力天花板能抬多高：聯盟越搭越大，天花板就一路往上頂。目前，這道天花板比中國公司的高太多。

雖然，中國公司也能抱金主，也能合縱連橫。但關鍵差別在于，它們抱住的那條腿，自己也站在同一條受限的供應鏈里排隊。

06 真正的窄門：會不會燒成泡沫？

需求那頭的故事，已經講得夠了——智能體一爆發，Token 消耗每兩周翻一倍；按 IDC 的預測，到 2030 年，全球年度 Token 消耗會比 2025 年漲超過三億倍。幾乎每篇樂觀文章都在算同一筆賬：中國未來每天燒多少 Token，仿佛燒得越多就越繁榮。

可很少有人回頭問一句：這些 Token 誰來生產？用什么芯片？在哪個機房？誰付電費？當編程智能體占了一半的生產力場景，誰來保證服務不會突然限流、排隊、漲價？

Token 消耗是需求側的繁榮，產能池底是供給側的現實——只盯前者，是一種虛假的繁榮。真正的關鍵詞從來不是“算力”，而是“產能”：芯片、顯存、互聯、電力、機房、調度、價格機制，是這一整套東西，才能把智能持續地、而且越來越便宜地生產出來。

繞了一圈，又回到楊立昆那句判斷——限購也好，省卡也好，擁抱國產產能也好，說到底都是在一個賽道里賽跑：成本能不能跑在錢燒光之前降下來。

降成本太重要了，對于今年的中國大模型市場來說，無論是抬高前沿模型的價格，還是通過降價讓便宜夠用的模型去搶市場，本質上仍然考驗一件事——無論是價格臺上天，還是把價格砸到地板，只要公司還在失血，就顯示出泡沫破裂并不是樂觀者認為的囈語。

這道南墻，中國撞得最早、也最痛。別人是在算力充裕里摳成本，中國是在算力稀缺里摳成本。時間和短缺這兩件事，對中國AI行業都更不友好。但如果這題要是解不開，崩掉的就不只是一兩家公司的市值，而是支撐整輪 AI 的那個循環——用戶用著投資人的錢補貼的服務，投資人等著成本下降來兌現回報——那個下降一旦遲遲不來，循環就會整個塌下去。到那天，所謂的繁榮，不過是又一片更貴的單車墳場。

所以這篇文章真正想追問的，不是智譜和 Kimi 誰更聰明，也不是 DeepSeek 的路子是不是更高明，而是一個更現實的問題：當所有人都在排隊等 Token 的時候，中國能不能為自己的智能，建起一套自由、充沛、能持續降價的產能兜底。

建得起，今天的限購，只是黎明前的擁擠。建不起，被算力逼出來的，就不再是某一種產品性格——而是一場泡沫，以及它炸開的那一聲。

原文標題 : 算力荒，會把中國 AI 燒成一場泡沫嗎？