訂閱
糾錯
加入自媒體

AI算力不能總為愛發電

2026-04-16 12:02
商業秀
關注

算力可以走普惠路線,可以追求性價比。但沒有廠商,能一直為愛發電。

/

文 | 羅小媚  編 | 楊肖若 張弘一

出品|商業秀

“月均調用API超15萬次每月”,盯著團隊開發的AI客服SaaS工具后臺近三個月的API調用量和賬單,李然的眉頭緊鎖。

4月13日,阿里云官網的一紙公告,更讓李然的心一沉。公告顯示,調整DataWorks標準版、專業版用戶的API(‌應用程序編程接口)免費額度并支持按量付費。DataWorks標準版,調用API的免費額度調整為10萬次/月,超出部分采用OpenAPI按量付費的方式。

這意味著,從4月14日政策生效起,每月至少5萬次的超額調用,將讓李然這位DataWorks標準版的用戶,運營成本增加超8000元,而他背后的AI客服SaaS工具上月的凈利潤剛過萬。

“算了一筆賬,這真的不是靠AI降本提效了。你看我們去年這時候,甚至還在為免費調用量用不完發愁呢!”李然笑著對我們調侃道。

2025年同期,李然和他的創業項目調用1000萬Token的成本僅500元,而如今同樣的用量,如果說再疊加騰訊云混元模型、百度文心的單價上調,成本已飆升至近萬元。

他說,自己的公司現金流還能再撐三個月,但成本一旦上漲,始終是有些壓力。

今年以來隨著AI的火爆,尤其是2026年春節以來的OpenClaw(龍蝦)熱徹底改變了Token的消耗邏輯,像李然這樣的中小開發者急需Token算力。

根據摩根大通曾預測,中國的AI推理Token消耗量預計將從2025年的約10千萬億增長至2030年的約3900千萬億,五年間增長約370倍。

當全球AI行業還在期待技術突破時,一場由算力價格調整引發的成本考驗也在降臨。最近國內外AI和云服務廠商的價格調整動作開始愈發密集,根據公開報道,阿里云已確認,從4月18日起,AI算力、存儲等產品將全線漲價,最高漲幅34%。

從阿里、騰訊到AWS、OpenAI,無一家缺席,甚至海外廠商的調整幅度比國內更甚。這意味著,所有消費者此前享受的API免費調用服務大幅縮水,超出部分必須真金白銀買單,尤其是對像李然這樣高頻用戶來說,也會增加他們的調用API成本。

這讓無數中小開發者正在重新審視這場由AI帶來的成本優化競賽。

01 一場全球范圍的算力調價

這場調整,其實是全球范圍內的算力價值重估。

先看國內廠商的調整路徑。最先調整的是百度智能云,3月18日其官宣,4月18日起AI算力相關產品價格上調5%-30%,文心一言系列API單價上調12%-25%,取消低階模型的“永久免費不限量”,改為QPS限流+超額計費。

這被業內認為是算力補貼時代的結束,畢竟過去靠免費額度吸引的中小開發者,如今需按實際用量付費。

緊隨其后的是騰訊云,3月調整混元模型API價格,4月9日騰訊云正式發布價格調整公告,宣布將于5月9日起對AI算力、容器服務TKE-原生節點及彈性MapReduce(EMR)相關產品刊例價統一上調5%。

字節火山引擎的調整相對隱蔽一些,Q1豆包LLM Token單價調整,文生視頻API價格較內測期上漲,單15秒視頻成本約15元,同時取消無限免費調用,僅保留新用戶500萬Token/30天的短期額度。

智譜AI的調整最為頻繁。幾乎智譜的每次發布模型都伴隨著價格上漲。4月8日,智譜發布旗艦開源模型GLM-5.1,同時智譜GLM系列API價格再度上調10%,直逼Anthropic。本月12日,智譜Coding Plan(海外版)漲價,月付價格幾乎翻倍,這已經是智譜今年第三次提價了。

在3月31日的業績電話會上,智譜CEO張鵬表示,2026年第一季度智譜的API調用定價提升83%,即便如此,市場依然呈現出供不應求的情況,調用量增長400%。

算力雖貴,但也在印證一個事實,那就是AI已從可選工具變成了企業的剛需生產資料,用戶對價格的敏感度卻低于對模型能力的需求。

海外廠商的調整也來勢洶洶。1月22日,亞馬遜AWS打破20年“價格下行”慣例,上調EC2機器學習容量塊價格15%;2月15日,微軟Azure調整GPT-4o、GPT-4 Turbo API價格,取消GPT-4o免費額度;3月10日,Google Cloud官宣5月1日起AI計算實例價格調整,下架Gemini低價訂閱套餐;OpenAI則調整GPT-4o/4 Turbo API價格,ChatGPT Plus從20美元/月漲至30美元/月,每日消息限30條。

從國內到海外,從算力實例到API調用,這場全球范圍內的集體調價,硬是把AI產業從補貼擴張階段拉回到了價值定價的理性軌道。免費額度成為過去,按量付費才是常態,開發者們是時候需重新算一筆賬,評估成本結構了。

02 調整背后的邏輯

全球廠商們集體調整價格,逐利是表面的,本質上還是AI產業從擴張期進入盈利驗證期的必然!干虡I秀」認為,這場全球范圍的調整背后藏著3個底層邏輯。

首先,最核心的底層邏輯是算力價值重估。

隨著AI的核心燃料(GPU、HBM)的供給緊張,成本上漲,也就倒逼所有下游廠商調整價格。而這一切的起點,或許要回到英偉達來看。

目前英偉達占據全球85%的AI芯片市場份額,凈利潤率高達56%,可以說,在很大程度上,它的定價直接決定了整個行業的成本底線。

2026年,英偉達Blackwell系列GPU交付周期排至2027年,單卡采購成本同比上漲30%以上。而HBM3E高帶寬內存現貨價較2025年底上漲超20%,全球產能缺口50%-60%,甚至出現供應緊張的局面。

更重要的是,英偉達通過硬件+軟件的閉環生態,進一步拉高了行業的成本。全球90%的AI訓練代碼基于CUDA編寫,500萬開發者都依賴這家巨頭的生態,每顆H20芯片就要搭配1.2萬美元的CUDA授權費,隱性成本占比就超過了30%。

這種從性能到成本的雙重影響,也讓阿里、騰訊、微軟、谷歌等廠商們只能被動接受成本上漲,繼而再將壓力傳導給下游用戶。

如果說,算力成本上漲是被動調整的理由,那么Token需求的指數級增長,就是廠商們主動調整的底氣。

2026年,AI應用從單輪對話進入到了智能體時代,隨之而來的是Token消耗呈現指數級的增長。以OpenClaw等Agent為例,它的單任務多輪遞歸、工具調用和反思驗證,光是Token消耗,就已經是傳統對話的50到100倍,單個活躍Agent月耗Token可以達到普通用戶的千倍以上。

數據顯示,2026年一季度國內日均Token調用量突破140萬億,較2024年初的1000億增長超過1400倍。字節豆包日均Token消耗超過120萬億,其中多模態(比如視頻/圖像)Token占比超過40%,成本是純文本的10倍以上。而百度千帆平臺企業用戶Token消耗Q1環比增長了280%。

目前算力的消耗狀態可以用一句話來形容,那就是低階免費模型需求旺盛,高階付費模型供不應求。一旦需求增長,供給緊張,價格自然就由供需決定,這也就可以解釋為什么智譜價格調整后調用量反而增長400%了。

由是觀之,高質量Token成為稀缺資源。

當然最根本的變化,還是整個AI產業的商業邏輯變了。行業開始從燒錢換規模、虧損換用戶,轉向了盈利優先和精細化運營,定價權從用戶端回歸廠商端。

過去兩年,整個AI行業處于瘋狂擴張的階段,大家的資本投入也多,廠商們靠著免費API、低價算力吸引用戶從而占領市場。哪怕是AI業務持續虧損也無所謂,反正還有其他業務的利潤支持,還有資本的資金來保障持續投入。

但是,進入2026年,風向就變了。資本投入趨于理性了,廠商們紛紛表示我們有盈利壓力了,畢竟大老板說了:AI業務必須給我盈利。

所以,這樣一來,我們就能理解為什么阿里云調整免費額度,開啟按量付費,而騰訊云、百度智能云全鏈路調整價格。字節火山引擎則是利用內部規模效應降低成本,同時通過外部價格調整實現AI業務盈利,海外的OpenAI、Anthropic,則也通過價格調整兌現模型能力的價值。

參考亞馬遜AWS歷經14年的奮斗才跨過盈虧平衡點,阿里云則在2022年走向盈利。國內云廠商的價格戰,早在 2014 年便已拉開帷幕,此后十余年間從未停歇,阿里云常年主動發起大規模降價,單次最高降幅超 50%,而騰訊云則始終快速跟進,甚至祭出比阿里云更低的報價,展開貼身肉搏式競爭。

據公開報道,騰訊云在過去很長一段時間里被視為集團的成本中心。為了在阿里云和華為云的激烈競爭中快速搶占市場份額,騰訊云長期采取了激進的低價策略,通過遠低于成本的報價和長期不漲價的承諾來獲取大客戶訂單。‌

而這種策略,雖然讓騰訊云的營收規?焖僮龃,一度坐穩國內第二,但也會導致業務長期處于規模不經濟的怪圈,也就是規模越大,虧損可能越嚴重。直到2025年,騰訊云業務才實現了全年規;。

毋庸置疑的是,隨著AI算力需求的上漲,市場規模越來越大。但是,絕大多數云廠商卻依舊是常年處于虧損狀態。目前這幾家除了市值突破4000億港元的智譜,有資本底氣來繼續抬高價格,繼續折騰,其他家幾乎還在垂死掙扎。

在這樣的大環境下,更不要說中小企業的生存了。

03 成本增加和賬單反思

“我們這種小團隊,沒有自研模型,沒有算力儲備,只能依賴公有云API!崩钊坏穆曇衾锿钢唤z無奈,“成本上漲后,要么調整價格,要么壓縮利潤!

更現實的是,廠商們會把算力資源,優先分配給付費率高、用量大、毛利高的客戶比如金融、政企、頭部互聯網企業等,中小企業不僅會增加成本,還可能面臨資源分配的問題,獲取穩定算力的難度也會有所增加。

這背后最受影響的反而是那些套殼應用,也就是沒有任何技術壁壘,只是簡單調用API做二次開發的企業和平臺!耙坏┏杀旧蠞q,它們的成本優勢減弱,那就需要重新審視商業模式了!鼻笆鐾顿Y人告訴「商業秀」。

對個人開發者來說,免費額度的調整同樣也會帶來影響,因為零成本試錯的窗口關閉了。百度調整低階模型的免費額度、字節調整豆包的免費額度,僅保留新用戶短期額度(百度100萬/90天、字節500萬/30天)。

是時候需重新規劃成本投入了。這種賬單反思,也正在倒逼開發者從無腦調用轉向精打細算,開始研究模型壓縮、量化、上下文窗口優化、RAG檢索增強,甚至說混合調用不同版本模型,這些只是為了降低Token消耗。

不過,這也需要時間和技術積累,對于很多中小團隊來說,當務之急是重新規劃公司的發展路徑。李然決定看看研究一下各家的套餐,“組合疊加使用起來,會更劃算!

可以看到的是,這場價格調整,正在加速AI產業的分化。頭部企業憑借全棧能力與規模效應,調整后仍能保持毛利,甚至通過資源優化進一步鞏固市場份額。而中小廠商,尤其是無自研模型、無算力儲備的中小AI服務商,成本增加無法傳導,利潤受到影響,需重新尋找發展路徑。

不過,也會有例外,那些深耕垂直場景、有核心技術(如模型優化、成本管控)的中小廠商,反而可能在這場調整中跑出來。它們不需要依賴高端API,只要能在垂直場景中實現降本增效,就能找到自己的出路。

相信有很多人關注這場價格調整,有人認為廠商們逐利,讓中小企業和開發者面臨成本壓力。但「商業秀」認為,這場調整也預示著AI產業正在走向成熟。畢竟,過去兩年免費AI的補貼模式,讓很多人誤以為AI是免費的,也催生了大量無價值的應用,浪費了算力資源。而2026年的這場集體調整,本質上是市場在優化和淘汰無價值的應用,倒逼技術迭代。只有這樣,才能讓真正有價值的AI應用獲得合理的商業回報。

算力可以走普惠路線,可以追求性價比。但沒有廠商,能一直為愛發電。

這場調整對廠商們來說,也是商業邏輯的回歸。接下來可以用成本+合理利潤定價來實現AI業務的可持續盈利。對中小企業和開發者來說,它們除了要控制自己的成本,更要轉向技術優化和深耕垂直場景。

AI從來都不是免費午餐。未來AI行業進入價值付費時代,只有真正能創造價值,做好成本管控的企業和開發者,才能不被時代拋棄,站穩腳跟活下去!竿辍

       原文標題 : AI算力不能總為愛發電

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號