新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

算力告急,四大力量涌入Token服務市場

2026-05-27 12:00
數智前線
關注
圖片

Token成為"硬通貨"之后,四股力量正快速布局。

文|趙艷秋

編|石兆

“現在你有多少Token就能賣多少,整個市場供不應求。”百度智能云AI與大模型平臺總經理忻舟告訴數智前線,原來大家Token都是打折賣的,現在加價都買不到,推理訴求變得非常強。AI Infra企業是石科技聯合創始人毛運航則觀察,整個市場正從買方市場轉向賣方市場,“以前API是降價的,是虧錢的,Token現在必須保證一定消耗量,才能夠給到比較好的價格和供應。”阿里云資深副總裁劉偉光給出了一個數字,過去5個月,阿里云Token調用量增長了15倍。

在Token變得緊俏之后,四個力量——云大廠、模型公司、運營商,以及AI Infra企業,已快速布局Token服務市場。

01 Token,從打折賣到加價都買不到

雖然Token銷售緊俏,但各家云廠商并未借機敞開對外售賣,反而謹慎分配自家的GPU資源,平衡內部模型訓練和對外Token銷售。“大家意識到,訓練出更好的模型能賣出更多Token。”一位大廠人士說,內部各部門都在搶卡,幾方最后通過算賬來爭奪。而且,去年Token打折賣,直接賣硬件設備掙得多;現在局面反轉,大家都在收縮純硬件銷售,“賣硬件不如賣Token”。

Token為何“一夜之間”如此搶手?原因是真實需求爆發。

劉偉光說,Coding成為巨大分水嶺,它不僅生成新應用,還將在未來一年內解鎖大量老系統——那些“程序太老、不能搬上云”的遺留應用,借助AI Coding可獲得新生。更關鍵的是,非程序員也開始“編程”,每個人都可以自己做報表、做分析、做項目預算,生產力得到釋放。

而智能體的普及,從技術層面放大了Token消耗。毛運航形容,“還什么都沒做,Token就沒了”。Agent有了“手腳”之后,完成一項任務每一步都在消耗Token,消耗量急劇增加。

過去兩年,每家大廠都有Token銷售的考核,字節看Token總量,阿里、百度、騰訊看模型調用次數,但執行起來很難。忻舟解釋,“市場沒有那么多真需求,很多都用的不太對,或者大材小用,比如拿大模型去做數據清洗或者小模型也能做的事,我們叫低質調用。”隨著智能體技術和模型、Coding能力的躍升,一些真正有價值的應用涌現,而這些應用也是Token重度消耗者。

為此,今年每家大廠對Token都定了不小的目標,“這個目標來源于對市場真需求的判斷”。

面對這場需求爆發,中國工程院院士鄭緯民觀察到一個行業轉向:從MaaS(模型即服務)轉向TaaS(Token as a Service)服務。雖然很多企業并不特別劃分MaaS和TaaS,但關注點已開始緊緊圍繞Token。

Token是大模型處理信息的最小計量單位,1000個Token大約對應700到800個中文字符。鄭緯民解釋,Token現在是三種度量衡:它是大模型處理信息的基本單位,是AI運行時不同算力消耗的計量映射,也正在成為行業定價計費的標準單位。

圖片

之前,MaaS解決“模型的可用性”,計費方式相對粗放,比如按調用次數結算。TaaS則讓AI算力像水、電、流量一樣封裝成標準化服務,把計費顆粒度精細到Token這個最小單位。

鄭緯民解釋這個演進背后的深層矛盾:目前AI基礎設施主要是為大模型訓練而設計的,行業陷入“算力基建昂貴、推理工程薄弱、Token產出薄弱”困局。他的判斷是,AI基礎設施的競賽,已從比拼算力集群規模,轉向比拼每瓦Token生產效率

對Token市場的爭奪,也快速展開。阿里劉偉光估算,AI原生創業企業,Token支出占比接近100%;國內互聯網企業已在15%到20%;傳統企業目前仍在5%以下。而阿里云對銷售的要求,客戶的Token支出至少不低于其今年支出的20%,并專門設置了純做MaaS的銷售崗位,在AI原生創業公司和OPC(個人公司)以MaaS銷售為主。劉偉光同時透露三條抓手:一是全員出動,數千銷售鋪向全國,解決覆蓋率,讓客戶先用起來,哪怕只是最基礎的Coding改造;二是模型策略開放,只要部署在阿里云上的模型,一律按一方模型對待;三是考核指標重構,重點看三件事:付費Token客戶數的每日增長、客戶核心系統接入Token的數量與效率,以及Agent在企業內自主完成閉環的效率。

忻舟以央國企為例,預估其Token支出占總IT支出的1%左右,未來增量空間巨大。百度要求今年首要把智能體的效果做出來,當客戶有了價值預期之后,再展開滲透和降本。

在算力吃緊的背景下,國產AI基礎設施迎來機會。毛運航觀察,國產芯片開始冒頭,陸續有國產芯片可以支撐大集群供應。而是石科技的國產適配工作,也從過去的小范圍甚至“為愛發電”,在升級為真正的生產級需求。“假如現在適配了某款國產芯片,能把新模型部署上去,達到生產級要求,基本上就把這家芯片的所有貨盤活了。”

劉偉光做了一個更宏觀的預判,當Token覆蓋了“everything”,整個市場的IT支出結構將發生根本變化,軟件外包、傳統IT采購,都將面臨產業重塑。Token正在成為新的水和電。

02 四大流派的動作

Token成為"硬通貨"之后,四股力量已快速布局:云大廠、模型公司、運營商,以及AI Infra企業。

云大廠是最早提出Token服務的一方力量,它們的核心優勢在于全棧能力,有模型、有算力基礎設施,也幾乎都有芯片。百度今年開發者大會提出“芯、云、模、體”,阿里云則在年度峰會提出“芯-云-模型-推理”。阿里云劉偉光去年告訴數智前線,云大廠的“勝負手”是性價比,而全棧技術是實現極致性價比的核心路徑。今年他尤其強調芯片與模型的深度綁定,“每一款模型訓練背后都有強大算力支撐,兩者齒輪咬合、螺旋上升。所以我們一定要走自己的道路,更加強調云、芯、模一體化。”

在產品側,云廠商正從云原生、AI原生邁向“Agent原生”,整套云技術棧和服務體系,幾乎都要為智能體應用重做一遍。目前,各家企業對云產品線展開系統性改造——Skill化、MCP化、CLI化。同時,云廠商不僅推廣Token銷售,也非常重視自己把Token包裝成Agent應用,如Coding、各種Agent和工具等,無論ToC還是ToB,自己先完成一個從Token生產到應用的閉環。

第二股力量是模型公司。這類公司包括智譜、Minimax、Kimi等。不過,他們更押注模型本身,這與云大廠截然不同。

它們提供API和Token服務,也委托其他產業鏈方銷售模型調用服務。雖然一些模型企業已在港股上市,市值數千億,但根據數據中心建設方等產業鏈多方觀察,這些企業的實際營收與現金流規模還不夠大,因此普遍選擇保持輕運營狀態,目前自持算力基礎設施不多。這類企業的重心在模型本身,“讓研發出的模型賣出去”是其核心目標,Token化只是手段。例如,在天翼云最近面向開發者及中小微企業的Token套餐,便接入了智譜GLM5等模型。

第三股力量是運營商。5月,三大運營商集體推出Token套餐服務,動作最快的是中國電信。實際上早在4月的數字中國峰會上,中國電信總經理劉桂清就對外傳達了“傳統產業分工和價值分配模式,正被以Token為核心的新型經營模式重塑”,披露Token相關戰略規劃,天翼云也展開了從IaaS到SaaS的全棧Token服務體系構建。此后,中國電信于5月推出試商用Token套餐。

運營商的核心優勢在于,既擁有大量數據中心、算力與網絡資源,又具備最后一公里客戶觸達平臺,以及覆蓋全國的屬地服務能力。AI被Token化之后,與話費、流量在邏輯上類似,可以像水、電一樣計費運營。運營商聯合生態共同開發AI應用,借助Token化服務,來推動AI普及。

更值得關注的是,運營商是國內第一批大規模采購國產芯片的主力,有強烈動力推動國產芯片生態適配。目前,行業面臨算力利用率偏低、異構算力碎片化、國產化適配難度大、模型迭代又非常快的挑戰。業內看到,目前國產芯片適配新模型,達到生產級要求,可能要花幾個月時間,而這個周期中模型公司又不斷推出新模型,整體適配速度完全不夠。為此,運營商也通過其生態整合能力,動員各方力量進行多芯適配、多模融合,是國產生態關鍵推手。

圖片

第四股力量是AI Infra企業,這也是當前融資熱度最高的一類。Agent應用爆發推高Token消耗,也正在重塑這類企業的商業邏輯,此前“賺差價、算不過賬”,而目前行業從買方市場走向賣方市場,讓這一賽道的商業化路徑愈發清晰。

這類企業中,是石科技對標美國Corewave公司,希望能在中國做好獨立第三方國產GPU云生態,主攻大規模集群運營與國產芯片適配,三年前已實現盈利,正在向重資產的獨立第三方云平臺演進。硅基流動去年因與華為云合作、最快部署DeepSeek模型一舉進入行業視野,主要聚焦MaaS層,靠近用戶側;無問芯穹是最早在行業內提出“MxN”概念,定位M種模型、N種芯片間的中間層產品。

業界觀察,美國AI Infra企業Corewave因受頭部模型公司與英偉達的雙重擠壓,利潤空間有限。但毛運航告訴數智前線,國內AI Infra企業面臨國產適配這一重要機會。國內市場對國產芯片適配有迫切需求,每款芯片架構不同、適配難度各異,光靠硬件廠商去解決從時間到力量都遠遠不夠,需要芯片廠商、AI Infra企業、應用方共同跑通整個鏈條。“一個是國產,一個是調優,這是我們在這一波發展中找到的機會。”毛運航說。

03 Coding與Agent:最確定的“印鈔機”

在眾多Token服務的方向中,收益最大的是Coding與Agent方向的大語言模型。有業內人士告訴數智前線,各大廠推出的Coding Plan(Coding訂閱套餐)看似價格不高,但實際并不虧錢。原因是包月定價模式下,大多數用戶實際消耗量遠低于上限,“Coding Plan平均下來比單純賣Token要賺錢”。

一位資深人士對數智前線進一步補充,現在看來,視頻生成的商業價值遠低于大語言模型。忻舟的判斷更為直接:大語言模型一旦真正進入生產環境,能夠產生巨大收益,且“收入沒有上限”。

劉偉光對此做了進一步分析。他認為,廣告、傳媒、影視、短視頻確實有巨大市場空間,但與Coding和Agent方向的大語言模型相比,完全不在同一量級。他的拆解邏輯是,Coding不只是編程,Coding催生了Agent,Agent能獨立完成任務、幫助人類提升生產力,而這一切都與大語言模型深度綁定。“我們現在所有火力集中的最大點,就是Coding和Agent方向的大語言模型,這個模型的市場會比其他模型大非常非常多。”

劉偉光觀察,自Coding工具出現以來,應用發展速度已明顯加快。他預判,一旦“人人Coding”成為現實,每年產生的應用數量或Agent數量將是過去的數倍。這不僅是生產力的躍升,更是整個軟件行業的結構性重塑。

AI Infra企業也關注到了這一賽道形勢。是石科技毛運航說,如今幾乎沒有不用AI的程序員,海內外大廠都在用模型做Coding,整個行業已被悄然改變。Agent的興起進一步放大了這一效應。“如何讓代碼穩定輸出、打滿緩存、將代碼做成完整項目,如何在可控范圍內讓Agent高效產出——這也是當下業界討論最集中的工程化方向。”

對于Token下一步增長趨勢,業界持不同看法。大部分人士認為2026年行業算力供給非常緊張,而且將愈發緊張,延續到明后兩年;也有人士認為,這波Token吃緊,與國內外芯片供應相關,但更長遠階段還需觀察。

但大家的共識是,在有限算力資源約束下,如何能夠最大化單位Token生產效率,已經是成為釋放AI生產力的一個核心命題。“我自己觀察一點,語言模型是一維的,駕駛其實是一個二維平面的,到低空、具身、世界模型就是三維的。從開始訓練需求起來,到推理全場景去用,又是一個量級的提升,所以我們能夠看到在計算這個事情上,大家還會花很長時間、很多功夫去做。”毛運航說。

       原文標題 : 算力告急,四大力量涌入Token服務市場

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號