Token套餐上線:AI時代的“流量戰爭”,輪到豆包們卷了

運營商把AI賣成流量套餐后,大模型廠商集體進入新戰場。
作者 | 張思
來源 | 硅基象限
當用戶不再糾結每月是否要升級流量套餐時,或許要開始糾結每月買多少Token服務了。
Token即將像流量、寬帶、短信一樣,被運營商包裝成標準化服務進行售賣。
日前,國內三大運營商陸續推出Token套餐產品:面向個人用戶推出按月訂閱制Token 方案,面向開發者和企業客戶提供分層算力套餐,并宣布已將數十至數百種大模型納入平臺,“按月購買、多模型調用、話費支付”。
中國電信已推出個人及企業版Token套餐,月費最低9.9元,1000萬Token使用量;上海移動、上海電信等地方運營商則推出按額度點或通用Token計費模式,上海移動1元可獲得40萬Tokens。
隨著運營商開始售賣Token服務,用戶切換大模型的成本將大幅降低,那么對于大模型企業來說,“用戶粘性”將被弱化,只有“更卷”才能保住市場。
未來,豆包、千問、DeepSeek等大模型廠商,不僅要卷“價格”,“單位能耗下Token質量”,甚至卷向“更高價值的AI應用解決方案能力”。
01什么是 Token 服務?
要理解Token服務,先理解什么是Token。
計算機無法直接識別文字,只能識別0、1代碼,所以我們輸入的每個單詞、文字、語音、標點,都會通過特定編碼機制,轉換成0、1代碼。
在大模型語境中,也是先識別數字編碼,而每個文字轉換成的數字編碼位數略有差異。
Token是大模型處理信息的最小計算單位。用戶輸入、上下文記憶、模型輸出,都以Token計算。模型調用越復雜、上下文越長、Agent執行鏈條越深,Token消耗越高。
通常情況下:在英文中,一個Token大約相當于4個字母;在中文中,由于漢字信息密度更高,一個漢字、一個標點符號或一個詞組,往往對應1到2個Token。
由于大模型的思考和輸出是逐個Token進行的,因此,行業便將大模型的調用成本、使用額度,以“每百萬Token(Per Million Tokens)”或“額度點”的形式向用戶進行售賣與結算。
目前大模型公司對于Token進行階梯收費,普通用戶用豆包、千問這類大模型普通模式,免費;而如果是企業級的重度使用,可以通過購買不同階梯的API包月、計量服務。
從去年開始,運營商開起了大模型“算力超市”。模型廠商是 “入駐商戶”,運營商收 “平臺費+算力費+渠道費”。用戶買的不是 “運營商模型”,而是:在電信平臺上,用電信算力,調用任意大模型,按Token計費。
2025年7月,中國移動發布模型服務平臺MoMA(Mobile Model Access);4月,中國電信發布星辰TokenHub運營服務平臺,5月,“聯通星羅”Token服務平臺發布,這些平臺把百度、阿里、字節、DeepSeek 等多家主流大模型全部接入,統一API、統一鑒權、統一計費。
運營商平臺內部對多種大模型適配,用戶只需要換個模型名稱(Model ID)就能平滑切換。
02運營商為何賣Token ?
Token服務的爆發并非偶然。
首先,計費模式改變。在傳統的云計算時代,用戶習慣于為“服務器租賃時間”或“固定帶寬”買單(即IaaS層的算力付費),買的是帶寬速率和時間。但是隨著大模型的發展,不同大模型提供的能力,不同任務所需消耗的成本差距非常大。比如更強的模型,單個 Token 更貴;更長上下文,Token 消耗更多;推理復雜度越高,實際成本越高。按Token計費,可以對齊“用戶消耗的智能程度”與“廠商付出的算力成本”。
其次,降低技術門檻與“試錯成本”。大模型的研發和部署動輒需要千萬乃至數億美元的投入。對于絕大多數中小企業和個人開發者而言,自建模型并不現實。Token服務將“通用人工智能(AGI)”能力切碎、打包,開發者不需要關心底層有幾萬張GPU在燒電,只需要按需調用API并支付Token費用。
最后,應用層爆發帶來的迫切需求。步入2026年,AI Agent(智能體)、AI輔助編程、多模態內容生成等應用層場景爆發。這些應用在日常運行中,需要頻繁地與底層大模型進行“吞吐”互動。一個自動化的AI寫代碼工具,可能在一夜之間就要消耗數百萬個Token。這種高頻、海量的交互,倒逼市場必須提供更加標準化、穩定且具備價格競爭力的Token套餐服務。
過去二十年,運營商商業模式經歷了三次核心計量單位變化。
第一階段是語音時代,運營商出售的是分鐘數;第二階段是移動互聯網時代,出售的是流量GB;而進入AI時代,運營商開始嘗試出售Token。
Token正在經歷與流量相似的演化過程。最初,只是技術指標;隨后成為計費單位;最終演變為標準化商品。
運營商入局,標志著Token已開始脫離技術范疇,進入消費體系。
未來幾年,用戶購買AI能力的方式可能發生根本變化:個人用戶購買“AI月包”、 企業采購“Token資源池”、家庭寬帶附帶AI額度、 政企專線集成Agent服務。Token將像電、水、流量一樣成為基礎資源。
但這并不意味著,運營商會替代大模型廠商。
03Token 怎么買合適?
Token服務究竟是從原生大模型廠直接售賣,還是從運營商平臺購買?目前兩種商業模式都有何利弊。
第一種是原生模型廠商模式,即按百萬Token計費。OpenAI、Anthropic、DeepSeek、千問等廠商普遍采用這一體系。用戶按輸入Token、輸出Token分別付費。諸如千問等可能采用月初預購買,月底結賬的形式。
第二種是運營商月費訂閱Token額度。例如上海電信推出最低9.9元對應1000萬Token,超額再追加,并計劃將Token權益融合進家庭的“美好家”數字空間中,支持話費賬單一鍵支付。
這種“一價全包”或“話費融合”的模式,讓中國用戶能夠像買流量包一樣購買大模型算力。
海外市場以大模型原生企業的API階梯計價為主,國內市場將Token服務推向了類似于手機話費的“套餐化”時代。
目前來看,兩種收費模式各有優勢,因為從Token套餐用戶群體看,主要分三個類型。
第一是獨立開發者與技術發燒友(Geeks)。他們利用各家廠商提供的API接口,搭建屬于自己的個性化AI應用,如效率工具、自動翻譯插件、個人專屬知識庫等;
第二類是中小企業、初創公司與 B 端獨立軟件開發商(ISV),這是Token服務最核心客群。無論是給公司員工購買用于編程的Token,還是開發針對特定行業的AI Agent,還是在現有的企業ERP、CRM系統中嵌入AI輔助功能,中小企業需要訂閱云廠商或運營商的“團隊版Token套餐”。
第三類是“重度依賴AI”的職場人與普通家庭,他們在居家場景需要高頻使用AI進行文案創作、代碼編寫,或者需要AI輔導孩子功課。
針對中小企業、初創公司,從技術經濟學角度,原生大模型的純Token計費模式更科學。
而運營商的套餐模式,有兩個優勢,一方面,獨立開發者不需要綁定在某一家大模型上,可以通過平臺商進行多種大模型自主選擇;另一方面,Token服務或將更快走向大眾消費。因為大多數人知道100GB流量意味著什么,卻無法感知1000萬Token代表多少。
運營商采用月費訂閱,本質上是在降低認知門檻。用戶不需要理解Token,只需要從普通9.9元/1000萬Token開始了解自己的需求。
隨著運營商開始售賣Token服務,“豆包們”即將開始向三個層次內卷。
從“拼參數”到“拼能效比”:對于大模型企業來說,將不能繼續盲目追求大模型的大參數、大耗能,而是將精力投入到模型蒸餾(Distillation)、量化(Quantization)以及推斷加速(Inference Optimization)等能用更小能耗、輸出更高質量Token的能力。
價格競爭將進一步加劇。運營商聚合數百模型后,用戶切換成本下降。如果A模型漲價,可通過平臺替換B模型。模型能力差異不足時,價格將成為核心競爭因素。
大模型企業利潤中心將轉移。單純賣API利潤有限,未來盈利重點可能轉向Agent、行業應用、企業解決方案。模型本身逐漸成為基礎設施,而應用層成為價值中心。
或許,“雙邊市場”正在形成:運營商控制入口,模型廠商控制能力。
原文標題 : Token套餐上線:AI時代的“流量戰爭”,輪到豆包們卷了
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













