訂閱
糾錯
加入自媒體

Token熱,他們賺麻了

2026-04-20 16:38
鉛筆道
關注

作者 | 鉛筆道 鄒蔚 王方 黃小貴編輯 | 鉛筆道 鄒蔚

最近,港股出現一家最猛的AI公司:迅策科技。

它上市不到4個月,股價6倍漲幅;只有10億營收,市值突破千億元。

它的核心生意:賣Token(詞元)。AI瘋狂消耗Token,讓賣Token成為一門急劇膨脹的生意。

今年3月,中國日均Token消耗量突破140萬億,較2024年初暴漲1000倍;全球年度Token的消耗,將在五年增長3億倍。

與此同時,AI“燃料商”們迎來了史上最好的日子,比如大模型公司。

月之暗面,20天收入超越2025年全年;而MiniMax和智譜市值,雙雙突破3000億元,股價累計漲幅也達5倍左右;

Token大生意時代來臨,背后真正的變量不是模型,而是“agent”(智能體)。

agent讓從AI從“坐公交”進入“開私家車”的時代——以前聊天模型是被動響應,現在agent是主動執行,token消耗從線性增長變成指數級膨脹。

這也是為什么,過去幾個月,那些“賣token”的公司,突然變成資本市場焦點。按token計費的收入,動輒增長數倍甚至十倍。

但資本市場暫時的樂觀,并不代表生意的完美。

多位創業者告訴鉛筆道,Token的重要性,雖然堪比電力、帶寬、石油,但由于無法壟斷,很難在充分競爭的市場里,長期賺到高利潤。

有人開始用Token生產內容,一條視頻背后消耗上億Token,并形成“內容—流量—變現—再投入”的閉環 ;

有人用Token驅動企業服務,把Token成本控制在10%-20%,按結果收費;

也有人看到更底層的變化——當用戶開始自己購買Token、自己承擔算力成本,整個AI的商業模式都會被重寫。

這意味著,Token熱潮并不是終點,而是起點。

鉛筆道對話了多位創業者,探討用Token賺錢的門道。

- 01 -最賺錢的,不是賣Token的

翁紹斌,零犀科技聯合創始人兼總裁

零犀科技是頭部大模型應用企業,已經完成4輪融資,正沖刺IPO

今年Token經濟火了。

春節前后,智能體浪潮,把大模型應用天花板捅破了。某些平臺,Token調用量暴增十倍、幾十倍。

很多人把這理解為“突然爆發”,但從行業內部看,遲早會發生,這意味著:大模型的應用天花板進一步被打開了。

另一方面,按Token計價的公司,收入確實激增。但很多人沒看到的真相是:收入漲10倍,虧損有可能也漲10倍。這是這一輪Token熱最容易被忽視的地方。

這種“成本加成”賣Token的模式,當前可能連毛利打正都難。

賣Token是門好生意嗎?不一定。

我打個比喻:這像當年2G到3G、3G到4G,流量包從幾百兆突然變幾個G。直接賣Token,本質還是基礎設施的生意。

就像電信運營商賣流量包——10個G賣多少錢,僅此而已。甭管上面構建了什么應用,本質還是比較像。

而且今天還處于更早期階段,各家相互競爭、吸引流量,甚至價格倒掛。顯然,這不是一個好生意。

說到這里,有人可能會不同意我的觀點:賣Token就不能有(模型)溢價嗎?我覺得空間不大。 說到底,還得靠產品或應用帶來溢價。

目前,全球最先進的閉源和最先進的開源,差距只有3-6個月,這是業內比較普遍的共識。而且在中國,便宜還不等于質量就差。

我們現在的做法是:生產環境用強化學習調優后的開源模型; 閉源模型更多用來做前期研發、做驗證。

在垂直行業,基于開源模型進行后訓練, 達到的效果顯著勝過OpenAI、Anthropic、Gemini等通用模型。 所以貴Token不一定能持續保持高溢價。

歸根到底,這取決于ROI——這個場景,值不值得企業自己投入資源,去做后訓練、強化學習。

既然賣Token的,不一定最賺錢,那最賺錢的是誰?

我們可以借鑒歷史。移動互聯網時代,電信運營商賣帶寬,但真正賺大錢的是誰?美團、滴滴、抖音。

帶寬在它們的成本里占比不到10%,它們靠服務創造價值。Token經濟也是一樣。賣Token的是水電煤,用Token的才是美團、抖音。

真正的價值創造來自應用層。應用層要有更大的服務溢價,Token成本占比得低于20%,甚至10%以下,這才是健康的Token經濟。

我們現在就是這個思路,算是這一波里有“服務溢價”的。

我們今天規模跑通的商業模式,給B端大客戶提供技術服務,我們提供的銷售智能體幫保險公司賣保險、幫車企賣車。不是按Token調用量收費,而是按成交結果收費(RaaS)。

我們是按價值創造定價,不是按Token成本定價。這比訂閱制、比Token成本加成,都更健康。

當然,除了我們,還有一些場景也非常有機會。

第一,編程。Anthropic把這個場景做到極致,純數字世界完成閉環,適應面特別廣,這是一個廣譜、更通用的機會。

第二,營銷。離錢較近,很多公司在這里面嘗試突破。

第三,知識生產。文本、圖片、視頻創作等。

像字節Seedance等模型出來,大家都在商業化,但整體來看,真正把經濟模型完全跑通的公司,目前還不多。

從我們的觀察來看,大模型能力基本每半年都會有一輪明顯提升。

Chatbot(聊天機器人)到Agent;從早期沒有推理能力,到現在可以做復雜推理;從大量幻覺問題,到現在逐步被壓制。一直在前進,但整體來看,行業還處在比較早期階段。

最后總結我的觀點:

第一,Token是基礎設施,真正的價值創造在應用層。

第二,Token成本占比低于10%-20%,才是健康的Token經濟。

第三,賣Token的是賣水的人,用Token創造價值的,才是未來真正賺錢的人。

從這個角度看,Token熱才剛剛開始,未來幾年,還會一層一層打開。

- 02 -賣Token,這類公司最賺錢

楊勁松,未來式智能創始人

未來式智能提供企業級AI Agnet服務,已完成三輪融資

最近Token話題確實很熱,但如果只看表面,會容易誤判——我給大家解讀下爆發的背景。

這波Token爆發,有一個很明確的時間節點:“龍蝦”這一類agent產品出來之后,Token使用量突然激增。

一方面,“龍蝦”類產品底層的Agent設計,直接讓Tokens調用量翻了數十倍。

另一方面,早期像 Anthropic 這些廠商,允許你在一些coding工具里“幾乎不限量使用”模型API,而只限制訪問頻次。

后來,這些通道被收緊甚至關閉了。這樣,用戶就不得不為百萬Tokens的使用來付費。比如龍蝦,每天輕松就可以花掉幾十美元。

一旦免費或者低成本供給被關掉,原來被壓住的需求,就會外溢。

再疊加另外一些因素,國內市場就爆發了。

比如海外模型價格比較貴,而國內模型能力又追了上來。于是就出現一個結果:大量原本在海外模型消耗的Token,開始轉移到國內模型上。

另外一方面,“龍蝦”的火爆,讓國內的大模型廠商,看到了可以大量消耗Tokens的場景,全都下場推出了自己的龍蝦產品,以及配套的coding plan,主打量大管飽。

這才是這一輪國內Token突然“爆火”的核心背景。

現在很多媒體會引用一些平臺的數據,說Token用量暴漲。

但這里有個問題:很多數據是基于類似OpenRouter這種“中轉平臺”,而這個平臺在全球Token消耗里,占比其實很小,可能不到1%。

所以如果用它來判斷整個行業,很容易高估或者誤判趨勢。其實如果看美國,在這段期間的日Tokens調用量,增長幅度并沒有特別大。

現在大家都在說:MiniMax、智譜、月之暗面收入漲得很快,Token賣得很多。那是因為之前賣的太少了,各家的coding plan計劃,基本都是25年底或者26年初才推出來,借著龍蝦的熱度消耗一下子就上來了。

但從行業里看,情況沒那么簡單。

我個人判斷,這些模型廠商:可能“收入在漲,但利潤不一定在漲”。

原因有幾條:1、算力準備不夠,要臨時擴容,2、到處在搶機房、搶算力,3、用低價甚至補貼去搶市場。

所以現在的階段,這更像是用價格換規模,用虧損換增長。

如果你從產業鏈往下看,會發現一個很清晰的結構:現在賺錢的,不一定是大模型廠,而是出租算力的人、建數據中心的人、賣服務器的人。

因為他們在這一輪里,是“剛需供給”。而模型廠,反而是在中間承壓的一層。

現在市場上,Token生意大概有三種模式:

第一類是算力批發商。他們直接租算力、把推理Token批量賣給模型廠。這類是穩定賺錢的。

第二類是Token聚合平臺。他們低價拿Token,加價賣給開發者。本質就是“分銷商”,也有利潤空間。

第三類是模型廠。他們既要買越來越緊俏的算力,又要打價格戰,還要搶用戶,這層反而最難賺錢。

不要只看當下賣Token的熱度,Token變現的最好途徑,是被“封裝成應用”。未來,開放agent框架成熟后,將會出現大量垂直應用,token被隱藏在產品里。用戶不會再關心Token,而是關心能不能幫我把事情做完。

今天很多Token的消耗,其實是“探索性消耗”。比如用agent去跑一個復雜任務:不斷試、不斷修正。這中間會浪費大量Token。

但一旦這個任務跑通了,后面就會發生變化:任務會被固化成workflow或者skills。

這個時候:Token消耗會明顯下降,但結果反而更穩定。

在企業場景里,這一點會更明顯。

剛開始接入agent的時候,所有任務都用agent跑,Token消耗會迅速上升。但慢慢企業會發現,并不是所有任務都適合用這種方式。

于是就會分成兩類:

一類是確定性任務,比如:財務報稅、報關、分類審核。這些任務有明確輸入輸出、有固定流程。最終會變成:workflow + 固定模型。這類任務的agent消耗Token更少、成本更低、穩定性更高。

另一類是開放性任務,比如研究分析、創意內容、非標準決策。這些任務沒辦法完全固化,就會繼續用agent去跑,會消耗大量Token。

建立在Token上的最大的應用機會,我認為是內容生產,尤其是視頻。

越來越多內容行業的人,用agent去做整條鏈路:選題、調研、生成、分發和復盤。這一套下來,token消耗會非常大。

而且內容制作是可以規模化復制的,一旦跑通,就可以批量生產,會持續消耗Token,形成商業閉環。

- 03 -Token不值錢,IP更值錢

司馬華鵬,硅基智能創始人

硅基智能正沖刺港股IPO,為企業提供數字人及數字IP制作服務

賣Token突然變成一門看起來不錯的生意,背后三個關鍵因素。

第一,agent爆發。過去人和AI的交互,無論是聊天還是簡單推理,Token消耗其實不高。但agent出現以后不一樣了,它有長上下文,有復雜任務鏈,Token消耗是幾何級增長的。這是最核心的驅動力。

第二,商業化場景跑通了,F在很多公司已經找到了用Token賺錢的路徑。

第三,國產模型能力追上來了。現在國內模型大概已經達到全球先進模型的95%,這讓大規模使用token成為可能。

而真正讓Token需求爆發的,是第二點——用Token做成生意。

比如短劇,就是一個典型場景。我們自己也在做內容矩陣,像“大司馬”這樣的IP,每天都有上億流量,對應的Token消耗,從幾千萬到幾億,很快可能到百億級。這里面最重要的是,它已經形成了商業閉環:內容—流量—變現—再投 Token。

過去,我們把工具賣給別人,現在是自己用Token直接生產結果。

我們內部有一套自動化的視頻生產系統,選題、調研、內容生產、運營復盤,基本都由 agent 完成。然后再疊加企業家IP、科普內容,就形成了一套可復制的內容生產和商業化體系。

一旦可復制,Token 的消耗就會快速放量。但我一直強調:Token本身不一定是最有價值的。

很多人現在討論賣Token這件事,但我不覺得這會是一個長期穩定的生意。

從商業邏輯上看,Token是一個會不斷貶值的東西。

你可以看到,一方面是開源在推進,比如谷歌、DeepSeek 這些都在往外放能力;另一方面,模型能力越來越接近,差異在縮小。一旦供給變多,價格一定往下走,這是必然的。

所以我更傾向于把 Token 理解成一種“基礎資源”,類似帶寬、電力,它不是一個有長期護城河的產品。

但你把Token“封裝”成了結果交付,比如幫企業做內容、做賬號、做增長,競爭就少很多。我們現在做的就是這件事。

所以,未來真正值錢的,不是Token,而是IP。

我們用Token去做IP、在每個內容里大量投入Token,走高質量路線。AI是一個“增效工具”,而不是“降本工具”。就像開一家牛肉面店,不是因為效率高了就少放肉,而是可以賣更多面,同時保證每碗肉的量。

從行業來看,未來 Token供給市場會明顯分化:

一類是低成本、大規模的Token,用來做日常任務,比如寫郵件、寫報告,這個市場很大,但競爭也極其激烈。

另一類是高質量、高價值的Token,用來做精品內容、復雜創作,這一類才有溢價空間。我們選擇的是后者。

現在行業痛點是Token質量還不夠高:做普通內容是夠用的,但你要做真正頂級的東西,比如電影、文學作品,它還差得很遠。

可以用一個很簡單的類比來理解這個行業。

一種是代步車,滿足基本需求,量大、便宜、普及,這是低端Token。另一種是賽車,追求極致性能,成本很高,但它代表技術上限,這是高端 Token。

最終能贏的,一定是那些能用“賽車級能力”去創造更高價值的公司。這些公司有機會走向更高水平,甚至接近AGI。

- 04 -這輪Token熱:2個明顯誤區

李笛,明日新程創始人

明日新程主攻群體多智能體,連續獲得兩輪天使融資

最近Token很熱。

本質上看,并不是Token消耗突然變多了,而是大家第一次“看見了Token”。

以前你在云端用AI產品,比如用ChatGPT、用各種模型,Token一直在消耗,只不過你感知不到,F在像OpenClaw這種智能體形態,讓Token消耗直接暴露在你面前,所以突然覺得“消耗很大”。

第二個變化是,過去Token優化主要是廠商在做,但現在很多優化權交給了用戶。用戶自己在調agent、調流程,這個過程中天然會產生大量低效消耗。

第三點更關鍵——AI從“被動響應”變成“主動執行”。

以前的AI,是reactive的(被動反應)。你問,它才干活;你不問,它停著。但現在的智能體不是,你不盯著,它也在后臺跑任務。這個變化,會讓Token消耗從“按次計費”,變成“持續消耗”。

舉個例子,過去的AI更像公共交通:統一線路、固定調度、用戶只是乘客。

智能體出現,相當于AI世界開始出現私家車。每個人可以自己決定路線,自己決定任務,自己調用Token。

這會帶來兩個結果:整個系統更“擁擠”,Token消耗更高,但整體經濟規模會更大、更繁榮。

現實世界也一樣,私家車一定比公共交通更消耗資源,但它帶來了更高的自由度和更大的經濟活動。

賣Token是一門大生意,但它不參與價值分配,是產業鏈里的基礎層。

就像汽油,它本身沒有附加價值,關鍵在于你把它用在哪里。加油站給豪華專車加油,還是給一輛破車加油,油價是一樣的,但最終能賺錢的是車的擁有者,看他用來做什么。

這也是為什么,這一輪AI其實很早就開始分化了——有人做基礎設施,有人做應用,有人做系統集成,各自占據不同位置。

如果未來Token消耗非常大,是不是可以像石油公司一樣靠規模賺錢?

可以,但前提不一樣。石油、電力、水這些基礎設施,都有一定壟斷或準壟斷屬性。但現在的Token供應,是完全競爭的。

現在市場上MiniMax、智譜、月之暗面,都在拼價格、拼能力、拼API。這種完全市場競爭環境下,很難形成穩定利潤率,也很難建立護城河。

這輪Token熱,我看到兩個明顯的誤區。

第一,很多人以為:好的任務用好Token,簡單任務用差Token。

其實不是。同一個任務,在不同階段,對Token的要求完全不同。

初期需要強模型(貴token)去探索、試錯,后期流程穩定后,用普通模型就可以跑。

Token的質量,不是由任務決定,而是由“成熟度”決定。這也是為什么端側、小模型會有機會。

第二,用Token消耗量來評價公司,甚至評價員工。

這個邏輯是有問題的。Token消耗多,有兩種可能:任務復雜、價值高或者純粹在浪費。

同樣一個視頻任務,不同團隊可能消耗差10倍Token,但結果一樣,那多出來的9倍,本質是低效。

這有點像評估經濟如果只看GDP單一指標,不看其它,最后一定不準確。而且只盯著token,容易看偏。

我現在看到的機會,更多是在Token之上的結構性變化。

第一,今天的agent,本質上還不成熟。你可以把它理解成一輛車:能開,但不好開。它不聽話,經常跑偏,甚至會“翻車”(比如誤刪數據)。

意味著現在最大的問題,不是Token不夠,而是:產品封裝能力不夠。

如果你要把agent賣給普通用戶,你必須做到幾件事:降低使用門檻(不能太極客)、控制風險(不能隨便出事故)、讓Token消耗可預期、出問題有明確的“說明書”。

誰能把這件事做好,誰就能吃到第一波紅利。

第二,現在很多人低估了一件事:agent之間的協同,是最大的難點。

單個agent做短任務,其實問題不大。但一旦多個agent協作,執行長任務(比如24小時),結果往往很糟糕。

原因很簡單:協同機制還沒做好。而且這件事不能交給用戶解決。

所以未來真正有價值的公司,是幫用戶把“多agent協同”做好的人。我們現在就在做這件事。

第三,我看好一個趨勢:算力從云端往端側遷移,用戶自己的設備加上自己買Token。

用戶一旦自己承擔計算成本,將會顛覆現有的AI商業模式。

今天AI產品不賺錢,本質原因只有一個:它們在幫用戶墊付算力成本。也就是批發英偉達算力,再打包賣給用戶,這件事利潤很薄。

但一旦變成用戶自己承擔token,軟件只收“服務費”,那AI整個商業模型就成立了。

端側設備我看好兩類:

1、手機和可穿戴設備這樣的隨身設備,它們有算力(1B~7B模型已經夠用),授權方便(agent需要頻繁調用權限);

2、家庭/組織節點,小型本地算力中心。

如果只看今年下半年,先賺錢的也會是硬件。

原因很簡單:AI必須依賴基礎設施,基礎設施一定是先有硬件。就像5G,先建基站,再有應用。

現在AI也是一樣。如果端側硬件不普及,agent沒地方跑,token經濟也跑不起來

所以Token經濟的順序是:先硬件,再軟件,再服務。

本文僅代表口述者獨立觀點,不構成任何投資建議。

       原文標題 : Token熱,他們賺麻了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號