養蝦人,開始認真算賬了
過去兩個月,OpenClaw這只“龍蝦”紅得發紫。
連不懂代碼的普通人,都花699塊找上門師傅“裝蝦”,只為體驗一把AI替我打工的爽感。
但熱度退得比來得更快。
進入4月,當你再次搜索“OpenClaw”,前排內容不再是教程和贊美,而是“龍蝦退潮了”“太燒token了”這樣的感嘆。
近幾天國內外大廠接連兩記重錘,更是把所有養蝦人拽回現實。
第一錘來自Anthropic。
4月4日Anthropic突然切斷了通過Claude訂閱使用OpenClaw等第三方Agent。想繼續用?可以,改走API密鑰,按token實打實付費。
第二錘來自小米MiMo大模型負責人羅福莉。
4月6日,她在X上發帖直指OpenClaw這類第三方Agent是“Token的虛假狂歡”,痛批它們對算力的粗放型消耗。
兩條新聞,指向同一個事實:龍蝦正在制造一個誰也堵不住的token黑洞。
在經歷過全民熱潮后,養蝦成本到底多少,成本黑洞能否被解決?
01
昂貴的龍蝦
“月薪兩萬,養不起一只龍蝦”。
“養蝦一時爽,賬單火葬場”。
這些流傳最廣的段子,寫出了初代養蝦人的心聲。
一位中小企業主描述了他的養蝦經歷:團隊五個人共享一個OpenClaw實例,設置自動執行測試用例和代碼審查。
第一個月結束時,他們預期的成本是100美元,實際賬單卻接近800美元。
“最恐怖的是,你根本不知道錢是怎么花掉的”,他在社交平臺分享,“就像家里有個看不見的水龍頭在一直滴水”。
這并不是個例,因為OpenClaw的賬單具有極強的欺騙性。
當你向OpenClaw發送一條簡單的指令,比如“幫我優化這段代碼”,你以為自己在進行一次API調用,但實際上,在后臺可能觸發了多次獨立的模型請求:
第一次是解析意圖,第二次是生成任務步驟,第三次是調用工具分析代碼,第四次是生成回復,第五次是為對話生成標題和標簽,甚至再推薦幾個可能的追問建議。
用戶只看到一次回復,但賬單卻在后臺無聲蒸發。
更隱蔽的是Heartbeat(心跳機制)。
為了保持上下文連貫,OpenClaw默認每30分鐘向模型發送一次“檢查新指令”的請求。如果讓OpenClaw在后臺運行一整天,即使不發任何指令,它也會自動產生幾十次API調用。
羅福莉把這種現象稱為“Token的粗放型消耗”,上下文管理混亂、緩存命中率低下、多輪對話中充斥著大量低價值的重復計算。
在她看來,OpenClaw這類工具像是一個沒有經過工程優化的原型車,每公里的油耗是正常車輛的十倍。
這樣的消耗,輕度玩家還能勉強接受:偶爾丟幾個任務,整理文檔、查資料、寫份報告,一個月下來幾百萬token,折合人民幣幾塊到幾十塊,勉強還在嘗鮮區間。
可一旦進入中度、重度使用,或者讓龍蝦24小時待命,賬單就徹底失控。
02
廠商的限額游戲
用戶感覺養蝦貴,只是冰山一角。
水面之下,廠商們正在經歷更殘酷的現實,他們也在失血,而且失血速度遠超預期。
Anthropic的訂閱制,本來是給普通用戶“包月刷網頁、聊聊天”的福利,結果被OpenClaw這類高強度Agent徹底玩崩。
比如Claude Max 每月200美元的訂閱,被用戶用龍蝦跑24小時循環、工具調用,直接燒出價值5000美元的算力。
有行業分析師估算,OpenClaw用戶通過訂閱套利產生的API消耗,與實際支付價格之間存在超過5倍的價差。
當Anthropic被全球開發者用龍蝦瘋狂薅羊毛,結構性虧損直接擺上桌面。
所以Anthropic的封禁來得又快又狠,Claude Pro、Max、Free所有訂閱額度,一夜之間全部和OpenClaw說再見。用戶只能老老實實走API,按token一分一厘地付錢。
Google同樣也在大面積封禁濫用賬號,不再為龍蝦的高消耗兜底。
相比之下,國內廠商則更早看清了龍蝦的本質,紛紛推出明碼標價的限額套餐,把token消耗從“無限”變成“包月封頂”。
比如,阿里云百煉的Coding Plan,早期推出的Lite基礎套餐首月只要7.9元(常規40元/月),每月18000次API請求;Pro高級套餐首月39.9元(常規200元/月),拉到每月90000次請求。
騰訊云、百度智能云、火山引擎同樣選擇了激進的獲客策略,推出了針對新客首月7.9元到9.9元/月的Lite套餐。
在各種套餐設計中,廠商們又進一步給出了算力消耗的限額。
比如,阿里云官方文檔顯示,Coding Plan適用于Claude Code、OpenClaw等交互式編程工具。
但如果把這套Key拿去做自動化腳本、自定義后端、批量調用等,就屬于違規濫用,訂閱可能會被暫停或封禁。
換句話說,阿里云通過使用場景限制,防止用戶把低價訂閱跑成持續性的Agent消耗。
再看騰訊云,Lite套餐限制1200次請求/5小時,9000次/周,18000次/月;Pro套餐限制6000次請求/5小時,45000次/周,90000次/月。
也就是說,用戶買的套餐不僅有額度的限制,還有“5小時”的限額。
有意思的是,國內廠商這兩周還在繼續朝更適合養蝦的方向調整。
進入4月后,阿里云百煉的養蝦"性價比之王"套餐,陷入了售罄狀態。
漲價前7.9元/首月的特惠套餐已全面下架,200元/月的Pro套餐也顯示無貨。
有用戶在開發者社區抱怨:"剛想認真養蝦,發現口糧沒了"。

騰訊云社區里在3月底已經出現了從Coding Plan升級到Token Plan的方案:
Lite套餐39元/月,3500萬tokens;Standard套餐99元/月,1億tokens;
Pro套餐299元/月,3.2億tokens;Max套餐599元/月,6.5億tokens。
文案里直接寫明是“針對龍蝦場景全新升級的專屬訂閱套餐”。
小米MiMo在4月3日也上線了四檔Token Plan:
Lite套餐39元/月、Standard套餐99元/月、Pro套餐329元/月、Max套餐659元/月,分別對應6000萬、2億、7億和16億Credits,而且特別強調“無5小時token使用限額”。
一個明顯的變化是,從賣Token變成賣Credits,說明小米不想只賣模型調用量,而是開始賣不同能力層級、不同上下文長度、不同使用強度下的一整套算力預算。
這些變化本身就表明,國內廠商已經在精打細算,把“養龍蝦”做成一門單獨的生意。
03
當限額撞上剛需
盡管國內廠商已經在用補貼換市場,推出各種算力套餐,但撞上用戶的真實需求時,反饋卻很分化。
有科技公司的產品經理記錄了他的真實成本:
第一周采用了騰訊云的Lite套餐,額度很快耗盡;接著升級Pro套餐,額度也快速耗盡。之后就是按API超額量計費,再加上云服務的費用,一周不到就花掉了3000多塊。
“比雇個實習生還貴",他在采訪中忍不住吐槽。
一位前端開發者在開發者社區發帖,他讓OpenClaw配合MiMo-V2-Pro做代碼審查、自動生成 changelog 和小范圍修 Bug,但很快就燒光了2億Credit額度。
"我買了Standard套餐,以為能撐半個月,結果幾天就收到額度預警",他在帖子中寫道:"現在我在手動數還剩多少個任務,像手機流量快用完時的那種焦慮"。
比起套餐不夠用,用戶更焦慮的是算不清。
國內廠商開始普遍采用Token-Credit換算體系,但換算系數如同迷宮;同時,用戶使用不同模型,消耗系數也不同。
一位全棧工程師在博客中寫道:"我需要一個Excel表格來實時計算當前消耗,這比寫代碼還累。用OpenClaw是為了提效,結果變成了成本會計"。
這種不確定性直接抑制了使用深度。
當用戶每次點擊發送前都要猶豫,這會不會燒掉我半個任務額度,OpenClaw就從生產力工具退化成了成本實驗。
還有一類常見的吐槽,是量有了,但任務完不成。
火山引擎開發者社區顯示,Coding Plan不是只有月度總額,而是同時卡每5小時、每周、每月三層限額,一旦觸發,系統會直接提示“已超出5小時使用配額”。
對長任務、多輪調用、上下文不斷膨脹的龍蝦類Agent來說,這種限制的殺傷力在于,套餐看起來還有余額,但任務可能已經先被中斷。
這種挫敗感在中小企業中尤為普遍。
當OpenClaw從個人玩具變成團隊工具,限額套餐就不再只是控制成本的手段,而會變成任務完成的問題。
當然,也不是所有用戶都對廠商的套餐不滿意。
如果任務沒那么重、對完成率要求沒那么苛刻,國內低價套餐會顯得便宜到離譜。
比如有用戶提到,之前阿里云7.9元/月的Lite套餐,僅OpenClaw就用了7億token,但是套餐才用了40%的量。
還有人說騰訊云的Coding Plan“使勁用,5小時都不會超50%”。
用戶不同情緒的背后,是廠商的兩難。
龍蝦這類Agent的消耗天然不可預測,當廠商用限額套餐試圖解決這個成本黑洞時,用戶感受到的不是成本控制,而是能力閹割。
一位開發者在知乎的總結獲得了高贊:
"國外大廠選擇封禁,是承認自己做不了這門生意;國內廠商選擇限額,是假裝自己能做但得給你戴手銬。Neither is a good answer"。
04
解決成本黑洞
真正的答案,或許藏在技術社區里。
當廠商的套餐無法滿足需求時,用戶正在被迫成為自己的“成本會計”。
目前社區用戶已經摸索出幾條實打實的降本路徑。
第一種,是模型分級+智能路由。
一位開發了ClawEasy優化工具的創業者,提出了一套智能模型路由方案,具體做法是在OpenClaw配置中植入常規任務、復雜任務、不確定任務三層路由邏輯。
比如,日常規劃、工具調用、簡單代碼全扔給便宜快速模型,只有跨模塊重構、架構決策才切成更貴的模型,關鍵是讓便宜模型先試。
更激進的玩家開始引入本地模型作為第一道防線。
通過Ollama在本地運行DeepSeek-R1,簡單任務實現"零Token成本",只有本地模型跑不通時才調用云端API。
一位實現了本地-云端混合架構的開發者計算:原本每月$800的純云端方案,替換為70%本地+30%云端后,實際支出降至$240,且響應延遲從800ms降至60ms。代價是初期投入$2000購置硬件,但三個月就回本了。
第二種,是上下文工程,這也是羅福莉點名的命門。
在GitHub社區,Work-Fisher發起的上下文壓縮項目獲得了廣泛關注。
這位前端開發者發現,OpenClaw的默認對話格式充斥著大量語義冗余:禮貌用語、重復確認、過度解釋,這些對人類友好的設計,對模型來說是昂貴的噪音。
他開發的壓縮方案把對話轉為純結構化格式,并啟用提示詞緩存:重復的系統指令和歷史記錄直接復用,命中率拉高后,每次調用成本直降70%。
Reddit上有用戶實測,在Claude系模型上緩存命中率能穩定在91%-95%;沒有緩存的話,整體支出會高出大約5倍。
目前,阿里云、MiniMax等廠商也都已經開始支持自動緩存,把Agent從粗放燒token改造成更會省token的系統。
第三種,是監控儀表盤,徹底杜絕OpenClaw心跳事故。
解決方案是后臺設硬性額度上限,一到就停;內置監控儀表盤,實時查看消耗;再加超時機制,每個任務設最大步數上限,卡住就自動回退人工。
用戶反饋很直接:以前一覺醒來心跳燒掉上百塊,現在睡得著覺了。
這些自救方案有效,但都有一個隱性成本,就是用戶被迫成為自己的成本工程師。
一位實踐了上述所有優化技巧的開發者,在博客中坦承:"我現在每天花30分鐘監控Token消耗、調整模型路由參數、清理歷史上下文。OpenClaw省下的錢,變成了我的時間成本。這是進步還是倒退?"
這個問題沒有標準答案。
但可以確定的是,當OpenClaw從開箱即用的工具,變成需要精密調優的系統時,它的用戶群體正在悄然分層:
輕度用戶被套餐限額勸退,回歸AI網頁版;
中度用戶在廠商套餐與優化技巧間掙扎,成為成本會計;
重度用戶被迫走向架構重構的深水區,成為真正的成本工程師。
人們還在養蝦,但養法已經從隨意消耗變成了精打細算。
05
結語
龍蝦沒有涼。
那些關于套餐、限額、緩存和心跳的討論,恰恰證明了一件事:用戶已經從嘗鮮者變成了使用者。
任何一個工具從極客玩具變成基礎設施,中間都要經過有人開始認真算賬的時刻。
龍蝦現在就在這個時刻。
原文標題 : 養蝦人,開始認真算賬了
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 2026,人形機器人只贏了面子
- 8 英特爾:告別“至暗”時刻,老霸主打響“反擊戰”
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 10 DeepSeek降價90%:價格屠夫不是身份,是戰略


分享













