養蝦人，開始認真算賬了

2026-04-09 16:56

世界模型工場

關注

過去兩個月，OpenClaw這只“龍蝦”紅得發紫。

連不懂代碼的普通人，都花699塊找上門師傅“裝蝦”，只為體驗一把AI替我打工的爽感。

但熱度退得比來得更快。

進入4月，當你再次搜索“OpenClaw”，前排內容不再是教程和贊美，而是“龍蝦退潮了”“太燒token了”這樣的感嘆。

近幾天國內外大廠接連兩記重錘，更是把所有養蝦人拽回現實。

第一錘來自Anthropic。

4月4日Anthropic突然切斷了通過Claude訂閱使用OpenClaw等第三方Agent。想繼續用？可以，改走API密鑰，按token實打實付費。

第二錘來自小米MiMo大模型負責人羅福莉。

4月6日，她在X上發帖直指OpenClaw這類第三方Agent是“Token的虛假狂歡”，痛批它們對算力的粗放型消耗。

兩條新聞，指向同一個事實：龍蝦正在制造一個誰也堵不住的token黑洞。

在經歷過全民熱潮后，養蝦成本到底多少，成本黑洞能否被解決？

昂貴的龍蝦

“月薪兩萬，養不起一只龍蝦”。

“養蝦一時爽，賬單火葬場”。

這些流傳最廣的段子，寫出了初代養蝦人的心聲。

一位中小企業主描述了他的養蝦經歷：團隊五個人共享一個OpenClaw實例，設置自動執行測試用例和代碼審查。

第一個月結束時，他們預期的成本是100美元，實際賬單卻接近800美元。

“最恐怖的是，你根本不知道錢是怎么花掉的”，他在社交平臺分享，“就像家里有個看不見的水龍頭在一直滴水”。

這并不是個例，因為OpenClaw的賬單具有極強的欺騙性。

當你向OpenClaw發送一條簡單的指令，比如“幫我優化這段代碼”，你以為自己在進行一次API調用，但實際上，在后臺可能觸發了多次獨立的模型請求：

第一次是解析意圖，第二次是生成任務步驟，第三次是調用工具分析代碼，第四次是生成回復，第五次是為對話生成標題和標簽，甚至再推薦幾個可能的追問建議。

用戶只看到一次回復，但賬單卻在后臺無聲蒸發。

更隱蔽的是Heartbeat（心跳機制）。

為了保持上下文連貫，OpenClaw默認每30分鐘向模型發送一次“檢查新指令”的請求。如果讓OpenClaw在后臺運行一整天，即使不發任何指令，它也會自動產生幾十次API調用。

羅福莉把這種現象稱為“Token的粗放型消耗”，上下文管理混亂、緩存命中率低下、多輪對話中充斥著大量低價值的重復計算。

在她看來，OpenClaw這類工具像是一個沒有經過工程優化的原型車，每公里的油耗是正常車輛的十倍。

這樣的消耗，輕度玩家還能勉強接受：偶爾丟幾個任務，整理文檔、查資料、寫份報告，一個月下來幾百萬token，折合人民幣幾塊到幾十塊，勉強還在嘗鮮區間。

可一旦進入中度、重度使用，或者讓龍蝦24小時待命，賬單就徹底失控。

廠商的限額游戲

用戶感覺養蝦貴，只是冰山一角。

水面之下，廠商們正在經歷更殘酷的現實，他們也在失血，而且失血速度遠超預期。

Anthropic的訂閱制，本來是給普通用戶“包月刷網頁、聊聊天”的福利，結果被OpenClaw這類高強度Agent徹底玩崩。

比如Claude Max 每月200美元的訂閱，被用戶用龍蝦跑24小時循環、工具調用，直接燒出價值5000美元的算力。

有行業分析師估算，OpenClaw用戶通過訂閱套利產生的API消耗，與實際支付價格之間存在超過5倍的價差。

當Anthropic被全球開發者用龍蝦瘋狂薅羊毛，結構性虧損直接擺上桌面。

所以Anthropic的封禁來得又快又狠，Claude Pro、Max、Free所有訂閱額度，一夜之間全部和OpenClaw說再見。用戶只能老老實實走API，按token一分一厘地付錢。

Google同樣也在大面積封禁濫用賬號，不再為龍蝦的高消耗兜底。

相比之下，國內廠商則更早看清了龍蝦的本質，紛紛推出明碼標價的限額套餐，把token消耗從“無限”變成“包月封頂”。

比如，阿里云百煉的Coding Plan，早期推出的Lite基礎套餐首月只要7.9元（常規40元/月），每月18000次API請求；Pro高級套餐首月39.9元（常規200元/月），拉到每月90000次請求。

騰訊云、百度智能云、火山引擎同樣選擇了激進的獲客策略，推出了針對新客首月7.9元到9.9元/月的Lite套餐。

在各種套餐設計中，廠商們又進一步給出了算力消耗的限額。

比如，阿里云官方文檔顯示，Coding Plan適用于Claude Code、OpenClaw等交互式編程工具。

但如果把這套Key拿去做自動化腳本、自定義后端、批量調用等，就屬于違規濫用，訂閱可能會被暫停或封禁。

換句話說，阿里云通過使用場景限制，防止用戶把低價訂閱跑成持續性的Agent消耗。

再看騰訊云，Lite套餐限制1200次請求/5小時，9000次/周，18000次/月；Pro套餐限制6000次請求/5小時，45000次/周，90000次/月。

也就是說，用戶買的套餐不僅有額度的限制，還有“5小時”的限額。

有意思的是，國內廠商這兩周還在繼續朝更適合養蝦的方向調整。

進入4月后，阿里云百煉的養蝦"性價比之王"套餐，陷入了售罄狀態。

漲價前7.9元/首月的特惠套餐已全面下架，200元/月的Pro套餐也顯示無貨。

有用戶在開發者社區抱怨："剛想認真養蝦，發現口糧沒了"。

騰訊云社區里在3月底已經出現了從Coding Plan升級到Token Plan的方案：

Lite套餐39元/月，3500萬tokens；Standard套餐99元/月，1億tokens；

Pro套餐299元/月，3.2億tokens；Max套餐599元/月，6.5億tokens。

文案里直接寫明是“針對龍蝦場景全新升級的專屬訂閱套餐”。

小米MiMo在4月3日也上線了四檔Token Plan：

Lite套餐39元/月、Standard套餐99元/月、Pro套餐329元/月、Max套餐659元/月，分別對應6000萬、2億、7億和16億Credits，而且特別強調“無5小時token使用限額”。

一個明顯的變化是，從賣Token變成賣Credits，說明小米不想只賣模型調用量，而是開始賣不同能力層級、不同上下文長度、不同使用強度下的一整套算力預算。

這些變化本身就表明，國內廠商已經在精打細算，把“養龍蝦”做成一門單獨的生意。

當限額撞上剛需

盡管國內廠商已經在用補貼換市場，推出各種算力套餐，但撞上用戶的真實需求時，反饋卻很分化。

有科技公司的產品經理記錄了他的真實成本：

第一周采用了騰訊云的Lite套餐，額度很快耗盡；接著升級Pro套餐，額度也快速耗盡。之后就是按API超額量計費，再加上云服務的費用，一周不到就花掉了3000多塊。

“比雇個實習生還貴"，他在采訪中忍不住吐槽。

一位前端開發者在開發者社區發帖，他讓OpenClaw配合MiMo-V2-Pro做代碼審查、自動生成 changelog 和小范圍修 Bug，但很快就燒光了2億Credit額度。

"我買了Standard套餐，以為能撐半個月，結果幾天就收到額度預警"，他在帖子中寫道："現在我在手動數還剩多少個任務，像手機流量快用完時的那種焦慮"。

比起套餐不夠用，用戶更焦慮的是算不清。

國內廠商開始普遍采用Token-Credit換算體系，但換算系數如同迷宮；同時，用戶使用不同模型，消耗系數也不同。

一位全棧工程師在博客中寫道："我需要一個Excel表格來實時計算當前消耗，這比寫代碼還累。用OpenClaw是為了提效，結果變成了成本會計"。

這種不確定性直接抑制了使用深度。

當用戶每次點擊發送前都要猶豫，這會不會燒掉我半個任務額度，OpenClaw就從生產力工具退化成了成本實驗。

還有一類常見的吐槽，是量有了，但任務完不成。

火山引擎開發者社區顯示，Coding Plan不是只有月度總額，而是同時卡每5小時、每周、每月三層限額，一旦觸發，系統會直接提示“已超出5小時使用配額”。

對長任務、多輪調用、上下文不斷膨脹的龍蝦類Agent來說，這種限制的殺傷力在于，套餐看起來還有余額，但任務可能已經先被中斷。

這種挫敗感在中小企業中尤為普遍。

當OpenClaw從個人玩具變成團隊工具，限額套餐就不再只是控制成本的手段，而會變成任務完成的問題。

當然，也不是所有用戶都對廠商的套餐不滿意。

如果任務沒那么重、對完成率要求沒那么苛刻，國內低價套餐會顯得便宜到離譜。

比如有用戶提到，之前阿里云7.9元/月的Lite套餐，僅OpenClaw就用了7億token，但是套餐才用了40%的量。

還有人說騰訊云的Coding Plan“使勁用，5小時都不會超50%”。

用戶不同情緒的背后，是廠商的兩難。

龍蝦這類Agent的消耗天然不可預測，當廠商用限額套餐試圖解決這個成本黑洞時，用戶感受到的不是成本控制，而是能力閹割。

一位開發者在知乎的總結獲得了高贊：

"國外大廠選擇封禁，是承認自己做不了這門生意；國內廠商選擇限額，是假裝自己能做但得給你戴手銬。Neither is a good answer"。

解決成本黑洞

真正的答案，或許藏在技術社區里。

當廠商的套餐無法滿足需求時，用戶正在被迫成為自己的“成本會計”。

目前社區用戶已經摸索出幾條實打實的降本路徑。

第一種，是模型分級+智能路由。

一位開發了ClawEasy優化工具的創業者，提出了一套智能模型路由方案，具體做法是在OpenClaw配置中植入常規任務、復雜任務、不確定任務三層路由邏輯。

比如，日常規劃、工具調用、簡單代碼全扔給便宜快速模型，只有跨模塊重構、架構決策才切成更貴的模型，關鍵是讓便宜模型先試。

更激進的玩家開始引入本地模型作為第一道防線。

通過Ollama在本地運行DeepSeek-R1，簡單任務實現"零Token成本"，只有本地模型跑不通時才調用云端API。

一位實現了本地-云端混合架構的開發者計算：原本每月$800的純云端方案，替換為70%本地+30%云端后，實際支出降至$240，且響應延遲從800ms降至60ms。代價是初期投入$2000購置硬件，但三個月就回本了。

第二種，是上下文工程，這也是羅福莉點名的命門。

在GitHub社區，Work-Fisher發起的上下文壓縮項目獲得了廣泛關注。

這位前端開發者發現，OpenClaw的默認對話格式充斥著大量語義冗余：禮貌用語、重復確認、過度解釋，這些對人類友好的設計，對模型來說是昂貴的噪音。

他開發的壓縮方案把對話轉為純結構化格式，并啟用提示詞緩存：重復的系統指令和歷史記錄直接復用，命中率拉高后，每次調用成本直降70%。

Reddit上有用戶實測，在Claude系模型上緩存命中率能穩定在91%-95%；沒有緩存的話，整體支出會高出大約5倍。

目前，阿里云、MiniMax等廠商也都已經開始支持自動緩存，把Agent從粗放燒token改造成更會省token的系統。

第三種，是監控儀表盤，徹底杜絕OpenClaw心跳事故。

解決方案是后臺設硬性額度上限，一到就停；內置監控儀表盤，實時查看消耗；再加超時機制，每個任務設最大步數上限，卡住就自動回退人工。

用戶反饋很直接：以前一覺醒來心跳燒掉上百塊，現在睡得著覺了。

這些自救方案有效，但都有一個隱性成本，就是用戶被迫成為自己的成本工程師。

一位實踐了上述所有優化技巧的開發者，在博客中坦承："我現在每天花30分鐘監控Token消耗、調整模型路由參數、清理歷史上下文。OpenClaw省下的錢，變成了我的時間成本。這是進步還是倒退？"

這個問題沒有標準答案。

但可以確定的是，當OpenClaw從開箱即用的工具，變成需要精密調優的系統時，它的用戶群體正在悄然分層：

輕度用戶被套餐限額勸退，回歸AI網頁版；

中度用戶在廠商套餐與優化技巧間掙扎，成為成本會計；

重度用戶被迫走向架構重構的深水區，成為真正的成本工程師。

人們還在養蝦，但養法已經從隨意消耗變成了精打細算。

結語

龍蝦沒有涼。

那些關于套餐、限額、緩存和心跳的討論，恰恰證明了一件事：用戶已經從嘗鮮者變成了使用者。

任何一個工具從極客玩具變成基礎設施，中間都要經過有人開始認真算賬的時刻。

龍蝦現在就在這個時刻。

原文標題 : 養蝦人，開始認真算賬了

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發表評論

登錄