訂閱
糾錯
加入自媒體

梁文鋒,不恐于誹

2026-04-27 14:22
智械島
關注

出品 | 智械島

作者 | 沈懷錚(上海)

昨天上午,DeepSeek官微推送了一條消息,沒有預熱,沒有倒計時海報,沒有發布會。

V4預覽版上線,同步開源。

技術報告里有一句話,被很多人劃了重點:能力水平仍落后于GPT-5.4和Gemini-3.1-Pro,發展軌跡大約滯后前沿閉源模型3至6個月。

放在國內AI圈,這句話的格格不入程度,相當于一個人走進了所有人都穿著同樣制服的房間,唯獨他穿著便裝,還告訴你制服上的勛章他沒來得及申請。

這種反常讓人不舒服,因為它讓人沒法用既有框架去判斷他到底強還是弱。

期待第二個R1時刻的人很難受。

2025年1月,DeepSeek用十分之一的價格做出逼近全球最強的模型,英偉達單日蒸發6000億美元,硅谷徹夜研讀技術報告,那是一種摧枯拉朽的爽文敘事。

15個月后,V4來了。爽文沒有續集,取而代之的是一份冷靜到你甚至覺得有意的克制。

如果把參數表、技術報告和那句主動披露的差距放在一起看,DeepSeek并沒有變弱。它只是把戰場從誰更強,換成了誰能被更多人用得起。

這比榜單上的第一名,更難打。

一、承認差距,但差距不是全部

V4-Pro在100萬token的極限場景里,單次推理算力只有上一代V3.2的27%,顯存占用壓到10%。上下文長度翻了近8倍,算力反而降了七成。

這個數字為什么重要?因為百萬上下文不是新概念,Gemini一年前就做到了。

但它從來沒成為行業標配,原因就一個字:貴。以前你不敢把整本小說、整份年報、整個代碼庫丟給AI,因為你知道它會燒掉一頓火鍋錢。

V4做的,是把這件事從高端功能打成了標配。不是宣布我做到了,而是讓你真正負擔得起反復用。

所以那句落后3到6個月的表述,不應該被孤立地讀。

DeepSeek真正想說的是:在最極致的性能上,我承認我還在追。但在把極致性能變成可用基礎設施這件事上,我已經換了一條賽道。

這是兩種完全不同的戰略。前者是沖刺,后者是鋪路。

二、便宜是一種能力

有人把DeepSeek的低價理解成營銷。壓價格、搶市場、把對手拖入消耗戰。

這種解讀把梁文鋒看得太簡單了。

V4的降價,不是砍利潤,是砍成本。

用架構創新把計算量和顯存需求壓到前代的四分之一以下,價格自然就下來了。不是少賺一點,是成本結構真的變了。

全球開發者聚合平臺OpenRouter有一組容易被忽略的數據:V3.2在發布五個月后,綜合排名已經掉到十幾名,但調用量依然穩居平臺前五,市場份額在5%到10%之間。

這說明什么?說明真實的開發者市場里,便宜和穩定,跑在了性能前面。

V4把這張牌打得更明確了。Pro版對標旗艦,Flash版輸出每百萬token兩塊錢,能力大約有頂級閉源模型的八五成。

對一家創業公司來說,這意味著以前不敢上的Agent調度、長文檔分析、代碼庫級審查,現在可以納入日常開發流了。不是先用著看看,是真的用得起。

而且V4留了一手。官方在價格說明的末尾用小字寫了一句:受限于高端算力,Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后價格會大幅下調。

不是畫餅,是提前寫給競爭對手的警告信。

三、人走了,錢才不得不來

技術路線選效率,定價策略選低價,這些梁文鋒都可以拍板。但他拍不了板的,是人。

過去15個月,DeepSeek四條核心技術主線,各走了一位骨干。

郭達雅去字節Seed主導Agent方向,羅福莉被雷軍千萬年薪挖到小米做MiMo負責人,王炳宣加入騰訊混元,阮翀出任元戎啟行首席科學家。

把這些名字和時間軸鋪開,你會發現一個規律:每一家挖人的公司,給出的都不只是錢。

字節有豆包的C端場景,小米有手機到汽車的完整硬件生態,騰訊有微信和元寶的超級入口,元戎啟行有自動駕駛的轟鳴賽道。

他們買的,是這些年輕人自己相信的方向。

當外部世界在用數倍于你的資源、數倍于你的決心,去押注那些你的核心骨干自己也看好,但你在內部暫時無法優先保證的方向時,理想主義本身就成了最容易松動的錨。

這就解釋了梁文鋒為什么要融資。

阿里和騰訊都在洽談入局。這筆錢不是為了買卡,是為了給留下的人一個答案:你們的期權值什么價。

不是變節,而是修正。在用過去最不習慣的方式,守住過去最想守住的東西。

四、藏在所有敘事背后的暗線

V4的技術報告里有一個首次出現的細節:將華為昇騰NPU與英偉達GPU并列為核心驗證平臺。

這不是多平臺適配的常規操作。

為了一行這樣的表述,DeepSeek花了大半年時間,把底層算子從英偉達的PTX語言遷移到跨平臺的領域專用語言上。

不是優化模型,是在重建工程底座。

代價是V4至少推遲了兩次發布。在一個更新速度即實力的行業里,這種取舍本身就是一種戰略選擇。

黃仁勛今年4月說過,如果DeepSeek在華為芯片上首發,對我們國家來說是一個可怕的后果。

他擔心的不是一家中國公司的模型能力,而是一個不依賴CUDA生態的完整技術棧正在成型。

V4發布當天,華為昇騰宣布超節點全系列產品支持DeepSeek V4。等于說,DeepSeek用一次模型升級,幫國產算力完成了一次壓力測試。

對整個中國AI產業來說,這是從在別人的水管上排隊接水到自己打井的質變。

梁文鋒沒有選擇先發一個跑在英偉達上的版本搶市場、再慢慢適配國產芯片。

他選了一條更難、更慢、但更安全的路。

五、結語

V4上線推文的末尾,DeepSeek放了16個字。沒有加粗,沒有單獨成段,像是隨手寫上去的。

不誘于譽,不恐于誹,率道而行,端然正己。

出自《荀子·非十二子》,荀子當時在罵那些追逐名聲、隨波逐流的人。他認為真正的羞恥,是不把事情做好,而不是不被看見。

放在今天這個場景里,這16個字比任何技術報告都更能說明問題。

R1爆火的時候,DeepSeek處于譽的頂點。全球最熱的AI公司,中國科技的象征,硅谷的朝圣對象。

在這個位置上,最容易犯的錯誤就是為了維持熱度而急著交一份平庸的卷子。

此后15個月,是誹的階段。用戶流失、落后論、神壇跌落的標題,每一條都在暗示它需要回應,需要反駁,需要解釋。

但他們什么都沒說。直到4月24日,把V4放出來,同步開源,同步上線,順便在技術報告里坦白自己還差3到6個月。

R1證明了DeepSeek能爆。V4要證明的是,DeepSeek能跑。這不是一個技術故事。

是一個男人帶著一支不到200人的團隊,在全員加速的時代里,主動選擇慢下來修路。然后告訴所有人,你們先跑,我把路修好,你們還會回來的。

在一個用發布會和榜單定義存在的行業里,沉默15個月然后交卷的人,要么最笨,要么最可怕。

梁文鋒顯然不是前者。

智械島版權所有,未經授權,禁止轉載

       原文標題 : 梁文鋒,不恐于誹

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號