梁文鋒不在乎贏，DeepSeek不能輸

2026-04-21 16:25

伯虎財經

關注

來源 | 伯虎財經（bohuFN）

作者 | 路費

上周末，外媒The Information爆出消息：DeepSeek正在尋求至少3億美元（約20億人民幣）的首輪外部融資，估值至少100億美元。

DeepSeek還沒對此消息做出任何回應，但是消息本身已經激起千層浪。

一方面，DeepSeek毫無疑問是圈內最技術理想主義的公司之一：長期拒絕外部融資、不稀釋股權、不被任何人的商業化時間表綁架。

根據晚點LatePost報道，DeepSeek沒有明確的績效考核和 DDL，研究員可自由組隊或獨自鉆研一些新想法，甚至沒有AI常見的內卷：中美核心AI開發人員的每周工時高達70-80小時，而DeepSeek的多數員工下午六七點就會離開公司。

背靠幻方量化，Deepseek活得更像一家研究機構而不是創業公司。

很多人認為，放開融資意味著Deepseek正在從一家神壇上的公司變回一個正常的AI創業公司，數據、算力、人才這些要素競爭的升維正在逼迫Deepseek改變過去的動作。

另一方面，雖然對于一家創業公司而言，100億美元的估值并不算低，但AI是看想象力的領域。

2026年初，OpenAI最新一輪融資估值高達8520億美元、Anthropic也完成了一輪估值3800億美元的融資。國內上市的智譜和MiniMax如果以4000億港元的市值計算，大概也在500億美元的量級。

因此，也有人認為，DeepSeek過于沉溺于自己的節奏，結果接連錯過多模態和coding兩大風口，這個估值水平其實是選擇導致的結果。

我們認為這些觀點一定程度上照見了DeepSeek當下的處境，但不是它的全部。

01 為什么要融資？

和其他AI創業者相比，DeepSeek的腰桿算是硬的。

幻方量化2025年平均收益率高達56.6%，管理規模超700億元人民幣，在百億級量化私募業績榜中位列第二，僅次于靈均投資。如果按照行業估算的方法，前者的收入大概在50億元人民幣左右。反過來說，3億美元不少，但是對于DeepSeek來說，有幻方量化在背后，并不是一定要邁出這一步。

同時，100億美元的估值對于DeepSeek來說確實顯著低于市場行情。以二級市場為例，同為AI六小龍的智譜、MiniMax的估值都明顯高于這個水平。

我們認為，DeepSeek啟動融資最主要的原因是，競爭的環境變了。

特別是人才爭奪。在接受36氪的采訪時，當被問道：

“很多大模型公司都執著地去海外挖人，很多人覺得這個領域前50名的頂尖人才可能都不在中國的公司，你們的人都來自哪里？”

梁文鋒的回答是，“V2模型沒有海外回來的人，都是本土的。前50名頂尖人才可能不在中國，但也許我們能自己打造這樣的人。”

但現在情況變了，DeepSeek自己就成了那個被搶奪的對象。除了最近被報道的加入字節的DeepSeek-R1核心作者郭達雅，DeepSeek被挖走的員工包括但是不限于參與早期大模型訓練的王炳宣、DeepSeek-OCR核心作者魏浩然，還有更為大家熟知的、已經在小米獨當一面的V3模型關鍵貢獻者羅福莉。

這些離職者覆蓋了基座模型、推理、OCR和多模態四條核心技術主線。

讓這些人選擇離開的當然不只是收入，但收入一定是一個重要原因。越來越多的AI公司開始加大人才爭奪的力度。

舉個例子，月之暗面即將推出一項新的頂尖人才校招計劃，擬授予尚未畢業的實習生公司期權。即便把范圍放大到整個互聯網行業，這也是一個很少見的激勵政策，股權和期權激勵的范圍過去都被限定在正式員工。考慮到月之暗面迅速攀升的估值，這項計劃對于月之暗面提前鎖定AI 人才有很大幫助。

DeepSeek也類似。期權的價值需要市場化定價來估算，如果員工對手中的股權缺乏預期，那么他也很難靠期權去留住核心員工。因此引入一輪小額融資，既能保證Deepseek的自主權，還能給到核心員工一些明確的回報預期。

02 梁文鋒不在乎贏

過去一年，AI行業的風向變得很快，但是DeepSeek很安靜。

V3和 R1爆火以后，DeepSeek成為了國內增長最快的AI App。但前者并沒有大力去做推廣，也沒有把目標放在行業最主流的方向。

從去年到今年，AI行業最受矚目的趨勢有兩個：

一是多模態生成。無論是Google的NanoBanana，還是字節的Seedance 2.0都引發很大關注。生成視頻模型有著非常確定的產業化趨勢，AI漫劇已經成為許多從業者乃至平臺比如愛奇藝的押注方向。有從業者分享，AI漫劇的產能已經來到每月上千部的水平。

生成視頻模型還和更前沿的世界模型有關。比如阿里發布Happy Oyster，強調可互動、可演繹、可探索的AI數字世界；騰訊發布并開源混元3D世界模型2.0，面向文字、圖片、視頻輸入生成和模擬3D世界。

二是以coding 能力為基礎的 Agentic 模型和應用。從Anthropic 和 OpenAI 的斗爭，到OpenClaw 的爆火，再到智譜、MiniMax、Kimi踩中需求估值大漲，都和這股風向有關。

但DeepSeek顯得非常淡定。

DeepSeek不是沒做到多模態，它做過Janus-Pro，也做過DeepSeek-OCR，但更集中于自己路線的開發。

比如今年1月，DeepSeek團隊連續發布了兩篇由梁文鋒署名的論文，mHC（流形約束超連接）及Engram（條件記憶），瞄準對大模型長序列處理的提升。這也是DeepSeek一以貫之的模型架構改進。

再比如去年9月，DeepSeek-V3.2引入了DSA（稀疏注意力）機制，它和 NSA（原生稀疏注意力）一樣都是為了更經濟的、不依賴大幅算力提升的前提下，能處理更長的上下文。

這種判斷和創始人梁文鋒有關。

在36氪的采訪中，梁文鋒認為中國AI和美國有一兩年差距，但真實的gap是原創和模仿之差。因此DeepSeek重視的不僅僅是測試結果乃至模型效果本身，還有能被行業追隨、復用的技術發現。

03 我們為什么期待DeepSeek？

DeepSeekR1某種程度上是中美AI發展的一個重要節點。在此之前，一個公認的觀點是，中國AI至少落后美國2-3年，每個人都對此深信不疑。當高端算力卡被鎖住以后，大家會認為中美AI的差距會越來越大，

DeepSeek不僅打破了這種敘事，也是和國產芯片適配的重要貢獻者，試圖打破高性能GPU 供給受限的現實。

去年8月，DeepSeek更新更新V3.1 后提及，DeepSeek 采用的 UE8M0 FP8——這是一種數據壓縮格式——“是針對下一代國產芯片設計”。前文提到的用國產開源的 TileLang 替代 Triton 也是這類工作，能在基礎層更有主動權。

去年9月，DeepSeek-V3.2更新，有開發者發現DeepSeek 把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。后者是北京大學楊智團隊發起的開源項目。

這意味著DeepSeek將會在技術底座全面“去美化”。

據《The Information》及多家科技媒體證實，DeepSeek在V4版本的開發過程中，打破了此前優先與英偉達、AMD合作的行業慣例，拒絕向這兩家美國芯片巨頭提供預發布版本的訪問權限。取而代之的是華為。

如果V4在華為芯片上跑出有競爭力的性能，它將是全球第一個不依賴英偉達的前沿AI模型。

從更宏大的敘事來說，這意味著中國AI有希望發展出自己的生態，從而完全逃離來自美國的限制。這些讓許多人有足夠的理由，去確保當DeepSeekV4登場時，至少仍然是最好的模型之一。

開放融資這件事當然說明了DeepSeek不是一家能完全對抗商業引力的公司，它隨后也一定會做出更多和同行并無二致的商業化舉動，比如推出更多的Agent產品。但驚喜一定不是突如其來的，每一個驚喜背后一定是長期的技術積累和堅持。

就像梁文鋒自己說的，我們不是有意成為一條鯰魚，只是不小心成了一條鯰魚。

參考來源：

1、全天候科技：DeepSeek不會向資本低頭

2、晚點LatePost：晚點獨家丨Kimi 計劃提前 1 年授予 27 屆頂尖人才期權

3、晚點LatePost：V4 發布前的 DeepSeek：特質、組織和梁文鋒的獨特目標揭秘DeepSeek：36氪：一個更極致的中國技術理想主義故事

4、界面新聞：AI投入大幅增加，字節跳動2025年凈利潤下滑超70%

5、錦緞：DeepSeek百億美元估值融資傳聞背后的四重邏輯判斷

6、投資界：再等等梁文鋒

原文標題 : 梁文鋒不在乎贏，DeepSeek不能輸

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發表評論

登錄