訂閱
糾錯
加入自媒體

梁文鋒不在乎贏,DeepSeek不能輸

2026-04-21 16:25
伯虎財經
關注

圖片

來源 | 伯虎財經(bohuFN)

作者 | 路費

上周末,外媒The Information爆出消息:DeepSeek正在尋求至少3億美元(約20億人民幣)的首輪外部融資,估值至少100億美元。

DeepSeek還沒對此消息做出任何回應,但是消息本身已經激起千層浪。

一方面,DeepSeek毫無疑問是圈內最技術理想主義的公司之一:長期拒絕外部融資、不稀釋股權、不被任何人的商業化時間表綁架。

根據晚點LatePost報道,DeepSeek沒有明確的績效考核和 DDL,研究員可自由組隊或獨自鉆研一些新想法,甚至沒有AI常見的內卷:中美核心AI開發人員的每周工時高達70-80小時,而DeepSeek的多數員工下午六七點就會離開公司。

背靠幻方量化,Deepseek活得更像一家研究機構而不是創業公司。

很多人認為,放開融資意味著Deepseek正在從一家神壇上的公司變回一個正常的AI創業公司,數據、算力、人才這些要素競爭的升維正在逼迫Deepseek改變過去的動作。

另一方面,雖然對于一家創業公司而言,100億美元的估值并不算低,但AI是看想象力的領域。

2026年初,OpenAI最新一輪融資估值高達8520億美元、Anthropic也完成了一輪估值3800億美元的融資。國內上市的智譜和MiniMax如果以4000億港元的市值計算,大概也在500億美元的量級。

因此,也有人認為,DeepSeek過于沉溺于自己的節奏,結果接連錯過多模態和coding兩大風口,這個估值水平其實是選擇導致的結果。

我們認為這些觀點一定程度上照見了DeepSeek當下的處境,但不是它的全部。

01 為什么要融資?

和其他AI創業者相比,DeepSeek的腰桿算是硬的。

幻方量化2025年平均收益率高達56.6%,管理規模超700億元人民幣,在百億級量化私募業績榜中位列第二,僅次于靈均投資。如果按照行業估算的方法,前者的收入大概在50億元人民幣左右。反過來說,3億美元不少,但是對于DeepSeek來說,有幻方量化在背后,并不是一定要邁出這一步。

同時,100億美元的估值對于DeepSeek來說確實顯著低于市場行情。以二級市場為例,同為AI六小龍的智譜、MiniMax的估值都明顯高于這個水平。

我們認為,DeepSeek啟動融資最主要的原因是,競爭的環境變了。

特別是人才爭奪。在接受36氪的采訪時,當被問道:

“很多大模型公司都執著地去海外挖人,很多人覺得這個領域前50名的頂尖人才可能都不在中國的公司,你們的人都來自哪里?”

梁文鋒的回答是,“V2模型沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。”

但現在情況變了,DeepSeek自己就成了那個被搶奪的對象。除了最近被報道的加入字節的DeepSeek-R1核心作者郭達雅,DeepSeek被挖走的員工包括但是不限于參與早期大模型訓練的王炳宣、DeepSeek-OCR核心作者魏浩然,還有更為大家熟知的、已經在小米獨當一面的V3模型關鍵貢獻者羅福莉。

這些離職者覆蓋了基座模型、推理、OCR和多模態四條核心技術主線。

讓這些人選擇離開的當然不只是收入,但收入一定是一個重要原因。越來越多的AI公司開始加大人才爭奪的力度。

舉個例子,月之暗面即將推出一項新的頂尖人才校招計劃,擬授予尚未畢業的實習生公司期權。即便把范圍放大到整個互聯網行業,這也是一個很少見的激勵政策,股權和期權激勵的范圍過去都被限定在正式員工?紤]到月之暗面迅速攀升的估值,這項計劃對于月之暗面提前鎖定AI 人才有很大幫助。

DeepSeek也類似。期權的價值需要市場化定價來估算,如果員工對手中的股權缺乏預期,那么他也很難靠期權去留住核心員工。因此引入一輪小額融資,既能保證Deepseek的自主權,還能給到核心員工一些明確的回報預期。

02 梁文鋒不在乎贏

過去一年,AI行業的風向變得很快,但是DeepSeek很安靜。

V3和 R1爆火以后,DeepSeek成為了國內增長最快的AI App。但前者并沒有大力去做推廣,也沒有把目標放在行業最主流的方向。

從去年到今年,AI行業最受矚目的趨勢有兩個:

一是多模態生成。無論是Google的NanoBanana,還是字節的Seedance 2.0都引發很大關注。生成視頻模型有著非常確定的產業化趨勢,AI漫劇已經成為許多從業者乃至平臺比如愛奇藝的押注方向。有從業者分享,AI漫劇的產能已經來到每月上千部的水平。

生成視頻模型還和更前沿的世界模型有關。比如阿里發布Happy Oyster,強調可互動、可演繹、可探索的AI數字世界;騰訊發布并開源混元3D世界模型2.0,面向文字、圖片、視頻輸入生成和模擬3D世界。

二是以coding 能力為基礎的 Agentic 模型和應用。從Anthropic 和 OpenAI 的斗爭,到OpenClaw 的爆火,再到智譜、MiniMax、Kimi踩中需求估值大漲,都和這股風向有關。

但DeepSeek顯得非常淡定。

DeepSeek不是沒做到多模態,它做過Janus-Pro,也做過DeepSeek-OCR,但更集中于自己路線的開發。

比如今年1月,DeepSeek團隊連續發布了兩篇由梁文鋒署名的論文,mHC(流形約束超連接)及Engram(條件記憶),瞄準對大模型長序列處理的提升。這也是DeepSeek一以貫之的模型架構改進。

再比如去年9月,DeepSeek-V3.2引入了DSA(稀疏注意力)機制,它和 NSA(原生稀疏注意力)一樣都是為了更經濟的、不依賴大幅算力提升的前提下,能處理更長的上下文。

這種判斷和創始人梁文鋒有關。

在36氪的采訪中,梁文鋒認為中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。因此DeepSeek重視的不僅僅是測試結果乃至模型效果本身,還有能被行業追隨、復用的技術發現。

03 我們為什么期待DeepSeek?

DeepSeekR1某種程度上是中美AI發展的一個重要節點。在此之前,一個公認的觀點是,中國AI至少落后美國2-3年,每個人都對此深信不疑。當高端算力卡被鎖住以后,大家會認為中美AI的差距會越來越大,

DeepSeek不僅打破了這種敘事,也是和國產芯片適配的重要貢獻者,試圖打破高性能GPU 供給受限的現實。

去年8月,DeepSeek更新更新V3.1 后提及,DeepSeek 采用的 UE8M0 FP8——這是一種數據壓縮格式——“是針對下一代國產芯片設計”。前文提到的用國產開源的 TileLang 替代 Triton 也是這類工作,能在基礎層更有主動權。

去年9月,DeepSeek-V3.2更新,有開發者發現DeepSeek 把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。后者是北京大學楊智團隊發起的開源項目。

這意味著DeepSeek將會在技術底座全面“去美化”。

據《The Information》及多家科技媒體證實,DeepSeek在V4版本的開發過程中,打破了此前優先與英偉達、AMD合作的行業慣例,拒絕向這兩家美國芯片巨頭提供預發布版本的訪問權限。取而代之的是華為。

如果V4在華為芯片上跑出有競爭力的性能,它將是全球第一個不依賴英偉達的前沿AI模型。

從更宏大的敘事來說,這意味著中國AI有希望發展出自己的生態,從而完全逃離來自美國的限制。這些讓許多人有足夠的理由,去確保當DeepSeekV4登場時,至少仍然是最好的模型之一。

開放融資這件事當然說明了DeepSeek不是一家能完全對抗商業引力的公司,它隨后也一定會做出更多和同行并無二致的商業化舉動,比如推出更多的Agent產品。但驚喜一定不是突如其來的,每一個驚喜背后一定是長期的技術積累和堅持。

就像梁文鋒自己說的,我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。

參考來源:

1、全天候科技:DeepSeek不會向資本低頭

2、晚點LatePost:晚點獨家丨Kimi 計劃提前 1 年授予 27 屆頂尖人才期權

3、晚點LatePost:V4 發布前的 DeepSeek:特質、組織和梁文鋒的獨特目標揭秘DeepSeek:36氪:一個更極致的中國技術理想主義故事

4、界面新聞:AI投入大幅增加,字節跳動2025年凈利潤下滑超70%

5、錦緞:DeepSeek百億美元估值融資傳聞背后的四重邏輯判斷

6、投資界:再等等梁文鋒

文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。

       原文標題 : 梁文鋒不在乎贏,DeepSeek不能輸

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號