新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

當(dāng)前位置： OFweek 人工智能網(wǎng) > 自然語言處理 > 正文

DeepSeek需要重走來時(shí)路

2026-04-20 11:26

別讓梁文峰太累了

DeepSeek融資了，能讓大家敞開了燒Token嗎？

4月18日，據(jù)上海證券報(bào)消息，DeepSeek正式啟動(dòng)了成立以來的首次外部融資，目標(biāo)估值不低于100億美元，計(jì)劃籌集至少3億美元資金。上海證券報(bào)記者求證稱，有接近人士表示“很有可能”，還有不少投資人稱：“圈里信息已經(jīng)‘炸了’。”

截至目前，深度求索公司方面尚未就此次融資消息作出官方回應(yīng)。路透社表示無法獨(dú)立核實(shí)此消息，但在The Information發(fā)布報(bào)道后，Reuters、Yahoo Finance、Investing等主流財(cái)經(jīng)媒體相繼跟進(jìn)轉(zhuǎn)載。

在資本圈的狂歡之外，回歸到大模型落地的現(xiàn)實(shí)里，其實(shí)DeepSeek要面臨的問題不少，大家對(duì)其的期許也有不同。

相比R1模型發(fā)布時(shí)被捧上天，新一代旗艦?zāi)Ｐ桶l(fā)布前的DS顯然承擔(dān)著外界更大的期許和壓力；而比起跑分、SOTA，在Agent時(shí)代里，大家顯然更關(guān)注的是，DeepSeek當(dāng)初在訓(xùn)練端打出的“成本通縮”，能否重現(xiàn)于如今依然高昂的推理端？

01

市場(chǎng)不需要能力更強(qiáng)的R1

DeepSeek的新模型，已經(jīng)“跳票”很久了。

1月中旬，The Information率先爆料稱，DeepSeek計(jì)劃在2026年2月正式發(fā)布下一代模型，并聲稱其編程實(shí)力已趕超Claude、GPT系列等頂尖閉源模型。然而整個(gè)2月，官方始終保持靜默。

到了2月底，隨著官方GitHub代碼庫(kù)中出現(xiàn)“MODEL1”等標(biāo)識(shí)，加上金融時(shí)報(bào)等媒體和券商研報(bào)的發(fā)聲，市場(chǎng)又傳出了新模型將在3月6日當(dāng)周發(fā)布的消息，結(jié)果依然是“只聞樓梯響”。

3月中旬，市場(chǎng)傳言又有相關(guān)流言傳出，甚至一度引發(fā)了A股算力板塊的上漲，針對(duì)該傳聞，DeepSeek官方企業(yè)咨詢賬號(hào)在用戶群中回應(yīng)：“辟謠：R2發(fā)布為假消息”。

到了4月中旬，大家苦等不來新模型，但DS的前核心研究員卻選擇了加入其它大廠。

據(jù)晚點(diǎn)報(bào)道， DeepSeek研究員郭達(dá)雅已經(jīng)加入字節(jié)跳動(dòng)負(fù)責(zé)大模型研發(fā)的組織Seed，成為agent負(fù)責(zé)人之一。而此前其離職是因?yàn)楫?dāng)時(shí)DeepSeek內(nèi)部Agent的優(yōu)先級(jí)不高，但2026年Agent的火熱，也反襯出了DeepSeek在當(dāng)下這個(gè)節(jié)點(diǎn)上的某種尷尬：

一邊是自己曾經(jīng)“輕視”的賽道如今成了全行業(yè)的主戰(zhàn)場(chǎng)，甚至要被對(duì)手用自己的人才攻城略地；另一邊，卻是自己死磕并被外界寄予厚望的底層新模型，遲遲交不出答卷。

大模型圈在過去這一年里經(jīng)歷了翻天覆地的變化，也許是時(shí)候放下對(duì)DeepSeek那層“無所不能”的技術(shù)濾鏡了。

畢竟在DeepSeek沒有發(fā)布旗艦?zāi)Ｐ偷倪@一年多空窗期里，整個(gè)大模型行業(yè)比拼的早已不是通用的基座能力。

首先，是原生多模態(tài)對(duì)純文本大模型的降維打擊。

當(dāng)Gemini帶著Nano Banana 2等模型在圖像生成與編輯上大殺四方，當(dāng)Seedance 2.0在視頻生成領(lǐng)域狂飆時(shí)，單一文本模型的護(hù)城河正在被迅速瓦解。無論是行業(yè)競(jìng)爭(zhēng)還是用戶需求，早已跨過了純文本跑分的階段，邁向了圖、文、視、音全面融合的深水區(qū)，成為了頭部大模型的標(biāo)配。

另一邊，Coding市場(chǎng)也迎來了徹底爆發(fā)。

作為最能直接轉(zhuǎn)化為生產(chǎn)力的高價(jià)值垂直場(chǎng)景，AI Coding的商業(yè)化空間在過去一年迎來了真正的狂飆。以Claude為代表的模型在這個(gè)細(xì)分賽道上展現(xiàn)出了驚人的統(tǒng)治力，甚至借力將ARR超過了OpenAI；而Cursor最新一輪融資后的估值也超過了500億美元。

同時(shí)，2026年的Agent繁榮也帶來了Token消耗的狂歡。

從OpenClaw到Hermas，都在將大模型的調(diào)用頻次推向指數(shù)級(jí)增長(zhǎng)。智譜、MiniMax、Kimi等廠商都憑借著海量的API調(diào)用狂賣Token，在推理端悶聲發(fā)大財(cái)，甚至還推動(dòng)了阿里、智譜和MiniMax轉(zhuǎn)向閉源。

DeepSeek如果想要復(fù)刻R1發(fā)布時(shí)的“全網(wǎng)沸騰”，它面臨的早已不是單點(diǎn)突破的考卷，而是必須要在多模態(tài)、代碼生成、Agent生態(tài)上全面多線出擊。

但如今的每一條細(xì)分賽道上，都有了“最高的山峰和最長(zhǎng)的河流”，多模態(tài)有谷歌和字節(jié)的重兵把守，代碼戰(zhàn)場(chǎng)是Claude絕對(duì)的天下，而在Agent與Token消耗的生態(tài)里，更是擠滿了紅了眼的其他多模型巨頭。

如果期望DeepSeek能掏出一個(gè)全知全能、在各個(gè)維度全面碾壓所有頂尖大廠的“六邊形戰(zhàn)士”，既不符合技術(shù)演進(jìn)的常識(shí)，也違背了當(dāng)下AI產(chǎn)業(yè)的客觀規(guī)律。

比起繼續(xù)沉溺于“拳打OpenAI、腳踢Claude”的技術(shù)造神敘事，對(duì)于眼下正在艱難算賬的整個(gè)AI應(yīng)用層而言，大家真正迫切需要的，其實(shí)是一個(gè)遠(yuǎn)比“跑分SOTA”更性感、也更具想象力的東西。

02

“價(jià)格屠夫”仍是DeepSeek的歸宿

當(dāng)前所有AI使用者最需要的，也是DeepSeek最可能為市場(chǎng)帶來的，是一個(gè)叫“Token通縮”的故事。

一年前R1橫空出世時(shí)，它給整個(gè)全球AI圈帶來的最大“暴擊”，其實(shí)不單單是某幾項(xiàng)評(píng)測(cè)指標(biāo)超越了GPT-4，而是R1真的太便宜了。

在全行業(yè)都篤信“大力出奇跡”，覺得只有像Altman、馬斯克那樣堆滿幾萬張老黃的頂級(jí)GPU才能訓(xùn)練出旗艦?zāi)Ｐ�，但DeepSeek僅用了約558萬美元的訓(xùn)練算例成本，就撞開了頂尖基座模型的大門，相比之下，GPT-4訓(xùn)練成本高達(dá)數(shù)億美元。

如此低廉的訓(xùn)練成本在當(dāng)時(shí)引起了AI算力市場(chǎng)的“恐慌”。

去年1月27日，DeepSeek發(fā)布其新AI模型后，美股市場(chǎng)出現(xiàn)了劇烈波動(dòng)。其中，芯片巨頭英偉達(dá)股價(jià)暴跌16.97%，市值在單個(gè)交易日內(nèi)蒸發(fā)了約5926.58億美元（約合人民幣4.3萬億元），創(chuàng)下美股史上最大單日市值損失紀(jì)錄。

除了英偉達(dá)外，其他美國(guó)科技巨頭也未能幸免。博通股價(jià)下跌17.4%，超威半導(dǎo)體公司（AMD）股價(jià)下跌6%，微軟股價(jià)下跌2.14%，谷歌母公司Alphabet股價(jià)下跌超過4%。

彼時(shí)，DeepSeek用一套極致優(yōu)化的算法和工程架構(gòu)向全行業(yè)證明：智能的獲取成本是可以被打骨折的，并在一年前創(chuàng)下了“訓(xùn)練端通縮奇跡”。

市場(chǎng)普遍擔(dān)憂AI硬件基礎(chǔ)設(shè)施的泡沫是不是馬上就要破了？但一年多后的今天，大家發(fā)現(xiàn)根本不用擔(dān)心大廠還需要買多少卡，而是自己的錢包還能不能撐得起逐級(jí)而上的Token消耗。

據(jù)中信證券，Agent帶來的巨大Token消耗需求驅(qū)動(dòng)了“老舊款”AI芯片H100租賃價(jià)格從2025年10月的約1.70美元/小時(shí)/GPU飆升至2026年3月的2.35美元/小時(shí)/GPU，漲幅近40%。

在云端，3月到4月間，國(guó)內(nèi)頭部云廠商接連調(diào)價(jià)，打破了行業(yè)長(zhǎng)期低價(jià)競(jìng)爭(zhēng)慣性。阿里云4月18日起AI算力產(chǎn)品最高漲幅34%，高性能存儲(chǔ)漲幅30%；百度智能云AI算力產(chǎn)品上調(diào)5%-30%；騰訊云5月9日起AI算力等產(chǎn)品上調(diào)5%。全球范圍內(nèi)，亞馬遜AWS已于1月對(duì)機(jī)器學(xué)習(xí)實(shí)例上調(diào)價(jià)格約15%，谷歌云也進(jìn)行小幅調(diào)整。

為了降低Token消耗，巨頭企業(yè)也出現(xiàn)了組織架構(gòu)上的變陣。

3月，阿里宣布成立Alibaba Token Hub（ATH）事業(yè)群，CEO吳泳銘親自掛帥，核心目標(biāo)就是圍繞“創(chuàng)造Token、輸送Token、應(yīng)用Token”來統(tǒng)籌AI業(yè)務(wù)。換句話來說，就是阿里看到了未來Token巨大的Token消耗，現(xiàn)在要從集團(tuán)層面上來統(tǒng)籌調(diào)配Token了。

到了用戶端的體感就更加明顯，曾經(jīng)那場(chǎng)免費(fèi)送Token額度的“價(jià)格戰(zhàn)”早已鳴金收兵。

現(xiàn)在一個(gè)看似簡(jiǎn)單的用戶指令，后臺(tái)往往伴隨著十幾次的循環(huán)反思、工具調(diào)用以及幾萬Token的上下文反復(fù)重載。而每個(gè)Token的消耗，都是在實(shí)打?qū)嵉責(zé)X。

而巧的是，看起來過去一年里，DeepSeek也沒有停下來Token降本的步伐。

今年元旦假期，DeepSeek提出了一種名為mHC的新架構(gòu)。該研究旨在解決傳統(tǒng)超連接在大規(guī)模模型訓(xùn)練中的不穩(wěn)定性問題，同時(shí)保持其顯著的性能增益，讓算力有限的中小AI企業(yè)，也能嘗試開發(fā)更復(fù)雜的大模型。

不久后，DeepSeek開源了名為Engram的模塊，并同時(shí)發(fā)布了與北京大學(xué)聯(lián)合撰寫的論文，闡述了一種新的大模型稀疏化方向：條件存儲(chǔ)（Conditional Memory）。

而這兩篇論文都體現(xiàn)了DeepSeek一直以來的方向：打破算力成本硬約束，通過架構(gòu)、方法論創(chuàng)新，走出更具性價(jià)比的道路。

既然DeepSeek當(dāng)初能憑一己之力，在訓(xùn)練端把競(jìng)爭(zhēng)對(duì)手們上億美金的訓(xùn)練成本打到骨折價(jià)，打出讓英偉達(dá)一夜暴跌的通縮效應(yīng)；那么一年后的梁文峰，又能否在Token消耗逐漸成為天量的現(xiàn)在，在推理端再當(dāng)一次“價(jià)格屠夫”，把全行業(yè)的Token單價(jià)打個(gè)骨折呢？

- END -

原文標(biāo)題 : DeepSeek需要重走來時(shí)路

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

6月30日
立即報(bào)名>> 【直播】 AI X 6G無線智能與下一代通信測(cè)試論壇
6月30日
立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
精彩回顧
立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
精彩回顧
立即查看>> 【直播】智測(cè)未來·2026�？怂箍荡杭井a(chǎn)品創(chuàng)新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)