訂閱
糾錯
加入自媒體

DeepSeek V4在前,美團LongCat跟進,中國AI邁過算力門檻

2026-04-30 09:57
胡說成理
關注

2026年4月,英偉達CEO黃仁勛在一場播客訪談中反復強調,計算不是汽車,不能今天換一個品牌、明天再換一個品牌。計算生態有黏性,替換它需要巨大的時間和能量。

這句話原本是黃仁勛為英偉達繼續參與中國市場在辯護,卻意外點破了中國AI產業過去兩年最深層的壓力:大模型競爭,表面上是參數、榜單和應用之爭,底層卻是算力生態之爭。誰掌握訓練和推理所依賴的芯片、軟件棧和工程體系,誰才真正握住了下一輪AI放量的鑰匙。

過去很長一段時間,國產大模型的關鍵算力受制于外部供應、生態遷移成本高、國產訓練集群穩定性不足等問題。算力不是簡單買幾張卡就能解決,它涉及芯片、互聯、編譯框架、算子庫、容錯系統和訓練工程,任何一個環節不穩,萬億模型都很難真正跑起來。

4月底,國內外多款頭部大模型集體煥新。不一樣的是,這一次的討論重心,開始從“模型強不強”,轉向“它跑在什么算力硬件上”。

DeepSeek V4為了適配國產算力經歷了艱難的調試遷移,已經把問題擺到了行業臺前。在同一天,美團LongCat-2.0-Preview開放測試,據公開信息顯示,其訓練推理全程依托國產算力集群完成。

兩個萬億模型,在同一時間節點,站在了同一個方向上。

這不是巧合,而是一個信號:中國AI的下一輪爆發點,不會只發生在模型榜單上,更在“模型能力 × 國產算力 × 真實場景 × 低成本調用”的交叉地帶。

——導語

01

兩個重磅

2026年4月下旬,中國AI產業同時拋出兩枚重磅籌碼:DeepSeek V4與美團LongCat-2.0-Preview。兩者參數規模均進入萬億級,均支持1M上下文窗口,單次推理可處理百萬字級輸入,把中國大模型競爭推入了一個新的密集迭代窗口。

如果放在全球競爭的坐標看—— OpenAI繼續以GPT系列維持閉源模型的能力上限,Google Gemini和Anthropic Claude仍在多模態、代碼、長上下文和Agent能力上加速推進;國內則形成DeepSeek、Qwen、Kimi、MiniMax、智譜、豆包、LongCat等多線并行局面。

兩條線都在加速,但路徑和生態已明顯分化。

中國模型的優勢不再只是“追得快”,而是在開源、低成本、高調用量和垂直場景中不斷形成自己的路徑。

DeepSeek V4的上線稱得上“萬眾矚目”,但團隊依然克制低調,外部情緒也不像1年前R1橫空出世般強烈。

這并不奇怪。DeepSeek第一次破圈時,真正震動行業的并不是“絕對性能第一”,而是“接近一線能力 + 極低調用成本”帶來的性價比沖擊。當一家公司已經把公眾期待抬到極高位置,后續每一次大版本迭代,都很難再復制第一次出圈時的情緒強度。

但從技術演進看,DeepSeek V4的百萬字上下文能力、MoE架構、推理效率、成本控制,以及對國產算力的深度適配,共同構成了這一代模型的真實看點。開發者社區對其代碼、復雜文檔處理和長文本推理能力,都給予了較高關注。

圖片

真正值得注意的是,DeepSeek V4把長文本推理成本繼續向下壓。過去,百萬級上下文、復雜推理和Agent編排往往意味著高昂token成本,只有大廠或預算充足的團隊能長期試錯。如今,當頭部模型調用成本持續下降,AI應用的盈虧平衡線就會被重新改寫。

成本革命,往往是技術普及的前夜。

從這個角度看,DeepSeek V4仍然是一次成功且激進的迭代。它沒有單純走“堆卡堆錢”的路線,而是通過稀疏注意力、MoE、推理系統優化和國產算力適配,在資源約束下繼續追求單位成本性能的最優解。

讓這次更新上升到產業層面的,是國產算力適配的細節。圍繞DeepSeek V4的討論,很快從“模型能力如何”,轉向“它運行在什么硬件和軟件生態上”。這說明,中國大模型競爭已經進入更底層的階段:不僅要做出強模型,還要證明模型可以在國產算力體系中訓練、部署和規模化調用。

幾乎在同一個時間窗口,美團LongCat-2.0-Preview開放測試。

它同樣進入萬億參數量級,與DeepSeek V4相似的不僅是參數規模,還有兩者都把“大模型能力”與“國產算力適配”放在同一張牌桌上。

LongCat-2.0-Preview有一個更進一步的標簽:公開信息顯示,它訓練推理全程依托國產算力集群完成,訓練階段使用了約5萬至6萬張國產算力卡,是迄今國產算力上完成的最大規模大模型訓練任務之一,也是目前為止公開口徑中唯一一個國產卡訓練的萬億大模型。

這句話的分量,需要放在中國AI產業過去兩年的算力現實中理解。

如果說DeepSeek V4證明了“國產芯片可以支撐頭部模型的關鍵環節”,那么LongCat-2.0-Preview進一步證明,國產算力并不是只能做驗證性適配,而是有能力承擔萬億參數模型的全流程訓練和推理。它不是一次孤立的模型更新,也在系統展示國產算力的工程化能力。

一方面,DeepSeek繼續用低成本和高效率推動AI應用普及;另一方面,LongCat-2.0-Preview用全程國產算力訓練推理,驗證了國產算力在大規模真實訓練任務中的可用性。兩者相繼出現,意味著中國AI牌桌上多了一個重要的變量。

這也是為什么美團的加入值得關注。它并不是一家傳統意義上的模型公司,卻擁有本地生活、履約網絡、商家經營、無人配送、無人機、消費搜索和即時零售等大量真實場景。對大模型而言,真實場景不是錦上添花,而是決定模型能否持續迭代的燃料。

02

從V4的“心臟移植”到LongCat的全程國產化

國產算力上跑出了萬億級的大模型,對產業是突破,但對其中的工程師更像是一場 “心臟移植”手術。

DeepSeek V4的千呼萬喚,表面看是時間節點變化,實質上反映的是從成熟CUDA生態向國產算力軟件棧遷移時,必須補上的工程課。

長期以來,英偉達CUDA生態的優勢不只在芯片本身,也在編譯器、算子庫、通信框架、調試工具、開發者習慣和大量歷史經驗。大模型公司過去在CUDA生態里訓練、調參、部署,很多基礎能力已經接近“默認可用”。但遷移到國產算力體系后,很多原本被生態封裝掉的問題,會重新暴露在工程團隊面前。

最耗時的,往往不是把代碼“搬過去”,而是讓同一個模型在不同硬件和軟件棧上跑出一致、穩定、可復現的結果。

這正是國產算力適配中最難的部分。算子重寫、通信優化、精度對齊、混合精度訓練、顯存調度、故障恢復,每一項都不性感,卻都繞不過去。沒有這些工程工作,所謂國產替代就很容易停留在演示層面,而無法進入真正的大規模生產。

圖片

DeepSeek V4的意義,正在于它把這種工程遷移推向了頭部模型級別。它讓行業看到,即使在外部高端GPU供應受到約束的情況下,中國大模型仍然可以通過架構創新和系統工程,繼續實現高強度迭代。

當然,國產芯片并不是在所有維度上已經完全等同于成熟國際生態。更準確的說法是,在部分硬件指標、軟件生態成熟度、開發者工具鏈和訓練經驗沉淀方面,國產體系仍在追趕和補課;但在真實大模型任務中,它已經開始具備支撐頭部模型的能力。

LongCat-2.0-Preview的價值,則在于從訓練到推理全程依托國產算力集群完成。

這使它具有更強的原生意義。

美團大模型團隊在國產算力訓練過程中,顯然趟過了不少坑,也沉淀了相當多工程能力。萬億參數級模型不是把卡堆起來就能跑。訓練任務一旦進入數萬卡規模,任何一個節點、鏈路、算子、調度策略或精度問題,都可能導致訓練中斷、結果漂移或效率崩塌。

首先,是并行策略與顯存優化。

萬億參數級MoE模型對顯存、通信和調度提出極高要求。國產算力體系在不同芯片形態、內存帶寬、互聯結構和軟件棧上,與英偉達成熟生態并不完全相同。要在這樣的系統中訓練萬億模型,團隊必須重新設計并行策略、通信路徑和顯存復用方式,把硬件資源壓榨到足夠高的效率。

其次,是底層軟件棧的成熟度。

CUDA生態是多年訓練、部署、開源社區和商業應用“熬出來”的。國產軟件棧進步很快,但在復雜任務中仍需要模型團隊深度參與優化。LongCat團隊很可能針對國產芯片特性重寫或優化核心算子,并建立更嚴格的數值一致性與可復現機制。

再次,是萬卡集群的穩定性。

大規模訓練不是單點性能競賽,而是復雜軟硬件系統工程。長期以來,即便是全球頂級模型團隊,也很少有人能輕松保證萬卡集群長時間穩定運行。鏈路波動、硬件故障、執行超時、計算差異、中間狀態恢復,都會影響訓練效率和最終結果。

LongCat-2.0-Preview的訓練實踐,說明美團團隊至少建立了覆蓋容錯、檢測、恢復和調度的工程體系。這些不是論文里的能力,而是在數萬張國產卡訓練任務中被逼出來的能力。

實際上,這些工程沉淀也會反哺到國產芯片生態。

芯片廠商最需要的,不只是實驗室benchmark,而是真實大模型訓練中的壓力測試數據。哪些算子拖慢訓練,哪些通信鏈路容易抖動,哪些場景會出現數值差異,哪些調度策略最有效,只有真實任務才能給出答案。LongCat-2.0-Preview這樣的項目,實際上把模型公司和國產算力廠商推向了相向而行的道路。

這也是它區別于普通模型更新的地方。

它不只在模型參數上增加一個名字,也在國產算力體系里留下了可復用的工程經驗。

03

為什么是現在?聊聊美團的“隱性基因”

LongCat-2.0-Preview的出現,更像是美團將AI嵌入業務流程許久后,浮出水面的那一截。

要理解這件事,需要先理解美團的AI需求,與很多互聯網公司不同。

美團不是純內容平臺,也不是純搜索平臺,更不是單一辦公軟件或云服務公司。它連接的是大量真實的物理世界服務:餐飲、外賣、到店、酒旅、即時零售、配送、商家經營、無人機、無人車、騎手調度、門店運營。

圖片

這些業務的特點是:數據密度高,履約鏈條長,供需匹配復雜,用戶對結果極其敏感。

用戶問一句“附近有什么適合兩個人吃的川菜”,背后不是簡單文本生成,而是商家質量、距離、價格、優惠、排隊時間、營業狀態、評價結構和用戶偏好的綜合判斷。商家問“這個位置能不能開店”,背后也不是一句建議,而是商圈、客流、競品、租金、客單價、配送半徑和歷史經營數據的綜合推演。

痛點,爽點,都有AI介入的空間。AI要落地,離不開真實業務的需求。恰恰美團有大量可以被AI提效的高頻場景。

因此,美團的AI產品,應放在一個更大的邏輯里理解:AI正在從“展示能力”轉向“嵌入業務流程”。

比如在C端,AI管家“小團”剛剛針對五一假期進行了能力更新,幫助用戶壓縮找店、比價領券、看評價、路線安排等環節的選擇成本。在B端,袋鼠參謀、智能掌柜等工具,指向的是商家經營提效。選址、評價分析、菜單優化、接待回復、促銷建議,這些原本依賴經驗和人工處理的工作,正在被AI工具逐漸輔助。

用戶關心體驗和效率,商家關注轉化和經營效果,都要求LongCat在美團的核心業務中擁有真實落點。

財報與公開溝通中,美團多次強調通過AI技術提升本地生活服務體驗,并將AI能力與即時零售、商家經營、履約網絡和物理世界服務連接起來。換句話說,目標是為提升整個服務網絡的效率。

這也是“物理AI底座”這一說法的來源。

AI不只要理解文本和圖片,還要理解真實世界中的人、貨、場,路、店、倉,以及運力和末端設施。

天然處在數字智能和物理世界的交界地帶——這也解釋了為何美團在AI大模型、半導體/AI智能硬件賽道,很早就有布局。

公開信息顯示,美團在硬科技領域至少投資了43家公司,包括智譜AI、月之暗面、摩爾線程、沐曦股份、銀河通用、禾賽科技、輕舟智航等獨角獸企業。看似分散,實際可以排列成一張鏈路:上游是算力與模型,中游是感知與決策,末端是機器人、自動駕駛和物理執行。

LongCat-2.0-Preview不是孤立出現的。業務特點,要求美團的模型定位有所不同。

DeepSeek用模型能力和成本效率打開全球開發者生態;LongCat試圖把大模型嵌入一個真實的服務網絡,在國產算力底座上驗證它能否長期跑起來。

04

海外視角下的中國AI“換芯”

當DeepSeek V4和LongCat-2.0-Preview相繼把國產算力推到臺前,海外產業界最敏感的人之一,正是黃仁勛。

在與Dwarkesh Patel的播客對話中,黃仁勛并不贊成把中國AI產業簡單排除在英偉達生態之外。他反復強調,計算生態不是汽車,不能隨意切換;生態一旦形成,就有高替換成本。對英偉達而言,讓中國AI開發者繼續留在CUDA體系內,顯然比把他們推向替代生態更符合自身利益。

這段話的價值,從外部視角解釋了國產算力替代的真正難度。

芯片供應受限并不只是“少了幾塊卡”。一旦不能穩定獲得先進GPU,就必須重建從芯片、軟件棧、編譯框架、算子庫、通信協議到訓練工程的整套能力。這個過程成本極高,也很痛苦,但一旦被迫完成,就會削弱原有生態的壟斷黏性。

這正是黃仁勛擔心的地方。

DeepSeek過去的破圈,已經讓業內意識到,中國模型不僅能實現高性能,還能在極低成本下開放調用和部署。Qwen、Kimi、MiniMax、智譜等模型的持續迭代,也在不斷豐富海外開發者對中國模型陣營的認知。如今LongCat又帶來一個新變量。

海外用戶對這些模型的評價,通常不是單一的“振奮”或“質疑”。開發者會關注速度、成本、長上下文、代碼能力和開放程度,也會繼續討論幻覺、穩定性、多模態能力和真實復雜任務表現。

這種就事論事的反應,恰恰說明它們不再只是被觀察的追趕者,而是能在成本、效率、開源、國產算力適配和真實場景上,給全球AI產業提出新議題的發起者。

國產算力,萬億參數,豐富的場景被放到一起,也是中國AI“換芯”敘事中,一步落地的驗證。

結語

國產算力時代的起點

DeepSeek V4和LongCat-2.0-Preview相繼亮相,標志著中國大模型競爭正在從單純模型能力比拼,進入復合競爭階段。

如果中國模型長期運行在CUDA生態里,哪怕中國公司做出很強模型,底層生態的主動權仍然握在別人手里。

反過來,如果中國公司在國產算力上訓練、推理、調優、部署,并逐漸沉淀自己的工程體系,全球AI產業就可能出現更明顯的雙生態結構。

國產算力生態顯然還要補足短板,中國大模型短期內也遠不能脫離外部算力。但至少4月底的集體動作證明,通過架構創新、系統工程和產業協同,已經能實現模型能力的迭代。

AI不存在“便宜大碗”就能過關斬將的情況。未來的考驗在于,能否在市場條件下持續迭代,建立穩定的開發者生態、應用生態和商業閉環。

無論如何,中國AI已經證明:在關鍵算力受到約束的條件下,模型創新并不會因此停擺,架構創新、系統工程、國產芯片生態和真實業務場景放在一起,是一條可以往前走的路。這是中國AI產業,在今年春天給出的回答。

       原文標題 : DeepSeek V4在前,美團LongCat跟進,中國AI邁過算力門檻

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號