DeepSeekV4 與美團 LongCat 同時「破萬億」，釋放了哪些信號？ - OFweek 人工智能網

當前位置： OFweek 人工智能網 > 機器學習 > 正文

DeepSeekV4 與美團 LongCat 同時「破萬億」，釋放了哪些信號？

2026-05-01 11:50

國內 AI 企業開始嘗試鋪設自己的軌道。

撰文|藍洞商業于瑋琳

今年伊始，海外科技圈都在關注中國的算力問題。

1 月，馬斯克在播客中稱，中國在 AI 算力上「將遠超世界其他地區」。2 月，OpenAI 首席執行官奧特曼說，中國在人工智能領域的技術進步「快得驚人」。英偉達 CEO 黃仁勛也多次公開表示：「限制中國的 AI 技術，反而會加速其自主研發」。

2025 年可以說是供給端的集結之年。摩爾線程、沐曦股份等國產 GPU 接連登陸資本市場，國產大模型的產業基礎進一步加深。2026年，變化向產業鏈下游傳導，4 月下旬，多款國產大模型發布新版本。

4 月 20 日，月之暗面推出擅長長程代碼編寫的 Kimi K2.6 模型；4月 24 日，DeepSeek V4 發布；隨后美團 LongCat-2.0-Preview 開放測試，兩者總參數規模均突破萬億，且均支持 1M 超長上下文。

值得一提的是，DeepSeek V4 完成了從英偉達體系向華為昇騰平臺的遷移與適配；而美團 LongCat2.0 則是訓練推理全程基于國產算力的萬億參數大模型，使用了 5 萬至 6 萬張國產算力芯片。

長久以來，中國 AI 從業者，普遍策略是搭上已有的成熟方案�，F在，國內 AI 企業開始嘗試鋪設自己的軌道。

在荒野修路

你該如何完成一次艱難的任務呢？

科幻作家阿瑟·克拉克的答案是：「唯一的辦法是讓不可能本身，成為前進的起點。」

DeepSeek V4 從最初定檔到最終發布，時間調整了多次。外部普遍推測，原因之一，就是需要將核心代碼從英偉達的 CUDA 遷移出來。

CUDA 生態經過十幾年的打磨，已是一個功能強大、工具完備的開發平臺。國產算力生態尚在構建初期。遷移代碼的過程，意味著開發團隊需要做大量底層框架的重構工作。

最終 DeepSeek 做到了，V4 發布兩日后，摩根大通在報告中指出，V4 成功適配華為昇騰芯片，驗證了國產算力在前沿 AI 推理上的可行性；且 DeepSeek 通過混合注意力架構等底層技術創新，顯著降低了推理成本。

DeepSeek 用技術極客的方式降本增效，通過重寫半個大模型的工作量完成硬核遷移。同日開放測試的美團 LongCat-2.0-Preview，則是直接跑在國產算力之上。

國產算力在工程層面，有哪些難點？不妨以 LongCat-2.0-Preview 為例看看。

第一個難點，是物理層面的。國產硬件底座的顯存容量和帶寬與英偉達芯片有差異，訓練部署萬億參數模型時，美團團隊在工程方面有不小的挑戰，需要用更多精力去調試并行策略、優化顯存。

第二難點，是軟件生態的成熟度，針對國產芯片的特性，確保訓練全程的精確可復現，團隊需要重寫和優化核心算子，以及自研全確定性的算子。

第三個難點，是萬卡集群的穩定性，在動用 5 萬-6 萬張國產算力卡的超大規模集群上，硬件故障難以避免。為此，團隊構建了一套完整的容錯與自動恢復體系。

最后，針對國產硬件的特點，團隊在訓練框架和模型結構進行針對性的親和設計，打破了通用框架的適配局限，提升了計算性能。

DeepSeek 的算法優化降低了算力的門檻，把模型的價格打了下來；美團的工程實踐則證明國產芯片的可行性。這些探索，也給國產芯片生態沉淀出工程能力和經驗。

梁文鋒曾說：「我們不是有意成為一條鯰魚，只是不小心成了一條鯰魚」，而今「鯰魚效應」已經顯現，DeepSeek 并不獨行。

從單點到系統

騰訊云的湯道生曾有這樣一個比喻：「大模型是發動機，使用者是駕駛員」。使用者很容易注意到發動機的性能，但優秀的駕駛員，會意識到燃料與底盤同樣重要。

中國算力的發展，依賴的是整條產業鏈的協同進步。各個環節的核心企業，都在持續補足短板。

在制造端，公開數據表明，中國芯片產量節節攀升，但卻是「啞鈴型」結構， 28nm 以上成熟制程占絕對主力，14nm 及以下先進制程產能依然稀缺。

面對 EUV 光刻機缺位的現實，中芯國際、華虹半導體等企業正推進多重曝光等工藝攻關，試圖在物理極限中尋找平衡點。多方報道顯示，中芯國際的 N+2 工藝（等效7nm）良率已經突破 80%，這意味著已經跨過了商業化量產的門檻。

在算力端，國產芯片在單卡算力上與英偉達仍存在差距。華為昇騰 910C 等產品的實踐表明，通過極致的集群線性加速比，也能跑通體量巨大的模型訓練。

「得生態者得天下」。英偉達 CUDA 構建的護城河之所以深厚，一個重要原因是形成了普適性的軟硬件兼容標準。

行業從業者也意識到這一點。比如寒武紀推出基礎軟件平臺，兼容主流框架，降低開發者的遷移門檻。智源人工智能研究院牽頭的開源系統，構建了統一的底層接口，讓上層模型可以運行在多種不同的國產芯片上。

國內互聯網大廠也有很多動作，百度的雙軌戰略，字節跳動的千億投入，都在為算力底座尋找更優解。

據公開數據梳理，在過去幾年中，美團至少布局了 21 家覆蓋半導體/智能硬件和通用大模型領域的相關公司。其中，既包括芯片算力層的摩爾線程、沐曦股份，以及視覺芯片領域的愛芯元智；也包括新材料等細分賽道的廣州眾山、東方算芯等多家企業。

在技術長期保持跟進的同時，產業資本也在做算力的投資人和共建者，逐漸形成正向循環。

從數字世界，到現實任務

「當下人工智能正處于第三次浪潮的重要拐點，大模型正推動其從弱人工智能邁向通用人工智能，更關鍵的是，推動機器人從 1.0 專用機器人時代進入 2.0 通用具身智能時代�！�

北京智源人工智能研究院院長王仲遠的話，點出 AI 能力的重要落點，是物理世界。

一方面，眾多國產廠商正致力于讓大模型在云端「讀萬卷書」，提升模型的智慧、邏輯推理的嚴密性。另一方面，也要讓大模型「行萬里路」，比如文心大模型被植入到自動駕駛的決策系統中；混元大模型的工業質檢方案，已出現在多個流水線場景。

美團的外賣、到店、酒旅等業務，構成了日常生活中最復雜的任務執行網絡。這里有海量的的真實場景：從商家后廚的出餐速度，到騎手在暴雨中的配送路徑，再到用戶深夜的一句「想吃火鍋」。

王興曾明確提出，要將美團 App 率先升級成「AI-powered App」。這意味著，LongCat 的訓練目標不僅是回答「哪家的小炒肉好吃」，更要「找到這家店，選出最佳的團購券，然后預定 2 個周五晚上 7 點鐘的座位」。

這意味著任務交付的效果尤為重要，也解釋了美團為何強調要打造物理世界的 AI 底座。

從參數提升到算力跑通，國產大模型正在完成從「能用」到「好用」的進階。

這條路沒有捷徑。未來，當算法、算力、資金與場景持續產生化學反應，中國 AI 的故事，也將從「單點突破」翻到「系統進化」這一頁。

原文標題 : DeepSeekV4 與美團 LongCat 同時「破萬億」，釋放了哪些信號？

AI 美團算力

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

即日-5.20
立即下載>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026�？怂箍荡杭井a品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會
精彩回顧
立即查看>> 維科杯· OFweek 2025中國機器人行業年度評選
精彩回顧
立即查看>> 【在線會議】液冷服務器信號完整性及冷卻液關鍵電參數測試

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號