6萬張國產卡訓出萬億模型，LongCat與DeepSeek驗證了什么

2026-04-27 17:46

【潮汐商業評論/文】

2026年4月24日，全球AI行業出現罕見的“一天三發”。

凌晨，OpenAI正式發布GPT-5.5，宣稱這是“迄今為止最智能、最直觀易用的模型”，OpenAI距離 “超級應用”更近了。

上午，被國人期待許久的DeepSeek V4系列亮相，1.6T總參數、49B激活規模、1M上下文窗口，以及后來宣布的開源，讓很多人感嘆“價格屠夫回來了”。下午，美團新一代基礎大模型LongCat-2.0-Preview開放測試，同樣支持1M上下文窗口、單次推理中可吞吐百萬字輸入，值得關注的是，它的參數規模也與V4相當。

同一天，大模型“萬億俱樂部”迎來了兩個中國玩家。

如果算上“谷歌計劃向Anthropic投資最高400億美元”的消息，這一天值得被反復提及。

一方是進一步強化技術優勢和話語權的美國巨頭，另一方是主要代表開源模式的中國科技公司。我們不能以簡單的參數競賽視角來審視雙方，但不容忽視的是，無論DeepSeekV4還是LongCat-2.0-Preview，都在全面深度地適配國產算力生態。

據悉，DeepSeek-V4已完成對華為昇騰、寒武紀等主流國產AI芯片的全棧深度適配；而LongCat-2.0-Preview的訓練與推理，全程依托國產算力集群獨立完成，是目前唯一一個國產卡訓練的萬億大模型。

有行業媒體形容，他們“正在用不到OpenAI零頭的資源訓練出同等水平的模型”。

客觀來看，國產芯片在單卡絕對性能和集群互聯算力上與英偉達仍有差距。但兩個中國大模型同時開始立足于國產算力生態，無疑具有里程碑意義——如果說OpenAI代表的是“算法閉源+英偉達算力”，那么DeepSeek與美團LongCat的此次版本更新，則意味著中國AI產業在“開源+國產算力”的路上，邁出有分量的一步。

“一旦主流開源大模型在中國國產算力生態上實現了規模化落地，美國芯片在AI領域的護城河，就會被徹底打開一個缺口。”不久前，英偉達CEO黃仁勛在訪談中表達的擔憂，正在變為現實。

01 “萬億俱樂部”同時迎來兩個中國大模型，意味著什么?

國產大模型在“算力自主”的層面上“會師”，讓長期由少數幾家廠商主導的AI算力格局，出現值得關注的變量。

在過去幾年里，中國AI企業面對的挑戰，早已不僅是“算力受限”的單一問題，而是“硬件+軟件”的雙重制約。在硬件端，英偉達事實上長期扮演“算力壟斷者”的角色。

數據顯示，其芯片占據全球AI訓練市場約90%、AI服務器市場約97%的份額。供不應求之下，高端AI算力芯片常年保持30%至70%的溢價。黃仁勛在2025年11月財報電話會上曾透露，其未交付訂單總額高達5000億美元，高端架構已排到2027年。與此同時，美國持續限制對華先進芯片出口，國內企業只能采購性能受限的特供產品，無論是通用大模型研發還是產業級AI落地，都面臨切實的算力制約。

在軟件端，閉源趨勢也在加深。OpenAI、谷歌、Anthropic等將核心算法、訓練數據與權重完全閉源，對中國區限制服務訪問，禁止本地部署與二次分發。2026年，OpenAI更聯合Anthropic、谷歌組建聯盟，限制國內大模型進行技術蒸餾。

在外部多重制約的現實面前，構建自主可控的AI生態，對國內企業不再是選擇題，而是必答題。

DeepSeek V4與美團LongCat-2.0-Preview的同日登場，釋放了一個清晰的信號：國產芯片與國產AI生態，正在部分尖端場景，實現從“可用”到“好用”的關鍵跨越。

更為關鍵的是，國產大模型與國產算力之間，正在形成“互相成就”的正向循環。萬億級大模型的極限錘煉，讓國產算力的底座更加堅實。據了解，LongCat-2.0-Preview全程基于國產芯片完成訓練與推理，動用了5至6萬張國產算力卡，刷新了目前國產算力規模最大的大模型訓練任務紀錄。

反過來，國產芯片生態的進步，也讓模型本身極具性價比，正在快速縮小與國外閉源產品的差距。

實際使用效果上，盡管關注度不及DeepSeekV4，但LongCat-2.0-Preview的實力不容小覷。其參數規模同樣突破萬億，實際效率躋身頂尖水平。例如，讓其在1分鐘內生成一個涵蓋中國歷史演變起源與朝代更替的復雜交互式HTML網頁，不僅能做到內容流暢、邏輯嚴密，其生成的視覺與代碼效果甚至不輸主流閉源模型。

“如果這條路走通了，意味著全球開發者和企業有了更多選擇。”有行業資深人士指出，以前萬億參數模型的訓練門檻極高，曾被視作唯有掌握頂級英偉達GPU的企業才能觸及的高地。大模型“萬億俱樂部”新增兩名中國成員，讓國產算力迎來了一個重要的分水嶺。

02 靠攏國產算力，何以成為共識?

國產算力的突破，關鍵在于模型廠商、科技巨頭與芯片廠商的多方協同。這一歷程，經歷了從被動應對到主動布局、從單點突破到形成生態共識的深刻轉變。

2022年之前，國產AI加速卡市場份額不足5%，核心技術受制于人是回避不了的現實。算力供給高度依賴進口，不僅采購成本高昂，更面臨供應鏈隨時可能中斷的風險。由于CUDA生態壁壘難以打破，國產算力長期處于產業邊緣，不得不沿著海外既定技術路線追趕。

然而，地緣環境的變化，以及《算力基礎設施高質量發展行動計劃》等頂層政策相繼出臺，“支持國產算力”已從一句口號加速落地為行業共識。

IDC最新報告顯示，2025年中國AI加速卡市場中，國產芯片合計出貨量已達165萬張，市場份額突破四成。市場預測，2026年以昇騰為首的國產AI芯片市占率有望首次跨越跨越50%大關。

目前國內企業支持國產算力已演化出三種極具代表性的主流模式：

一種是大廠“自建智算集群”模式。阿里、騰訊、字節等互聯網巨頭依托云業務，大規模建設國產智算中心，將昇騰、寒武紀等芯片規模化部署，為自有模型與第三方開發者提供普惠算力，從供給側降低行業準入門檻。

一種是“早期投資+生態”的布局模式。以美團為例，王興曾透露，美團AI領域進行了持續且高強度的投入，“除有云計算業務的企業外，美團在AI上的投入規模，大概率是國內企業里最大的，且已堅持布局三年多。”目前，美團圍繞通用GPU、芯片設計、半導體材料、邊緣AI構建了龐大的算力矩陣，投資了摩爾線程、沐曦股份、紫光展銳等14家以上的半導體和智能硬件企業。

還有一種，也是值得關注的“軟硬協同”模式。模型廠商對接、應用國產算力的過程中，持續互動，進行反哺。比如訓練過程中，為提升國產芯片顯存容量、帶寬、軟件生態、集群穩定性等方面的性能，美團AI團隊重寫優化核心算子、自研全確定性算子，結合國產硬件的特性，做了更具“親和力”的訓練框架與模型結構，最大化釋放國產芯片的計算潛能。

核心在于“模型定義算力、算力支撐模型”。大模型企業在國產算力訓練中趟過的“坑”、沉淀的海量工程經驗，直接反哺了國產芯片的迭代優化，加速推動生態走向成熟。

如今，智譜GLM-5、文心一言、通義千問、豆包等主流模型均已全面適配或正在適配國產算力。

03 國產AI生態，依然是一場嚴峻的持久戰

不過，在DeepSeek、LongCat和kimi們進行突破之際，中國AI行業仍需保持清醒，與英偉達和OpenAI相比，無論是國產算力還是大模型廠商，客觀差距依然存在，遠未到開香檳的時刻。

一個細節是，DeepSeek也并未完全放棄英偉達生態，而是選擇了英偉達與昇騰“雙棧并行”的策略。畢竟，算法層面的極致優化，目前還無法完全抹平芯片互聯帶寬、基礎軟件生態（如CUDA的先發優勢）等物理和生態層面的差距。

有行業人士給出了一個精準的評價：“DeepSeek對顯存、激活參數的極致壓榨，把MoE架構玩出花，死磕每個Token的計算效率，這不是為了炫技，而是為了給受限的硬件打補丁。”

從追趕到局部并跑，中國AI產業注定還有一場漫長的持久戰，但國產AI生態的底氣，正在增加。

一方面是，中國AI行業已經探索出了一條走開源模式、走算法創新、走場景生態的差異化路線。作為全球最大的工業國，中國擁有全球最龐大多樣的物理世界場景與需求，這是OpenAI等美國公司難以復制的獨特優勢。

以美團為例，其擁有遍布全國2800多個市縣的即時配送網絡，在無人機、無人車配送上積累了海量數據。這些業務覆蓋了中國最復雜的任務需求和物理環境，為大模型的應用與進化提供了天然試驗田，無人配送、食品安全等實際業務，也為多種計算架構和性能的芯片提供了真實的“需求牽引”。另一方面，在龐大的需求下，國產大模型和算力正呈現出的“指數級”迭代速度。