訂閱
糾錯
加入自媒體

6萬張國產卡訓出萬億模型,LongCat與DeepSeek驗證了什么

圖片

【潮汐商業評論/文】

2026年4月24日,全球AI行業出現罕見的“一天三發”。

凌晨,OpenAI正式發布GPT-5.5,宣稱這是“迄今為止最智能、最直觀易用的模型”,OpenAI距離 “超級應用”更近了。

上午,被國人期待許久的DeepSeek V4系列亮相,1.6T總參數、49B激活規模、1M上下文窗口,以及后來宣布的開源,讓很多人感嘆“價格屠夫回來了”。下午,美團新一代基礎大模型LongCat-2.0-Preview開放測試,同樣支持1M上下文窗口、單次推理中可吞吐百萬字輸入,值得關注的是,它的參數規模也與V4相當。

圖片

同一天,大模型“萬億俱樂部”迎來了兩個中國玩家。

如果算上“谷歌計劃向Anthropic投資最高400億美元”的消息,這一天值得被反復提及。

一方是進一步強化技術優勢和話語權的美國巨頭,另一方是主要代表開源模式的中國科技公司。我們不能以簡單的參數競賽視角來審視雙方,但不容忽視的是,無論DeepSeekV4還是LongCat-2.0-Preview,都在全面深度地適配國產算力生態。

據悉,DeepSeek-V4已完成對華為昇騰、寒武紀等主流國產AI芯片的全棧深度適配;而LongCat-2.0-Preview的訓練與推理,全程依托國產算力集群獨立完成,是目前唯一一個國產卡訓練的萬億大模型。

有行業媒體形容,他們“正在用不到OpenAI零頭的資源訓練出同等水平的模型”。

客觀來看,國產芯片在單卡絕對性能和集群互聯算力上與英偉達仍有差距。但兩個中國大模型同時開始立足于國產算力生態,無疑具有里程碑意義——如果說OpenAI代表的是“算法閉源+英偉達算力”,那么DeepSeek與美團LongCat的此次版本更新,則意味著中國AI產業在“開源+國產算力”的路上,邁出有分量的一步。

“一旦主流開源大模型在中國國產算力生態上實現了規;涞兀绹酒贏I領域的護城河,就會被徹底打開一個缺口。”不久前,英偉達CEO黃仁勛在訪談中表達的擔憂,正在變為現實。

01 “萬億俱樂部”同時迎來兩個中國大模型,意味著什么?

國產大模型在“算力自主”的層面上“會師”,讓長期由少數幾家廠商主導的AI算力格局,出現值得關注的變量。

在過去幾年里,中國AI企業面對的挑戰,早已不僅是“算力受限”的單一問題,而是“硬件+軟件”的雙重制約。在硬件端,英偉達事實上長期扮演“算力壟斷者”的角色。

數據顯示,其芯片占據全球AI訓練市場約90%、AI服務器市場約97%的份額。供不應求之下,高端AI算力芯片常年保持30%至70%的溢價。黃仁勛在2025年11月財報電話會上曾透露,其未交付訂單總額高達5000億美元,高端架構已排到2027年。與此同時,美國持續限制對華先進芯片出口,國內企業只能采購性能受限的特供產品,無論是通用大模型研發還是產業級AI落地,都面臨切實的算力制約。

在軟件端,閉源趨勢也在加深。OpenAI、谷歌、Anthropic等將核心算法、訓練數據與權重完全閉源,對中國區限制服務訪問,禁止本地部署與二次分發。2026年,OpenAI更聯合Anthropic、谷歌組建聯盟,限制國內大模型進行技術蒸餾。

在外部多重制約的現實面前,構建自主可控的AI生態,對國內企業不再是選擇題,而是必答題。

圖片

DeepSeek V4與美團LongCat-2.0-Preview的同日登場,釋放了一個清晰的信號:國產芯片與國產AI生態,正在部分尖端場景,實現從“可用”到“好用”的關鍵跨越。

更為關鍵的是,國產大模型與國產算力之間,正在形成“互相成就”的正向循環。萬億級大模型的極限錘煉,讓國產算力的底座更加堅實。據了解,LongCat-2.0-Preview全程基于國產芯片完成訓練與推理,動用了5至6萬張國產算力卡,刷新了目前國產算力規模最大的大模型訓練任務紀錄。

反過來,國產芯片生態的進步,也讓模型本身極具性價比,正在快速縮小與國外閉源產品的差距。

實際使用效果上,盡管關注度不及DeepSeekV4,但LongCat-2.0-Preview的實力不容小覷。其參數規模同樣突破萬億,實際效率躋身頂尖水平。例如,讓其在1分鐘內生成一個涵蓋中國歷史演變起源與朝代更替的復雜交互式HTML網頁,不僅能做到內容流暢、邏輯嚴密,其生成的視覺與代碼效果甚至不輸主流閉源模型。

“如果這條路走通了,意味著全球開發者和企業有了更多選擇。”有行業資深人士指出,以前萬億參數模型的訓練門檻極高,曾被視作唯有掌握頂級英偉達GPU的企業才能觸及的高地。大模型“萬億俱樂部”新增兩名中國成員,讓國產算力迎來了一個重要的分水嶺。

02 靠攏國產算力,何以成為共識?

國產算力的突破,關鍵在于模型廠商、科技巨頭與芯片廠商的多方協同。這一歷程,經歷了從被動應對到主動布局、從單點突破到形成生態共識的深刻轉變。

2022年之前,國產AI加速卡市場份額不足5%,核心技術受制于人是回避不了的現實。算力供給高度依賴進口,不僅采購成本高昂,更面臨供應鏈隨時可能中斷的風險。由于CUDA生態壁壘難以打破,國產算力長期處于產業邊緣,不得不沿著海外既定技術路線追趕。

然而,地緣環境的變化,以及《算力基礎設施高質量發展行動計劃》等頂層政策相繼出臺,“支持國產算力”已從一句口號加速落地為行業共識。

IDC最新報告顯示,2025年中國AI加速卡市場中,國產芯片合計出貨量已達165萬張,市場份額突破四成。市場預測,2026年以昇騰為首的國產AI芯片市占率有望首次跨越跨越50%大關。

圖片

目前國內企業支持國產算力已演化出三種極具代表性的主流模式:

一種是大廠“自建智算集群”模式。 阿里、騰訊、字節等互聯網巨頭依托云業務,大規模建設國產智算中心,將昇騰、寒武紀等芯片規;渴,為自有模型與第三方開發者提供普惠算力,從供給側降低行業準入門檻。

一種是“早期投資+生態”的布局模式。以美團為例,王興曾透露,美團AI領域進行了持續且高強度的投入,“除有云計算業務的企業外,美團在AI上的投入規模,大概率是國內企業里最大的,且已堅持布局三年多。”目前,美團圍繞通用GPU、芯片設計、半導體材料、邊緣AI構建了龐大的算力矩陣,投資了摩爾線程、沐曦股份、紫光展銳等14家以上的半導體和智能硬件企業。

還有一種,也是值得關注的“軟硬協同”模式。 模型廠商對接、應用國產算力的過程中,持續互動,進行反哺。比如訓練過程中,為提升國產芯片顯存容量、帶寬、軟件生態、集群穩定性等方面的性能,美團AI團隊重寫優化核心算子、自研全確定性算子,結合國產硬件的特性,做了更具“親和力”的訓練框架與模型結構,最大化釋放國產芯片的計算潛能。

核心在于“模型定義算力、算力支撐模型”。大模型企業在國產算力訓練中趟過的“坑”、沉淀的海量工程經驗,直接反哺了國產芯片的迭代優化,加速推動生態走向成熟。

如今,智譜GLM-5、文心一言、通義千問、豆包等主流模型均已全面適配或正在適配國產算力。

03 國產AI生態,依然是一場嚴峻的持久戰

不過,在DeepSeek、LongCat和kimi們進行突破之際,中國AI行業仍需保持清醒,與英偉達和OpenAI相比,無論是國產算力還是大模型廠商,客觀差距依然存在,遠未到開香檳的時刻。

一個細節是,DeepSeek也并未完全放棄英偉達生態,而是選擇了英偉達與昇騰“雙棧并行”的策略。畢竟,算法層面的極致優化,目前還無法完全抹平芯片互聯帶寬、基礎軟件生態(如CUDA的先發優勢)等物理和生態層面的差距。

有行業人士給出了一個精準的評價:“DeepSeek對顯存、激活參數的極致壓榨,把MoE架構玩出花,死磕每個Token的計算效率,這不是為了炫技,而是為了給受限的硬件打補丁。”

從追趕到局部并跑,中國AI產業注定還有一場漫長的持久戰,但國產AI生態的底氣,正在增加。

一方面是,中國AI行業已經探索出了一條走開源模式、走算法創新、走場景生態的差異化路線。作為全球最大的工業國,中國擁有全球最龐大多樣的物理世界場景與需求,這是OpenAI等美國公司難以復制的獨特優勢。

以美團為例,其擁有遍布全國2800多個市縣的即時配送網絡,在無人機、無人車配送上積累了海量數據。這些業務覆蓋了中國最復雜的任務需求和物理環境,為大模型的應用與進化提供了天然試驗田,無人配送、食品安全等實際業務,也為多種計算架構和性能的芯片提供了真實的“需求牽引”。 另一方面,在龐大的需求下,國產大模型和算力正呈現出的“指數級”迭代速度。

圖片

在DeepSeek V4、美團LongCat-2.0-Preview之外,智譜GLM-5、MiniMax M2、文心一言4.0、通義千問3.5等頭部模型持續快速迭代。在算力端,華為昇騰、中科曙光等新一代硬件密集落地,“訓練—推理—部署”全鏈路向國產算力底座的遷移,已經進入到實質性階段。

兩條路徑交匯,國內模型與算力的綜合勢能正在加速積累。4月13日,斯坦福大學HAI發布的《2026年人工智能指數報告》指出,中美AI模型性能的差距正在大幅收窄。但另一方面,美國在基礎模型創新、資本投入和算力基礎設施上依然保持領先,擁有5427個數據中心。

技術的突破從來不是一蹴而就。從CUDA到國產框架,從英偉達到國產算力,從閉源壟斷到開源普惠,中國AI正在用一種“飛行中換引擎”的極致操作,重構底層能力。

LongCat-2.0-Preview與DeepSeek V4的同日登場,是中國AI生態走向新起點的姿態,也是中國AI生態迎來百花齊放、自主可控的新紀元的號角。

越來越多的中國玩家進入大模型的“萬億俱樂部”,將是中國AI生態邁入新階段的信號,也是國產AI走向規;⒆灾骰闹匾⒛_。

       原文標題 : 6萬張國產卡訓出萬億模型,LongCat與DeepSeek驗證了什么

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號