熱點丨500億砸向算力基建,DeepSeek打響國產AI的地基爭奪戰
前言:
模型是樓,應用是窗,算力基建才是地基。
在算力競賽中,誰能在電費和散熱上省下每一分錢,誰就能在模型定價上擁有更大的騰挪空間。
作者 | 方文三
圖片來源 | 網絡

從租算力到建算力,投入背后的成本賬
2026年6月DeepSeek首輪融資細節曝光:擬募資約500億元人民幣,投后估值高達3500億至4000億元,這是中國AI領域有史以來最大規模的單輪融資之一。
據行業投資人預測,這筆資金中高達60%至70%,也就是300億到350億元,將直接流向算力基礎設施建設。
在此之前,DeepSeek的算力供給主要依賴第三方云服務商,這種模式在模型研發初期足夠靈活,但隨著訓練規模擴大和推理請求激增,短板正在快速顯現。
按照業內測算,一個萬卡級AI集群一年的租賃成本就在數十億元量級。
而DeepSeek規劃中的GW級算力中心,對應約50萬張加速卡的規模,若全部采用租賃模式,每年的算力支出將是天文數字。
自建數據中心雖然前期投入巨大,但從三到五年的周期看,單位算力成本會顯著低于租賃模式。
更深層的考量來自供應鏈安全,對于志在前沿模型研發的DeepSeek來說,算力供給的穩定性直接決定了產品迭代的速度。
自建算力中心相當于把發展的主動權握在自己手里,不用再看上游供應鏈的臉色。
從招聘信息透露的細節看,DeepSeek的基建團隊已經在研究液冷、高密度供配電、模塊化建設等新一代數據中心技術。
這意味著他們要建的不是傳統意義上的機房,而是專為AI訓練和推理優化的下一代智算中心。
這種從底層架構做起的投入,短期看很重,長期看卻能形成別人難以復制的成本優勢和效率優勢。
融資傳聞之外,DeepSeek招聘動作釋放出的信號更值得關注。
IDC設計規劃工程師、數據中心運維、交付管理等崗位,指向的不是一間普通互聯網公司辦公室,而是從園區、機房、電力、制冷到基礎設施架構的完整算力工程。
崗位描述中出現「從MW到GW級基礎設施規劃與建設」,這句話幾乎把DeepSeek下一步的戰略寫在了明面上。
但DeepSeek的算力布局并非蠻力堆砌,它選擇了一條極具策略性的路徑,將數據中心建在內蒙古烏蘭察布。
烏蘭察布被業內稱為「草原云谷」,年均氣溫僅4.3℃,全年約10個月可利用自然冷源冷卻,制冷成本可節約20%至30%。
當地工業電價僅為京津冀地區的一半左右,新能源裝機占比超過65%,網絡時延低至3.5毫秒,構成了一個難以復制的成本洼地。
資金流向人才、芯片、機房、電力、網絡和運維系統,本質是把不確定的外部供給,轉化為可以自己調度、自己優化、自己定價的基礎設施能力。
在V3技術報告里DeepSeek-V3是6710億總參數、每個token激活370億參數的MoE模型,訓練使用了14.8萬億token,全流程消耗約278.8萬H800 GPU小時。
透過數據看內核,DeepSeek計劃把模型架構、訓練框架、通信策略和硬件條件放在一起做系統優化。
這對國產算力極其重要,國產AI芯片真正需要的是DeepSeek這類高強度真實工作負載。
大模型訓練和推理會毫不留情地暴露問題:哪里帶寬不足,哪里通信延遲高,哪里算子適配差,哪里內存管理效率低,哪里框架遷移成本高。
只有在真實業務里反復打磨,國產芯片、編譯器、驅動、通信庫、調度系統才會進入正循環。
因此,DeepSeek若把新資金投入國產算力基建,會成為國產AI基礎設施的一座壓力測試場。
過去國產算力常常被視為「備選方案」,這個轉向一旦跑通,國產AI產業鏈獲得的將不是一次采購訂單,而是一套可復制的工程模板。

算法效率打底,省錢哲學成護城河
很多人提到DeepSeek的成本優勢,會簡單歸結為「會省錢」,但這其實低估了這家公司的技術底色。
早在DeepSeek V3發布時,行業就注意到一個驚人的數字:這款性能對標GPT-4的模型,訓練成本僅約600萬美元,不到GPT-4訓練成本的十分之一。
從自研的MoE路由策略到MLA注意力機制,再到訓練框架層面的深度調優,DeepSeek團隊一直在做一件事:讓每一張GPU的算力都發揮到極致。
過去十年間,算法效率的提升速度實際上快于硬件摩爾定律的進展,大約每9個月就能讓達到同等智能水平所需的算力減半,DeepSeek正是把這種算法效率的紅利吃到了極致。
五百億算力基建的投入,相當于給這套高效的算法系統配上了專屬的硬件底座。算法優化和基建能力形成雙重疊加,會產生1+1大于2的效果。
同樣投入一塊錢買算力,DeepSeek能產出比同行更多的模型能力,這種差距會隨著規模擴大而越拉越大。
反觀全球范圍內的其他頭部AI公司,走的大多是堆硬件的粗放路線。
OpenAI每年在算力上的投入超過百億美元,Anthropic為了獲取足夠算力也在不斷融資擴表。
這種模式在算力充足時跑得很快,但一旦遇到供應鏈波動或者成本上漲,就會面臨很大的經營壓力。
DeepSeek走的算法提效+自建基建路線,反而可能在長跑中顯示出更強的韌性。

美國卡芯片,中國補地基
全球AI競賽的核心約束正在從模型論文,轉向芯片供應與算力管制。
美國對先進計算芯片和超級計算用途的出口管制持續加碼,H800、H20等面向中國市場的產品也先后受到限制。
這類限制給中國AI公司帶來的影響十分直接,算力來源不穩定,采購周期不可控,供應價格容易波動,長期路線不能完全押注外部芯片。
大模型訓練可以靠階段性集中投入完成,推理服務卻需要長期穩定供給。
對于DeepSeek這種開放模型影響力迅速擴大的公司,算力供應的每一次波動,都會影響產品體驗、生態信心和商業化節奏。
因此,國產AI的地基爭奪戰,表面是數據中心建設,深層是供應鏈韌性建設。
中國過去幾年已經在國家層面推動算力基礎設施高質量發展,「東數西算」、全國一體化算力網、八大國家算力樞紐、智能算力規模擴張,都在為AI時代鋪底座。
地方智算中心可以建得很快,模型公司能不能用得順才是下一道門檻。

結尾:
因為AI競爭越往后,越像一場大型工業系統競賽。模型能力只是水面上的浪花,水下還有芯片、能源、網絡、軟件、運維、資本、政策和應用生態。
DeepSeek把戰線向下推進了一層,中國AI產業也必須向下扎根一層。
部分資料參考:量子位:《國產大模型廠商DeepSeek:上線IDC崗位,500億融資超6成投向算力基建》,中關村在線:《DeepSeek獲500億元融資,加速建設GW級算力中心支撐萬億參數大模型》,東方財富網:《新信號!DeepSeek招人 將建設GW級數據中心?》,觀察者網:《Deepseek為什么在烏蘭察布招人?》
原文標題 : 熱點丨500億砸向算力基建,DeepSeek打響國產AI的地基爭奪戰
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













