熱點丨500億砸向算力基建，DeepSeek打響國產AI的地基爭奪戰

2026-06-17 10:26

Ai芯天下

關注

前言：

模型是樓，應用是窗，算力基建才是地基。

在算力競賽中，誰能在電費和散熱上省下每一分錢，誰就能在模型定價上擁有更大的騰挪空間。

作者 | 方文三

圖片來源 | 網絡

從租算力到建算力,投入背后的成本賬

2026年6月DeepSeek首輪融資細節曝光：擬募資約500億元人民幣，投后估值高達3500億至4000億元，這是中國AI領域有史以來最大規模的單輪融資之一。

據行業投資人預測，這筆資金中高達60%至70%，也就是300億到350億元，將直接流向算力基礎設施建設。

在此之前，DeepSeek的算力供給主要依賴第三方云服務商，這種模式在模型研發初期足夠靈活，但隨著訓練規模擴大和推理請求激增，短板正在快速顯現。

按照業內測算，一個萬卡級AI集群一年的租賃成本就在數十億元量級。

而DeepSeek規劃中的GW級算力中心，對應約50萬張加速卡的規模，若全部采用租賃模式，每年的算力支出將是天文數字。

自建數據中心雖然前期投入巨大，但從三到五年的周期看，單位算力成本會顯著低于租賃模式。

更深層的考量來自供應鏈安全，對于志在前沿模型研發的DeepSeek來說，算力供給的穩定性直接決定了產品迭代的速度。

自建算力中心相當于把發展的主動權握在自己手里，不用再看上游供應鏈的臉色。

從招聘信息透露的細節看，DeepSeek的基建團隊已經在研究液冷、高密度供配電、模塊化建設等新一代數據中心技術。

這意味著他們要建的不是傳統意義上的機房，而是專為AI訓練和推理優化的下一代智算中心。

這種從底層架構做起的投入，短期看很重，長期看卻能形成別人難以復制的成本優勢和效率優勢。

融資傳聞之外，DeepSeek招聘動作釋放出的信號更值得關注。

IDC設計規劃工程師、數據中心運維、交付管理等崗位，指向的不是一間普通互聯網公司辦公室，而是從園區、機房、電力、制冷到基礎設施架構的完整算力工程。

崗位描述中出現「從MW到GW級基礎設施規劃與建設」，這句話幾乎把DeepSeek下一步的戰略寫在了明面上。

但DeepSeek的算力布局并非蠻力堆砌，它選擇了一條極具策略性的路徑，將數據中心建在內蒙古烏蘭察布。

烏蘭察布被業內稱為「草原云谷」，年均氣溫僅4.3℃，全年約10個月可利用自然冷源冷卻，制冷成本可節約20%至30%。

當地工業電價僅為京津冀地區的一半左右，新能源裝機占比超過65%，網絡時延低至3.5毫秒，構成了一個難以復制的成本洼地。

資金流向人才、芯片、機房、電力、網絡和運維系統，本質是把不確定的外部供給，轉化為可以自己調度、自己優化、自己定價的基礎設施能力。

在V3技術報告里DeepSeek-V3是6710億總參數、每個token激活370億參數的MoE模型，訓練使用了14.8萬億token，全流程消耗約278.8萬H800 GPU小時。

透過數據看內核，DeepSeek計劃把模型架構、訓練框架、通信策略和硬件條件放在一起做系統優化。

這對國產算力極其重要，國產AI芯片真正需要的是DeepSeek這類高強度真實工作負載。

大模型訓練和推理會毫不留情地暴露問題：哪里帶寬不足，哪里通信延遲高，哪里算子適配差，哪里內存管理效率低，哪里框架遷移成本高。

只有在真實業務里反復打磨，國產芯片、編譯器、驅動、通信庫、調度系統才會進入正循環。

因此，DeepSeek若把新資金投入國產算力基建，會成為國產AI基礎設施的一座壓力測試場。

過去國產算力常常被視為「備選方案」，這個轉向一旦跑通，國產AI產業鏈獲得的將不是一次采購訂單，而是一套可復制的工程模板。

算法效率打底，省錢哲學成護城河

很多人提到DeepSeek的成本優勢，會簡單歸結為「會省錢」，但這其實低估了這家公司的技術底色。

早在DeepSeek V3發布時，行業就注意到一個驚人的數字：這款性能對標GPT-4的模型，訓練成本僅約600萬美元，不到GPT-4訓練成本的十分之一。

從自研的MoE路由策略到MLA注意力機制，再到訓練框架層面的深度調優，DeepSeek團隊一直在做一件事：讓每一張GPU的算力都發揮到極致。

過去十年間，算法效率的提升速度實際上快于硬件摩爾定律的進展，大約每9個月就能讓達到同等智能水平所需的算力減半，DeepSeek正是把這種算法效率的紅利吃到了極致。

五百億算力基建的投入，相當于給這套高效的算法系統配上了專屬的硬件底座。算法優化和基建能力形成雙重疊加，會產生1+1大于2的效果。

同樣投入一塊錢買算力，DeepSeek能產出比同行更多的模型能力，這種差距會隨著規模擴大而越拉越大。

反觀全球范圍內的其他頭部AI公司，走的大多是堆硬件的粗放路線。

OpenAI每年在算力上的投入超過百億美元，Anthropic為了獲取足夠算力也在不斷融資擴表。

這種模式在算力充足時跑得很快，但一旦遇到供應鏈波動或者成本上漲，就會面臨很大的經營壓力。

DeepSeek走的算法提效+自建基建路線，反而可能在長跑中顯示出更強的韌性。

美國卡芯片，中國補地基

全球AI競賽的核心約束正在從模型論文，轉向芯片供應與算力管制。

美國對先進計算芯片和超級計算用途的出口管制持續加碼，H800、H20等面向中國市場的產品也先后受到限制。

這類限制給中國AI公司帶來的影響十分直接，算力來源不穩定，采購周期不可控，供應價格容易波動，長期路線不能完全押注外部芯片。

大模型訓練可以靠階段性集中投入完成，推理服務卻需要長期穩定供給。

對于DeepSeek這種開放模型影響力迅速擴大的公司，算力供應的每一次波動，都會影響產品體驗、生態信心和商業化節奏。

因此，國產AI的地基爭奪戰，表面是數據中心建設，深層是供應鏈韌性建設。

中國過去幾年已經在國家層面推動算力基礎設施高質量發展，「東數西算」、全國一體化算力網、八大國家算力樞紐、智能算力規模擴張，都在為AI時代鋪底座。

地方智算中心可以建得很快，模型公司能不能用得順才是下一道門檻。

結尾：

因為AI競爭越往后，越像一場大型工業系統競賽。模型能力只是水面上的浪花，水下還有芯片、能源、網絡、軟件、運維、資本、政策和應用生態。

DeepSeek把戰線向下推進了一層，中國AI產業也必須向下扎根一層。

部分資料參考：量子位：《國產大模型廠商DeepSeek：上線IDC崗位，500億融資超6成投向算力基建》，中關村在線：《DeepSeek獲500億元融資，加速建設GW級算力中心支撐萬億參數大模型》，東方財富網：《新信號！DeepSeek招人將建設GW級數據中心？》，觀察者網：《Deepseek為什么在烏蘭察布招人？》

原文標題 : 熱點丨500億砸向算力基建，DeepSeek打響國產AI的地基爭奪戰