國產超節點擂臺賽,華為、阿里、曙光上演三強爭霸
2025年,國產超節點玩家開場即沸騰,華為、阿里、中科曙光等廠商拾階而上,儼然把中國智算集群玩出國際新高度。
近日,繼昇騰384、磐久AL128連續刷新行業紀錄,曙光最新操刀的全球首個單機柜級640卡超節點——scaleX640粉墨登場,一舉將算力集成度抬升至384超節點的20倍,順利接棒磐久AL128開啟守擂環節。
本文謹遵照發布時間排序及各家廠商披露信息,逐一對三大超節點產品展開盤點(由于產品迭進節奏差異,部分產品或已更新性能指標,以下盤點不分高下只論異同)。
華為昇騰384,垂直路線一枝獨秀
昇騰384超節點Atlas 900 A3 SuperPoD基于分布式多框集群設計與靈衢(LingQu)光互聯為架構核心,彼時堪稱業界最大規模高速總線互聯超節點,創新性集成384顆昇騰NPU和192顆鯤鵬CPU,成功打破AI算力互聯瓶頸,并同時滿足了AI計算和通用計算需求。
其優勢在于“以網聯算”的技術路徑出神入化,基于高速互聯總線讓超節點像一臺計算機一樣工作,實現“一卡一專家”并行推理,追求極致的是互聯性能。不過在加速卡選擇上,384超節點僅支持昇騰910C加速卡,并完全圍繞CANN進行生態建設,適配范圍相對狹窄。
目前,384開始側重于“硬件聚焦,軟件開放”策略。硬件層面從昇騰NPU、鯤鵬CPU到靈衢總線,構建完整的國產技術體系。軟件層面,華為將核心的CANN計算架構、MindSpore深度學習框架等開放給社區,以號召更好開發者補全生態短板。
阿里磐久AL128,軟硬協同全棧優化專家
磐久AL128超節點在云棲大會上展示了其極致密度集成能力的突破。如傳統服務器機柜通常支持數十個AI計算芯片,而磐久128彼時刷新了單柜支持128個加速卡的紀錄,算力集成度可換算為384超節點的4倍。
高密度集成背后是散熱技術的突破。據悉,該產品采用單相浸沒式液冷技術,散熱效率比傳統風冷提升3倍,使數據中心PUE可低至 1.09,同時冷卻系統節能 30%,占地面積減少 50%。
這一技術解決了高密度計算帶來的熱量積聚問題,確保芯片在最佳溫度下持續高性能運行。
不過,最讓同行服氣的還是阿里的軟硬件協同優化能力。磐久AL128超節點與阿里云自研的 HPN 8.0 高性能網絡、CPFS 并行文件存儲以及人工智能平臺 PAI 深度集成,形成了從底層硬件到上層應用的垂直優化體系,通義千問模型基于此實現訓練端到端加速比3倍提升。
曙光scaleX640,開放式架構的巔峰之作
曙光scaleX640超節點幾乎代表了現階段計算集群規模極限。該產品作為世界首個單機柜級640卡超節點,是面向萬億參數大模型,基于AI計算開放架構設計的新一代大規模、高效率智算基礎設施,具有“超強性能、極致效率、全面開放、超高可靠”等領先特性。
scaleX640采用“一拖二”高密架構設計,構建大規模、高帶寬、低時延超節點通信域,雙機柜合體可組成1280卡計算單元,柜間通過高速網絡互連,液體冷凝換熱裝置CDM為千卡級計算單元提供高達1.72MW的超級散熱能力,PUE值低至1.04,算力密度最大增幅達20倍。
更關鍵之處在于,曙光采用了復雜度最高的全棧開放式架構集成路線,整合算、存、網、電、冷、管等諸多子系統,并基于超高速正交架構、超高密度刀片、浸沒相變液冷、高壓直流供電等多技術融合創新設計,MOE大模型訓練效率與高通量推理吞吐性能大幅提升30-40%。
結語:
三大超節點產品除了在性能指標上實現代代更新意外,更值得關注的是其路線差異展現出的發展特征。
其中,以單一巨頭為主導的垂直一體路線,表現出開發周期短、協同難度低、前期起步快等優勢,但在全棧資源整合量級上遜于開放式架構路線,存在一定的擴展性局限。
另外,以阿里、中科曙光為代表的技術路線,在底層硬件選擇上支持多種AI芯片,具有開放架構和兼容性設計,具有產業活性足、內生潛力強、算力能效高等優勢特征,但在產業鏈協作難度上存在一定的生態壁壘,需要投入大量資源和精力統一技術接口和協同規范。
總體而言,垂直式路線側重于單槍匹馬打天下,產業鏈風險可控、鏈主收益較大,特別適用于行業發展前期培育細分領域龍頭;開放式路線強調上下游組團結成命運共同體,風險與收益共擔共負,鏈上參與者積極性更強,尤其有利于行業發展中后期構筑可持續發展底座。
原文標題 : 國產超節點擂臺賽,華為、阿里、曙光上演三強爭霸
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













