科創丨國內原生AGI Infra迎7億融資記錄,AI基建迎來新生產力壁壘
前言:
2026年資本開始把目光移向另一層更底部的資產,誰能把GPU、國產芯片、智算中心、電力、模型服務和企業場景,壓縮成可穩定交付的Token生產能力。
這正是原生AGI Infra受到追捧的核心原因,它賣的是一整套把算力轉化為智能輸出的系統能力。
7億融資押注的是Token經濟的[煉化廠]
近日,無問芯穹宣布此前已再獲超7億元融資,這筆融資被多家媒體稱為中國AI原生基礎設施公司融資規模之首。
聯合領投方包括杭州高新金投集團和惠遠資本,跟投方包括國興資本、秦淮數據、廣發乾和、力合清瞳、中保投資、AEF NextGen、騰瑞投資、卡萊特、中信建投資本和寬德智能學習實驗室,老股東君聯資本、上海國投孚騰和元智未來追加投資。
資金將投向多元異構技術、軟硬協同效率提升,以及企業級智能體服務平臺建設。
無問芯穹的業務很容易被理解為[算力運營商],這個說法只說對了一半。
傳統算力服務的核心在供給側,企業采購GPU服務器、租用云資源、搭建集群,關鍵指標是卡數、租金、帶寬和機房條件。
AI原生基礎設施的邏輯更進一步,它要解決的是算力進入模型之后的工程效率問題。
一張芯片并不會自動等于生產力,模型部署、并行推理、顯存管理、負載調度、KV Cache優化、模型路由、服務穩定性、工具調用準確率,都會影響最終的Token成本和用戶體驗。
企業真正需要的結果是每天能穩定處理多少業務請求,每次調用的延遲是多少,單位Token成本能不能繼續下降。
Token正在成為AI產業的高頻計量單位,國家數據局信息稱:2025年底躍升至100萬億;2026年3月已突破140萬億,兩年增長超千倍。
AI商業化正從試用進入高頻調用,如今智能體開始進入銷售、研發、制造、金融風控、代碼生成、數據分析等流程,調用頻次呈指數級放大。
一個企業內部流程被AI重構后,Token消耗不再是零散需求,而會變成類似電力、帶寬、云存儲一樣的持續性基礎資源。
無問芯穹這類AGI Infra公司的價值就出現在這個位置,它承擔的角色更像AI產業鏈中的[煉化廠]。
上游接入多元芯片、智算中心和模型,下游面向企業應用、智能體平臺和行業客戶,中間通過調度、優化和服務化,把原始算力加工成可計量、可調用、可交付的智能資源,AI Infra廠商負責把這些碎片化能力組織成可用的生產系統。
AI生產力公式:定義Token價值
未來幾年,AI產業會出現越來越清晰的分層。
最上層是應用和智能體,負責直接進入業務流程;中間是模型層,負責提供推理、規劃、生成和多模態能力;底層是芯片、服務器、數據中心和能源;貫穿其中的,是AI Infra。
它把底層資源組織起來,把模型能力服務化,再把服務能力交付給應用。
這意味著AI Infra會成為AI時代非常關鍵的[窄腰]。
它未必最接近用戶,也未必最接近硬件制造,但它連接兩端,決定智能生產的效率、成本和穩定性。在本輪融資落地官宣后,無問芯穹對外發布了全新的AI生產力邏輯,首提AI生產力公式:
AI生產力=智能規模×Token生產效率×Token價值轉化。
過往,Token只是一個單純的技術計量單位,用來統計模型交互消耗。
這套全新公式直接將Token升級為驅動AI產業發展的核心經濟變量,清晰拆解出AI產業化落地、價值變現的完整閉環邏輯。
①智能規模:可通過技術極致優化的多元異構算力規模。
②Token生產效率:將電能高效轉化為Token的能力(Token/s)
③Token價值轉化:將Token高效轉化為全社會生產力的能力(生產力/Token)
[Token生產效率]與[Token價值轉化]的單位相乘,即得到[生產力/s]。
無問芯穹提出的價值轉化邏輯是:投入→電能→Token→生產力→價值。
三大新生產力壁壘
大廠的基礎設施通常服務于自身生態,它們擁有強大的技術能力,但資源組織方式往往圍繞自家云、自家模型、自家客戶體系展開。
大量中小模型公司、行業應用公司、科研機構、地方智算中心以及使用國產芯片的企業,并不一定能直接復用大廠內部那套高度定制化系統。
中國AI產業的一個現實情況是供給側相當復雜,芯片并非單一架構,GPU、NPU、ASIC、國產AI芯片并存。
模型高度分散,DeepSeek、Kimi、智譜、通義、MiniMax等模型各有接口、性能、成本和部署方式。
地方智算中心建設快速推進,但許多項目面臨利用率、調度效率和客戶轉化壓力。
①中立性:無問芯穹最核心的優勢,也是最難被復制的優勢,就是它的中立第三方定位。
AI行業同樣遵循專業人做專業事的規則,模型企業深耕算法與場景,底層算力優化與Token生產,交由專業的第三方MaaS平臺落地。
然而大廠Infra以服務內部業務為主,芯片廠商Infra綁定硬件生態,均難以做到全行業公平開放。
而模型公司自建Infra則受競爭關系限制,無法成為全行業通用底座。
在這樣的行業格局下,只有保持中立,才能成為中國AI產業鏈的最大公約數。
無問芯穹的中立性,讓它能夠同時服務包括MiniMax、智譜、Kimi、DeepSeek在內的多家頭部模型公司。
其Agentic MaaS平臺已上線160余種大模型,面向國產主流模型提供服務優化,并對萬億參數大模型進行推理優化。
截至2026年4月底,該平臺日均Token調用量較2025年底增長超20倍。
②多元異構:當前AI產業上游有N種不同架構的AI芯片,下游有M種不同結構的大模型,硬件與模型間的適配成本高昂。
一個模型要適配一種新的芯片,通常需要3-6個月的時間,這在技術快速迭代的AI行業幾乎是不可接受的。
無問芯穹的多元異構技術,正是為了解決這個[M×N]適配難題。
其平臺已支持英偉達、華為昇騰、壁仞等10種以上不同芯片,通過將異構算力池化、虛擬化,屏蔽底層硬件差異。
通過任務拆解實現異構混訓混推,讓模型廠商提升國產芯片比例時無需承受3~6個月的迭代周期損失。
更重要的是,無問芯穹將行業平均不到30%的GPU利用率,提升到了97%以上。
同樣一塊H100別人只能用4成,它能用到幾乎滿負荷,直接把算力成本砍了一半還多。
它打破了單一芯片廠商的供給和成本結構對AI規模化落地的制約,為行業提供了更多選擇和更高的靈活性。
③軟硬協同:無問芯穹的軟硬協同技術,跨越軟件硬件做聯合設計,把芯片的應用算力挖到極致。
其Agentic MaaS平臺通過軟硬件協同優化,將系統吞吐量提升2到3倍,整體時延縮減50%,首字延遲控制在500毫秒以內。
在執行精度上,與原廠模型的精度對齊率超過99.9%,并實現了99.95%的企業級高可用性。
這種極致的效率提升,在Token需求爆發的當下顯得尤為關鍵。
隨著Token價格的上漲,每提升一點Token生產效率,都意味著實實在在的成本節約和利潤增長。
結尾:
誰能用更低成本把電力和芯片轉化為Token,再把Token轉化為企業生產力,誰就會在AI產業鏈中擁有更強的話語權。
國內擁有發展Token經濟的得天獨厚的優勢,充沛穩定的能源結構,為大規模算力運轉提供了扎實底座,全球最完整的AI產業鏈、最大的AI應用消費市場。
部分資料參考:量子位:《Token需求狂飆千倍,22億熱錢涌向這家AGI Infra頭號玩家》,
無問芯穹:《無問芯穹再獲超7億融資|首發AI生產力公式,躋身Token經濟樞紐》,虎嗅APP:《7億融資流向清華系[Token工廠]》
原文標題 : 科創丨國內原生AGI Infra迎7億融資記錄,AI基建迎來新生產力壁壘
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 特斯拉Optimus Gen3量產在即,哪些環節最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 五分之一崗位被AI滲透:美國加速替代,中國穩崗賦能,全球勞動力市場冰火兩重天
- 4 估值泡沫隱憂:OpenAI 8520 億估值的信任危機與戰略迷途
- 5 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 6 2026年,具身智能開啟工業單場景落地元年
- 7 Tesla AI5芯片最新進展總結
- 8 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 9 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 10 AI晨報 | 英偉達發布全球首個量子AI模型Ising;騰訊云率先支持熱門Agent部署;OpenAI開撕Anthropic,大戰升級 過去一天,全球AI產業風云再起。從中美技術角力的最新論斷,到云


分享













