新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

第四大Token工廠沖刺IPO!毛利率-24%,AI Infra被卷成"流量生意"

又一家AI公司要在港股上市了。

昨天,港交所官網(wǎng)顯示,硅基流動正式披露招股書,沖刺港股“AI Token工廠第一股”。

作為AI基礎(chǔ)設(shè)施公司,硅基流動身上幾乎濃縮了這一輪AI浪潮最火熱的一面。

2024年12月,硅基流動平臺上的平均日均token消耗只有478億。而到了今年4月,公有云平均日均token消耗增長到5785億,翻了10倍還不止。

從收入來看,硅基流動的增長很快。2024年,公司收入只有 734.6 萬元,2025年已經(jīng)增長到了5533 萬元,同比增長 653.2%。

但熱鬧的數(shù)據(jù)背后,也藏著AI推理市場最殘酷的一面。

去年,硅基流動虧了1.87億,幾乎是收入三倍還多,毛利率只有-24%。

除了研發(fā)費(fèi)用外,虧損主要來自公有云和用戶補(bǔ)貼。2025年,占公司過半收入的公有云業(yè)務(wù),毛利率只有-119%。也就是說,每產(chǎn)生一塊錢的收入,公司還要虧1塊錢。

同時,為了搶用戶,去年硅基流動就投入了5421萬元免費(fèi)算力,相當(dāng)于幾乎把全年收入又補(bǔ)貼了一遍。

即便如此,今年前四個月,這個數(shù)字只有145萬,相當(dāng)于只有去年全年的四分之一。按比例來說,不僅沒有增長,還出現(xiàn)了下降。

一家原本靠效率取勝的AI基礎(chǔ)設(shè)施公司,在國內(nèi)競爭激烈環(huán)境下,似乎也終究免不了被卷入到流量和價格漩渦里。

/ 01 / 國內(nèi)第四大Token工廠

硅基流動的創(chuàng)始人袁進(jìn)輝曾用一個極其通俗的比喻,來形容他們的業(yè)務(wù):

"算力就像白菜、土豆等原材料,既可以直接賣給客戶,也可以將這些原材料加工成宮保雞丁之類的成品菜,再'端'給客戶。我們提供的是成品模型,而不是原始的算力資源。"

在這個被稱為「Token工廠」的模式中,硅基流動的核心能力是,通過「管道」,將復(fù)雜的算力資源和多元模型打包,統(tǒng)一輸出成便宜、好用的標(biāo)準(zhǔn)化Token。

這種模式的價值,主要體現(xiàn)在兩個方面:

第一,是提升算力利用效率,尤其是國產(chǎn)芯片的適配能力

中國AI Infra最大的特點(diǎn),是底層算力非常分散。美國市場幾乎圍繞英偉達(dá)CUDA生態(tài)展開,而國內(nèi)除了英偉達(dá),還有華為昇騰、沐曦、摩爾線程、壁仞等大量國產(chǎn)AI芯片。不同芯片的軟件棧并不統(tǒng)一,一家企業(yè)如果想同時使用多種芯片,往往需要投入大量研發(fā)成本做適配。

這就是硅基流動試圖解決的問題,解決各類國產(chǎn)芯片(如昇騰、摩爾線程、沐曦等)的適配問題,通過高性能推理引擎讓國產(chǎn)芯片能產(chǎn)出更多Token。

目前,硅基流動已經(jīng)能夠在大規(guī)模生產(chǎn)環(huán)境下,同時支持英偉達(dá)GPU以及昇騰、摩爾線程、沐曦等多種國產(chǎn)AI芯片。

第二點(diǎn)是模型中立

今天的大模型市場,大多數(shù)云廠商既提供基礎(chǔ)設(shè)施,又擁有自己的模型和AI應(yīng)用,既是平臺,也是參與者。

而硅基流動只做基礎(chǔ)設(shè)施,既不研發(fā)模型,也不做AI應(yīng)用。這種純粹的中立性,對于擔(dān)心數(shù)據(jù)安全、業(yè)務(wù)依賴或被平臺綁定的頭部客戶(尤其是金融、政務(wù)、大型企業(yè))來說,有很大的吸引力。

截至目前,硅基流動已經(jīng)服務(wù)了超過1.3萬家企業(yè)客戶,平臺累計支持超過170個模型。

按2025年Token年吞吐量計算,硅基流動已是中國第四大Token供應(yīng)平臺,排在它前面的,是火山引擎、阿里云和百度智能云這三座大山。

對于一家成立僅三年的AI Infra公司來說,這樣的成績絕對算不上差。

/ 02 / 賣Token,成了流量生意

相比Token的快速增長,硅基流動的商業(yè)化表現(xiàn)就比較尷尬了。

從收入來看,硅基流動的增長很快。2024年,公司收入只有 734.6 萬元,2025年已經(jīng)增長到了5533 萬元,同比增長 653.2%

不過與大模型公司類似,硅基流動也虧了不少。2025年,公司的經(jīng)調(diào)整虧損為1.87億,幾乎是收入三倍還多。

除了研發(fā)費(fèi)用外,虧損主要來自公有云和用戶補(bǔ)貼。

從交付方式來說,硅基流動主要分別兩種:公有云和本地部署,收入基本各占一半。其中,公有云又分為無服務(wù)器詞元服務(wù)、專屬實(shí)例,前者是共享算力資源,后者相當(dāng)于獨(dú)家算力資源。

不過公有云毛利率很低。2025年,公有云的毛利率只有-119%。也就是說,每產(chǎn)生一塊錢的收入,公司還要虧1塊錢。

與此同時,為了吸引更多用戶進(jìn)去公有云平臺。去年,硅基流動還花了5421萬的算力推廣成本。這些錢,全用來給用戶發(fā)免費(fèi)算力了。

硅基流動這么做的原因也很簡單,用很低的價格把更多用戶吸引進(jìn)來,然后讓他們?nèi)ベ徺I更多的獨(dú)家算力。

理想很美好,不過現(xiàn)實(shí)很骨感。

去年全年,使用公有云共享算力資源的用戶為545萬。而今年前四個月,這個數(shù)字只有145萬,相當(dāng)于只有去年全年的四分之一。按比例來說,不僅沒有增長,還出現(xiàn)了下降。

一個很重要的原因是,注冊用戶增長放緩。2025年,公有云注冊用戶為919.7萬。而截至今年4月3日,這個數(shù)字為1028萬,增長11.78%。

雖然公有云共享算力的付費(fèi)用戶滲透率從去年年底的13.13%增長到44.18%。但截至今年前4月,購買獨(dú)家算力的客戶仍然只有20個,而去年全年是49個。

公有云的商業(yè)化窘境背后,一個更殘酷的真相是:公有云API正在不可逆地變成“流量批發(fā)”,最終只能靠極端的規(guī)模效應(yīng)來微利生存

更可怕的是,連運(yùn)營商都下場搶食了。

今年5月中旬,中國移動、中國聯(lián)通、中國電信相繼面向C端用戶推出Token套餐。上海移動聯(lián)合騰訊推出“1元可購40萬Tokens”;北京移動甚至推出了最低5.99元的次包。

當(dāng)算力Token被運(yùn)營商打包成普通用戶能買的“流量包”時,硅基流動這種的中間商,又還能有多少空間?

/ 03 / 越來越卷的AI Infra

公有云競爭激烈,但本地化部署也沒好到哪去。過去兩年,雖然本地部署的平均客單價從22萬元提升至130.3萬元,但客戶數(shù)量卻從28家減少到20家。

按理說,本地部署對AI Infra能力要求更高,硅基流動的效率優(yōu)勢應(yīng)該更容易轉(zhuǎn)化為商業(yè)價值。但問題在于,幾乎所有玩家都盯上了這塊市場。

回過頭來看,在行業(yè)早期,硅基流動的效率優(yōu)勢確實(shí)非常明顯。

由于更早押注開源生態(tài),它成為DeepSeek爆發(fā)最大的受益者。在很長一段時間里,它幾乎是唯一支持DeepSeek的第三方MaaS平臺。

而當(dāng)所有人都看到了AI推理算力和異構(gòu)算力infra需求,這個市場也正在變得越來越卷。尤其當(dāng)效率成為整個中國AI產(chǎn)業(yè)的共識時,硅基流動的優(yōu)勢也在被產(chǎn)業(yè)各方快速追趕。

一方面,無論是阿里、騰訊、百度、字節(jié)等大廠,還是摩爾、沐曦、壁仞等芯片公司,都在瘋狂補(bǔ)齊Infra算力技術(shù)和模型適配能力。

去年年底,騰訊云甚至專門拆分成立AI Infra部門。而字節(jié)跳動的AI Infra團(tuán)隊(duì)規(guī)模,據(jù)業(yè)內(nèi)估計已經(jīng)超過千人。

另一方面,模型廠商和芯片廠商之間,也開始繞過第三方Infra平臺,直接合作。比如,華為昇騰與DeepSeek、摩爾線程與智譜、壁仞與階躍等合作,都在縮短模型到芯片之間的距離。

換句話說,原本屬于AI Infra公司的工作,正在被上下游逐步消化

壁仞科技創(chuàng)始人張文去年也談過這一點(diǎn)。他認(rèn)為,國產(chǎn)GPU從設(shè)計到量產(chǎn)往往需要兩年,而模型幾乎每周都在迭代,因此模型公司與芯片公司的協(xié)同只會越來越緊密。

當(dāng)然,這并不意味著獨(dú)立AI Infra沒有機(jī)會。畢竟,中國的AI基礎(chǔ)設(shè)施不是一個統(tǒng)一的英偉達(dá)世界,同時開源生態(tài)的發(fā)展,也在不斷提升MaaS平臺的價值。

真正的問題在于,這個市場的空間能有多大。

過去,云計算和SaaS的發(fā)展已經(jīng)證明,中國to B生意從來不是一個可以靠技術(shù)或者效率取勝的事情。從這一點(diǎn)來說,硅基流動的故事并不好講。

       原文標(biāo)題 : 第四大Token工廠沖刺IPO!毛利率-24%,AI Infra被卷成"流量生意"

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號