訂閱
糾錯
加入自媒體

字節跳動與科大訊飛:大模型之戰的AB面

2025-01-16 11:27
連線Insight
關注

文/陳鋒

編輯/子夜

走過近兩年的競速賽后,中國大模型賽道正加速迎來分化。

分化首先體現在大模型初創公司的路徑選擇上。2024年,一度吸引了更多公眾關注的“大模型六小虎”,開始走向不同的方向。

百川智能轉向了行業大模型;月之暗面和MiniMax的戰略優先級是C端產品和應用;零一萬物采取了“大廠+小虎”的合作范式,它將超大模型交給阿里訓練,自己負責小參數、適中的行業模型;智譜AI和階躍星辰,則仍然聚焦AGI大模型。

從這個側面看中國大模型產業,一個越來越清晰的事實是,“百模大戰”正加速退潮,從初創企業到大公司,幾乎所有的玩家都在思考:在大模型和AI的浪潮中,自己應該承擔怎樣的角色,技術該如何更好落地、該聚焦國內市場還是出海,以及如何創造出差異化價值。

而無論是To C還是To B,面向2025年,業界已經達成了新的共識——接下來,大模型將繼續走出同質化,進入到既拼技術實力、也拼落地進展、還拼商業化的階段。

基于2024年的市場表現來看,字節跳動和科大訊飛,是兩個值得重點討論的樣本。

字節跳動過去一年在C端表現搶眼,呈現出后來者居上的姿態。現在,全球范圍內,從月活規?,豆包App已經成為僅次于OpenAI的ChatGPT的AI應用。

另一邊,科大訊飛在To B賽道呈現出了領跑之姿。

第三方機構智能超參數發布的《中國大模型中標項目監測報告(2024)》指出,2024年,在通用大模型廠商中標排行榜中,科大訊飛以91個中標項目、披露中標金額84780.8萬元,排名第一,成為2024年度標王——從披露的中標金額來看,它是百度的兩倍、智譜AI的八倍。

圖片

圖源智能超參數 

在這背后,作為中國大模型產業如今分別在C端和B端的領頭羊,他們走過的路都不輕松,但都具備一定的啟示意義。

1、大模型的兩條賽道上,科大訊飛、字節跳動各自領跑

在大模型賽道上,字節跳動入局不算早,但發展速度很快。

據DataEye研究院不完全統計,2024年8月至今,字節跳動在AI領域一共推出了包括豆包大模型家族在內的17款大模型、2個智能體開發平臺。

字節旗下更多的C端AI應用也在加速推出。2024年以來,字節跳動在國內外已經推出了包括豆包在內的20余款App,覆蓋了AI聊天助手、AI視頻工具、AI娛樂應用、辦公等多個領域。

圖片

圖源浙商證券

這對應的是,字節跳動沿用了過去“大力出奇跡”的戰略打法。浙商證券統計,2024年字節跳動在AI上的資本開支達到了800億元,甚至接近百度、阿里、騰訊的總和(約1000億元)。

市場研究機構Omdia的研究也顯示,字節2024年采購了約23萬張英偉達芯片,成為僅次于微軟的英偉達全球第二大買家。

在更大力度的投入、更廣泛的布局下,字節跳動在這一年里迅速完成了在C端應用上的趕超。

截至11月,豆包App的月活躍用戶數已經接近6000萬,MAU增速達到了16.92%。

另一個視角里,在較難被普通用戶感知到的大模型To B市場,科大訊飛則穩扎穩打,積累起了領先優勢。

與字節跳動的“后發先至”不同的是,大模型浪潮襲來以后,科大訊飛某種程度上屬于“先發先至”。

2022年底OpenAI發布ChatGPT以后,科大訊飛在大模型布局上快速跟進,并在接下來兩年時間里,快速確定了技術思路和技術路線,并完成了多輪技術迭代。

OpenAI發布ChatGPT僅僅半個月后,科大訊飛就已經決定,要把資源壓上去做大模型,同時其還提出,做大模型要做“1+N”,“1”是指通用認知智能大模型,“N”是指在教育、辦公、汽車、人機交互等各個領域落地。

當時,科大迅飛快速拉通了核心研發平臺15個方向的團隊,專門成立了大模型專項組,內部又分成四個項目組,分別專注于“算力和訓練框架”“數據構建”“推理框架和服務”“算法研發及大模型研制”,科大訊飛研究院院長胡國平后來回憶,“這么大規模的‘會戰’在訊飛研究院歷史上也是少有的。”

在那之后,科大訊飛的訊飛星火大模型加速迭代。

1月15日,科大訊飛正式發布了星火深度推理模型x1,同時首發了星火語音同傳大模型。此外,訊飛星火4.0Turbo的底座能力和行業能力也實現了再次升級。

圖片

稍早一些,科大訊飛發布了訊飛星火4.0 Turbo,七大核心能力全面超過了GPT-4 Turbo,數學和代碼能力超越了GPT-4o,國內外中英文14項主流測試集中實現了9項第一。

從大模型的落地進展來看,科大訊飛也走在了行業前列。

一方面,如我們上文所述,2024年,科大訊飛是通用大模型廠商中的“標王”;

另一方面,同樣在2024年里,科大訊飛的星火大模型還斬獲了六項“第一”:央國企中標第一、教育醫療市場第一、智能汽車市場第一、大模型開發者生態第一、智能硬件市場第一、賦能科研應用第一。

由此不難發現,經過兩年的跑馬圈地后,在To C和To B這兩條路線上,行業格局已然明晰——字節跳動和科大訊飛,率先跑在了前列。

2、“中標”背后,科大訊飛和字節跳動如何解題?

客觀來看,無論是字節跳動在大模型C端應用上的“逆襲”式反超,還是科大訊飛在B端的落地探索,都不輕松。

對To C的大模型應用而言,首先是推理成本高,緊接著廠商在考慮產品市場匹配度時,要考慮到技術需求、技術難度和成本等因素,還需要把握時間窗口,此外在探索商業化路徑時,相比國外,國內用戶的付費意愿也相對較弱。

也就是說,想要做出一款好用的、用戶愛用的大模型應用,意味著更高的投入成本,以及不確定的回報周期,這也是為什么,這兩年很多大模型創業公司都將視角轉向了海外。

如何持續吸引到新用戶,并提升用戶留存率,則是另一重挑戰。

從字節跳動在大模型領域的積極布局來看,它顯然希望自己能成為做出更多爆款應用的先行者,潛在機會也更大。

一來,字節跳動不缺資金、不缺技術、不缺人才、也不缺投入的決心;

二來,字節跳動早些年在移動互聯網時代成功To C的經驗,如今也成了它的差異化優勢。比如比起競爭對手們,字節有更豐沛的流量能夠支撐應用的快速起量。

最后,現在的字節對用戶需求也在變得更加敏銳,反應速度也變得更加敏捷了。

12月11日,據媒體報道,字節提升了即夢的產品優先級,嘗試用新的路徑打造AI時代的“抖音”——即夢AI隸屬于字節跳動旗下剪映業務,定位是AI內容平臺,支持通過自然語言及圖片輸入,生成高質量圖像及視頻。

據悉,字節計劃后續把更多資源向更多模態的產品形態轉移,即夢會承擔更大的希望。

再來看B端。如今大模型的競爭已陸續進化為體系之戰——要構建起一個企業真正能用的大模型,需要具備構建算力、數據治理、模型訓練、場景落實、應用搭建、持續運營、安全合規整套能力,還要會打造各種標準化軟件產品,比如數字人、客服助手、代碼助手等,以及場景落地中的軟硬結合產品。

簡單來說,大模型在B端的落地,難就難在“交付”,需要大模型廠商首先成為一個“六邊形戰士”。

從企業的視角來看,現階段大家對大模型的訴求也在變得更加務實,不僅關注模型技術的領先性,也要看如何融合到業務場景,如何降本增效解決實際問題。

圖片

圖源《2024 中國行業大模型市場報告》 

科大訊飛的解題路徑,為我們提供了一個透視大模型落地B端的觀察窗口。

“為什么我們中標數量第一,而且中標比例越來越高?因為很多企業只能做到第三步即訓練模型,后面的幾步與我們差距很大,即使能做到,他們實際上整理數據和訓練模型的能力,與我們差距也很大。”科大訊飛創始人劉慶峰此前如此表示。

這對應的是,科大訊飛為企業大模型構建提供了頂層規劃到執行落地的全套解決方案:“建算力、理數據、訓模型、落場景、保安全、精運營”。

在算力層面,2023年時,科大訊飛和華為聯合做了中國第一個萬卡算力集群“飛星一號”,在昇騰910B的基礎上,攻克了諸多疑難雜癥,解決了500多次基礎軟硬件問題、模型適配問題等,使得大模型訓練從對標A100/A800的20%-30%提升到了90%以上。

2024年10月,科大訊飛聯合華為、合肥市大數據資產運營有限公司打造的國產超大規模智算平臺“飛星二號”,也正式啟動,將帶來新模型新算法的持續適配,以及智算集群規模的再次躍遷。

剛剛發布的深度推理模型X1,正是基于“飛星一號”打造了完全適配華為昇騰算力的深度推理模型訓練框架,突破了樹搜索加速、異步推理調度等技術難題,用更少算力實現了業界一流效果,多項指標國內第一,是國產算力集群對標英偉達集群的又一關鍵里程碑。

在“理數據、訓模型”層面,科大訊飛完整的工具鏈也大幅提升了效率——數據清洗效率提升了24倍、數據構建效率提升了90%、場景優化的平均效果提升了30%、知識采編效率提升了5倍。

再到更關鍵的行業場景落地中,截至2024年10月,科大訊飛已經與各頭部企業共建了20多個行業大模型,覆蓋了超300個應用場景。

劉慶峰還提到,這些已經落地的實際應用案例,已經形成相互借鑒和復用的規模效應,“每個企業搭建后,我們都會找到很多可復用的給其他企業。很多央國企頭部企業在這個行業做完后,可推廣給全行業,也可以在不同行業相互借鑒。”

由此可以預見,訊飛星火大模型在B端的落地,某種程度上像是星星之火,從長遠視角來看,或將為科大訊飛帶來更充足的想象空間。

3、商業化大考在即,領跑者加速邁向“正向循環”

大模型競速賽走到現在,另一個越來越清晰的事實是,淘汰賽已然陸續上演。

這一背景下,無論是To C市場還是To B市場,在日益白熱化的市場競爭中,領先者持續維持競爭優勢、追趕者抹平分差奮起直追的路徑,基本只有一條:

保持在技術側的敏銳度,在迭代和升級速度上打“持久戰”,做好大模型技術與應用、場景的融合。

這也正是科大訊飛和字節跳動正在做的事情。

前段時間的科大訊飛全球1024開發者節期間,除了發布訊飛星火4.0 Turbo外,科大訊飛還首發了10項基于訊飛星火底座能力的產品與創新應用:

包括定義了多模AIUI標準,發布超擬人數字人,發布星火多語言大模型、訊飛星火醫學影像大模型、汽車端側星火大模型,等等。

再到1月15日,科大訊飛又迎來了多項新的技術升級。

它發布了星火深度推理模型X1,是當前業界全國產算力平臺上唯一的深度推理模型。此前X1參加了小初高(含競賽)、大學(含競賽)、AIME、MATH500多多項考試,交出了亮眼的成績單:用更少的算力,達到業界一流效果,多項指標國內第一。

此外,科大訊飛也發布了國內首個具有端到端語音同傳能力的大模型——星火語音同傳大模型。

星火語音同傳大模型支持不同時延的翻譯模式,在長達5H的音視頻測試中,8s時延模式在內容完整度、信息準確度等評價維度超過了谷歌的Gemini2.0、OpenAI的GPT-4o等國外主流大模型。

基于不同行業龍頭企業的落地訴求、C端2億多用戶的真實反饋,訊飛星火4.0 Turbo也進行了新一輪升級,在七大核心能力上實現了全面提升。

圖片

其中,訊飛星火4.0 Turbo升級版的文本生成能力提升了3.2%、語言理解能力提升了4.5%、知識問答能力提升了4.7%、邏輯推理能力提升了2.6%、數學能力提升了10.5%、代碼能力提升了3.5%、多模態能力提升了1.6%。

此外,在長文本能力和圖文能力上,訊飛星火也進行了升級,還首發了混域知識搜索技術——無論個人知識、企業知識、業務系統數據、精品行業數據,還是互聯網信息,一次提問,可以拿到綜合搜索后的結果,信息搜索的效率實現了極大提升。

可以看到,基于底座能力的持續升級,科大訊飛在B端不同行業不同場景的落地廣度還在拓寬,深度還在延展,價值也在持續釋放。

在醫療行業,基于訊飛星火醫學影像大模型打造的智能醫學影像助手,在智能質控環節能幫助影像技師快速評估圖像質量,及時糾正問題;在智能診斷環節,能幫助影像醫師快速生成診斷報告;在智能讀片環節,也能通過相關問答,幫助臨床醫師制定診療方案。

在司法場景里,法律大模型能賦能庭審筆錄制作、裁判文書編寫、法條類案檢索等司法場景,和星火通用大模型相比,效率提升從61.7%提升到了87.9%。

這一過程中,科大訊飛對大模型落地路徑的長遠規劃,也想得更清楚了。

比如在讓大模型的能力更好落地上,劉慶峰此前表示,“今天是一個通用模型和專用模型相結合、端側模型和云端模型相結合、軟件和硬件相結合的、全新的大模型落地時代。”

比如它不僅僅是希望自己能夠成為大模型浪潮中走得走快的一家,也希望幫助更多企業走的更快。首個同傳大模型助力中國企業出海,就是一個鮮明的例子。

字節跳動當下正加速構建的,某種程度上也是這樣一條“正向循環”的未來路徑——

通過更大規模、更大決心的投入,推動大模型技術的快速迭代與升級,進而賦能到C端用戶、B端客戶,哪怕C端用戶的回報周期相對較長,但用耐心換取未來,再用商業化反哺技術投入。

而在技術這一基石之上,字節跳動做C端應用的邏輯,與科大訊飛深入B端的邏輯,本質上是相似的——科大訊飛在努力離客戶更近、字節跳動在努力離用戶更近。

這種做產品和服務的姿態,是字節跳動幾乎只用半年時間就后來居上的根源,也是科大訊飛“領先一步,超前一路”的根源。

(本文頭圖來源于字節跳動官網、科大訊飛官方微博。) 

       原文標題 : 字節跳動與科大訊飛:大模型之戰的AB面

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號