AI新王與舊王：一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭

誰能更快轉(zhuǎn)動那個飛輪？

文｜徐鑫

編｜任曉漁

時隔三年，大反轉(zhuǎn)。

上周一，OpenAI CEO山姆·奧特曼在內(nèi)部宣布啟動“紅色代碼”行動，推遲其他一切產(chǎn)品開發(fā)專注ChatGPT，以應(yīng)對來自谷歌和其他對手的沖擊。三年前此時，ChatGPT剛問世，拉響紅色警報(bào)的是谷歌這家老牌人工智能巨擘。

攻守易勢，恰恰映射出AI競爭當(dāng)下進(jìn)入的新周期。

OpenAI拉響警報(bào)，在于這些大模型賽道的開啟者，突然發(fā)現(xiàn)自己通過不斷定義新戰(zhàn)場，圈用戶建生態(tài)形成的領(lǐng)先優(yōu)勢，正被人工智能舊王谷歌所逐漸侵蝕。

拉長時間線看，相比OpenAI這類在算法層面奪得先聲的公司,谷歌擁有的場景和生態(tài)能力當(dāng)下在拉鋸戰(zhàn)里占據(jù)主動。場景-數(shù)據(jù)與大模型轉(zhuǎn)動起來的效果超出了OpenAI的預(yù)期。

在國內(nèi)，同樣的情形也在上演。可靈憑借著快手在APP時代的數(shù)據(jù)沉淀和場景快速從視頻生成賽道脫穎而出，而快手又為可靈健康造血以及模型迭代提供了閉環(huán)場景。群核科技憑借著應(yīng)用時代積累的海量物理正確的三維數(shù)據(jù)，在空間智能時代在全球嶄露頭角。甚至最近大火的豆包手機(jī)，也讓許多人意識到APP場景、數(shù)據(jù)在AI時代也關(guān)乎大模型能力閉環(huán)。

國內(nèi)外無論是AI原生玩家還是老牌巨頭，都在紛紛加速基于場景，構(gòu)建從數(shù)據(jù)-模型到生態(tài)能力的閉環(huán)。

而那些能在競爭里將“場景理解”有效轉(zhuǎn)化為“智能理解”的企業(yè)，有望率先定義AI戰(zhàn)爭的下一章。

紅色警報(bào)背后，新王是舊王？

時隔三年，硅谷再次響起了紅色警報(bào)。

8月問世的Nano Banana以刷屏級表現(xiàn)驅(qū)動了Gemini的用戶規(guī)模增長。9月13日，Gemini成功登頂美國地區(qū)AppStore免費(fèi)榜總榜，并于同日在其他77個國家和地區(qū)免費(fèi)榜位居第一。

11月谷歌在官方博客中提及Gemini月活躍用戶突破6.5億，這個數(shù)字較7月谷歌財(cái)報(bào)發(fā)布時公布的4.5億月活用戶（相比此前季度50%增長）再出現(xiàn)大幅增長，顯著縮小了與ChatGPT的8億月活差距。

人工智能之父Hinton日前對BusssinessInsider鮮明表達(dá)了對這場戰(zhàn)爭的態(tài)度，他甚至驚訝于谷歌到現(xiàn)在才翻身，“谷歌制造自己的芯片，有很多非常優(yōu)秀的研究員，顯然還有大量數(shù)據(jù)和數(shù)據(jù)中心”，因此谷歌會贏得戰(zhàn)爭。

一位AI行業(yè)資深人士告訴數(shù)智前線，場景和數(shù)據(jù)優(yōu)勢在當(dāng)下的智能競爭中是很重要的一環(huán)。谷歌此前的應(yīng)用場景里沉淀了大量用戶搜索意圖數(shù)據(jù)，天然適配強(qiáng)化學(xué)習(xí)技術(shù)。用戶基于搜索的結(jié)果會有行為反饋，比如十個結(jié)果會點(diǎn)幾下，這種“決策-結(jié)果-反饋”，完美適配RLHF/RLAIF。在Scaling Law越來越重視后訓(xùn)練強(qiáng)化學(xué)習(xí)的背景下，它對模型智能至關(guān)重要。

可以說，AI戰(zhàn)爭，已經(jīng)不再是單一維度的模型參數(shù)規(guī)模的競爭，應(yīng)用時代的積累的生態(tài)與分發(fā)優(yōu)勢、技術(shù)與數(shù)據(jù)的閉環(huán)，產(chǎn)品協(xié)同與場景落地，都左右著局勢。

無獨(dú)有偶，國內(nèi)戰(zhàn)場，同樣的情形也在上演。

無論是千問期望協(xié)同阿里體系內(nèi)高德、閃購等生態(tài)力量，打造一個會辦事的AIToC入口，還是豆包手機(jī)的Agent奇襲手機(jī)APP引發(fā)一眾超級應(yīng)用彈壓，都顯示出，AI時代的硝煙與上一個時代的戰(zhàn)局有著千絲萬縷的聯(lián)系。

實(shí)際上，視頻生成領(lǐng)域去年已經(jīng)上演過類似的腳本。

去年2月Sora的Demo視頻讓生成的人物、場景第一次真正地動了起來，而不再是有動效的圖片，OpenAI很自然地成了賽道的定義者。

之后的幾個月里，海內(nèi)外各路玩家及新興創(chuàng)業(yè)團(tuán)隊(duì)紛紛推出視頻生成類產(chǎn)品。去年6月，快手加入賽道，第一次凸顯出了場景和數(shù)據(jù)優(yōu)勢對戰(zhàn)局的影響。

不同于當(dāng)時Sora是期貨，可靈能真正試用，且效果經(jīng)驗(yàn)，生成時長還達(dá)到分鐘級，這種節(jié)奏超過了原先的賽道定義者OpenAI。快手官方今年8月在財(cái)報(bào)發(fā)布會上提到，可靈AI單季度收入突破2.5億元。

與之對比，OpenAI的Sora1去年12月才上線，Sora2今年9月30日上線，推出后雖然收獲了一大票稱贊，但這位曾經(jīng)的市場教育者要從“玩具”進(jìn)化成“工具”挑戰(zhàn)重重——最近a16z合伙人Olivia Moore展示了一張APP數(shù)據(jù)監(jiān)測服務(wù)商Sensor Tower的截圖顯示，Sora的30天用戶留存率1%，60天用戶留存率接近0%。

擁有場景和應(yīng)用生態(tài)在AI時代的價值由此可見一斑。快手此前并不算AI第一梯隊(duì)玩家，但基于APP時代海量的場景沉淀和數(shù)據(jù)積累，快手沿襲Sora探出來的路，成功打造了一款有全球影響力的產(chǎn)品。

這也讓很多分析人士看到，中國過去十余年數(shù)字經(jīng)濟(jì)發(fā)展所沉淀下來的多元，豐富的場景及數(shù)據(jù)優(yōu)勢在當(dāng)下AI競爭里的價值和意義。同時，一些人認(rèn)為，應(yīng)該重估那些上一個應(yīng)用時代拼出來的場景和數(shù)據(jù)的價值。

不過，這當(dāng)然并不意味著僅憑數(shù)據(jù)和場景就能自動贏得戰(zhàn)爭。局勢的真實(shí)情況就像谷歌和OpenAI的位置輪替一樣，基模更迭如同出回合制決斗，各方都在加速補(bǔ)課，看誰能更快轉(zhuǎn)動那個飛輪。

是AI原生玩家們基于AI原生能力穿透用戶心智，構(gòu)建出用戶與AI迭代的閉環(huán)，還是上一個時代的老炮們依托場景數(shù)據(jù)積累，快速將場景和數(shù)據(jù)優(yōu)勢轉(zhuǎn)換成模型優(yōu)勢，比拼的還是決心、敏捷和執(zhí)行力。

一場圍繞著數(shù)據(jù)飛輪的纏斗已經(jīng)打響。

空間智能，呼喚智能飛輪

作為AI發(fā)展演進(jìn)的前沿賽道以及人工智能的下半場，空間智能領(lǐng)域里同樣的邏輯正在復(fù)現(xiàn)——場景、數(shù)據(jù)和智能能否形成迭代閉環(huán)，正關(guān)乎行業(yè)能否加速從實(shí)驗(yàn)室走向產(chǎn)業(yè)規(guī)模落地。

一位行業(yè)資深人士告訴數(shù)智前線，目前整個空間智能領(lǐng)域可以類比為大語言模型的GPT-2階段。在這一階段里，技術(shù)路線激烈碰撞，基礎(chǔ)能力還在積累，行業(yè)的Scaling Law仍待發(fā)現(xiàn)。

全行業(yè)需要努力實(shí)現(xiàn)技術(shù)路線收斂，同時破解高質(zhì)量大規(guī)模的3D數(shù)據(jù)稀缺瓶頸，基于場景加速數(shù)據(jù)-模型迭代，才能推動空間智能的涌現(xiàn)。

用更直白的話說，整個行業(yè)都在呼喚著空間智能領(lǐng)域能構(gòu)建起一個數(shù)據(jù)飛輪。

行業(yè)內(nèi)玩家正從不同層面來加速這一進(jìn)程。

比如人工智能教母李飛飛的世界模型Marble、GoogleDeepMind推出的世界模型Genie3、Meta的三維重建模型SAM3D和國內(nèi)的騰訊混元3D世界模型以及英偉達(dá)的Cosmos世界基礎(chǔ)模型（WFM）等，它們的能力涉及到空間的重建、生成、推理、交互等多個層面。

但作為一個還處在發(fā)展早期的領(lǐng)域，這些不同層面的能力很少在一個體系內(nèi)能讓人真正廣泛地用起來。這無疑不利于整個行業(yè)內(nèi)構(gòu)建數(shù)據(jù)飛輪，實(shí)現(xiàn)技術(shù)落地。

而國內(nèi)最早做物理世界模擬的群核科技率先做了一個決定：將14年來沉淀的底層空間能力匯聚在自己的Aholo空間智能開放平臺，全面開放給行業(yè)。其中包括其模型層和工具層的空間重建、空間生成、空間編輯與空間理解在內(nèi)的能力，將以API/SDK的形式逐步對外開放。

空間重建借助3DGS技術(shù)能夠快速1：1復(fù)制物理世界到數(shù)字世界。空間生成則是從0到1創(chuàng)造3D空間，幾句話描述或者給模型一張照片，模型就能生成三維場景。今年國內(nèi)外空間生成模型動態(tài)頻頻，是空間智能領(lǐng)域“新王們”的一個核心押注方向。空間編輯解決了當(dāng)下AIGC無法二次編輯調(diào)整的痛點(diǎn)，讓AI生成的空間內(nèi)容不再是“黑箱產(chǎn)物”。空間理解則是包括具身智能等智能體看懂眼前物理世界的基本能力。

外界看來，這四重能力集中在一個平臺，其實(shí)有助于加速行業(yè)推進(jìn)空間智能的應(yīng)用和落地進(jìn)程，加速基于場景數(shù)據(jù)-應(yīng)用反饋與迭代的閉環(huán)。

原來重建工作主要靠CAD圖紙等去做一些數(shù)字化，真實(shí)世界數(shù)據(jù)與數(shù)字世界數(shù)據(jù)之間有GAP。而3DGS技術(shù)和空間生成能力協(xié)同，相當(dāng)于打開了內(nèi)容的新的源頭，打破了過往高質(zhì)量3D數(shù)據(jù)的瓶頸。

“源頭打開了，才會有人把內(nèi)容導(dǎo)入到工具平臺，用戶才會進(jìn)來完成后面的編輯跟推理工作”，一位行業(yè)資深人士指出。

空間編輯可以視作數(shù)據(jù)優(yōu)化與交互界面。此前群核就已通過酷家樂等產(chǎn)品載體將之用在空間設(shè)計(jì)、電商3DAI設(shè)計(jì)、工業(yè)柔性制造等場景中。

現(xiàn)在進(jìn)一步對外開放，隨著更多數(shù)據(jù)導(dǎo)入，有了編輯工具就像語言模型的多輪對話能更好校準(zhǔn)用戶需求提升回答準(zhǔn)確性一樣，專業(yè)人士借助工具鏈去做更加深度編輯。比如把商品放入到構(gòu)建好的數(shù)字空間里，設(shè)計(jì)師能自由編輯，產(chǎn)出更符合個性需求的高品質(zhì)內(nèi)容物料。

“市場才剛剛開始，談不上競爭。行業(yè)當(dāng)下最需要的是底層技術(shù)的‘賣水人’，我們希望空間智能能夠更快向前。”群核科技董事長黃曉煌在媒體溝通環(huán)節(jié)告訴數(shù)智前線。

隨著算力的提升，當(dāng)下無論是空間設(shè)計(jì)、XR、影視短劇、文化遺產(chǎn)保護(hù)等3D內(nèi)容創(chuàng)作領(lǐng)域，還是工業(yè)數(shù)字孿生、機(jī)器人仿真訓(xùn)練等對3D結(jié)構(gòu)化數(shù)據(jù)有高要求的場景，對高質(zhì)量、可交互、可計(jì)算的3D場景和數(shù)據(jù)的需求都在急劇攀升。

那些能夠把物理世界和數(shù)字世界更好連接起來的技術(shù)能夠開放出來，無疑對行業(yè)早期是一個巨大的驅(qū)動。

一家公司的飛輪和中國AI的飛輪

而對群核這家公司來說，隨著越來越多用戶使用，反饋沉淀，其自身的數(shù)據(jù)飛輪正在增強(qiáng)。

這家從空間設(shè)計(jì)軟件起家的公司，現(xiàn)在已經(jīng)是全球最大的空間設(shè)計(jì)平臺。群核有著全球最多元龐大的空間場景沉淀，并且，由于空間設(shè)計(jì)最終都要真實(shí)落地，讓其沉淀的數(shù)據(jù)具備了獨(dú)特的物理正確屬性，符合物理規(guī)律。在空間智能時代，這些都成為了構(gòu)建強(qiáng)大空間智能模型的燃料。今年它也正式推出了業(yè)界首個專注于3D室內(nèi)場景認(rèn)知與生成的空間大模型。可以說，群核自身已經(jīng)形成了一個正向循環(huán)的飛輪。

空間編輯工具帶來了空間場景和數(shù)據(jù)的沉淀，海量的數(shù)據(jù)加速了空間大模型迭代。而隨著此次更多的能力對外開放，群核完成了數(shù)據(jù)-大模型-工具能力的全鏈路開放，這家公司又有機(jī)會獲得更豐富更開放多維的場景和數(shù)據(jù)沉淀，真正成為一個空間智能的基礎(chǔ)設(shè)施平臺。正向循環(huán)的數(shù)據(jù)飛輪有望更加速運(yùn)轉(zhuǎn)。

目前在一些場景里，群核已經(jīng)與一些合作伙伴探索測試基于Aholo平臺四項(xiàng)能力在同一個工作流去應(yīng)用落地。比如工廠數(shù)字孿生和仿真場景，一些成熟的工廠需要引入智能化設(shè)備。基于群核這套能力去做模擬仿真，可以大大降低不合理設(shè)計(jì)帶來的成本浪費(fèi)。

另一方面，從數(shù)據(jù)到模型到底層能力的全面開放，對群核而言，也意味著從3D空間軟件提供商走向了空間智能服務(wù)提供商。

黃曉煌提到，空間智能此前更多是群核內(nèi)生的能力，之所以通過Aholo平臺開放出來，是因?yàn)樗麄冋J(rèn)知到時代在發(fā)生變化。能力開放后滾動而來的新的數(shù)據(jù)和能力進(jìn)一步讓群核的應(yīng)用有了迭代。

他們剛剛發(fā)布的3D AI內(nèi)容創(chuàng)作工具LuxReal就是一個代表。通過空間大模型和工具的相互補(bǔ)充，LuxReal或許能夠補(bǔ)足現(xiàn)有視頻生成模型時空不一致和不可控的問題。這或許是全球第一個3D 視頻生成Agent。

“今年以來包括Deepseek在內(nèi)的一批公司都一開始就把底層能力暴露出來，大家有一種一起推動行業(yè)往前走的勢頭，我們也順勢而為。”他認(rèn)為，空間智能正處于發(fā)展早期階段，基于開放的平臺，整個行業(yè)能一起解決問題，突破技術(shù)瓶頸。

外界觀察來看，這可能也是當(dāng)下新一批中國公司開放創(chuàng)新浪潮的一個縮影。中國創(chuàng)新企業(yè)正進(jìn)入新的階段，既能參與最前沿賽道最前沿戰(zhàn)場的創(chuàng)新，也以開放和共享的姿態(tài)，有成為行業(yè)基礎(chǔ)設(shè)施的能力和意愿。

這種角色變化里其實(shí)也能窺見中國企業(yè)在人工智能時代里的一種可能的成長路徑。

以群核和快手這批企業(yè)為例，過往在應(yīng)用時代，基于場景沉淀出數(shù)據(jù)，今天正在成為推進(jìn)AI發(fā)展的重要燃料，它進(jìn)一步帶動了企業(yè)在新興賽道智能飛輪的形成。可以說，應(yīng)用優(yōu)勢，在全新的人工智能時代仍有回響。

中國整體在移動互聯(lián)網(wǎng)時代強(qiáng)大的應(yīng)用場景和海量數(shù)據(jù)積累，能否推動中國AI更快構(gòu)建這種場景-數(shù)據(jù)和智能的飛輪，實(shí)現(xiàn)從場景到智能的躍遷？從這個意義上看，當(dāng)下中國AI也需要加速構(gòu)建這一輪智能飛輪。

原文標(biāo)題 : AI新王與舊王：一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭