誰能更快轉(zhuǎn)動那個飛輪?
文|徐鑫
編|任曉漁
時隔三年,大反轉(zhuǎn)。
上周一,OpenAI CEO山姆·奧特曼在內(nèi)部宣布啟動“紅色代碼”行動,推遲其他一切產(chǎn)品開發(fā)專注ChatGPT,以應(yīng)對來自谷歌和其他對手的沖擊。三年前此時,ChatGPT剛問世,拉響紅色警報(bào)的是谷歌這家老牌人工智能巨擘。
攻守易勢,恰恰映射出AI競爭當(dāng)下進(jìn)入的新周期。
OpenAI拉響警報(bào),在于這些大模型賽道的開啟者,突然發(fā)現(xiàn)自己通過不斷定義新戰(zhàn)場,圈用戶建生態(tài)形成的領(lǐng)先優(yōu)勢,正被人工智能舊王谷歌所逐漸侵蝕。
拉長時間線看,相比OpenAI這類在算法層面奪得先聲的公司,谷歌擁有的場景和生態(tài)能力當(dāng)下在拉鋸戰(zhàn)里占據(jù)主動。場景-數(shù)據(jù)與大模型轉(zhuǎn)動起來的效果超出了OpenAI的預(yù)期。
在國內(nèi),同樣的情形也在上演。可靈憑借著快手在APP時代的數(shù)據(jù)沉淀和場景快速從視頻生成賽道脫穎而出,而快手又為可靈健康造血以及模型迭代提供了閉環(huán)場景。群核科技憑借著應(yīng)用時代積累的海量物理正確的三維數(shù)據(jù),在空間智能時代在全球嶄露頭角。甚至最近大火的豆包手機(jī),也讓許多人意識到APP場景、數(shù)據(jù)在AI時代也關(guān)乎大模型能力閉環(huán)。
國內(nèi)外無論是AI原生玩家還是老牌巨頭,都在紛紛加速基于場景,構(gòu)建從數(shù)據(jù)-模型到生態(tài)能力的閉環(huán)。
而那些能在競爭里將“場景理解”有效轉(zhuǎn)化為“智能理解”的企業(yè),有望率先定義AI戰(zhàn)爭的下一章。
01
紅色警報(bào)背后,新王是舊王?
時隔三年,硅谷再次響起了紅色警報(bào)。
8月問世的Nano Banana以刷屏級表現(xiàn)驅(qū)動了Gemini的用戶規(guī)模增長。9月13日,Gemini成功登頂美國地區(qū)AppStore免費(fèi)榜總榜,并于同日在其他77個國家和地區(qū)免費(fèi)榜位居第一。
11月谷歌在官方博客中提及Gemini月活躍用戶突破6.5億,這個數(shù)字較7月谷歌財(cái)報(bào)發(fā)布時公布的4.5億月活用戶(相比此前季度50%增長)再出現(xiàn)大幅增長,顯著縮小了與ChatGPT的8億月活差距。
人工智能之父Hinton日前對BusssinessInsider鮮明表達(dá)了對這場戰(zhàn)爭的態(tài)度,他甚至驚訝于谷歌到現(xiàn)在才翻身,“谷歌制造自己的芯片,有很多非常優(yōu)秀的研究員,顯然還有大量數(shù)據(jù)和數(shù)據(jù)中心”,因此谷歌會贏得戰(zhàn)爭。
一位AI行業(yè)資深人士告訴數(shù)智前線,場景和數(shù)據(jù)優(yōu)勢在當(dāng)下的智能競爭中是很重要的一環(huán)。谷歌此前的應(yīng)用場景里沉淀了大量用戶搜索意圖數(shù)據(jù),天然適配強(qiáng)化學(xué)習(xí)技術(shù)。用戶基于搜索的結(jié)果會有行為反饋,比如十個結(jié)果會點(diǎn)幾下,這種“決策-結(jié)果-反饋”,完美適配RLHF/RLAIF。在Scaling Law越來越重視后訓(xùn)練強(qiáng)化學(xué)習(xí)的背景下,它對模型智能至關(guān)重要。
可以說,AI戰(zhàn)爭,已經(jīng)不再是單一維度的模型參數(shù)規(guī)模的競爭,應(yīng)用時代的積累的生態(tài)與分發(fā)優(yōu)勢、技術(shù)與數(shù)據(jù)的閉環(huán),產(chǎn)品協(xié)同與場景落地,都左右著局勢。
無獨(dú)有偶,國內(nèi)戰(zhàn)場,同樣的情形也在上演。
無論是千問期望協(xié)同阿里體系內(nèi)高德、閃購等生態(tài)力量,打造一個會辦事的AIToC入口,還是豆包手機(jī)的Agent奇襲手機(jī)APP引發(fā)一眾超級應(yīng)用彈壓,都顯示出,AI時代的硝煙與上一個時代的戰(zhàn)局有著千絲萬縷的聯(lián)系。
實(shí)際上,視頻生成領(lǐng)域去年已經(jīng)上演過類似的腳本。
去年2月Sora的Demo視頻讓生成的人物、場景第一次真正地動了起來,而不再是有動效的圖片,OpenAI很自然地成了賽道的定義者。
之后的幾個月里,海內(nèi)外各路玩家及新興創(chuàng)業(yè)團(tuán)隊(duì)紛紛推出視頻生成類產(chǎn)品。去年6月,快手加入賽道,第一次凸顯出了場景和數(shù)據(jù)優(yōu)勢對戰(zhàn)局的影響。
不同于當(dāng)時Sora是期貨,可靈能真正試用,且效果經(jīng)驗(yàn),生成時長還達(dá)到分鐘級,這種節(jié)奏超過了原先的賽道定義者OpenAI。快手官方今年8月在財(cái)報(bào)發(fā)布會上提到,可靈AI單季度收入突破2.5億元。
與之對比,OpenAI的Sora1去年12月才上線,Sora2今年9月30日上線,推出后雖然收獲了一大票稱贊,但這位曾經(jīng)的市場教育者要從“玩具”進(jìn)化成“工具”挑戰(zhàn)重重——最近a16z合伙人Olivia Moore展示了一張APP數(shù)據(jù)監(jiān)測服務(wù)商Sensor Tower的截圖顯示,Sora的30天用戶留存率1%,60天用戶留存率接近0%。
擁有場景和應(yīng)用生態(tài)在AI時代的價值由此可見一斑。快手此前并不算AI第一梯隊(duì)玩家,但基于APP時代海量的場景沉淀和數(shù)據(jù)積累,快手沿襲Sora探出來的路,成功打造了一款有全球影響力的產(chǎn)品。
這也讓很多分析人士看到,中國過去十余年數(shù)字經(jīng)濟(jì)發(fā)展所沉淀下來的多元,豐富的場景及數(shù)據(jù)優(yōu)勢在當(dāng)下AI競爭里的價值和意義。同時,一些人認(rèn)為,應(yīng)該重估那些上一個應(yīng)用時代拼出來的場景和數(shù)據(jù)的價值。
不過,這當(dāng)然并不意味著僅憑數(shù)據(jù)和場景就能自動贏得戰(zhàn)爭。局勢的真實(shí)情況就像谷歌和OpenAI的位置輪替一樣,基模更迭如同出回合制決斗,各方都在加速補(bǔ)課,看誰能更快轉(zhuǎn)動那個飛輪。
是AI原生玩家們基于AI原生能力穿透用戶心智,構(gòu)建出用戶與AI迭代的閉環(huán),還是上一個時代的老炮們依托場景數(shù)據(jù)積累,快速將場景和數(shù)據(jù)優(yōu)勢轉(zhuǎn)換成模型優(yōu)勢,比拼的還是決心、敏捷和執(zhí)行力。
一場圍繞著數(shù)據(jù)飛輪的纏斗已經(jīng)打響。
02
空間智能,呼喚智能飛輪
作為AI發(fā)展演進(jìn)的前沿賽道以及人工智能的下半場,空間智能領(lǐng)域里同樣的邏輯正在復(fù)現(xiàn)——場景、數(shù)據(jù)和智能能否形成迭代閉環(huán),正關(guān)乎行業(yè)能否加速從實(shí)驗(yàn)室走向產(chǎn)業(yè)規(guī)模落地。
一位行業(yè)資深人士告訴數(shù)智前線,目前整個空間智能領(lǐng)域可以類比為大語言模型的GPT-2階段。在這一階段里,技術(shù)路線激烈碰撞,基礎(chǔ)能力還在積累,行業(yè)的Scaling Law仍待發(fā)現(xiàn)。
全行業(yè)需要努力實(shí)現(xiàn)技術(shù)路線收斂,同時破解高質(zhì)量大規(guī)模的3D數(shù)據(jù)稀缺瓶頸,基于場景加速數(shù)據(jù)-模型迭代,才能推動空間智能的涌現(xiàn)。
用更直白的話說,整個行業(yè)都在呼喚著空間智能領(lǐng)域能構(gòu)建起一個數(shù)據(jù)飛輪。
行業(yè)內(nèi)玩家正從不同層面來加速這一進(jìn)程。
比如人工智能教母李飛飛的世界模型Marble、GoogleDeepMind推出的世界模型Genie3、Meta的三維重建模型SAM3D和國內(nèi)的騰訊混元3D世界模型以及英偉達(dá)的Cosmos世界基礎(chǔ)模型(WFM)等,它們的能力涉及到空間的重建、生成、推理、交互等多個層面。
但作為一個還處在發(fā)展早期的領(lǐng)域,這些不同層面的能力很少在一個體系內(nèi)能讓人真正廣泛地用起來。這無疑不利于整個行業(yè)內(nèi)構(gòu)建數(shù)據(jù)飛輪,實(shí)現(xiàn)技術(shù)落地。
而國內(nèi)最早做物理世界模擬的群核科技率先做了一個決定:將14年來沉淀的底層空間能力匯聚在自己的Aholo空間智能開放平臺,全面開放給行業(yè)。其中包括其模型層和工具層的空間重建、空間生成、空間編輯與空間理解在內(nèi)的能力,將以API/SDK的形式逐步對外開放。
空間重建借助3DGS技術(shù)能夠快速1:1復(fù)制物理世界到數(shù)字世界。空間生成則是從0到1創(chuàng)造3D空間,幾句話描述或者給模型一張照片,模型就能生成三維場景。今年國內(nèi)外空間生成模型動態(tài)頻頻,是空間智能領(lǐng)域“新王們”的一個核心押注方向。空間編輯解決了當(dāng)下AIGC無法二次編輯調(diào)整的痛點(diǎn),讓AI生成的空間內(nèi)容不再是“黑箱產(chǎn)物”。空間理解則是包括具身智能等智能體看懂眼前物理世界的基本能力。
外界看來,這四重能力集中在一個平臺,其實(shí)有助于加速行業(yè)推進(jìn)空間智能的應(yīng)用和落地進(jìn)程,加速基于場景數(shù)據(jù)-應(yīng)用反饋與迭代的閉環(huán)。
原來重建工作主要靠CAD圖紙等去做一些數(shù)字化,真實(shí)世界數(shù)據(jù)與數(shù)字世界數(shù)據(jù)之間有GAP。而3DGS技術(shù)和空間生成能力協(xié)同,相當(dāng)于打開了內(nèi)容的新的源頭,打破了過往高質(zhì)量3D數(shù)據(jù)的瓶頸。
“源頭打開了,才會有人把內(nèi)容導(dǎo)入到工具平臺,用戶才會進(jìn)來完成后面的編輯跟推理工作”,一位行業(yè)資深人士指出。
空間編輯可以視作數(shù)據(jù)優(yōu)化與交互界面。此前群核就已通過酷家樂等產(chǎn)品載體將之用在空間設(shè)計(jì)、電商3DAI設(shè)計(jì)、工業(yè)柔性制造等場景中。
現(xiàn)在進(jìn)一步對外開放,隨著更多數(shù)據(jù)導(dǎo)入,有了編輯工具就像語言模型的多輪對話能更好校準(zhǔn)用戶需求提升回答準(zhǔn)確性一樣,專業(yè)人士借助工具鏈去做更加深度編輯。比如把商品放入到構(gòu)建好的數(shù)字空間里,設(shè)計(jì)師能自由編輯,產(chǎn)出更符合個性需求的高品質(zhì)內(nèi)容物料。
“市場才剛剛開始,談不上競爭。行業(yè)當(dāng)下最需要的是底層技術(shù)的‘賣水人’,我們希望空間智能能夠更快向前。”群核科技董事長黃曉煌在媒體溝通環(huán)節(jié)告訴數(shù)智前線。
隨著算力的提升,當(dāng)下無論是空間設(shè)計(jì)、XR、影視短劇、文化遺產(chǎn)保護(hù)等3D內(nèi)容創(chuàng)作領(lǐng)域,還是工業(yè)數(shù)字孿生、機(jī)器人仿真訓(xùn)練等對3D結(jié)構(gòu)化數(shù)據(jù)有高要求的場景,對高質(zhì)量、可交互、可計(jì)算的3D場景和數(shù)據(jù)的需求都在急劇攀升。
那些能夠把物理世界和數(shù)字世界更好連接起來的技術(shù)能夠開放出來,無疑對行業(yè)早期是一個巨大的驅(qū)動。
03
一家公司的飛輪和中國AI的飛輪
而對群核這家公司來說,隨著越來越多用戶使用,反饋沉淀,其自身的數(shù)據(jù)飛輪正在增強(qiáng)。
這家從空間設(shè)計(jì)軟件起家的公司,現(xiàn)在已經(jīng)是全球最大的空間設(shè)計(jì)平臺。群核有著全球最多元龐大的空間場景沉淀,并且,由于空間設(shè)計(jì)最終都要真實(shí)落地,讓其沉淀的數(shù)據(jù)具備了獨(dú)特的物理正確屬性,符合物理規(guī)律。在空間智能時代,這些都成為了構(gòu)建強(qiáng)大空間智能模型的燃料。今年它也正式推出了業(yè)界首個專注于3D室內(nèi)場景認(rèn)知與生成的空間大模型。可以說,群核自身已經(jīng)形成了一個正向循環(huán)的飛輪。
空間編輯工具帶來了空間場景和數(shù)據(jù)的沉淀,海量的數(shù)據(jù)加速了空間大模型迭代。而隨著此次更多的能力對外開放,群核完成了數(shù)據(jù)-大模型-工具能力的全鏈路開放,這家公司又有機(jī)會獲得更豐富更開放多維的場景和數(shù)據(jù)沉淀,真正成為一個空間智能的基礎(chǔ)設(shè)施平臺。正向循環(huán)的數(shù)據(jù)飛輪有望更加速運(yùn)轉(zhuǎn)。
目前在一些場景里,群核已經(jīng)與一些合作伙伴探索測試基于Aholo平臺四項(xiàng)能力在同一個工作流去應(yīng)用落地。比如工廠數(shù)字孿生和仿真場景,一些成熟的工廠需要引入智能化設(shè)備。基于群核這套能力去做模擬仿真,可以大大降低不合理設(shè)計(jì)帶來的成本浪費(fèi)。
另一方面,從數(shù)據(jù)到模型到底層能力的全面開放,對群核而言,也意味著從3D空間軟件提供商走向了空間智能服務(wù)提供商。
黃曉煌提到,空間智能此前更多是群核內(nèi)生的能力,之所以通過Aholo平臺開放出來,是因?yàn)樗麄冋J(rèn)知到時代在發(fā)生變化。能力開放后滾動而來的新的數(shù)據(jù)和能力進(jìn)一步讓群核的應(yīng)用有了迭代。
他們剛剛發(fā)布的3D AI內(nèi)容創(chuàng)作工具LuxReal就是一個代表。通過空間大模型和工具的相互補(bǔ)充,LuxReal或許能夠補(bǔ)足現(xiàn)有視頻生成模型時空不一致和不可控的問題。這或許是全球第一個3D 視頻生成Agent。
“今年以來包括Deepseek在內(nèi)的一批公司都一開始就把底層能力暴露出來,大家有一種一起推動行業(yè)往前走的勢頭,我們也順勢而為。”他認(rèn)為,空間智能正處于發(fā)展早期階段,基于開放的平臺,整個行業(yè)能一起解決問題,突破技術(shù)瓶頸。
外界觀察來看,這可能也是當(dāng)下新一批中國公司開放創(chuàng)新浪潮的一個縮影。中國創(chuàng)新企業(yè)正進(jìn)入新的階段,既能參與最前沿賽道最前沿戰(zhàn)場的創(chuàng)新,也以開放和共享的姿態(tài),有成為行業(yè)基礎(chǔ)設(shè)施的能力和意愿。
這種角色變化里其實(shí)也能窺見中國企業(yè)在人工智能時代里的一種可能的成長路徑。
以群核和快手這批企業(yè)為例,過往在應(yīng)用時代,基于場景沉淀出數(shù)據(jù),今天正在成為推進(jìn)AI發(fā)展的重要燃料,它進(jìn)一步帶動了企業(yè)在新興賽道智能飛輪的形成。可以說,應(yīng)用優(yōu)勢,在全新的人工智能時代仍有回響。
中國整體在移動互聯(lián)網(wǎng)時代強(qiáng)大的應(yīng)用場景和海量數(shù)據(jù)積累,能否推動中國AI更快構(gòu)建這種場景-數(shù)據(jù)和智能的飛輪,實(shí)現(xiàn)從場景到智能的躍遷?從這個意義上看,當(dāng)下中國AI也需要加速構(gòu)建這一輪智能飛輪。


分享













