新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

顫抖吧人類,AI仍在加速狂奔

2026-06-15 10:06
光錐智能
關注

 

圖片

大模型的下一關,是讓物理AI成真。 

文|魏琳華 

編|王一粟

沒錯兒,AI仍然在加速狂奔。

2016年,深度學習爆發了僅一年,就幾乎停滯不前。2026年,爆發了4年的大模型依然沒有觸及上限。

在智源大會2026現場,光錐智能看到,從模型、軟硬件到產品,一切都在為了AI從數字世界“跑”進物理世界努力。

一方面,Scaling Law穩定發揮、推動大語言模型和多模態模型依然在發展發展,AI行業已經進入了追逐世界模型的階段。只是當前技術路線、數據等問題懸而未決,還需要可能至少3-5年時間探索。

另一方面,Agent取得的突破加速了AI在現實場景中的落地。隨著Agent達到了可用階段,行業正在推進其在醫療、會議等場景的應用。為了讓Agent從可用走向好用,軟硬件協同也成了關鍵。在智源大會的展臺現場,芯片廠商占據了“半壁江山”。幾乎頭部的國產AI芯片悉數到場。

圖片

“我們正站在一個新的歷史臨界點上。人工智能不再只是改造某個行業的工具,而是正在成為重構世界的底層力量。AI Coding、自主智能體、模型自進化,正在打開AI、創造AI的可能性。世界模型、具身智能和機器人,則讓智能從數字世界延伸到物理世界。”智源研究院院長王仲遠說。

這場底層力量重構'的浪潮里,到底在發生什么?

智源大會的第一天,在場嘉賓們給出了這個答案:AI正在從“會聊天”走向“會干活”。Scaling Law還在繼續,技術方向尚未收斂的世界模型成為下一階段的重心,而智能體已經從可用開始走向好用,也有諸多問題等待優化。

AI不僅技術沒到天花板還學會了自我進化

過去一年,隨著高質量互聯網文本數據被消耗殆盡,行業內彌漫著一種“Scaling Law(縮放定律)即將觸頂”的悲觀情緒。

在智源大會的多場論壇中,“Scaling Law的紅利是否縮小”頻繁被提及,多位嘉賓均否定了這一說法。

“我還是比較堅信Scaling還遠沒有到盡頭。”銀河通用創始人兼CTO王鶴說,“今天回過頭來看,Scaling Law沒有失效,只是它變得更加多樣化。”

在一系列新發布的大語言模型上,Scaling仍然在繼續發揮作用。以Anthropic最近發布的Fable 5分析,小米羅福莉表示,這個模型本身就是科學推進Scaling的產物。它是大模型在參數規模、合成數據和強化學習三個維度結合得到的擴展成果。

“我們猜測,Fable 5本身的參數規模應該是目前最大(規模)的開源模型的幾倍,其次在Test-Time Scanning(推理時擴展)或強化學習上也投入了強大算力。此外,由人和Agent產生的合成數據,讓數據規模達到了新量級。”羅福莉說。

圖片

于多模態領域,Scaling帶來的模型性能提升同樣效果顯著。生數科技創始人兼首席科學家朱軍表示,數據質量、模型尺寸還有大規模訓練,都會給模型帶來提升。在基礎模型能力提升的基礎上,模型學習物理規律、3D場景的理解也會更加高效。

Scaling持續生效的同時,伴隨AI Coding逐漸成熟、Agent加速落地,AI自進化趨勢明顯,從寫代碼升級到自行完成產品的迭代更新。

“人類大量數字世界底層就是通過代碼構成的,AI Coding有了真正實質上的進步并且成為主流,意味著所有在數字世界的東西,AI都有可能逐步接管。”王仲遠說。

海內外,用AI完成產品更新已經成為常態。

海外,Anthropic中超過80%合并代碼由Claude完成,國內,騰訊、百度等一眾公司的代碼工作交由AI完成。百度搭子Dumate產品總架構師李景秋告訴光錐智能,Dumate的90%代碼由AI完成,產品從立項到內測花了一周時間,再用一周時間完成了發布版本。

“我們在年初的時候其實就已經覺得Agent可能會迎來爆發式發展,所以一開始做了非常多圍繞 Agent 應用的規劃。”李景秋對光錐智能說,“但我們沒想到會這么時不我待——幾乎到了剛做完規劃、剛把產品線條拉起來的時候,通用智能體龍蝦就火了,帶動了大量用戶需求。”

“如果說模型決定了智能體的能力,那么Harness就決定了智能體能力的上限。”李景秋說。“它的難點在于需要在模型基礎上進一步做好問題的澄清、驗證和反饋。”

比如,如果只靠模型理解問題,它難免會有局限性。Harness需要做的就是完善和豐富用戶簡單的一句話指令,讓模型能夠更好地理解需求,這里面需要Harness發揮意圖理解能力,并在拿到任務后,設計好接下來的任務流程,再調度模型執行。這個過程中可能需要結合人工干預和糾偏,再在任務完成前做好檢查。

世界模型大模型的下一個關鍵戰場

沿著數字世界的邊界向外突圍,世界模型成為了大模型的下一個關鍵戰場。

“當前還沒有哪一個世界模型真正能夠讓人感覺特別驚艷,解決真實物理世界的各種問題。”王仲遠說。

對于處在發展初期的世界模型來說,針對世界模型的技術,行業目前沒有完全達成共識。且在技術路線尚未收斂的情況下,還有一系列亟待解決的問題。以數據為例,王仲遠舉例,到底是需要視頻數據、仿真數據還是真實物理世界的數據,大家還沒有找到方法路徑。

以銀河通用為例,王鶴在現場介紹了他們對合成數據的應用。

“在WAM(World Action Model,即世界動作模型)范式尚未出現前,我們在VLA范式里,先用合成數據,針對抓取這件事做了大量的嘗試。”王鶴說,“我們用仿真數據10億幀證明了:只要你把數據Scale到這個程度,你就可以完全實現zero-shot(零樣本學習),在真實世界隨便給我一個東西,就能搞定抓取。”

針對世界模型的發展情況,智源研究院預判“至少還需要好幾年時間”,未來三到五年都會是世界模型持續演進和迭代的階段。

幾年內,行業里出現了多種不同技術路線的世界模型,且發展各有千秋。

以多模態世界模型為例,朱軍表示,視頻模型和世界模型關系緊密,因為世界模型需要具備看懂并理解狀態、預測、行動三大能力。而在當前能夠接觸到的訓練數據中,和世界模型最相關的就是視頻數據。

在各類技術路線分化、行業尚未形成共識的情況下,智源研究院將世界模型分為四類:

第一類是以語言為中心的世界模型,把其它模態、其它能力映射到語言空間,包括大語言模型、VLM、VLA等;

第二類是以像素為中心的世界模型,視頻生成本質上是預測下一個畫面幀,但視頻生成模型不等于世界模型,它和世界模型是相關的,今年可能會非;鸬腤orld Action Model(WAM)都是以像素為中心演進;

第三類是以三維結構為中心的世界模型,包括3D重建就是單純的三維世界;

第四類是以視覺表征為軸心的世界模型。

圖片

目前,智源研究院正在探索“第五類”路徑——以語言為中心和以視覺表征為中心的融合,即潛空間表征,相當于把文本、圖像等一系列信息壓縮到向量空間中,以表征各種真實物理世界的狀態。

“將來統一的潛空間建模不僅僅是視覺空間,而是全模態潛空間,很有可能是世界模型真正下一個可能的路徑。”王仲遠說。

智源研究院在大會上介紹了正在研發中的世界模型——悟界·Physis-v0.1版本,它以物理空間建模,實現下一個物理狀態的預測為中心。它的定位是全球首個通用世界基座模型,強調“物理正確、動作因果可溯、長時序一致、通用泛化”四項關鍵能力。

圖片

目前,該模型還在訓練階段,下半年智源將持續分享進展,在訓練完成以后開源模型。

從“可用”邁向“好用”智能體還有更多關要闖

模型側,世界模型的進展推動物理AI的實現;產品側,Agent(智能體)成為AI走進大眾生活的關鍵落地產品。

從被稱為“智能體元年”的2025年開始,Agent已經出現了一部分讓人印象深刻的產品,有了爆發的苗頭出現,但“龍蝦們”今年的潑天熱度,還是出乎意料。

“我們年初就已經覺得Agent可能會迎來爆發,所以做了非常多圍繞Agent應用的規劃。”李景秋對光錐智能說,“但我們沒想到會這么時不我待——幾乎到了百度剛做完規劃、剛把產品線條拉起來的時候,通用智能體龍蝦就火了,帶動了大量用戶需求。”

比起去年智能體還處在執行狀態,今年的智能體顯然變得更主動、更會辦事兒,可以幫助用戶主動執行更復雜的任務。

今年的智源大會上,智源研究院也發布了四款偏向垂類的智能體:全球首個面向心臟磁共振的輔助診斷智能體BAAI Cardiac Agent,通過融合多模態能力和醫生專業知識,輔助醫生完成決策;自主研究智能體AREX應用于科研領域;幫助用戶實時聽會、捕捉要點的智能體SoulAgent;以及面向有害蛋白獲取的風險發現智能體。

圖片

其中,以聽會智能體為例,光錐智能測試了它總結不同會議內容的能力。SoulAgent確實對會議內容做出了簡單的總結。雖然不及紀要完整,但核心觀點無誤。對于這種分論壇時間出現重合的情況比較適合。

圖片

不過,當前智能體在技術方面還存在諸多亟待進一步優化的問題。南洋理工大學校長講席教授安洋提及,要維持智能體能力繼續提升,目前最重要的還是和上下文工程相關的部分,比如Memory(記憶)、編排等等。

智能體分論壇現場,去年鮮少被關注、今年熱度頗高的Harness(直譯為馬挽具,指圍繞智能體搭建的一整套工程化框架或環境)成為了現場提及的高頻關鍵詞之一。

“如果說模型決定了智能體的能力,那么Harness就決定了智能體能力的上限。”李景秋說。“它的難點在于需要在模型基礎上進一步做好問題的澄清、驗證和反饋。”

比如,如果只靠模型理解問題,它難免會有局限性。Harness需要做的就是完善和豐富用戶簡單的一句話指令,讓模型能夠更好地理解需求,這里面需要Harness發揮意圖理解能力,并在拿到任務后,設計好接下來的任務流程,再調度模型執行。這個過程中可能需要結合人工干預和糾偏,再在任務完成前做好檢查。

簡而言之,如同一個真人助理,其中的每一步細節都需要產品針對Harness進行打磨,才能進一步提升Agent的執行效果。

當前,Agent還處在初期發展階段,能夠預見的是,這個行業的進步空間很大,無論是模型能力的提升,還是工程細節的夯實,都將為Agent辦事能力進一步添磚加瓦。

       原文標題 : 顫抖吧人類,AI仍在加速狂奔

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號