新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

<rp id="5rghh"><tbody id="5rghh"></tbody></rp>

<noscript id="5rghh"></noscript>

<noscript id="5rghh"><tbody id="5rghh"></tbody></noscript>

當前位置： OFweek 人工智能網 > 云計算 > 正文

顫抖吧人類，AI仍在加速狂奔

2026-06-15 10:06

大模型的下一關，是讓物理AI成真。

文｜魏琳華

編｜王一粟

沒錯兒，AI仍然在加速狂奔。

2016年，深度學習爆發了僅一年，就幾乎停滯不前。2026年，爆發了4年的大模型依然沒有觸及上限。

在智源大會2026現場，光錐智能看到，從模型、軟硬件到產品，一切都在為了AI從數字世界“跑”進物理世界努力。

一方面，Scaling Law穩定發揮、推動大語言模型和多模態模型依然在發展發展，AI行業已經進入了追逐世界模型的階段。只是當前技術路線、數據等問題懸而未決，還需要可能至少3-5年時間探索。

另一方面，Agent取得的突破加速了AI在現實場景中的落地。隨著Agent達到了可用階段，行業正在推進其在醫療、會議等場景的應用。為了讓Agent從可用走向好用，軟硬件協同也成了關鍵。在智源大會的展臺現場，芯片廠商占據了“半壁江山”。幾乎頭部的國產AI芯片悉數到場。

“我們正站在一個新的歷史臨界點上。人工智能不再只是改造某個行業的工具，而是正在成為重構世界的底層力量。AI Coding、自主智能體、模型自進化，正在打開AI、創造AI的可能性。世界模型、具身智能和機器人，則讓智能從數字世界延伸到物理世界。”智源研究院院長王仲遠說。

這場底層力量重構'的浪潮里，到底在發生什么？

智源大會的第一天，在場嘉賓們給出了這個答案：AI正在從“會聊天”走向“會干活”。Scaling Law還在繼續，技術方向尚未收斂的世界模型成為下一階段的重心，而智能體已經從可用開始走向好用，也有諸多問題等待優化。

AI不僅技術沒到天花板還學會了自我進化

過去一年，隨著高質量互聯網文本數據被消耗殆盡，行業內彌漫著一種“Scaling Law（縮放定律）即將觸頂”的悲觀情緒。

在智源大會的多場論壇中，“Scaling Law的紅利是否縮小”頻繁被提及，多位嘉賓均否定了這一說法。

“我還是比較堅信Scaling還遠沒有到盡頭。”銀河通用創始人兼CTO王鶴說，“今天回過頭來看，Scaling Law沒有失效，只是它變得更加多樣化。”

在一系列新發布的大語言模型上，Scaling仍然在繼續發揮作用。以Anthropic最近發布的Fable 5分析，小米羅福莉表示，這個模型本身就是科學推進Scaling的產物。它是大模型在參數規模、合成數據和強化學習三個維度結合得到的擴展成果。

“我們猜測，Fable 5本身的參數規模應該是目前最大（規模）的開源模型的幾倍，其次在Test-Time Scanning（推理時擴展）或強化學習上也投入了強大算力。此外，由人和Agent產生的合成數據，讓數據規模達到了新量級。”羅福莉說。

于多模態領域，Scaling帶來的模型性能提升同樣效果顯著。生數科技創始人兼首席科學家朱軍表示，數據質量、模型尺寸還有大規模訓練，都會給模型帶來提升。在基礎模型能力提升的基礎上，模型學習物理規律、3D場景的理解也會更加高效。

Scaling持續生效的同時，伴隨AI Coding逐漸成熟、Agent加速落地，AI自進化趨勢明顯，從寫代碼升級到自行完成產品的迭代更新。

“人類大量數字世界底層就是通過代碼構成的，AI Coding有了真正實質上的進步并且成為主流，意味著所有在數字世界的東西，AI都有可能逐步接管。”王仲遠說。

海內外，用AI完成產品更新已經成為常態。

海外，Anthropic中超過80%合并代碼由Claude完成，國內，騰訊、百度等一眾公司的代碼工作交由AI完成。百度搭子Dumate產品總架構師李景秋告訴光錐智能，Dumate的90%代碼由AI完成，產品從立項到內測花了一周時間，再用一周時間完成了發布版本。

“我們在年初的時候其實就已經覺得Agent可能會迎來爆發式發展，所以一開始做了非常多圍繞 Agent 應用的規劃。”李景秋對光錐智能說，“但我們沒想到會這么時不我待——幾乎到了剛做完規劃、剛把產品線條拉起來的時候，通用智能體龍蝦就火了，帶動了大量用戶需求。”

“如果說模型決定了智能體的能力，那么Harness就決定了智能體能力的上限。”李景秋說。“它的難點在于需要在模型基礎上進一步做好問題的澄清、驗證和反饋。”

比如，如果只靠模型理解問題，它難免會有局限性。Harness需要做的就是完善和豐富用戶簡單的一句話指令，讓模型能夠更好地理解需求，這里面需要Harness發揮意圖理解能力，并在拿到任務后，設計好接下來的任務流程，再調度模型執行。這個過程中可能需要結合人工干預和糾偏，再在任務完成前做好檢查。

世界模型大模型的下一個關鍵戰場

沿著數字世界的邊界向外突圍，世界模型成為了大模型的下一個關鍵戰場。

“當前還沒有哪一個世界模型真正能夠讓人感覺特別驚艷，解決真實物理世界的各種問題。”王仲遠說。

對于處在發展初期的世界模型來說，針對世界模型的技術，行業目前沒有完全達成共識。且在技術路線尚未收斂的情況下，還有一系列亟待解決的問題。以數據為例，王仲遠舉例，到底是需要視頻數據、仿真數據還是真實物理世界的數據，大家還沒有找到方法路徑。

以銀河通用為例，王鶴在現場介紹了他們對合成數據的應用。

“在WAM（World Action Model，即世界動作模型）范式尚未出現前，我們在VLA范式里，先用合成數據，針對抓取這件事做了大量的嘗試。”王鶴說，“我們用仿真數據10億幀證明了：只要你把數據Scale到這個程度，你就可以完全實現zero-shot（零樣本學習），在真實世界隨便給我一個東西，就能搞定抓取。”

針對世界模型的發展情況，智源研究院預判“至少還需要好幾年時間”，未來三到五年都會是世界模型持續演進和迭代的階段。

幾年內，行業里出現了多種不同技術路線的世界模型，且發展各有千秋。

以多模態世界模型為例，朱軍表示，視頻模型和世界模型關系緊密，因為世界模型需要具備看懂并理解狀態、預測、行動三大能力。而在當前能夠接觸到的訓練數據中，和世界模型最相關的就是視頻數據。

在各類技術路線分化、行業尚未形成共識的情況下，智源研究院將世界模型分為四類：

第一類是以語言為中心的世界模型，把其它模態、其它能力映射到語言空間，包括大語言模型、VLM、VLA等；

第二類是以像素為中心的世界模型，視頻生成本質上是預測下一個畫面幀，但視頻生成模型不等于世界模型，它和世界模型是相關的，今年可能會非�；鸬腤orld Action Model（WAM）都是以像素為中心演進；

第三類是以三維結構為中心的世界模型，包括3D重建就是單純的三維世界；

第四類是以視覺表征為軸心的世界模型。

目前，智源研究院正在探索“第五類”路徑——以語言為中心和以視覺表征為中心的融合，即潛空間表征，相當于把文本、圖像等一系列信息壓縮到向量空間中，以表征各種真實物理世界的狀態。

“將來統一的潛空間建模不僅僅是視覺空間，而是全模態潛空間，很有可能是世界模型真正下一個可能的路徑。”王仲遠說。

智源研究院在大會上介紹了正在研發中的世界模型——悟界·Physis-v0.1版本，它以物理空間建模，實現下一個物理狀態的預測為中心。它的定位是全球首個通用世界基座模型，強調“物理正確、動作因果可溯、長時序一致、通用泛化”四項關鍵能力。

目前，該模型還在訓練階段，下半年智源將持續分享進展，在訓練完成以后開源模型。

從“可用”邁向“好用”智能體還有更多關要闖

模型側，世界模型的進展推動物理AI的實現；產品側，Agent（智能體）成為AI走進大眾生活的關鍵落地產品。

從被稱為“智能體元年”的2025年開始，Agent已經出現了一部分讓人印象深刻的產品，有了爆發的苗頭出現，但“龍蝦們”今年的潑天熱度，還是出乎意料。

“我們年初就已經覺得Agent可能會迎來爆發，所以做了非常多圍繞Agent應用的規劃。”李景秋對光錐智能說，“但我們沒想到會這么時不我待——幾乎到了百度剛做完規劃、剛把產品線條拉起來的時候，通用智能體龍蝦就火了，帶動了大量用戶需求。”

比起去年智能體還處在執行狀態，今年的智能體顯然變得更主動、更會辦事兒，可以幫助用戶主動執行更復雜的任務。

今年的智源大會上，智源研究院也發布了四款偏向垂類的智能體：全球首個面向心臟磁共振的輔助診斷智能體BAAI Cardiac Agent，通過融合多模態能力和醫生專業知識，輔助醫生完成決策；自主研究智能體AREX應用于科研領域；幫助用戶實時聽會、捕捉要點的智能體SoulAgent；以及面向有害蛋白獲取的風險發現智能體。

其中，以聽會智能體為例，光錐智能測試了它總結不同會議內容的能力。SoulAgent確實對會議內容做出了簡單的總結。雖然不及紀要完整，但核心觀點無誤。對于這種分論壇時間出現重合的情況比較適合。

不過，當前智能體在技術方面還存在諸多亟待進一步優化的問題。南洋理工大學校長講席教授安洋提及，要維持智能體能力繼續提升，目前最重要的還是和上下文工程相關的部分，比如Memory（記憶）、編排等等。

智能體分論壇現場，去年鮮少被關注、今年熱度頗高的Harness（直譯為馬挽具，指圍繞智能體搭建的一整套工程化框架或環境）成為了現場提及的高頻關鍵詞之一。

“如果說模型決定了智能體的能力，那么Harness就決定了智能體能力的上限。”李景秋說。“它的難點在于需要在模型基礎上進一步做好問題的澄清、驗證和反饋。”

比如，如果只靠模型理解問題，它難免會有局限性。Harness需要做的就是完善和豐富用戶簡單的一句話指令，讓模型能夠更好地理解需求，這里面需要Harness發揮意圖理解能力，并在拿到任務后，設計好接下來的任務流程，再調度模型執行。這個過程中可能需要結合人工干預和糾偏，再在任務完成前做好檢查。

簡而言之，如同一個真人助理，其中的每一步細節都需要產品針對Harness進行打磨，才能進一步提升Agent的執行效果。

當前，Agent還處在初期發展階段，能夠預見的是，這個行業的進步空間很大，無論是模型能力的提升，還是工程細節的夯實，都將為Agent辦事能力進一步添磚加瓦。

原文標題 : 顫抖吧人類，AI仍在加速狂奔

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

6月30日
立即報名>> 【直播】 AI X 6G無線智能與下一代通信測試論壇
6月30日
立即申請試用>> 【免費試用】旭之源工業電源一一機器人的穩定“心臟“
精彩回顧
立即查看>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026海克斯康春季產品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號

<td id="h3t3w"></td>

<source id="h3t3w"><tr id="h3t3w"></tr></source>

<td id="h3t3w"></td>

<td id="h3t3w"><tr id="h3t3w"><th id="h3t3w"></th></tr></td>