訂閱
糾錯
加入自媒體

硅谷前沿|Physical AI 元年:一場關于“世界怎么運轉”的萬億美元豪賭

2026-04-03 15:39
硅兔賽跑
關注

2026 年 3 月,由圖靈獎得主、曾任 Meta 首席 AI 科學家的 Yann LeCun 牽頭創立的 AMI Labs 宣布完成 10.3 億美元種子輪融資。

幾乎在同一時間:

Fei-Fei Li 創立的 World Labs 完成新一輪約 10 億美元融資

Google DeepMind 發布 Genie 3 世界模型

Tesla 持續推進 Optimus 人形機器人在工廠中的部署

這些事件并非孤立發生,而是共同指向一個更加清晰的趨勢:AI 正在從“理解數字世界”走向“理解并作用于物理世界”。

如果說 2024 年是大語言模型的擴張期,2025 年是 Agent 的落地探索期,那么 2026 年,硅谷的核心敘事正在轉向一個更底層的問題:AI 能否真正理解“世界如何運轉”,并在現實中完成任務?

這并不只是一個技術方向的變化,更意味著產業價值鏈正在被重新改寫。過去兩年,AI 競爭的主戰場主要集中在模型、算力與數據中心等少數幾個高門檻環節;而當 AI 開始真正進入物理世界,競爭就不再只發生在模型層,而是同步擴展到硬件本體、系統集成、數據采集、仿真環境、供應鏈協同與真實場景落地。換句話說,Physical AI 帶來的不是單點突破,而是一整套基礎設施體系的重構。

也正因為如此,這一輪變化對中文世界,尤其是華人創業者、工程師與投資人而言,可能不僅是一波新的技術熱潮,更是一個少見的結構性機會窗口。與上一輪主要由大模型訓練資源和超級資本主導的競賽不同,Physical AI 天然更依賴復合能力:既要理解算法,也要懂工程;既要能做系統協同,也要能進入制造、供應鏈和產業場景深處。那些兼具技術深度、硬件協同能力與中美產業視野的團隊,反而更有機會在這場新周期中占據關鍵位置。

換句話說,Physical AI 不只是硅谷在講的新故事,它也可能是華人在下一輪全球技術基礎設施變局中,最值得重視的一張入場券。

01┃ 兩條路線的世紀之爭:LLM 派 vs. 世界模型派

過去三年,大語言模型(LLM)幾乎主導了 AI 的發展路徑,其核心范式是基于海量文本數據進行 next-token prediction(下一個詞預測)。但這一范式的邊界也在逐漸顯現:它可以“描述”物理世界,卻不具備可執行的理解;缺乏對因果關系與物理約束的建模能力;在連續決策和長期任務中也表現有限。

因此,以 Yann LeCun 為代表的一派開始推動另一條路徑:World Model(世界模型)——預測“狀態”,而非“文本”。兩者的核心差異在于,LLM 以文本為學習對象、以語言為輸出形式,本質停留在“認知與表達”;而世界模型則以物理世界狀態為建模對象,直接指向“感知—決策—執行”的能力閉環。

這并非 LeCun 一個人的判斷。2026 年 Q1,世界模型方向幾乎在同一時間迎來幾項關鍵進展:AMI Labs 以 JEPA 為核心架構,明確押注“先研究、后產品”的長期路線;World Labs 從“空間智能”切入,試圖讓 AI 真正理解三維世界中的關系、遮擋與物理約束;Google DeepMind 則通過 Genie 3 推動可實時交互的動態環境生成,并將其用于智能體訓練。

三家公司路徑不同,但指向的是同一個趨勢:AI 的下一次躍遷,不只是生成更好的文本,而是更準確地建模世界,并在其中完成行動。

02┃ 硬件戰爭:誰在造“身體”?

世界模型解決的是“大腦”問題——AI 如何理解物理世界。但 Physical AI 的另一半戰場同樣激烈:誰來造“身體”?

2026 年的人形機器人賽道,已經從“實驗室 demo”全面進入“工廠量產”階段。幾個關鍵數字:

Tesla Optimus Gen 3:超過 1000 臺已部署在 Gigafactory Texas 和 Fremont 工廠,執行零件處理和裝配任務。這是人類歷史上規模最大的人形機器人工廠部署。Tesla 正在 Giga Texas 建設年產能 1000 萬臺的專用工廠,目標單臺成本壓至 2 萬美元——兩年前行業均價還在 5-25 萬美元。

Boston Dynamics Atlas:CES 2026 上的產品版 Atlas,身高 6.2 英尺,56 個自由度,可舉起 110 磅重物。更值得關注的是它的“靈魂”——Boston Dynamics 宣布與 Google DeepMind 合作,將前沿基礎模型集成到 Atlas 中。2026 年全年產能已被 Hyundai 和 Google DeepMind 預定,30000 臺/年的工廠正在規劃中。

Figure 03:Figure AI 以 390 億美元估值融了 10 億美元,其 Figure 02 在 BMW Spartanburg 工廠的 11 個月試運行中,參與了超過 30000 輛 BMW X3 的生產,移動了 9 萬多個零件,累計運行 1250 小時。Figure 03 在此基礎上全面升級,配備 48+ 自由度和專有 Helix AI 平臺。

Mind Robotics:3 月剛宣布 5 億美元融資,專注工業規模的 AI 機器人部署。

但在這場硬件競賽中,一個被低估的環節正在浮出水面:靈巧手(Dexterous Hand)。

人形機器人的腿解決了移動問題,軀干解決了承載問題,但真正決定機器人能否在復雜環境中干活的,是手。以 Tesla Optimus 為例,手部成本占整機的 17%,約 9500 美元——是最昂貴的單一組件。

靈巧手之所以難,在于一個根本性矛盾:手指空間太小,放不下大電機;小電機力矩不夠,就需要高減速比齒輪箱來放大力量;而高減速比齒輪箱會帶來慣性失真、力反饋喪失和機械磨損——這三個問題會從物理層面“毒化”AI 的學習過程。

一批新公司正在嘗試突破這個瓶頸。有的采用軸向磁通電機架構將減速比從 288:1 壓縮至 15:1,實現完全可反向驅動的靈巧手;有的通過同步設計數據采集手套,讓人類操作數據可以零損耗遷移到機器人硬件上。這些看似小的硬件創新,可能是整個 Physical AI 生態中最關鍵的基礎設施之一。

03┃ NVIDIA:Physical AI 時代的“賣鏟人”

每一次技術浪潮,都會出現一個“賣鏟人”。

在大模型時代,NVIDIA 憑借 GPU 與 CUDA 生態成為最大受益者;而在 Physical AI 時代,其角色正在進一步升級——不只是提供算力,而是試圖構建一整套機器人時代的基礎設施。

在 2026 年 3 月的 GTC 大會上,NVIDIA 發布了一整套圍繞 Physical AI 的平臺能力:包括面向人形機器人的視覺-語言-動作模型 Isaac GR00T、用于生成大規模合成數據的 Cosmos 系列,以及覆蓋訓練、評估與部署的工具鏈(如 Isaac Lab 與 OSMO)。這些能力并非單點工具,而是逐步形成一套完整的開發與運行體系。

包括 Boston Dynamics、Caterpillar、Franka Robotics、LG、NEURA Robotics 等在內的多家機器人公司,已經在 NVIDIA 平臺上構建下一代系統。

其策略也非常清晰:

不直接參與終端產品,而是成為整個行業的底層標準。

如果說 Physical AI 是一座正在建造的城市,那么 NVIDIA 正在同時提供水泥、鋼筋與電網。

04┃ 數據:Physical AI 最稀缺的“石油”

在大語言模型的世界里,互聯網提供了幾乎無限的文本數據。但在 Physical AI 中,一個更根本的問題浮現出來:

真實世界的操控數據極其稀缺。

這使得數據,成為整個產業鏈中最關鍵、也是最稀缺的資源之一。

目前,行業主要探索三條路徑。

真實數據路線。以 Physical Intelligence 為代表,其 π0 模型基于超過 1 萬小時的真實機器人操作數據訓練,覆蓋多種機器人形態與任務類型,能夠完成復雜操作(如疊衣服、組裝紙箱等)。其開源行為,本質上為行業提供了一套“操控預訓練基座”。

合成數據路線。Google DeepMind 的 Genie 3 與 NVIDIA 的 Cosmos,嘗試通過世界模型生成大量模擬環境,在虛擬世界中完成訓練,再遷移到真實世界。這一路徑的核心挑戰在于 sim-to-real gap,但隨著模擬精度的提升,這一差距正在逐步縮小。

人類遙操作路線。通過數據采集手套等設備,將人類操作直接映射到機器人系統中。這種方式數據質量最高,但在成本與規;芰ι先源嬖谙拗。

Tesla 則在嘗試一條混合路徑:通過工廠視頻持續采集人類操作行為,并用于訓練 Optimus 的動作能力。

長期來看,Physical AI 的競爭格局,很可能不取決于誰的模型最優,而取決于誰擁有最多、最高質量的物理世界交互數據。一旦數據飛輪開始運轉,其壁壘將呈指數級增強。

05┃ 錢在說什么:一張 2026 Q1 Physical AI 融資全景圖

數字不會騙人。以下是 2026 年第一季度 Physical AI 領域的關鍵融資事件:

【世界模型層】

· AMI Labs(LeCun)— $10.3 億種子輪,估值 $35 億

· World Labs(李飛飛)— $10 億新一輪,Autodesk 投 $2 億

【基礎模型層】

· Physical Intelligence — 正在談判 $10 億新一輪,估值將超 $110 億

· RLWRLD — $4100 萬種子輪擴展

【人形機器人整機】

· Figure AI — 此前以 $390 億估值融 $10 億(2025)

· Mind Robotics — $5 億,工業規模部署

· Galaxea — $4.34 億,Series B 獨角獸

· Humanoid — $2.9 億種子輪,直接獨角獸

· Generative Bionics — €7000 萬種子輪

【基礎設施與工具】

· NVIDIA — 持續投入 Isaac GR00T / Cosmos 平臺

· RoboForce — $5200 萬,Physical AI 勞動力平臺

僅上述公開數據,Q1 已超過 64 億美元。而這還不包括 Tesla、Hyundai/Boston Dynamics、Google DeepMind 等大廠的內部投入。

資本的流向說明一件事:Physical AI 已經越過了“概念驗證”的階段,進入了“基礎設施建設”的階段。投資人不再問“機器人能不能用”,而是在問“誰的基礎設施能讓機器人最快規;”。

06┃ 冷思考:泡沫還是拐點?

當然,硅谷從不缺泡沫。面對 Physical AI 的狂熱,幾個冷靜的問題值得思考:

Demo ≠ 部署。正如業內人士在達沃斯 2026 上的共識:一個精彩的 demo 和一個能連續運行 10000 次不出錯的系統之間的鴻溝,比宣傳暗示的要大得多。Figure 02 在 BMW 工廠確實參與了 30000 輛車的生產,但它執行的是相對標準化的零件搬運,而非靈巧裝配。

Sim-to-real 依然是硬骨頭。世界模型的保真度在提升,但物理世界的長尾復雜性——光照變化、材料差異、非預期碰撞——仍然是合成數據路線的最大挑戰。

商業模式尚未跑通。LeCun 自己說 AMI Labs 第一年只做研究。World Labs 在嘗試免費+付費模式。Physical Intelligence 開源了核心模型。目前這些公司的收入幾乎為零,資本賭的是 3-5 年后的范式壟斷。

安全與監管的灰犀牛。當成千上萬臺具備自主決策能力的機器人進入工廠甚至家庭,誰為事故負責?目前全球對 Physical AI 的監管框架幾乎一片空白。

但恰恰這些問題正說明,我們正處于技術拐點的早期,而非泡沫的頂部。每一項真正的范式轉換——互聯網、智能手機、云計算——在早期都伴隨著“Demo 遠好于產品”的階段。關鍵的區別在于:底層技術是否在真正進步,而不只是 PPT 在進步。

從 LeCun 的 JEPA 架構、到 Genie 3 的實時世界生成、到 π0 的 68 任務泛化能力、到 Optimus 1000 臺級別的工廠部署——2026 年 Q1 的進展是實打實的工程突破,不是空中樓閣。

07┃ Physical AI 不是一個獨立賽道,它是 AI 的最終形態。

Physical AI 不是一個新賽道,它更像是 AI 的終局形態之一。

當 AI 從“理解世界”走向“進入世界”,真正被重寫的不只是模型能力邊界,也是產業分工與價值分配方式。未來的競爭,不會只發生在模型參數和算力集群里,也會發生在機器人本體、靈巧手、數據采集、仿真系統、產業場景和供應鏈組織能力上。

這也是為什么,這一輪對華人尤其重要。

因為華人在過去二十年里,最深的積累之一,從來不是單一維度的技術標簽,而是把前沿技術、工程執行、硬件制造和跨區域產業協同真正串起來的能力。無論是創業者、工程師,還是投資人與產業資源組織者,只要能夠抓住這一輪從數字智能走向物理智能的遷移,就有機會不只是參與趨勢,而是在某些關鍵層上,成為趨勢本身的一部分。

2026 年,Physical AI 也許還遠未成熟;但正因為它還在早期,窗口才剛剛打開。對華人來說,這可能不是又一輪“跟隨式參與”的周期,而是一輪更有機會向基礎設施層、平臺層和關鍵組件層深度切入的新起點。

作者提示:個人觀點,僅供參考

       原文標題 : 硅谷前沿|Physical AI 元年:一場關于“世界怎么運轉”的萬億美元豪賭

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號