訂閱
糾錯
加入自媒體

原力靈機周而進:具身智能從Demo到進廠,會殘酷篩掉99%的團隊

2026-04-10 15:32
智能進化論
關注

大模型狂歡之后,AI 領域的下一場“硬仗”,正無可爭議地指向了具身智能。

在這條熾熱的賽道上,成立僅一年的「原力靈機」走了一條略顯“非主流”的務實路線。當不少團隊熱衷于用炫酷的 Demo 展示機器人“會做什么前沿動作”時,有著曠視科技背景、兼具大模型研發與多年 AI 商業落地經驗的創始團隊,卻一頭扎進了最難的底層基建里。

過去一年,原力靈機一口氣交出了五張答卷:具身原生大模型 DM0、開源開發框架 Dexbotic 2.0、量產工作流 DFOL、真機評測平臺 RoboChallenge 以及開源硬件。他們的目標極其明確:把具身智能從“只能活在實驗室的 Demo”,硬拽進“真實場景、商業閉環與持續迭代”的工業流水線里。

這種死磕落地的基因,與聯合創始人周而進的履歷高度契合。他初三便保送清華電子工程系,2013 年作為曠視研究院早期成員,曾主導開發了行業首個金融級身份認證云服務 FaceID——那是 AI 視覺技術最早、也最成功的規;虡I戰役之一。如今,帶著跑通大規模商業閉環的經驗,他在原力靈機掌舵具身模型與框架研發,直面這個行業最底層的生死命題。

面對當下喧囂的具身賽道,周而進向我們拋出了三個冷峻的判斷: 

第一,  真機數據的價值已無可撼動。 具身智能的分水嶺,就在于誰能率先將機器人大規模部署出去,強力轉動數據飛輪;

第二,   具身智能的“ChatGPT 時刻”不在于花哨的絕技,而在于“開箱即用的泛化性”。 即機器人在陌生的場景、面對陌生的物品,依然能穩定、不出錯地完成基本動作; 

第三,  從跨出 Demo 到真正完成場景閉環,這中間極高的壁壘“會殘酷地篩掉 99% 的人”。 這里面充滿了無法用算力跳過的、不可壓縮的時間成本。

圍繞這些論斷,我們與周而進展開了一次深度對話。且看這位兼具頂級算法思維與老辣落地經驗的創業者,如何解構行業的關鍵變量:

昂貴的真機數據與海量的第一視角(human data),究竟該如何排兵布陣?

萬眾期待的具身智能“ChatGPT 時刻”,到底何時降臨?

困擾全行業的“泛化性”難題,真正的突破口藏在哪里?

為什么讓機器人從 Demo 走到真實場景,遠比人們想象的還要難上一萬倍?

原力靈機聯合創始人周而進在2026年技術開放日現場

數據與泛化性

智能進化論:進入具身智能領域一年多,你覺得行業最大的變化是什么?

周而進:大家在數據方面信心越來越堅定,對要大規模要搞真機基本形成共識。兩年前,要搞一個10萬小時的數采,所有人都會覺得瘋狂。今天大家基本有共識,要把具身搞好,至少得有百萬小時級別的數據規模。

現在的很多研究,包括我們自己做實驗也會發現,數據量拉起來,模型在泛化能力上就是表現得越來越魯棒。

智能進化論:除數據之外的其他因素呢?

周而進:有很多,但最核心應該先把數據拉起來,其他是被牽引的。如果數據量起來了,模型的體量也應該增加,否則可能學不了那么多數據。所以逐步也會看到模型參數量也在增加。

智能進化論:行業內有觀點認為可能不需要那么依賴真機數據,因為它比較稀少。

周而進:這是階段性的狀態。但真要大規模落地,最直接的就是真機數據。類比自動駕駛,今天有誰拿人騎自行車的數據去訓自動駕駛,沒有。你應該把機器造出來,大規模鋪出去,機器人的數據機器人自己生產。

智能進化論:你覺得具身智能現在處在什么階段?

周而進:大的階段,一定還是比較早期的。但又跟一兩年前不太一樣,當時能比較穩的完成一個動作就不錯了。我們自己的目標,今年年底把基本動作做到開箱即用,有場景的泛化性,有物品的泛化性。

什么時候真機能夠大規模部署出去,就是邁向一個新臺階了。今天到了要把基礎模型能力拉到有保證的準確率和泛化性能狀態上。誰達到了這個狀態,他的真機就可以大規模部署做強化學習了。他的數據飛輪和數據質量,和做不到這一個階段,還是在實驗室環境里面去采數據,之間的差距會越來越大。

智能進化論:你說的大規模是多少量級?

周而進:現在一般的數據采集還只是幾十臺到百臺,在真機做強化可能也就十幾臺到20臺,實驗室就會更少,幾臺。我們期望的規模是百到千這個級別的。

智能進化論:如果具身智能有ChatGPT時刻的話,會什么時候到來,以什么為標志?

周而進:每個人對ChatGPT時刻的理解不太一樣。我更多理解為開箱即用,能夠有場景泛化,有準確率的下限保證。你的模型、你的硬件不只在自家實驗室work,放其他家都能work。

開箱即用可以是一個非常簡單的任務,比如pick and place,把東西從A拿到B,這個簡單動作已經能解決很多問題了。如果能夠做到在不同的場景、不同操作對象上都不犯錯,都成功,這個泛化性就比現有的模型又往前走了一大截了。

智能進化論:開箱即用能不能舉個例子,比如下游整機廠商拿到我們的模型,就可以直接部署上了嗎?

周而進:我們會先綁定自己的硬件,自己的本體和算法肯定是最適配的。在我們自己的本體上面,希望能夠做到開箱即用,完成一些基本動作。泛化性我們拆解為4個維度:物品,場景,任務,硬件構型,難度是依次遞增的。我們對于開箱即用的首要目標是前三者。在硬件構型上也有一個學習的過程。相當于對一個大模型來說,我都沒見過德語,不可能上來就會講德語,但是如果你給我準備語料微調一下,模型也能適應新的硬件。

智能進化論:你覺得現在行業過熱的是什么?被低估的又有什么?

周而進:我覺得相比大模型來說,具身行業沒有過熱,或者熱度還遠遠不夠。大家對于通用機器人發展的預期一直是低估的。

我覺得大家在數據上面的投入還不夠多。今天很多搞數據規模的都是在海外,證明了這條路是work的,然后我們是跟隨的策略。我覺得整個行業應該有更大更堅定的決心在數據投入上。

智能進化論:真機數據方面,你覺得行業普遍面臨哪些挑戰呢?

周而進:真機數據在控制成本的情況下,規模和高精度無法兼顧,是兩者的平衡。

如果想要更多場景泛化,比如 human data,egocentric data,數據精度低但量很大。如果想把某個動作做好,就通過遙操把精確的關節電機信號采集下來,得到高精度的數據。

智能進化論:什么樣的數據算是訓練具身模型的高質量數據?

周而進:還是回到你的目的,缺啥補啥。

智能進化論:咱們主要用三類數據來訓練,多模態互聯網數據、駕駛行為數據、具身多傳感數據,這里面真機數據的占比會不會越來越大?

周而進:我覺得會越來越大,真機數據是提高模型質量最大的一個變量。今天其實機器人的數據這件事情,大家才剛剛開始起量。數據量是很容易被拉起來的。

智能進化論:你們提到“熵在哪里,數據就投向哪里”,熵是人判斷還是系統判斷的?

周而進:最終希望是自動化系統來反饋。經常容易出錯的地方,就是信息密度很高,我就先往這個方向去投資源做。如果我做好了,就相當于做小學數學題,沒有信息量了。但是現在的baseline都很低,人就能夠判斷。

智能進化論:你們說數采要“全身全時全域”,全域是指什么?

周而進:全域就是你的采集場景,場所。如果從終點倒推,我們相信最終機器人能夠完成絕大部分人類日常的操作活動,那么人類今天日;顒拥膮^域都是它的素材區域。

智能進化論:關于第一視角,我們怎么看待這條路線?

周而進:我覺得這類數據的價值很高。第一視角是我們今年的一個非常重要的數采方向。在機器人被大規模部署出去之前,怎么樣有一種性價比最高的方式去廣泛的捕捉各種場景的各種動作,第一視角是比較方便的一種數采方案。

圖片

模型與閉環

智能進化論: 你們怎么看VLA這個路徑?

周而進:今天整個具身的訓練方式還是從一個已有的知識體系往物理世界做遷移。VLA的前身會有一個互聯網的VLM預訓練模型,在這個基礎上,疊加一些動作數據或者機器人數據, 希望它能夠掌握物理的動作技能。 這種方式它的上限可能是比較明顯的。相當于一個小孩,從小只讓看書不讓你動手,等到10歲的時候教你踢球,運動能力肯定受影響。 所以DM0模型我們做了具身原生的VLA,從第一天開始就把互聯網數據跟機器人數據從零開始一起訓練的。從小不僅讀書,同時也練體育,做到全面發展。

智能進化論:這就是我們具身原生最核心的一點吧?具體是怎么同步來做?

周而進:核心是訓練方式。我們整個VLM從頭開始自己訓,并且在過程中設計了多任務的一套訓練范式,就是物理空間推理思維鏈。

智能進化論:空間推理思維鏈是怎么實現的?

周而進:就像人做事一樣,比如我要打掃房間,第一,要做任務的拆解,每一步干啥。第二,定位被操作對象。比如說我第一步要掃地,我得找到掃把在哪。

第三,人很多時候是下意識的,我要掃地,我要先走過去拿起掃把,然后從哪開始掃。所以我們希望模型能夠生成出來運動軌跡。

推理思維鏈里后面幾個環節都是關于運動軌跡,以不同的表現形式,可以是一條線,也可以是3D運動軌跡。把它串起來之后,希望機器人能夠把一個復雜任務像人一樣去理解和拆解。

智能進化論:今年要實現更高的泛化性,空間推理思維鏈會升級嗎?

周而進:今年會復雜很多,比如說方位代詞、肢體語言、空間代詞等各種指代關系,就是機器人需要進一步具備的能力。

生活中最常見的,“衛生間在哪?在那。”我做了一個手勢,告訴你一個代詞。純用文本,向左走左拐五十米再右拐,是非常麻煩的。這些都是我們擴充訓練模式的方法。

智能進化論:空間推理思維鏈的壁壘在什么地方?

周而進:方法都是開源的,我們不認為它是壁壘。核心還是回到數據和你對于具身任務的理解。如果你沒有自己做過機器人,你并不知道坑會在什么地方,機器人最容易犯錯的地方在哪,而訓練流程就是基于這些認知推導出來的。

智能進化論:你認為現在具身大模型最難的挑戰在什么地方?泛化、記憶、精度和長程任務,還是什么?

周而進:最重要的還是泛化性。

智能進化論:泛化性,最難突破的點在什么地方?

周而進:首先泛化需要海量的數據,這也是為什么今年大家都在往human data,ego data這個方向去做。第二是傳感器的豐富度。今天機器人好用的觸覺傳感器模組,很多還在探索,沒有收斂到統一的方案下。這些傳感器采集的數據,也遠小于現在攝像頭的數據,其他傳感器數據就更少了。 視覺是一個非常強的信號,純視覺方案可能已經能解決絕大部分問題了。但是如果我們目標不是要一個六七十分的東西,比如在家洗碗,不可能用六七十分的,洗10個碗有4個會打碎,我一定會選一個99%的。這時候其他維度的傳感器都是需要的。

智能進化論:原力靈機今年提升泛化性最大的抓手在什么地方?

周而進:在廣泛的數據的基礎之上,有一套精巧的模型結構和訓練范式。

VLA和世界模型,這兩個方向我們同時在做。我們是非常務實主義的,不會說要站隊哪條技術路線,更多的還是這條路線能夠解決哪些問題。

我們就會把VLA跟世界模型結合做一個統一的模型,同時做兩種預測,一個是接下來應該做什么動作,第二是世界接下來怎么變化,兩者是完全對偶的。

智能進化論:模型架構方面是沿用其他家的還是自己創新的?

周而進:我們現在有好幾個點在自己探,包括記憶,觸覺,動作的編碼形態,但最后會把它們整合到一個模型里。

去年我們第一個在VLA領域提出了基于記憶的方式,后面有好多家都在follow。動作的編碼形態,現在大家都用Pi的模式,有沒有其他的編碼形態能夠讓整個動作的訓練、軌跡的訓練變得更加絲滑?

智能進化論:今年DM0模型會再升級嗎?是否延續小參數路線?

周而進:會,到時候看。DM是一系列模型的發布計劃,基本上每半年就會發布一個新的版本。

智能進化論:DM0模型我們強調智能密度高,怎么理解?

周而進:一味追求參數量大,好像大就是牛,這是非常有問題。對機器人來說,大就意味著推理效率是個問題,當然你可以認為只是成本問題。

最核心的問題是,大真的牛嗎?或者對于1B、2B的模型,到底它的天花板在哪?這個問題是被忽視的。我們發布一點幾B的模型,其實想要傳達這樣的理念,通過好好做數據加科學的訓練范式,甚至能做到比更大的模型更好的效果。

智能進化論:DM0在產業已經應用了嗎?

周而進:物流行業是業務上面會首先選擇的方向,一些客戶已經在做POC驗證了。

智能進化論:我們強調模型訓練閉環的重要性,在真實場景7×24小時跑。閉環具體難在哪?

周而進:具身模型并不是模型訓練完那一刻,模型智能就被鎖死了。而是放到真實場景里,能被用起來,才能能夠得到真實的數據。數據繼續加入訓練流程里,才能夠把飛輪轉起來。

核心問題是能不能真的進到場景,最后一步其實會篩掉99%的人。沒有經歷過完整的AI產品商業化落地,做過真正的交付,去工廠趴過的團隊,根本就不會意識到,所謂場景完全閉環,讓你的機器人24小時被用起來,冰山下有多少坑。

比如對接過工廠的操作系統嗎?改造過它的產線嗎?機器人犯錯了怎么辦?如果不考慮這些問題,demo做的再好,最后一步永遠實現不了。

智能進化論:我們是怎么做的?

周而進:我們之前在曠視做了十幾年算法的落地。我們非常清楚這里面坑有多少,要配備怎樣的交付團隊,怎樣對接客戶的業務系統,以及你要交付的應該是個解決方案,而不是單點的一個模型或者機器人。

為什么我們選擇物流,因為我們有很強的客戶基礎,在物流的很多場景里面,我們和合作伙伴是具備產線改造的能力的。

智能進化論:要跨過這一步,最難的挑戰在哪?

周而進:很多東西你沒有經歷過,永遠不會具備這個能力,這里面有很大的時間不可壓縮性。所以我不認為從算法到demo是0~1,從demo到進廠是1~100,那是一個復雜得多的路。Moving atoms,難度遠高于moving bits。這也是我們的壁壘和優勢,完整的經歷過整個創業的階段。

智能進化論:目前物流場景能真實交付的,哪些場景已經跑通了?

周而進:比如物料的分揀。一個典型任務是從料箱中抓取商品、分揀并完成打包。 我們首先去做的,就是拆解成很多的崗位和步驟,比如第一步就是做物料的篩選。你能夠從這邊把東西拿到另一邊,所以Pick up & place是一個非常重要的技術能力。

智能進化論:現在我們這套流程全自動化了嗎?

周而進:全自動化是不嚴謹的說法。如果說我的模型在物流場景已經99%了,這是吹牛。我們的方案是有兜底方案的整體解決方案,如果出錯了也不會讓你產線停下來。在物流場景內,隨著數據飛輪轉起來,準確率會越來越高,節省下來的成本會越來越多。

智能進化論:OpenClaw(龍蝦)與具身智能結合有哪些想象空間,會是未來的方向之一嗎?

周而進:龍蝦是非常好的方向,完全打開了大家對大模型的想象力。但是今天用龍蝦去操作機器人不是特別火。龍蝦是個大腦,能做很好的任務規劃下達指令,但如果具身就是做不了,那也無能為力。更重要的是,機器人本體做low level的簡單任務的成功率得往上走,這樣再配合上云端的龍蝦,可能要火很多。

圖片

框架與工作流

智能進化論:Dexbotic開源框架在行業內有什么樣的優勢?

周而進:現在行業里很多框架是我發表了一個好的工作,然后把代碼工程化一下開源了,這只是針對你工作的一個開源。

今天做具身,VLM、視覺編碼器、動作生成序列的 action expert,都可以用不同家的。 如果站在更加通用的角度,想要提供類似腳手架的基礎建設,就不該綁死某種模型結構,而是給大家充分的選擇權。Dexbotic的設計理念,就是希望大家自由創造你自己的實驗和結構。我們做了更好的工程化的解耦,不同模塊之間可以相互組合。

智能進化論:現在Dexbotic框架的使用情況如何?

周而進:GitHub上一直有用戶反饋,給我們提了很多改進建議。我們覺得首先大家是需要這樣的一套框架的。

框架是第一步,我們也開源了自己的硬件。框架跟硬件合在一起,從數采到模型訓練,到最后重新部署回這臺機器,Dexbotic提供完整的走完一整套流程的平臺。我們很多高校的客戶、合作伙伴企業,很多都需要這種完整平臺。

智能進化論:行業內有沒有類似Dexbotic這樣的框架?

周而進:很少,我們還是挺獨特的,不光是框架,還跟自己的硬件結合。去年我們跟清華大學與無問芯穹的 RLinf 團隊深度合作,一鍵就能在Dexbotic上基于RLinf把模仿學習到強化學習全部都走完。從完備性的功能角度,我們現在是獨一份。

Dexbotic推出后已服務數十家機構,超千名開發者

智能進化論:DFOL柔性生產工作流到底能產生什么價值?

周而進:就是閉環。它是一套標準化的基礎設施,將算法訓練、數據更新與采集清洗緊密耦合。

部署到客戶現場后,模型運行并產出的高質量數據回流至云端,經自動化基建完成模型迭代,改進后的模型再下發至客戶側,獲得進一步反饋并觸發更多數據收集。從模型迭代的視角,就是快速把數據飛輪轉起來,把模型迭代的效率拉起來。我們一些核心的物流客戶已經在使用。

智能進化論:業內也有其他廠商在做真機評測,RoboChallenge真機評測如何保持行業領先性?

周而進:我們自己做算法,也做硬件,所以是站在最前沿的一線來反推,我到底需要一個什么樣的科學評測機制。評測在我們內部是一個團隊來做,重要性不亞于算法訓練。我們會周期性更新,相當于攻防出題,原來的題老了就換新的題。

智能進化論:今年Robochallenge的演進方向是什么?

周而進:泛化性是今年評測的一個重點。之前的Table30測試集其實并沒有測泛化性,還是在特定題目下面完成任務。但是我給你換幾個被抓取的對象,你是不是還能把這個任務做了?

第二,我們要逐步從桌面走到更大空間,從抓取到移動到全身控制,評測整個機器人運動的復雜性也是一個維度。

智能進化論:泛化性怎么測?

周而進:回到我們對泛化性的定義,要不停的換不同的操作對象、場景和任務。相當于你訓練的任務,跟我給你測試的任務不完全一樣。

Table 30 V2 任務集

成長與愿景

智能進化論:進入具身領域一年多來,你個人最大的感受是什么?

周而進:物理世界是一個非常復雜的環境,算法跟硬件高度耦合的領域,比純粹做模型要復雜得多。我覺得要有空杯心態,充分吸收交叉領域的知識。因為每個領域都有自己的專家,一定是一個團隊協作的方式。

智能進化論:就你自己的經驗來說,哪些是可以遷移過來的,哪些是要重新學的?

周而進:我們是做視覺出身,在模型訓練這一塊經驗還是比較豐富的。后來從視覺到文本、多模態,這一整條鏈路都做過。這一年半,大家都自己動手去修機器,部署模型,看著機器人采數據。整個過程中學習了非常多硬件相關知識。

智能進化論:你覺得自己一路從求學,進曠視到現在,哪些東西是一直沒變的?

周而進:對技術的追求極致和對未知的一個好奇心,這可能是最本源的。因為做很多事情過程中有很多挫折,但是回過頭想想,每天醒來仍然有讓自己比較熱血沸騰的點。

一個是要把這件事情做到極致,就是你覺得從原理上來說,它就應該能夠做到怎么樣?為什么沒有做到這樣?第二是好奇心,無論具身還是大模型,今天大家還是面臨很多新問題,有好奇心就有動力去試。

智能進化論:你從小就對計算機特別感興趣,還是什么事情啟發了你?

周而進:我學生生涯花了比較多精力在搞信息學競賽,競賽的影響是比較深的。

第一,分析問題的邏輯思維能力,對復雜工程的拆解能力,用代碼在有限時間內實現出來,我覺得是特別有意思的一件事情。

第二,競賽的過程中你會接觸到很多計算機科學的開放性問題,極大地擴充了視野,原來有那么多有趣的東西。所以由它(競賽)入門,衍生出來一系列自己的關注點,興趣都在往計算機科學領域靠近了。

智能進化論:AI沖擊包括科技巨頭的裁員,好多年輕人都會迷茫,焦慮,對于他們有什么建議嗎?

周而進:年輕人不想聽建議。我也是個年輕人,我只能說我自己的想法。我從小到大基本上,一直在做自己深層次真正感興趣的事情。因為過程中有太多挑戰了,要能夠堅持下去,一定是你真的感興趣這件事。還有得學習新東西,不能讓自己的視野、認知停下來。

智能進化論:你對具身智能有什么愿景,或者理想中的畫面?

周而進:我的一個愿景是看到具備廣義社會身份的機器人出現,這是挺讓人興奮的。

今天大家對機器人的期待,更多是功能層面,它能替我干啥事兒。如果機器人有自己的身份ID、支付寶、電話號碼,已經某種程度賦予了它一個虛擬的社會身份了。

當機器人有自己的身份,很多基礎設施也可以為機器人建,而不是為人建。就像沒有汽車的時候不會建馬路,汽車大規模普及,世界上出現了各種馬路。

人機共生不是簡單在功能層面的,是更復雜的社會層面,從整個社會的基礎設施,到人和機器人之間的關系,機器人本身的權益等都考慮進來。

END

本文為「智能進化論」原創作品,歡迎關注。

       原文標題 : 原力靈機周而進:具身智能從Demo到進廠,會殘酷篩掉99%的團隊

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號