新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯(cuò)
加入自媒體

火熱的具身智能,藏著半個(gè)自動(dòng)駕駛?cè)?/p>

文章配圖-1

自動(dòng)駕駛用十年證明,在特定場(chǎng)景里“做到能用”比“看起來(lái)像人”更重要,具身智能正在重演這個(gè)真理。

文|妍旭

編輯|孟雯

2017年的自動(dòng)駕駛,曾經(jīng)相信終局會(huì)很快到來(lái)。

那一年,L4、L5被反復(fù)討論,無(wú)人駕駛出租車(chē)被視為觸手可及的未來(lái)。但十年過(guò)去,改變行業(yè)格局的并非最早承諾“無(wú)人駕駛”的公司,而是那些率先把輔助駕駛裝進(jìn)量產(chǎn)車(chē)、跑通數(shù)據(jù)閉環(huán)的人。

今天的具身智能,站在相似的節(jié)點(diǎn)。

在剛剛結(jié)束的智源大會(huì)現(xiàn)場(chǎng),人形機(jī)器人端咖啡、打乒乓球、做動(dòng)態(tài)分揀吸引了眾多圍觀者,“機(jī)器人的ChatGPT時(shí)刻”也成為被頻繁討論的話(huà)題。

但在另一邊,越來(lái)越多從自動(dòng)駕駛行業(yè)走出來(lái)的創(chuàng)業(yè)者,卻在談?wù)撊绾握业降谝粋(gè)能夠穩(wěn)定運(yùn)行的場(chǎng)景,如何建立真實(shí)世界的數(shù)據(jù)閉環(huán),以及如何讓機(jī)器人先“跑起來(lái)來(lái),再變聰明”。

星源智創(chuàng)始人劉東把自動(dòng)駕駛稱(chēng)為“最簡(jiǎn)單的具身”。在他看來(lái),從二維空間里的避障導(dǎo)航,到三維空間里的物理交互,機(jī)器人面對(duì)的是比自動(dòng)駕駛更復(fù)雜的問(wèn)題。

具身智能是在復(fù)刻智駕的敘事節(jié)奏嗎?為什么從智駕過(guò)來(lái)的人成為行業(yè)變陣的關(guān)鍵變量,他們帶來(lái)的“漸進(jìn)式落地”思路,會(huì)讓具身智能走出一條不同的路嗎?

當(dāng)一個(gè)尚未到來(lái)的時(shí)刻成為行業(yè)圖騰

智源大會(huì)現(xiàn)場(chǎng),銀河通用創(chuàng)始人兼CTO王鶴認(rèn)為機(jī)器人的ChatGPT時(shí)刻,是指模型具備零樣本能力,無(wú)需專(zhuān)門(mén)學(xué)習(xí)即可在特定場(chǎng)景完成70%到80%的人類(lèi)技能,且具備極高的可訪問(wèn)性,初中畢業(yè)的人就能操作。

星源智創(chuàng)始人劉東則認(rèn)為:“現(xiàn)在具身也是,大家瞄著實(shí)際應(yīng)用的場(chǎng)景去做,但是L2能落地的也還不多,差不多是2015、2016年的智駕狀態(tài),剛剛起步。”

2017年前后,自動(dòng)駕駛行業(yè)同樣彌漫著類(lèi)似的樂(lè)觀預(yù)期:L4級(jí)無(wú)人駕駛被普遍認(rèn)為“三到五年量產(chǎn)”,但與此同時(shí),真實(shí)的量產(chǎn)車(chē)?yán)铮B在高速上保持車(chē)道和自適應(yīng)跟車(chē)都還在打磨。

無(wú)論是彼時(shí)的自動(dòng)駕駛,還是今天的具身智能,都是“終局先于路徑被討論”,行業(yè)先形成了對(duì)于未來(lái)的集體想象,再回頭尋找通往未來(lái)的工程路線。

智源大會(huì)的現(xiàn)場(chǎng),這種錯(cuò)位以另一種形式呈現(xiàn)。人形機(jī)器人端咖啡、跟人類(lèi)打乒乓球、在流水線上做動(dòng)態(tài)分揀,這些Demo在展臺(tái)前圍滿(mǎn)了觀眾。

與此同時(shí),星源智最新發(fā)布的ω-EVA模型在LIBERO上的成功率達(dá)到98.6%,在RoboTwin上的任務(wù)成功率從88.9%提升到90.3%。

數(shù)字很漂亮,但劉東在采訪時(shí)還是給出了相對(duì)冷靜的落地分層:純移動(dòng)的巡檢、導(dǎo)覽已經(jīng)比較成熟;抓放操作解決了90%的場(chǎng)景,但還有一些品類(lèi)抓不好;至于酒店打掃、家庭服務(wù)等復(fù)雜操作,“短期落地還是比較困難”。

這并不意味著Demo沒(méi)有價(jià)值。恰恰相反,在一個(gè)新興技術(shù)領(lǐng)域,Demo是技術(shù)路線可行性的必要證明。

但需要區(qū)分的是,Demo證明的是“這件事在特定條件下可以做到”,而交付要求的是“這件事在多變條件下反復(fù)做到”。

這兩者之間的鴻溝,自動(dòng)駕駛用了10年才走完。

奈何資本和產(chǎn)業(yè)端的熱情已經(jīng)提前就位。智源研究院院長(zhǎng)王仲遠(yuǎn)提到,本屆大會(huì)匯聚了至少15家以上估值超過(guò)百億的具身智能CEO,“具身智能與人形機(jī)器人”是報(bào)名最火的論壇之一。

這讓人很難不聯(lián)想到2017年自動(dòng)駕駛?cè)Φ?ldquo;All in AI”,那時(shí)只要項(xiàng)目里有“自動(dòng)駕駛”四個(gè)字,估值和曝光都會(huì)自動(dòng)上一個(gè)臺(tái)階。

但現(xiàn)實(shí)的商業(yè)進(jìn)度,未必跟上了敘事的節(jié)奏。星源智是少數(shù)能拿出具體落地案例的公司:叉車(chē)上的具身大腦、機(jī)器狗在開(kāi)放場(chǎng)景里撿垃圾、物流場(chǎng)景里的自動(dòng)化揀選。

劉東提到,這些合作是跟客戶(hù)“一事一議”談出來(lái)的,數(shù)據(jù)需要共享,場(chǎng)景需要定制。這不是那種“發(fā)布即通用”的敘事,而是先找到一個(gè)具體的場(chǎng)景,讓系統(tǒng)在里面跑起來(lái),再談泛化。

所以,如果一定要在自動(dòng)駕駛和具身智能之間畫(huà)一條線,可能不是敘事重疊,而是兩個(gè)行業(yè)在相似階段,面臨著同一種誘惑。

一代智駕人的“二次創(chuàng)業(yè)”

像劉東一樣有著自動(dòng)駕駛背景的創(chuàng)始人,在具身智能領(lǐng)域不在少數(shù)。

自動(dòng)駕駛解決了“讓車(chē)在平面上不撞東西”的問(wèn)題,而具身智能要處理的是“讓設(shè)備在三維空間里與物體發(fā)生交互”。劉東把智駕比喻為最簡(jiǎn)單的具身,“因?yàn)橹邱{當(dāng)時(shí)做的時(shí)候,是在平面范圍內(nèi)避開(kāi)所有的物體,跟物體不發(fā)生交互。

現(xiàn)在具身領(lǐng)域,除了精確的導(dǎo)航行走之外,還要跟三維空間的物體進(jìn)行交互。”

從“避開(kāi)”到“拿起”,這個(gè)區(qū)別聽(tīng)起來(lái)只是動(dòng)作復(fù)雜度的增加,但在工程實(shí)現(xiàn)上,卻是一套完全不同的系統(tǒng)約束。

在自動(dòng)駕駛里,攝像頭和激光雷達(dá)主要做環(huán)境感知和障礙物識(shí)別,決策鏈路相對(duì)清晰:看到、判斷、繞行。而在具身智能里,設(shè)備不僅要“看到”一個(gè)杯子,還要判斷“怎么拿”“拿起來(lái)會(huì)不會(huì)灑”“放下去的位置準(zhǔn)不準(zhǔn)”。

力控、觸覺(jué)、多模態(tài)同步,這些在自動(dòng)駕駛里幾乎不存在的課題,在具身智能里成了日常功課。

所以,當(dāng)這批從智駕過(guò)來(lái)的人進(jìn)入具身領(lǐng)域時(shí),他們帶來(lái)的不只是技術(shù)棧的遷移,還有一套已經(jīng)跑過(guò)的產(chǎn)業(yè)記憶。

2017年的自動(dòng)駕駛行業(yè),曾經(jīng)集體陷入“全棧自研”的誘惑,算法、硬件、數(shù)據(jù)、車(chē)輛,全部自己干。當(dāng)時(shí)的邏輯是,只有閉環(huán)才能做出最好的體驗(yàn)。但后來(lái)的產(chǎn)業(yè)現(xiàn)實(shí)證明,在銷(xiāo)量規(guī)模起來(lái)之前,全棧自研是一個(gè)極其昂貴的賭局。

在問(wèn)及“頭部公司做全棧會(huì)不會(huì)影響你們”時(shí),劉東的回答帶著這種經(jīng)驗(yàn)的痕跡:“在真正的銷(xiāo)量沒(méi)有起來(lái)之前,是沒(méi)有辦法支撐一個(gè)公司做全棧研發(fā)投入的,除非你已經(jīng)大到像特斯拉這種規(guī)模,賬上根本不缺錢(qián)。”

他進(jìn)一步判斷,市面上近兩百家具身公司里,真正有能力全棧閉環(huán)的“頂多就兩三家”,更多的公司會(huì)面臨一個(gè)選擇題:自己從頭研發(fā)大腦,還是從第三方采購(gòu)?

自動(dòng)駕駛行業(yè)最終證明,全棧自研的門(mén)檻極高,只有少數(shù)車(chē)企能夠負(fù)擔(dān)。因此行業(yè)逐漸分化:一部分資金和技術(shù)實(shí)力較強(qiáng)的新勢(shì)力選擇深度自研,而更多車(chē)企,包括部分傳統(tǒng)大廠和缺乏自研基因的新品牌,開(kāi)始轉(zhuǎn)向與華為、Momenta、大疆、百度等供應(yīng)商合作,或采取"部分模塊自研+核心算法外采"的折中路線。

劉東認(rèn)為,具身智能領(lǐng)域也會(huì)呈現(xiàn)類(lèi)似格局:“有些公司擅長(zhǎng)做本體,有些公司擅長(zhǎng)做模型,類(lèi)似于我們以前看自動(dòng)駕駛在整車(chē)行業(yè)的發(fā)展。”

基于這種判斷,星源智選擇了“不自己做本體”,外界曾把星源智比作“具身賽道的華為”,提供大腦模型和端側(cè)算力平臺(tái),覆蓋市面上70%以上的頭部本體客戶(hù)。

這個(gè)選擇本身,很難說(shuō)是因?yàn)?017年的“失敗教訓(xùn)”,還是僅僅因?yàn)楣こ處焸円呀?jīng)習(xí)慣了產(chǎn)業(yè)鏈分工的效率邏輯。但有一點(diǎn)是明確的:當(dāng)一個(gè)團(tuán)隊(duì)已經(jīng)經(jīng)歷過(guò)“什么都想自己做”的階段,他們?cè)谶M(jìn)入新戰(zhàn)場(chǎng)時(shí),會(huì)更早地思考“什么應(yīng)該讓別人做”。

除了商業(yè)模式的分化,從智駕過(guò)來(lái)的人還帶來(lái)了一套對(duì)“落地”的務(wù)實(shí)認(rèn)知。

在自動(dòng)駕駛領(lǐng)域,他們經(jīng)歷過(guò)“云端算力還是車(chē)端算力”的路線之爭(zhēng),知道控制時(shí)延對(duì)安全系統(tǒng)的意義。

這種經(jīng)驗(yàn)在具身智能里被重新激活:劉東在解釋為什么必須端側(cè)部署時(shí),給出的不是技術(shù)偏好,而是物理約束,十幾個(gè)攝像頭加三個(gè)激光雷達(dá),每秒數(shù)據(jù)量是幾個(gè)G,如果靠Wi-Fi或5G傳云端,“機(jī)器人已經(jīng)撞上了,云端還在推理”。

所以,他們更早地接受了“端側(cè)閉環(huán)”的必然性,而不是把它當(dāng)作一個(gè)可選項(xiàng)來(lái)討論。

具身智能難以“大力出奇跡”

回看自動(dòng)駕駛發(fā)展歷程,曾經(jīng)最受關(guān)注的是L5和Robotaxi,但率先進(jìn)入交通系統(tǒng)的,是ADAS和L2+輔助駕駛。

它們沒(méi)有L5那么令人興奮,卻在不斷運(yùn)行中積累數(shù)據(jù)、完善系統(tǒng),讓自動(dòng)駕駛擁有了繼續(xù)進(jìn)化的土壤。

具身智能也在經(jīng)歷類(lèi)似的過(guò)程。家庭保姆機(jī)器人仍然遙遠(yuǎn),通用機(jī)器人大腦也尚未成熟,但叉車(chē)、機(jī)器狗、物流揀選等場(chǎng)景已經(jīng)開(kāi)始落地。它們未必最像人,卻最有機(jī)會(huì)率先跑通數(shù)據(jù)閉環(huán)。

如果說(shuō)ADAS是自動(dòng)駕駛通往L4的橋梁,那么今天的叉車(chē)和機(jī)器狗,就是具身智能通往AGI的橋梁。

劉東把落地難度分為三層,第一層是“純移動(dòng)”:巡檢、導(dǎo)覽、導(dǎo)購(gòu),機(jī)器人只需要在空間里行走、識(shí)別目標(biāo)、拍照記錄,不需要與物體發(fā)生復(fù)雜的物理交互。這一層已經(jīng)比較成熟,星源智的機(jī)器狗在開(kāi)放場(chǎng)景里撿垃圾、做清潔,就是這層的應(yīng)用。

第二層是“抓放操作”,倉(cāng)庫(kù)里的揀選、藥店的上下料、工廠里的簡(jiǎn)單搬運(yùn)。劉東坦承,這一層已經(jīng)解決了90%的場(chǎng)景,但“還有一些品類(lèi)是抓不好的,成功率也不高”。這10%的缺口,聽(tīng)起來(lái)很小,但在真實(shí)商業(yè)環(huán)境里,可能就是客戶(hù)是否愿意簽單的關(guān)鍵。對(duì)應(yīng)到2017年的自動(dòng)駕駛,這很像“高速NOA”剛上線時(shí)的狀態(tài):能跑,但還不敢讓用戶(hù)完全脫手。

第三層是“復(fù)雜操作”,酒店打掃、家庭服務(wù)、精細(xì)裝配。這些場(chǎng)景涉及多步驟任務(wù)鏈、非結(jié)構(gòu)化環(huán)境、柔性物體的操作,劉東的判斷是“短期落地還是比較困難”。

這種“分層”既帶著從智駕移植過(guò)來(lái)的工程務(wù)實(shí),也受限于具身智能的數(shù)據(jù)約束。星源智聯(lián)合創(chuàng)始人孫振國(guó)在采訪中提到,大語(yǔ)言模型可以從互聯(lián)網(wǎng)上免費(fèi)獲取幾乎無(wú)限的語(yǔ)料,但具身智能沒(méi)有“互聯(lián)網(wǎng)級(jí)別的物理數(shù)據(jù)”。

各地政府牽頭建的數(shù)采廠,投入了大量機(jī)器人設(shè)備去采集動(dòng)作數(shù)據(jù),但采集到的數(shù)據(jù)量對(duì)于超大規(guī)模訓(xùn)練來(lái)說(shuō),仍然遠(yuǎn)遠(yuǎn)不夠。大語(yǔ)言模型可以堆到幾百B甚至上千B的參數(shù),而具身模型目前還在幾B、幾十B的規(guī)模徘徊。

這個(gè)瓶頸意味著,具身智能不可能像大語(yǔ)言模型那樣,通過(guò)“大力出奇跡”的方式一夜之間突破。它必須像自動(dòng)駕駛一樣,在具體的場(chǎng)景里一圈一圈地跑,用真實(shí)的物理交互去喂養(yǎng)模型。

劉東在描述叉車(chē)的落地案例時(shí),給出了一個(gè)很有說(shuō)服力的細(xì)節(jié):以前物流倉(cāng)庫(kù)里也有自動(dòng)化方案,但它們是“基于規(guī)則的”必須保證卡車(chē)停在準(zhǔn)確的位置,貨物有準(zhǔn)確的托盤(pán),托盤(pán)有準(zhǔn)確的形狀。

而具身大腦的價(jià)值在于,它可以“柔性地面對(duì)不同任務(wù)”,卡車(chē)大小不同、貨物形態(tài)各異、托盤(pán)可有可無(wú),系統(tǒng)仍然能自主規(guī)劃卸貨邏輯,先卸什么后卸什么,避免碰撞和卸不干凈。

這種“柔性”,不是通過(guò)更大的模型一次性實(shí)現(xiàn)的,而是通過(guò)“特定場(chǎng)景的數(shù)據(jù)閉環(huán)”慢慢磨出來(lái)的。

星源智的叉車(chē)項(xiàng)目用了“兩個(gè)月左右”做出第一版系統(tǒng),這個(gè)速度在具身智能領(lǐng)域算是很快,但劉東強(qiáng)調(diào),他們復(fù)用了之前的算法基座,并且“完全端側(cè)部署”。

這也對(duì)應(yīng)了劉東對(duì)未來(lái)格局的判斷:具身大腦公司最終會(huì)“分化成不同垂類(lèi)的專(zhuān)長(zhǎng)公司”,有些擅長(zhǎng)家庭場(chǎng)景,有些擅長(zhǎng)物流場(chǎng)景,有些擅長(zhǎng)工業(yè)操作。這很像自動(dòng)駕駛分化出的格局:高速NOA、城市NOA、記憶泊車(chē)、代客泊車(chē)……每個(gè)細(xì)分賽道里都長(zhǎng)出了專(zhuān)門(mén)的公司。

所以,回到最初的問(wèn)題,具身智能是在重演自動(dòng)駕駛嗎?答案是,敘事的節(jié)奏確實(shí)相似,終極目標(biāo)被提前消費(fèi),Demo和交付之間存在落差,行業(yè)在一開(kāi)始都會(huì)追逐最“像人”的解決方案。

但相似的開(kāi)局,未必導(dǎo)向相同的結(jié)局。

自動(dòng)駕駛花了十年證明,決定勝負(fù)的,不是誰(shuí)最早喊出無(wú)人駕駛,而是誰(shuí)先找到能夠持續(xù)產(chǎn)生數(shù)據(jù)的場(chǎng)景。

今天的具身智能落地場(chǎng)景遠(yuǎn)比自動(dòng)駕駛更分散,人形機(jī)器人、家庭服務(wù)、通用大腦依然是行業(yè)共同追逐的終局,但在終局到來(lái)之前,決定行業(yè)走向的,或許是倉(cāng)庫(kù)里的叉車(chē)、園區(qū)里的機(jī)器狗、流水線上的機(jī)械臂……

它們未必最“像人”,卻最先讓機(jī)器人學(xué)會(huì)成長(zhǎng)。

編輯:木人 審校:張問(wèn)心  制作:瑞總

       原文標(biāo)題 : 火熱的具身智能,藏著半個(gè)自動(dòng)駕駛?cè)?/span>

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)