新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

當智能體需要無處不在,算力該如何多端流轉?

2026-06-03 14:28
光錐智能
關注

圖片

云與邊緣融合為一個統一的系統,構建一個計算的連續體。 

文|劉俊宏

編|王一粟

一只龍蝦引爆了Token經濟學。

2026年初,智能體OpenClaw(龍蝦)改變了所有AI公司的商業模式。

AI開始從“被動響應”邁向“自主行動”。用戶不再滿足于讓AI“回答問題”,而是要求它能規劃任務、調用API、跨系統協作、甚至在物理世界執行動作。

智能體不再是云端一個大模型,而是分裂成一群小助手,實時在手機、PC、機器人等邊緣設備、云端之間跑來跑去,幫你訂機票、開車、做實驗。

智能體不僅是無處不在,還會自主運行、互相協同。這就帶來了許多新的算力需求和挑戰。

首先,是智能體自主運行,與軟件交互的速度遠超人類。在所有工作流中,Token將以機器速度生成,而非人類速度。

“2026年,全球每10秒約317億Token需求;到2030年,同樣是每10秒,這一數值將達到1.27萬億,增幅高達40倍。而這一爆發式增長,正是由智能體 AI 生成的海量Token所驅動。”高通CEO安蒙預測。

另外,無處不在的智能體AI ,分布式地流轉在不同設備之間,要的是一個無處不在、能夠提供連續服務的計算平臺。

圖片

“我們不會再單獨去談云端與邊緣,因為它們將融合成為一個統一的系統。”高通認為,云與邊緣不是非此即彼。安蒙在發言中稱,“AI 是在云端還是在邊緣側運行,是由智能體來決定。計算資源將被充分利用,AI 將在所有設備上運行。”

這就意味著,推理能力將被分布到最合適的位置,在token成本、功耗、延遲和隱私之間實現最優平衡。

智能體時代已來 所有設備都將成為AI的端點

機器人,被看作是智能體在物理世界的最佳載體之一。

2026年,機器人的智能被分成了三層。其中,第一層是即時執行,對應人類不需要思考的動作,例如站穩腳跟;第二層是具體動作執行,這部分對應機器人跟場景的交互,例如跳舞;第三層是邏輯推理,這部分對應真實世界物理關系的理解,例如推理一個完整任務并理解前因后果。

三層智能層層遞進又相互補充,安蒙總結說:“研發機器人不只是研發它的‘大腦’,還需要配備核心計算單元、運動控制模塊,以及各類驅動執行能力。想要在機器人領域取得成功,你必須懂得如何將其設計為一套分層式計算系統。”

同樣的現象,也出現在智能汽車上。在此前,智能汽車和座艙互不相干,而在2026年艙駕一體成為關鍵詞之后,汽車智能也變成了一個由兩層級智能整合的系統,用戶現在可以直接用語音讓汽車啟動智駕。

這場改變的原因,就是AI智能體讓之前只能當Chatbot的AI能直接辦事。“AI 正從簡單響應指令、輔助人機交互的工具,進化為能夠自主采取行動的系統。這是 AI 正在演進的方向,并將迎來前所未有的規;占。”安蒙說。這也是為什么高通將2026看作是“智能體之年”。

但同時,在看到端側開始逐漸承載運行智能體的需求之后,安蒙也意識到當下所有的算力廠商面臨前所未有的機遇和挑戰,“它正在重塑計算架構,將催生對新型設備和計算能力的巨大需求,而這一升級周期,有望成為行業有史以來規模最大的周期之一。”

事實上,在過去的三年里終端硬件廠商做了不少AI落地的鋪墊。

例如從2024年底開始,手機和PC行業就大量在設備中集成NPU,智能汽車座艙和智駕芯片的算力參數也變得越來越大。但現實是,許多PC的NPU算力調度還很有限,手機的各種AI功能大部分還要默認聯網執行,用戶對端側AI實際的使用感知非常有限。

但在智能體時代,或許這些之前準備好的基礎設施終于要真正用起來了。

“這些設備都將成為智能體的端點(endpoint)。而且,智能體也不會受限于任何單一設備或單一生態系統。所有能夠將用戶與智能體連接起來的一切,都將成為AI的端點。”

正如安蒙所說。當智能體需要在設備上即時響應、自主規劃、跨應用執行復雜任務時,端側平臺必須成為智能體能夠原生棲息的運行環境。如此一來,由智能體主導的工作流就能將任務分布到最合適的位置——終端設備、邊緣側、本地服務器以及云端。

這意味著,當AI開始主導“自己”的工作,開始調動多個云側和端側AI設備來共同提供算力。那之前單一堆疊AI加速器的方法將不再適用,AI計算平臺必須進行系統級的重新設計。

計算連續體 智能體AI新基建

當智能體代替人類操控,需要什么樣的新基建?

云端、手機端、PC端、車端,智能體的計算該怎么協同分配?

高通給出的答案是“計算連續體”,讓智能體在整個算力鏈條里面自由流轉。

這套方案并不只是簡單的算力分攤,讓不同環節的AI終端共同產出Token。而是一套讓推理能力被分布到最合適的位置,在單Token成本、功耗、延遲和隱私之間取得最優平衡的全新基建體系。

圖片

這種認識,也是當下算力基礎設施廠商的共識。

例如AWS OpenSearch Service總經理Tia White近日在LinkedIn發帖稱,智能體的通信需求跟人類完全不一樣,“它們可能毫無征兆地出現流量峰值,也可能悄然進入空閑狀態”。而面對智能體產生的數據流量對現有計算網絡的沖擊,邊緣計算公司Cloudflare高級產品經理Lai Yi Ohlsen表示:“非人類流量將在 2027 年上半年的某個時候超過人類流量。”

重塑整個計算鏈路的好處,Omdia在一份報告中指出,通過在設備間分布式部署AI能力,80%的本地處理率可將云端運營成本從55億美元降至約12億美元,每年節省43億美元,同時改善延遲、能效和可靠性。

圖片 

這項改造具體如何實現?高通在本次大會上提供了一套包含“三大支柱”的解決方案。

首先,第一支柱是“規;采w”,這回答的是“智能體到底在哪運行”。

在高通的構想中,智能體不會局限于某一位置,而是需要在終端設備、邊緣、本地環境和數據中心之間動態遷移。高通在其中負責提供統一架構,算力平臺覆蓋從毫瓦級(終端側)到千瓦級(數據中心),使推理與規劃工作負載在各層級之間實現無縫流動。

這種智能體原生的基礎設施,能支撐智能體運行時的流量爆發;诟咄ㄓ嬎闫脚_的統一調度,Token的生成就可以避免傳統云端的單點瓶頸或端側算力比較小的天花板。進而在保證AI性能的同時降低總體成本,并保持響應速度。

整套流程,簡單來說就像是解一道數學題。之前是博士生提供完整答案,但高通的思路是博士生負責給出解題思路,研究生負責列算式,大學生負責每一步計算。

更重要的是,由于整個計算平臺都在高通的架構內,這就像是整個團隊“心有靈犀”。在端側和云端融合之后,智能體還能獲得跨層級的一致性,進一步保證運算效果又快,還不會“跑偏”。

高通給出的第二支柱,是“原生AI設備及系統”,這回答的是“智能體應用怎么落地”。

畢竟,用戶是需要通過具體的終端設備來使用AI的。這代表著智能體在設備上提供始終在線的服務,必須滿足即時性能、隱私保護和可靠性三重約束。換句話說,就是要想實現AI聰明地“到處跑”(規模化覆蓋),就必須要先讓設備天生“會AI”(原生系統)。

高通在這一層的布局覆蓋了智能手機、AI PC、可穿戴設備、智能汽車、機器人、邊緣推理設備以及面向新形態的系統級設計。

在PC上,高通這次帶來了面向入門級PC的驍龍C平臺;在具身智能領域,高通展示了高性能機器人參考設計平臺高通躍龍IQ10 RRD。最令人意外的是,高通這次還正式公布了面向數據中心的新品牌——高通飛龍(Dragonfly)。從個人設備,到數據中心,高通的計算平臺即將實現閉環。

圖片

值得注意的是,高通在這些業務領域都落地了高性能CPU和推理專用加速器。這讓每一種產品都能夠提供智能體規劃所需的通用計算和處理人工智能神經網絡推理的能力。

不僅如此,高通的計算平臺一如既往地能夠兼顧成本和功耗控制,讓消費者能夠以高性價比買到智能體長時間的陪伴。

“每種設備都需要合適的AI平臺,因為它們各不相同、用途上也存在差異。關鍵在于讓智能和能效在任何地方都實現最大化。”安蒙總結說。

圖片

最后一個支柱是“智能連接”,這回答的是“智能體之間如何協同”。

當端側設備都具有AI能力,連接本身也必須具備智能。如果說前面兩大支柱都還在智能體的計算層面,那么連接讓智能體能夠互相聊天、實時合作,就像一群小分隊在戰場上瞬間協同作戰。

這一點,Omdia在報告中也指出,要實現AI的有效規;,科技行業需要優先發展跨設備的協同規劃能力,整合邊緣系統與云服務。畢竟,通信是智能體協作最關鍵的部分,如果不能及時交換信息,那分布式計算可謂毫無意義。

要滿足這一需求,可能要寄托于即將到來的6G網絡。

但對于這部分,高通早已做好了相關布局。安蒙展望說,“網絡本身就是一個AI原生網絡,其分布式AI計算與推理能力從無線基站一直延伸到中心機房乃至數據中心。”這意味著,萬物智能的時代終于到來了。

通過“計算連續體”的方案可以看到,高通在AI時代的布局已遠不止個人終端與通信,而是覆蓋從可穿戴設備到數據中心的完整算力網絡。從最小的邊緣算力到云端基礎設施,高通都能提供相關產品,并試圖用一套相互連接的解決方案將它們串成整體。

“高通在智能手機、PC、車載計算和機器人領域有著領先的每瓦特性能表現,并正在將這一優勢延伸至數據中心”。

正如安蒙所言。高通的標簽即將在智能體時代發生改變——從過去的芯片公司,升級為 AI智能體解決方案公司。

護城河的深度取決于AI應用的廣度

高通的轉變是今年Computex大會的一個縮影。

在AI大模型時代之前,Computex就像是個“電腦配件大賣場”。在2023-2025年AI大模型剛開始的時期,大會內容主要是硬件廠商嘗試與AI接軌,“堆基礎設施造大模型”的狂歡。而在今年,大會的風向徹底轉向以AI為中心,在場的每一個廠商都在討論AI在“物理世界+智能體時代”的具體落地。

尤其是今年有不少廠商都宣布,將擴大AI領域布局。

例如,今年英偉達就一口氣發布了CPU、PC芯片、人形機器人等多項產品,準備從AI基礎設施的定位擴展到物理AI全棧。AMD這次的主線是從純硬件,轉向做Agent Computers(本地智能體),試圖搶占英偉達在開發者和邊緣AI的份額。Intel靠18A工藝“翻身”之后,開始規劃做“從手持設備到數據中心”的AI全棧硬件。

“討論的重點,從來都不是在云端能運行的東西也能在邊緣運行。我們需要的是,該在云端運行的東西在云端運行,該在邊緣的在邊緣運行,這是完全不同的概念。”

正如安蒙所說,在當下階段,單純的算法或是硬件已經不能回答智能體是否能用好的問題。要想智能體真正在全棧算力硬件自由流轉,不僅需要廠商擁有AI布局的廣度,更需要吃透智能體應用的每一個環節。

圖片

為此,高通在本次大會現場準備了大量真實演示,試圖驗證計算連續體這套端到端系統級布局的可行性。

其中一些Demo由高通親自操刀,作為技術標桿展示其深度。例如,智能體發票助手能夠通過攝像頭掃描收據,自動完成從翻譯到生成文件,展示了端側多模態AI的完整工作流。另一些Demo來自合作伙伴,覆蓋了從創意生產到軟件開發的完整工作流,展示的是生態的廣度。

端云協同的好處,安蒙舉了個例子說:“以一段真實的Claude Code運行場景為例,規劃器會對工作負載進行智能調度:將部分任務留在設備端本地計算,把必要內容上傳至云端。通過這種分布式智能體AI架構,充分利用跨計算連續體的所有算力資源,可節省約140萬Token,在獲得相同結果的前提下減少成本60%。”

這種成本的降低,對燒錢如流水的token來說,簡直就是久旱逢甘霖。

為了實現這種效果,高通背后做了大量布局。

例如在去年6月,高通宣布收購Alphawave Semi,這是一家擅長高速有線連接的公司,補齊了數據中心AI推理加速卡在scale-up(PCIe)和scale-out(Ethernet)方面的需求,這是高通能進一步押注數據中心算力卡的關鍵。

另外,高通嘗試用躍龍品牌覆蓋從工業邊緣側到機器人大腦的計算平臺。這次大會上,高通帶來了面向機器人的計算平臺的全棧參考設計——高通躍龍IQ10 RRD。據了解,高通躍龍IQ10 RRD不僅能同時支持工業機器人、自主移動機器人(AMR)及人形機器人,而且還集成了端到端的軟件棧,主打“開箱即用”。

而在消費端,本次高通在之前的主打PC高性能的驍龍X平臺基礎上,帶來了面向入門級筆記本的驍龍C平臺。從產品預期上來說,或許搭載驍龍C平臺的PC有點類似Chromebook,主打輕應用和辦公需求。但兩者的區別是驍龍C平臺集成了NPU,這意味著新一代入門PC的產品門檻,除了功耗和性能之外,還要能用上端側AI。

從芯片到連接,從可穿戴設備到數據中心,從消費端到工業場景,高通構建了一條貫穿物理世界的完整算力連續體。

這種全方位的布局,讓高通在智能體時代抓住了真正全面整合的機會。當其他算力廠商仍在強調“暴力計算”與參數規模時,高通卻用邊緣AI網絡、每瓦特性能和極致的TCO(總體擁有成本)優勢,提出了一套截然不同的系統性答案。

在智能體成為關鍵詞的2026年,AI已經大幅降低了人類獲取更高智能的門檻。而高通正在做的,是將這一門檻進一步拉低到人人可及。

       原文標題 : 當智能體需要無處不在,算力該如何多端流轉?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號