新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

Siri們加速Agent化,未來人類可能會忘記“點擊App”這事兒

2026-06-04 13:45
雷科技
關注

App 入口要被干掉了。

谷歌在今年的 Android Show(I/O 版)上,說了一句聽起來有點夸張的話,Android 正從一個 operating system,轉變為一個 intelligence system。

7da9945a2d0a339cea99364117a6752d.png

(圖源:Google)

或許,以后我們再也不需要 App 圖標了。

這句話翻譯成人話,就是手機不再只是被動等你點開 App 的工具,它開始主動幫你把事情做完。谷歌給的例子很具體:你把一份購物清單記在備忘錄里,Gemini 可以讀出來,再去購物 App 里一項項加進購物車;你讓它從 Gmail 里翻出某本教材的信息,它能找到之后直接幫你下單;你給它一張照片,它能在旅行平臺上替你搜對應的行程。

gemini-vs-voice-assistant.gif

(圖源:雷科技制圖)

不僅僅是手機,按照谷歌的計劃,這項能力最早在三星 Galaxy 和 Pixel 上布局,隨后到手表、汽車、眼鏡和筆記本上。

但問題來了,當手機開始替我們「干活」而不只是回應,App 那套我們用了十幾年的邏輯會被改寫嗎?以下是雷科技的看法。

Siri們長出「手」后,一切都將改變

過去的語音助手,用起來的感覺就是它只是一個會回應你的小伙伴。比如你對著手機說「把我備忘錄里的購物清單加進購物車」,過去的 Google Assistant 會怎么做?大概率是把這句話當成一個搜索詞,打開瀏覽器,給你返回幾條相關鏈接,然后任務就結束了。

但在用戶的角度,肯定還是希望它能夠打開備忘錄、記住清單、切換到購物 App、一項項搜索、一項項加入,完全解放雙手。尷尬就在于,它聽懂了你的話,卻干不了你的事。

03-agent-automates-ticket-task.gif

(圖源:Google)

本質上的原因在于,過去的助手只有「眼睛」和「嘴」,沒有「手」。它能識別語音、能朗讀結果、能打開某個固定的功能,比如設個鬧鐘、打個電話、查個天氣這些,一旦任務需要跨越多個 App、需要中間步驟、需要根據上一步的結果決定下一步,它就抓瞎了。

Android 開發者社區里有人復盤過谷歌早年的兩次嘗試,一個叫 Direct Actions API,要求 App 必須在前臺運行助手才能操作,等于助手沒法自己后臺干活;另一個叫 Assist API,給了系統「看屏幕」的眼睛,卻沒給它「理解該怎么操作」的腦子,兩條路子都不太行。也就是說,其實大家對于語音助手只能回答不能干活這件事,早就有怨言。

Gemini Intelligence 想補上的,正是「手」和「腦」這兩塊。谷歌把這套能力叫做 Task Automation(任務自動化),它能在用戶授權下,跨多個被選中的 App 完成多步驟任務,并且全程保留透明度和用戶控制權。換句話說,你說一句話,它會讀清單、調 App、加購物車,每到關鍵的、不可逆的環節,比如真要付錢了,再停下來等你點頭確認。

值得注意的是,谷歌這次開放這個能力也是相對小心翼翼的,它配了一個叫 Android Halo 的東西,在你屏幕頂部用很輕的方式顯示「智能體現在正在干什么、進度到哪了」,讓你隨時能看見、隨時能叫停。其實谷歌也很清楚,「替你操作手機」是一件信任成本極高的事,它不敢全部大包大攬。

05-intelligent-autofill.gif

(圖源:Google)

但坦白講,這一版能做的事,目前還相當克制。任務自動化首批只覆蓋被精選過的少數 App,能力范圍也有限。而且 Gemini Intelligence 對手機硬件的要求還很高,連不是所有機型都能跑得動。從目前來看,它更像是一個方向明確、但還在小步快跑的早期形態。

我認為,過去十幾年,我們和手機的關系是「打開 App,再找功能」,而 Gemini Intelligence 想把它改成「提出需求,系統替你調用 App」。這個轉向如果成立,影響的就不只是一個助手好不好用,而是整套移動端的交互邏輯。假如一句話就能干活,那 App 的圖標還有存在的意義嗎?

Google AppFunctions 要做移動端的 MCP?

這次 I/O 上,谷歌同時面向開發者推出了 AppFunctions,并且直接給了它一個副標題:Android MCP。谷歌官方的描述是,AppFunctions 是一套 Android 平臺 API,配套一個 Jetpack 庫,讓你的應用能像一臺「端側 MCP server」一樣運作,把自己的工具、服務和數據開放給系統和智能體調用。

MCP這套協議,過去主要解決的是云端的事,就是讓 AI 智能體能標準化地連接到服務器側的各種工具。而 AppFunctions 做的,是把同樣的機制搬到了手機本地。

開發者只要把「創建備忘錄」「發送消息」「搜索郵件」「添加購物清單」這些能力,寫成一段段自帶自然語言描述的函數,注冊到 Android 系統內置的「能力清單」里,Gemini 這樣的智能體就能發現它們、調用它們。更關鍵的是,整個過程在設備本地執行,延遲更低、也更利于隱私。

945c9f875a61ae896fae3e43a1be3185.png

(圖源:Google)

過去智能體想替你操作一個 App,靠的是一套很笨拙的辦法,先截屏、OCR 識別文字、再找到按鈕的位置、模擬點擊、等頁面變化、出錯了再重試。這套流程又慢又脆,App 改個界面就可能全部失靈。AppFunctions 把它換成了,App 主動聲明「我能做什么」,智能體帶著授權直接調用這些能力,系統負責管權限、管調用邊界、管安全約束。

谷歌對未來手機系統的設想就是,未來的軟件會越來越像「一組能力」,而非單純「一組界面」。也就是,App 的圖標可能會消失,轉而變成一些核心的能力留在用戶手機里,用戶也不需要記得這些 app 分別是干嘛的,只需要說自己的需求。

當然,AppFunctions 目前的狀態還非常早期,對于那些還沒接入的 App,谷歌的兜底方案是另一套「UI 自動化」框架,也就是讓 Gemini 退回到模擬點擊的老路子上去臨時頂一下。這就不得不提到豆包手機助手,它本質上還是 GUI Agent 那套「看懂屏幕、模擬點擊」的邏輯,只是權限拉滿,才實現各種跨應用的功能。

無論是哪種方案,趨勢已經很清楚,App 不會消失,可 App 圖標、首頁、傳統菜單這些「入口」的權重,可能會慢慢下降,用戶越來越不在意 App 本身,而是愈發看重 App 的核心能力。

動動嘴讓AI干活這事兒,會消滅手機 app 嗎?

過去十幾年,App 之間打的是一場「入口爭奪戰」,爭的是什么?是桌面第一屏的位置,所有的產品設計、所有的 push 通知、所有的紅點,本質上都是在搶用戶的關注度。

可一旦 AI 成了新的系統級入口,戰場就變了。未來 App 要搶的,是智能體的「調用次數」。當用戶不再親手打開 App,而是把需求拋給 Gemini,那么「Gemini 決定去調哪個 App」這件事,就成了新的兵家必爭之地。你想想,用戶說「幫我訂杯咖啡」,系統調的是瑞幸還是星巴克的 App 動作?或者說,訂個酒店、買張機票,系統會推薦哪個 App 呢?

9854ca7a5fb91b152d43fd07f2fb2f3e.png

(圖源:Google)

也正因為利益這么大,谷歌在這條路上跑得這么急,就顯得格外耐人尋味,因為它的老對手蘋果,在同一件事上摔了個大跟頭。

早在 2024 年的 WWDC,它就高調演示過一個全新的 Siri,靠 App Intents 框架實現跨 App 操作,經典的演示場景是:「找出上個月 Sarah 生日的照片,把最好的一張去掉背景,發到她的 Instagram。」一句話,Siri 在多個 App 之間穿梭著把活干完。這套愿景,和今天 Gemini Intelligence 講的幾乎一模一樣。

02-siri-app-intents-cross-app-demo-under-2mb.gif

(圖源:Apple)

但后面的故事大家也清楚了,這套個性化 Siri 原本計劃 2025 年上線,先是被推遲到 2026,又一路從 iOS 26.4 延到 26.5,這不馬上 iOS 27 都要來了,這能力也沒點頭緒。

蘋果高管 Craig Federighi 的解釋是,原本那套功能建在「V1」架構上,能跑,但質量不達標,必須重新建在新的「V2」架構上。蘋果軟件工程負責人和營銷負責人在采訪里被追問具體日期,只含糊地說 2026 會上,那大概率就是 WWDC27 公開了。

其實呢,倒也不能完全怪蘋果。跨 App 自動化和生成一段文字完全是兩碼事,它要在意圖模糊、App 狀態在變、還涉及真實權限的情況下,精準地執行正確動作,可靠性、準確性,還有敏感內容的問題,都是一道道坎。

所以,在「讓 AI 接管手機操作」這件事上,靠著 AppFunctions 這套開放給開發者的底層設計,加上三星、谷歌兩家硬件先行鋪貨,更有可能率先跑出一個能用的「Agent OS」雛形。

06f6d6d3d3b0c76c9405e4edb83dfa99.png

(圖源:Google)

當然,目前 Android 這條路最大的風險,恰恰是它的開放,支持海量的機型和 App 服務,注定了它必須謹慎對待每一個能力和環節,也注定了它很難完全放開能力給用戶。

那么回到最開始的問題,App 圖標真的會因此消失嗎?雷科技(ID:leitech)的判斷是,圖標不會消失,但它的權重會慢慢降低,直到用戶已經不那么在意“自己該在什么時候去點擊哪個熟悉的圖標執行什么任務”這件事。

它未必能在一兩年內就改變所有人的習慣,畢竟手機這東西,承載了我們太多年的肌肉記憶。但至少在方向上,谷歌已經替整個行業把「下一代手機長什么樣」這道題的答案寫在了考卷上。

谷歌豆包AppAIAgent

來源:雷科技

本文圖片來自:123RF 正版圖庫       來源:雷科技

       原文標題 : Siri們加速Agent化,未來人類可能會忘記“點擊App”這事兒

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號