新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切

圖片

作者|林易

編輯|重點君

5月20日凌晨,谷歌舉辦了2026年I/O發(fā)布會。CEO Sundar Pichai在會上透露,目前谷歌各項服務(wù)每月處理的Token數(shù)量已達3.2千萬億個,相比上一年增長了七倍。

這一次,谷歌從芯片、模型到應(yīng)用的全棧技術(shù)和產(chǎn)品完整更新:

芯片層:推出針對預(yù)訓(xùn)練優(yōu)化的TPU 8t 與針對推理優(yōu)化的TPU 8i,通過升級全球算力集群,解決行業(yè)高昂的算力成本痛點。

模型層:發(fā)布具備物理一致性的Gemini Omni 世界模型,讓AI跨越純文本與像素生成的限制,真正理解三維空間智能。同時,推出主打高性價比、低延遲的 Gemini 3.5 Flash,能力在編碼能力、Agent能力、工具調(diào)用能力都比上一代的3.1 Pro要強不少。至于Gemini 3.5 Pro,則要下個月才能見到了。

應(yīng)用層:發(fā)布最新Antigravity 2.0平臺,該平臺的多智能體協(xié)同能在12小時內(nèi)自主編寫出完整的操作系統(tǒng)。此外,推出可在云端虛擬機全天候自主運行的個人智能體Gemini Spark,加速軟件工程自動化的落地。

行業(yè)標準:聯(lián)合亞馬遜、微軟、Meta 等巨頭推出UCP與AP2智能體電商協(xié)議,搶先確立智能體時代的商業(yè)交互規(guī)范。

終端硬件:發(fā)布首款基于Android XR平臺的內(nèi)置Gemini音頻智能眼鏡。

一句話總結(jié),整場發(fā)布會看下來:谷歌憑借全棧AI技術(shù)優(yōu)勢,在搜索、辦公、購物和硬件全線筑起了“Agent優(yōu)先”的超級生態(tài)壁壘,AI從工具變成了全天候在線、能自主拆解并執(zhí)行復(fù)雜任務(wù)的生產(chǎn)力,智能體正在接管一切。

我們整理了本次發(fā)布會的關(guān)鍵信息,以下是重點內(nèi)容:

1.算力底座:第八代TPU并大幅追加資本支出

谷歌發(fā)布了針對預(yù)訓(xùn)練優(yōu)化的TPU 8t和專為推理設(shè)計的TPU 8i。同時,Sundar Pichai披露,谷歌今年的年度資本支出預(yù)計將達到約1800億至1900億美元,是2022年的近六倍。

2.模型更新:Gemini Omni世界模型與Gemini 3.5 Flash

Gemini Omni具備跨越式的物理概念理解能力,突破了此前AI系統(tǒng)在模擬動能和重力等物理屬性上的局限,不僅能根據(jù)文本提示生成具有準確物理特性的視頻,還支持用戶通過對話直接對視頻元素進行二次編輯。

Gemini 3.5 Flash主打極高的響應(yīng)速度與成本效益。據(jù)官方數(shù)據(jù),3.5 Flash在每秒輸出Token數(shù)上是其他前沿模型的四倍。

3.軟件工程:Antigravity 2.0全自動代碼生成平臺

Antigravity 2.0平臺極大提高了軟件開發(fā)效率。在一個測試項目中,由93個子智能體組成的團隊并行工作12小時,處理了26億個Token,從零開始編寫并測試了一個包含調(diào)度程序、內(nèi)存管理和文件系統(tǒng)的完整操作系統(tǒng)。在Gemini 3.5 Flash的成本優(yōu)勢支撐下,這一復(fù)雜軟件工程的端到端API調(diào)用成本被壓縮到了1000美元以內(nèi)。

4.智能體:全天候運行的Gemini Spark

Gemini Spark運行在Google Cloud的專用虛擬機上,保持24/7全天候在線,即使終端設(shè)備處于關(guān)閉狀態(tài),Gemini Spark依然可以在后臺自主跨越Docs、Gmail、Calendar等多款應(yīng)用程序,替用戶執(zhí)行復(fù)雜任務(wù)。

5.搜索架構(gòu):信息智能體與動態(tài)交互UI

谷歌搜索全面升級至Gemini 3.5,用戶現(xiàn)在可以設(shè)定多個智能體在后臺持續(xù)監(jiān)控網(wǎng)絡(luò)信息,在金融市場劇烈波動、特定商品上架等關(guān)鍵節(jié)點,推送高度相關(guān)的定制化方案。

此外,搜索結(jié)果頁還引入了由Antigravity平臺支持的動態(tài)交互式UI,能夠根據(jù)用戶的具體提問,實時生成可直接操作的數(shù)據(jù)可視化圖表。

6.商業(yè)基礎(chǔ)設(shè)施:智能體電商標準化協(xié)議

UCP(通用商業(yè)協(xié)議)為各家AI智能體提供了一種通用的數(shù)據(jù)交互方式,涵蓋產(chǎn)品搜索、結(jié)賬到物流查詢的全流程。目前Amazon、Meta、Microsoft、Salesforce和Stripe等企業(yè)已加入支持該標準。

AP2(智能體支付協(xié)議)用于設(shè)定AI購物的資金邊界并確保權(quán)責(zé)明晰。它在用戶、商家和支付機構(gòu)之間建立了基于隱私保護技術(shù)的驗證鏈接,確保退貨和賬單記錄的一致性。

基于上述協(xié)議,通用智能購物車(Universal Cart)實現(xiàn)了跨商家和跨服務(wù)功能,能夠在后臺自動比價、監(jiān)控庫存,并提供購買建議。

7.智能硬件:基于Android XR平臺的音頻智能眼鏡

谷歌聯(lián)合三星、Gentle Monster和Warby Parker,推出了首款基于Android XR平臺、內(nèi)置Gemini的音頻智能眼鏡。該設(shè)備專注于免提交互體驗,用戶無需掏出手機,可完全通過語音指令讓Gemini執(zhí)行任務(wù),例如結(jié)合實時地圖數(shù)據(jù)進行路線導(dǎo)航,調(diào)用本地生活應(yīng)用,以及完成商品的訂購與支付驗證。

8.行業(yè)信任:SynthID數(shù)字水印技術(shù)的跨平臺普及

面對社會對生成式AI內(nèi)容失控的擔(dān)憂,谷歌宣布將SynthID數(shù)字水印技術(shù)全面擴展至搜索和Chrome瀏覽器中,目前該技術(shù)已累計為全球超過1000億張圖片和視頻添加了底層來源標記。OpenAI、NVIDIA、Kakao和ElevenLabs等行業(yè)頭部機構(gòu)已正式宣布采用這一標準,共同確立AI內(nèi)容來源的識別規(guī)范。

 

圖片

 以下是2026谷歌I/O大會演講實錄:

1.效率與協(xié)作工具革新:Ask Maps、Ask YouTube 與 Docs Live

SUNDAR PICHAI:現(xiàn)場觀眾大家好,以及全球各地正在觀看直播的朋友們,你們好。很高興能回到今年的I/O大會。過去的一年意義非凡,持續(xù)不斷的產(chǎn)品發(fā)布以及技術(shù)的飛速進步,讓我們處于一個超速發(fā)展的時期。我確實深有感觸,這是極其充實的一年。這里帶大家回顧一下我最近都在忙些什么。

剛才視頻中我正在插上TPU的畫面其實挺準確的,但我希望今年不僅忙于這些。在它進入太空之前,還有很多工作要做,我們正在為此努力。說認真的,這確實是一個非凡的時刻。自公司轉(zhuǎn)型為AI優(yōu)先以來,已經(jīng)過去了10年。我們深知AI在推進公司使命、大規(guī)模改善人們生活方面,將產(chǎn)生多么深遠的影響。這就是為什么我們正在采取一種差異化的全棧AI創(chuàng)新方法:從定制芯片和安全基礎(chǔ),到世界級的科學(xué)研究和模型,再到觸達數(shù)十億用戶的產(chǎn)品和平臺。這種方法使我們能夠更快速地迭代和創(chuàng)新,并正在全方位賦能我們這家公司。

真正令人驚嘆的是人們使用我們AI的方式。學(xué)生們通過Gemini應(yīng)用備考期末考試;音樂家和藝術(shù)家將Lyria和Veo等生成式AI模塊融入他們的創(chuàng)作流程;開發(fā)者們編寫代碼,將他們的創(chuàng)意變?yōu)楝F(xiàn)實。我自己在生活中也以各種方式使用Gemini。最近,我一直在用Gemini來讀懂我父母的就診報告,相信你們中的許多人也做過類似的事情。這些關(guān)于人們?nèi)绾问褂肁I的故事,是衡量AI價值和進展的最佳標準。

SUNDAR PICHAI:為了更直觀地展示人們使用AI的規(guī)模,還有一個很好的指標:Token。Token是模型處理數(shù)據(jù)的基本單位,每一個Token都代表著一個正在被解決的問題。兩年前,我們各項服務(wù)每月處理9.7萬億個Token,這已經(jīng)是個龐大的數(shù)字。在去年的I/O大會上,這個數(shù)字增長到了約480萬億。而到今天,這個數(shù)字已經(jīng)翻了七倍,達到每月3.2千萬億個Token。

在I/O主旨演講中提到“千萬億”這個量級確實罕見,但我們確實做到了。有些人可能會覺得這只是在“刷榜”,確實有一定道理,但我認為它深刻反映了我們的產(chǎn)品以及開發(fā)者在這些模型基礎(chǔ)上構(gòu)建生態(tài)的火熱現(xiàn)狀。目前每月有850萬用戶使用我們的模型構(gòu)建新的應(yīng)用和體驗。我們的模型API現(xiàn)在每分鐘處理約190億個Token。在過去的12個月里,有超過375家客戶各自處理了超過1萬億個Token,這代表了整個行業(yè)對AI的強勁需求。

當然,我們各款產(chǎn)品的需求也極其旺盛。我們現(xiàn)在擁有13款用戶數(shù)超過10億的產(chǎn)品,其中有5款產(chǎn)品的用戶數(shù)更是超過了30億。我們的Gemini模型正在吸引更多人使用我們的產(chǎn)品,并提升他們的使用頻率。

這一切都始于Search,它比世界上任何其他產(chǎn)品都更早讓大眾享受到生成式AI的益處。AI Overviews現(xiàn)在的月活躍用戶已超過25億。這是一項突破性的功能,也是我們對搜索進行的史上最大升級。人們非常喜歡它,在短短一年內(nèi),其月活躍用戶數(shù)就突破了10億。當人們在Search中使用AI驅(qū)動的功能時,他們使用搜索的頻率明顯變高了。我非常喜歡現(xiàn)在的Search,它不再僅僅局限于單個查詢,而更像是一場持續(xù)的對話,不僅能為您提供更深刻的見解,還能將您與廣闊的網(wǎng)絡(luò)世界無縫連接。

另一個我們在快速創(chuàng)新的領(lǐng)域是Gemini應(yīng)用。在去年的I/O大會上,Gemini應(yīng)用的月活躍用戶數(shù)為4億。今天,這個數(shù)字已經(jīng)突破了9億,在一年內(nèi)翻了一倍多。與此同時,每日請求量增長了七倍以上。這是令人驚嘆的增長。我們一直在添加許多獨特的功能,例如Personal Intelligence,它能讓AI的響應(yīng)更加定制化、更有幫助。目前,已經(jīng)有超過500億張圖像是由我們的Nano Banana模型生成的。它在過去的一年里大放異彩,我知道大家玩得都很開心。除了Gemini應(yīng)用之外,我們還在許多產(chǎn)品內(nèi)部直接引入了Gemini,讓對話變得更加自然。

最近,Maps迎來了十年來最大的升級,推出了名為Ask Maps的新功能。人們正在用它來詢問更復(fù)雜、更長的問題。這里有一個家長的真實查詢:“我的孩子剛掉進了鴨子池塘,而婚禮30分鐘后就要開始了。我可以在附近步行能到的地方買到一件新裙子嗎?”我很想知道她最后順利買到?jīng)]有。

我們還將把這種對話式AI引入另外兩款產(chǎn)品。首先是Ask YouTube。人們每天都會來YouTube提出很多問題,這里有海量的優(yōu)秀視頻,但有時很難知道該從哪里看起。Ask YouTube完全重塑了這種體驗。假設(shè)你想教3歲的孩子騎腳踏自行車,而他之前只學(xué)會了騎平衡車。你只需詢問YouTube,就能看到完全不同的搜索結(jié)果:信息變得易于理解且方便瀏覽,你不僅能獲得概覽和實用技巧,還能看到最符合你需求的視頻。如果你想嘗試某種特定的教學(xué)方法,還可以點擊進行深入了解。最棒的是,它能直接跳轉(zhuǎn)到視頻中最相關(guān)的片段,這讓我想起了當年教孩子們騎車的場景。它能記住上下文,因此你可以進行追問,比如:“我應(yīng)該買帶手剎的還是腳剎的?”這使它成為一種連續(xù)的對話體驗。它甚至能以表格形式呈現(xiàn)信息,方便你進行對比。我們現(xiàn)在正開始測試Ask YouTube,它將于今年夏天在美國正式推出。

到目前為止,我們展示的都是對話式文本查詢。但很多時候,我希望能以說話的速度來完成任務(wù)。得益于我們在音頻技術(shù)方面的飛躍,這在今天已經(jīng)成為現(xiàn)實。一項名為Docs Live的新功能將這種體驗提升到了全新高度。以前使用Gemini創(chuàng)建文檔時,你必須輸入非常精確的提示詞。而有了Docs Live,你只需口頭傾訴腦海中的任何想法,剩下的交給Gemini即可。讓我們通過產(chǎn)品團隊的演示來看看它的實際效果。需要說明的是,這些都是實時演示,沒有經(jīng)過任何加速處理。

好的,讓我們來試一下。我剛才突然想起,明天我要回母校的高中職業(yè)日做一個校友演講,需要準備一些演講要點,向?qū)W生們解釋我的職業(yè)——一名軟件工程師具體是做什么的。雖然我自己就是工程師,但我不太確定該從哪里開始。你能從我的Drive里提取我的簡歷嗎?直接看簡歷可能有點無聊,也許你能想出一些有趣的類比,讓這場演講對學(xué)生們來說更引人入勝?另外,學(xué)校之前給過我一封主題大概是“職業(yè)日后勤”的電子郵件。你可以從那封郵件里獲取具體細節(jié),把它們放在文檔的最頂端,這樣我就能清楚知道該去哪里以及什么時候到。讓我們更新這些需求,并直接生成一份草稿。

【生成結(jié)果】這很酷,但內(nèi)容有點太密集了。也許可以把這些類比用表格的形式展現(xiàn),這樣更方便我掃視。然后再幫我加一條筆記,講講我哥哥是如何激勵我成為一名軟件工程師的故事。把它放在文檔頂部附近并加粗,這樣我就不會漏掉。好的,看起來棒極了。

在未來,你將能夠創(chuàng)建新的Docs并直接進行編輯,全程只需使用語音。Docs Live將于今年夏天向Pro和Ultra訂閱用戶推出,同樣強大的語音功能也將應(yīng)用于Gmail和Google Keep?吹礁黜棶a(chǎn)品展現(xiàn)出的創(chuàng)新速度令人贊嘆。

 

圖片

2.AI基礎(chǔ)設(shè)施升級:第八代定制芯片TPU 8t與8i

SUNDAR PICHAI:為了向廣大用戶提供大規(guī)模支持,同時服務(wù)全球企業(yè)和開發(fā)者,我們需要在基礎(chǔ)設(shè)施領(lǐng)域進行巨大投入,且一直在為現(xiàn)在和未來投資。2022年我們的年度資本支出為310億美元。今年預(yù)計這一數(shù)字將增長約六倍,達到約1800億至1900億美元。這項投資的關(guān)鍵部分是我們的定制芯片。

十年前,我們在這個I/O舞臺上發(fā)布了第一款TPU。從那時起,我們改變了行業(yè)構(gòu)建AI的方式。最近在Cloud Next大會上,我們發(fā)布了第八代TPU。這是我們首次采用雙芯片策略,針對訓(xùn)練和推理設(shè)計了專門的架構(gòu):TPU 8t和8i。雖然它們看起來相似,但實際上大不相同。

8t針對大規(guī)模預(yù)訓(xùn)練進行了優(yōu)化,原始算力幾乎是上一代產(chǎn)品的三倍。我們對訓(xùn)練基礎(chǔ)設(shè)施采取了根本性的不同方法。通過JAX和Pathways,訓(xùn)練不再受限于單個龐大數(shù)據(jù)中心。相反,現(xiàn)在可以無縫將訓(xùn)練分布到多個站點,實現(xiàn)在全球超過100萬個TPU上擴展運行。這使我們有能力創(chuàng)建全球最大的訓(xùn)練集群。對模型構(gòu)建者而言,這意味著可以在數(shù)周而非數(shù)月內(nèi)訓(xùn)練出規(guī)模更大、能力更強的模型。TPU 8i專為推理設(shè)計。我們大幅提升了每一步的速度,因為在從事搜索業(yè)務(wù)的27年里,我們深知延遲至關(guān)重要。

為了讓你直觀感受這種速度,這里有一個即將在Flash模型上運行的提示詞,假設(shè)它運行在8i上。我將創(chuàng)建一個Chrome Dino游戲并點擊提交,響應(yīng)是實時生成的。在觀看的同時,請留意右上角的每秒token數(shù)。速度非常驚人,接近每秒1500個token。寫請求的時間幾乎比生成時間還長,而且游戲也非常有趣。除了速度,我們也在思考如何實現(xiàn)可持續(xù)擴展。這兩款芯片都具有更高的能效,每瓦性能提升高達兩倍。TPU一直在為今年的I/O大會進行緊張訓(xùn)練。據(jù)我所知,這里有一段幕后花絮。 

短片角色:嘿,周末過得好嗎?挺好的,剛剛折疊了稀有腫瘤數(shù)據(jù)集中的蛋白質(zhì)。你呢?我模擬了未來50年的氣候數(shù)據(jù)。我畫了一張哈巴狗的照片,你見過穿得像會計師一樣的哈巴狗嗎?沒見過,想看嗎?好了,TPU們聽好了,I/O馬上就要開始了,我們有活兒要干了。事實上,我們有數(shù)萬億項任務(wù)要處理,所以清理一下緩存。Timmy!擦干你的風(fēng)扇,讓我們火力全開。嘿,你在干什么呢?我在剪輯蒙太奇呢。行了,你能不能別弄你那蒙太奇了,趕緊下來幫幫忙?什么?就現(xiàn)在嗎?好吧,這就來。 

SUNDAR PICHAI:我敢打賭在I/O大會結(jié)束后,像Timmy這樣的TPU已經(jīng)準備好直接躺平休息了。我們的算力創(chuàng)新推動了自身的進步。

今天我想在模型、編程和智能體(Agents)這三個領(lǐng)域進行深入探討,向大家展示各方面的進展。讓我們從世界模型(World Models)取得的令人興奮的進展開始。通過世界模型,AI正在從預(yù)測文本轉(zhuǎn)向模擬現(xiàn)實。Demis和Google DeepMind團隊一直在致力于突破這些模型的能力邊界。讓我邀請Demis出來分享更多內(nèi)容。

3.世界模型突破:Gemini Omni與Omni Flash

DEMIS HASSABIS:大家好,很高興來到這里。過去一年里,AI能力實現(xiàn)了飛躍式提升。我們現(xiàn)在有了能夠為我們制定計劃并采取行動的智能體。距離實現(xiàn)通用人工智能(AGI)也只有幾年時間了。今天,我很高興能分享我們在構(gòu)建通用人工智能方面取得的進展。

去年我闡述了擴展Gemini多模態(tài)能力的愿景,使其成為一個能夠理解并模擬世界的AI世界模型。這是實現(xiàn)AGI的關(guān)鍵,也將對從構(gòu)建AI助手到訓(xùn)練機器人等所有領(lǐng)域產(chǎn)生深遠影響。現(xiàn)在我們邁出了下一步,我很高興宣布Gemini Omni。

這款新模型能夠根據(jù)任何輸入生成任何內(nèi)容。它將Gemini的智能與我們最優(yōu)秀的生成式媒體模型相結(jié)合,實現(xiàn)了全新的世界理解、多模態(tài)和編輯能力。Veo、Nano Banana和Genie等模型已經(jīng)能夠創(chuàng)建極其逼真的視頻、圖像和交互式模擬。雖然尚不完美,但它們展示了令人印象深刻的直觀物理概念理解。借助Omni,我們現(xiàn)在取得了更大進展,在模擬動能和重力等方面實現(xiàn)了跨越式的突破,而以前的系統(tǒng)很難處理這些概念。Gemini的世界知識和推理能力在Omni中表現(xiàn)得淋漓盡致,它可以將復(fù)雜的想法轉(zhuǎn)化為高度準確的視頻。例如,你可以給它一個簡單的提示詞,比如“制作一個關(guān)于蛋白質(zhì)折疊的定格動畫解說視頻”,大家可以看看效果。 

視頻旁白:蛋白質(zhì)最初是氨基酸鏈。它們折疊成特定的模式,比如alpha螺旋和被稱為beta折疊的平坦部分,從而形成完美的蛋白質(zhì)三維結(jié)構(gòu)。 

DEMIS HASSABIS:但初始生成僅僅是開始。創(chuàng)作過程很少一步到位,通常是不斷迭代的。就像Nano Banana重新定義了圖像編輯一樣,Omni為你提供了一種更自然的方式,允許通過對話式語言來編輯視頻。真正酷的是你可以提供自己的視頻(例如一段自拍),然后以一種非常有趣的方式改變現(xiàn)實。你可以輕松調(diào)整細節(jié)和風(fēng)格,甚至添加新元素,整個場景都會隨之演變,從而體現(xiàn)你的新創(chuàng)意。

比如一個簡單的圓圈可以變成黑洞,或者讓一段黃昏下的漫步煥發(fā)生機。任何事物都能成為創(chuàng)造全新現(xiàn)實的畫布。讓我們通過一段短片來看看Omni能做些什么。我們目前從視頻生成開始,但隨著時間推移,Omni將能夠從任何輸入生成任何輸出。這始終是我們的目標,也是我們從一開始就將Gemini構(gòu)建為原生多模態(tài)模型的原因。雖然這是一條更艱難的道路,但堅實的基礎(chǔ)架構(gòu)現(xiàn)在正發(fā)揮巨大作用。

今天我們將發(fā)布Omni系列的首個模型Gemini Omni Flash。它現(xiàn)已貫穿我們的各項產(chǎn)品中,稍后您將聽到更多相關(guān)信息。我對目前的進展感到非常興奮,很快也會分享更多關(guān)于Omni Pro的消息。迫不及待想看到你們的絕妙創(chuàng)作,現(xiàn)在把舞臺交還給Sundar。

 

圖片

4.AI內(nèi)容透明度:SynthID 跨平臺擴展

SUNDAR PICHAI:謝謝Demis,這確實是巨大的進步。隨著生成式AI不斷完善,對更高透明度的需求也隨之增加。研究表明人們能夠正確識別高質(zhì)量深度偽造(Deepfake)視頻的概率僅為四分之一左右。

三年前我們推出了SynthID,這是一種肉眼無法察覺的水印技術(shù)。自發(fā)布以來,SynthID已為1000億張圖片和視頻,以及長達6萬年的音頻資產(chǎn)添加了水印。數(shù)百萬人正在使用Gemini應(yīng)用中的SynthID Detector來驗證AI生成的內(nèi)容。

而現(xiàn)在我們正更進一步,增加跨產(chǎn)品的Content Credentials(內(nèi)容憑證)驗證功能。這將向你展示內(nèi)容的來源是AI還是相機,以及它是否曾使用生成式AI工具進行過編輯。在這個示例中,Gemini可以識別出這張照片是用Pixel相機拍攝的,然后使用Google Photos進行了編輯。我們希望讓更多人能輕松使用這些工具。

因此,我們正將SynthID和Content Credentials驗證功能擴展到Search和Chrome中。你只需通過即圈即搜(Circle to Search)或在Chrome中右鍵點擊并詢問“這是由AI生成的嗎?”,就能獲得清晰的回答及其他有用的上下文。例如,這張圖片去年在社交媒體上廣為流傳,但這顯然是假的,因為我根本不吃漢堡。對于其他人來說這可能并不明顯,這就是這些工具真正能派上用場的地方。當然,只有當更多合作伙伴決定為其AI生成的內(nèi)容添加水印時,這一切才能實現(xiàn)規(guī);(yīng)。NVIDIA去年已簽約加入SynthID陣營,今天我非常激動地宣布OpenAI、Kakao和ElevenLabs也正在采用SynthID。很高興看到這種跨行業(yè)的合作,我們期待將合作擴展到更多伙伴,并為AI時代的透明度設(shè)定新標準。

以上就是我們在世界模型(World Models)方面取得的進展,F(xiàn)在來談?wù)凣emini 3系列的下一步計劃。

5.大模型系列重大升級:Gemini 3.5 Flash與3.5 Pro

SUNDAR PICHAI:幾個月前發(fā)布的Gemini 3擁有完整的模型系列,也是我們迄今為止被采用最廣泛的系列。我們非常高興看到開發(fā)者將Flash作為日常主力模型,并利用Pro的深度推理能力構(gòu)建出令人驚嘆的多模態(tài)體驗。我們一直致力于改進這些模型,特別專注于智能體編程、長周期任務(wù)以及真實世界的流程。

今天,我很高興能介紹Gemini 3.5 Flash,這是我們首個將前沿智能與行動能力相結(jié)合的模型系列。有兩點我想強調(diào):

首先,與3.1 Pro相比,F(xiàn)lash在幾乎所有基準測試中都表現(xiàn)得更好。它在編程方面取得了巨大進步,在涵蓋許多具有實際經(jīng)濟價值任務(wù)的GDP val基準測試中實現(xiàn)了驚人跨越。

其次,3.5 Flash是一款功能強大的行業(yè)前沿模型,足以媲美頂尖模型但速度要快得多。這就是為什么在觀察智能程度與輸出速度的關(guān)系圖表時,它能在右上象限中獨占鰲頭。在每秒輸出Token數(shù)方面,它的速度是其他前沿模型的四倍,使用體驗令人驚嘆。

這款新模型對Google內(nèi)部而言具有變革性意義。我們一直將3.5 Flash應(yīng)用于重新構(gòu)想的Agent優(yōu)先開發(fā)平臺Antigravity,它極大地加速了我們的構(gòu)建過程。三月份,我們每天為內(nèi)部開發(fā)者處理5000億個token,這個數(shù)字每隔幾周就會翻倍,而現(xiàn)在我們每天處理超過3萬億個token。這種規(guī)模創(chuàng)造了一個強大的反饋循環(huán),正幫助我們不斷改進3.5。今天我們也將把它帶給Antigravity的開發(fā)者們,下面讓Varun來分享更多信息。

 

圖片

6.智能體開發(fā)平臺:Antigravity 2.0桌面應(yīng)用

VARUN MOHAN:這確實是一個成為構(gòu)建者的絕佳時代。我們已經(jīng)超越了輔助編寫代碼的AI工具,進化到了能夠協(xié)助執(zhí)行任務(wù)的智能體(Agents)。這些智能體極大地降低了開發(fā)門檻,讓任何人都能成為構(gòu)建者,甚至是忙碌的CEO。事實上,Sundar上周還使用Google Antigravity修復(fù)了Google代碼庫中的一個Bug。當我們在11月推出Antigravity IDE時,我們確保核心的智能體驅(qū)動型IDE體驗達到極致,并添加了一個實驗性的首創(chuàng)智能體用于Surface,以此展示未來的發(fā)展方向。數(shù)以百萬計的用戶已經(jīng)在使用Antigravity,因此我們今天很高興能帶來更多內(nèi)容。我們觀察了任務(wù)和偏好的多樣性,聽取了坦率的產(chǎn)品反饋并吸取了經(jīng)驗。

現(xiàn)在,Antigravity正在大規(guī)模擴展其智能體能力、界面、集成和產(chǎn)品系列功能。

首先,我們將推出完整的CLI體驗:Antigravity SDK、支持Gemini音頻模型的原生語音支持,以及與Android、Firebase和Google AI Studio等多個界面和平臺的集成。所有這些今天就已準備就緒供大家試用。

最重要的是,其核心是Antigravity 2.0,這是一款全新的獨立桌面應(yīng)用程序,完全實現(xiàn)了最初對真正Agent優(yōu)化體驗的愿景。全新的Antigravity毫不掩飾地堅持Agent優(yōu)先,專注于核心智能體對話、智能體生成的制品以及多智能體編排。

正如Sundar提到的,這正是Google內(nèi)部團隊一直以來用于創(chuàng)造巨大價值的體驗。Antigravity Agent Harness是Gemini執(zhí)行現(xiàn)實世界任務(wù)的隱形框架,隨著子智能體(Subagents)、鉤子(Hooks)和異步任務(wù)管理等新核心原語的加入,功能變得更加強大。

支撐這一切的基礎(chǔ)是Gemini模型,其中Gemini 3.5 Flash已經(jīng)與Antigravity Harness進行了深度協(xié)同優(yōu)化。作為工程師我們很好奇,這些智能體和模型究竟能將可能性的邊界推向何處。

因此,利用全新的Antigravity和Gemini 3.5 Flash,我們要求智能體去承擔(dān)一項被認為高度復(fù)雜且令人印象深刻的任務(wù):從頭開始構(gòu)建一個運行中的操作系統(tǒng)。我們對結(jié)果感到非常驚訝。Antigravity以異步方式將挑戰(zhàn)分解為一個連貫的計劃,通過并行子智能體處理任務(wù),并對其進行生成、執(zhí)行和迭代。在內(nèi)部測試中,93個子智能體并行工作超過12小時,發(fā)起了超過15000次模型請求,處理了26億個token,將一個最初為空的項目開發(fā)成了一個功能完備的操作系統(tǒng)核心。這在Gemini 3.1 Pro上是不可能實現(xiàn)的,但得益于Gemini 3.5 Flash的性能和成本效益,構(gòu)建這樣一個功能完備的操作系統(tǒng)消耗了不到1000美元的API額度。

Antigravity智能體編寫了從調(diào)度程序到內(nèi)存和文件系統(tǒng)管理的每一行代碼,全部由一個自主智能體團隊生成、審計和測試。需要說明的是,從零開始開發(fā)操作系統(tǒng)出了名的殘酷,可能需要耗費數(shù)月時間。我們不僅僅是在構(gòu)建一個應(yīng)用程序,而是一個應(yīng)用程序可以運行其上的功能完備的操作系統(tǒng)。

讓我們進行現(xiàn)場演示,實際展示該操作系統(tǒng)的運行情況。

現(xiàn)在我正處于Antigravity構(gòu)建的操作系統(tǒng)終端窗口中。演示運行中的操作系統(tǒng)并不容易,所以讓我們找點樂子看看好不好使。我們可以安裝一個有趣的實用程序SL,這是LS命令的一個常見拼寫錯誤。先不劇透,直接看效果。成功了,你可以看到一輛印著Antigravity標志的酷炫機車穿過屏幕。

但顯然,除非能玩《毀滅戰(zhàn)士》(Doom),否則它就不是一個真正的操作系統(tǒng)。我現(xiàn)在嘗試運行Doom,但它無法工作,結(jié)果發(fā)現(xiàn)這里缺少一些必要的視頻和鍵盤驅(qū)動程序。所以讓我們嘗試在新的Antigravity中修復(fù)它。我準備了一個提示詞正準備粘貼進去,在它運行的同時,我們先來參觀一下Antigravity 2.0。

如你所見,Antigravity 2.0完全采用了智能體優(yōu)先(Agent First)的設(shè)計,所有的智能體對話和項目都顯示在側(cè)邊欄。讓我們快速查看一下我之前進行過的一段對話。對于這次演示,我很好奇關(guān)于Doom的一些趣聞軼事,所以我讓智能體做了一些調(diào)研。它在面板右側(cè)生成了圖表,最后還為我生成了一個很酷的制品(Artifact)。它甚至使用Nano Banana Pro生成了一張信息圖,利用它剛剛編寫的代碼生成圖表,隨后又生成了一些很酷的表格。正如你所見,Antigravity 2.0是毫不掩飾的智能體優(yōu)先產(chǎn)品,并且已優(yōu)化為你與智能體交互的最佳界面。

讓我們回顧之前的對話看看進展如何。Antigravity最終進行了大量研究,編寫了超過100行代碼,修復(fù)并構(gòu)建了操作系統(tǒng)。讓我們瞧瞧Doom是否能運行,真相大白的時刻到了。完美運行,太棒了!這游戲永遠不會過時。雖然在Antigravity構(gòu)建的操作系統(tǒng)上玩Doom既有趣又令人印象深刻,但進步并未止步于此。我們已經(jīng)要求智能體構(gòu)建了一套照片編輯套件、一個實時消息應(yīng)用以及一個多用戶協(xié)作平臺,所有這些都取得了相同的高質(zhì)量結(jié)果。得益于全新的子智能體(Subagent)團隊協(xié)作能力,長達數(shù)天的工程工作正在縮減至數(shù)小時甚至數(shù)分鐘。

我們很高興能以早期研究預(yù)覽版的形式,在Antigravity中為您呈現(xiàn)這一強大功能。最后但同樣重要的一點是,3.5 Flash的速度快得驚人。正如Sundar所說,它比其他前沿模型快四倍。但眾所周知智能體編程極度消耗Token,因此我們在Antigravity中將其性能提升到了新高度。我們對Flash進行了專屬優(yōu)化,使其在Antigravity中的速度不僅快了4倍,而是快了驚人的12倍。

我們非常激動能從今天開始讓大家體驗到這一切。我們今天展示的不僅僅是一個愿景,更是我們?nèi)绾螌ntigravity打造成為面向所有人的最完備智能體開發(fā)平臺。我們正通過Google生態(tài)系統(tǒng)來實現(xiàn)這一目標,無論是集成你已在使用的技術(shù)棧和工具,還是利用Antigravity的Agent Harness為Google各項產(chǎn)品中下一批智能體體驗提供動力。今天,Antigravity 2.0已面向全球所有人開放。請加入我們的開發(fā)者主題演講,我們將演示所有新功能;氐侥隳抢,Sundar。 

SUNDAR PICHAI:謝謝Varun。令人難以置信的是,Varun演示的整個操作系統(tǒng)是由一個子智能體團隊在短短12小時內(nèi)以如此低的成本構(gòu)建完成的。Flash的驚人之處在于,它能以不到同類前沿模型一半的價格,提供前沿級別的能力。

我們聽說許多公司才到五月份就已經(jīng)耗盡了全年的Token預(yù)算。如果公司混合使用Flash和其他前沿模型,他們可以節(jié)省大量資金。為了更直觀地說明這一點,Google Cloud的頂尖客戶每天處理約1萬億個token。如果他們將80%的工作負載從其他前沿模型轉(zhuǎn)移到3.5 Flash,每年將節(jié)省超過10億美元。這些實實在在節(jié)省下來的資金,可以重新投入到公司的發(fā)展中。

Gemini 3.5 Flash即日起面向所有人開放,涵蓋我們的各項產(chǎn)品和API。我們對3.5 Pro也感到非常興奮,我們正在內(nèi)部使用它,它展現(xiàn)出了巨大的進步。我知道你們等不及想親手體驗它了,請再給我們一個月的時間將其交付給你們。

 

圖片

7.個人專屬AI智能體:Gemini Spark

SUNDAR PICHAI:Gemini 3.5和Antigravity正在開啟一個關(guān)于智能體及智能體能力的新世界。我們一直致力于為開發(fā)者和企業(yè)提供智能體。而現(xiàn)在,我們正全力專注于安全、可靠地將這種力量帶給消費者,讓它們?yōu)槊總人服務(wù)。

今天你將在我們的許多產(chǎn)品中看到豐富的智能體體驗。我對我們直接引入Gemini App的新功能感到無比興奮,隆重推出Gemini Spark。它是你的個人AI智能體,可以幫助你處理數(shù)字生活,在你的指導(dǎo)下代表你執(zhí)行操作。它運行在Google Cloud的專用虛擬機上,并且24/7全天候在線。沒錯,你可以安心合上筆記本電腦。它由Gemini 3.5和Google Antigravity Harness提供動力,這使得它能夠輕松在后臺執(zhí)行長時間運行的任務(wù)。Spark與各種工具無縫集成,首先從我們自己的工具開始,并在接下來的幾周內(nèi)通過MCP與第三方工具集成。你可以采用最方便的方式與Spark協(xié)作,無論是在Gemini應(yīng)用中,還是很快將支持的電子郵件和聊天交互。讓我們請Josh上臺分享更多內(nèi)容。 

JOSH WOODWARD:謝謝Sundar。很高興見到大家。讓我通過一些個人生活中的例子向大家展示Spark是如何工作的。現(xiàn)在我們打開了經(jīng)過徹底重新設(shè)計的全新Gemini,稍后會在節(jié)目中詳細討論這一點。

我想帶大家看看這里的Spark,你可以直接看到一個包含我在后臺運行的所有任務(wù)的儀表板。它允許你查看這些任務(wù),我馬上就粘貼進一個任務(wù)。這是一個非常直接但很實用的例子。幫我給團隊起草一封郵件,匯總關(guān)于我們最近Gemini Live發(fā)布的所有內(nèi)容以及上周取得的成果。使用斜杠命令調(diào)用ghost writer,這樣就有幾件事正在處理。它會跨越Docs、電子郵件和聊天記錄編譯所有內(nèi)容,并抓取本次更新所需的最重要信息。它還會使用上周所有調(diào)用了slash ghost writer的內(nèi)容。這是我編寫的一項個人技能,所以電子郵件聽起來很像我的語氣。最棒的是通過Spark你可以上傳在網(wǎng)上找到的最喜歡的技能。所以我們要讓它在后臺運行。你可以看到它已經(jīng)開始執(zhí)行各種工具調(diào)用。

現(xiàn)在我要切換到另一個個人生活中的例子。我們正在籌劃一場大型街區(qū)派對。這是一個相當復(fù)雜的提示詞,我們希望它能協(xié)助收集所有的RSVP回復(fù)確認,記錄誰帶了什么東西,并記得給那些還沒注冊的鄰居發(fā)郵件。

這里最令人驚嘆的是Spark將逐步執(zhí)行所有步驟,并在跨越各種技能和應(yīng)用進行協(xié)作時為你節(jié)省大量時間。它會把任務(wù)分解并為你生成文件。第一個是一個實時RSVP追蹤器,直接在Google Sheets中運行。它顯示了誰已確認誰還沒有。它實際上會自動更新,因為它與Gmail相連。當L. Thompson回復(fù)了8份RSVP時它會自動更新,這非常了不起。

另一件事是它會跟蹤所有不同的嘉賓并向尚未報名的人發(fā)送后續(xù)提醒,這同樣會自動發(fā)生。它會創(chuàng)建草稿并在我的控制下由我發(fā)送。最后提示詞還生成了一份用于街區(qū)派對的預(yù)熱演示文稿,直接在Google Slides中生成并完美集成。它甚至加入了像我們將放在盡頭路口的巨大充氣城堡之類的內(nèi)容。所有這一切都發(fā)生在后臺并受我控制。Gemini甚至可以更進一步提取出諸如你所在社區(qū)的業(yè)主協(xié)會不允許你在6月5日周五下午之前進行搭建之類的信息,這是從我Google Drive中的一個文件里提取出來的。因此它在整合所有內(nèi)容方面表現(xiàn)得非常出色。

這展示了Spark在筆記本電腦上的運行情況,它在移動端同樣表現(xiàn)驚人,同時支持Android和iPhone。在我的手機上打開進入Spark,你可以看到我們之前的兩項任務(wù)剛剛同步完成。它們會在你的所有設(shè)備上保持同步,這非常有幫助。

Spark在記錄腦海中的靈感碎片方面表現(xiàn)驚人。如果你超級忙碌,你可以隨手把任務(wù)拋給它,Spark就會接住它們并開始處理。請看這個指令:幫我開啟幾個線程。第一個找到所有即將舉行的與Sundar的會議并將它們?nèi)繕擞洖榱练凵悦忮e過。第二個給昨晚寫下的新鄰居John和他的家人寫一張便條,邀請他們參加我們的街區(qū)派對,因為他們不在我們最初的列表上。第三個創(chuàng)建一個文檔,列出在學(xué)年結(jié)束前我和妻子需要為孩子們做的最重要的事情,按截止日期和優(yōu)先級進行分類并使其易于理解,我不想錯過任何事情。發(fā)送該請求后,它能以我說話的速度捕捉所有上下文并處理任務(wù)。它以單線程開始,而在后臺實際上會去處理并將這些內(nèi)容分解為單個任務(wù),F(xiàn)在我可以直接收起手機繼續(xù)我一天的生活,Spark會在后臺為我工作。這是我們第一次能夠把手機放下讓它在I/O舞臺上持續(xù)工作,這太棒了。

出于安全考慮,我們本周將向受信任的測試人員謹慎發(fā)布Spark,并于下周作為測試版面向美國的Google AI Ultra訂閱用戶推出。我們希望這種新型幫助能讓盡可能多的人使用,因此我們將推出每月100美元的全新Ultra方案。對于那些需要最高限制的用戶,我們將把頂級Ultra方案的價格從每月250美元降至每月200美元。

還有更多精彩內(nèi)容即將推出,今年夏天晚些時候Gemini Spark將直接在Chrome中運行,作為你在整個網(wǎng)絡(luò)上的代理瀏覽器,它可以在您的指導(dǎo)下執(zhí)行操作完成任務(wù)。我們還在為您的智能體在手機上構(gòu)建一個專屬的大本營Android Halo,它將于今年晚些時候推出。正如Sundar所說,我們已經(jīng)進入了整個Google的全新智能體時代,我們迫不及待地想看到你們將用它構(gòu)建出什么樣的成果;氐侥氵@里Sundar。

SUNDAR PICHAI:謝謝Josh。很高興看到Gemini Spark能夠代表你處理事務(wù)。我嘗試過各種各樣的智能體,你能真切地看到其中的潛力。在讓智能體變得易于使用、極度安全且真正提供幫助方面目前仍處于早期階段。這就是為什么我對Gemini Spark感到非常興奮。我們正在奠定基礎(chǔ)以安全可靠的方式將這一切帶給各地的消費者,期待著讓大家都能嘗試。

我們正堅定地處于智能體化的Gemini時代。Gemini Spark是你們所見到的第一個體驗,由3.5模型和Antigravity共同實現(xiàn)。這種結(jié)合為我們提供了履行使命的新方式,并使我們的產(chǎn)品能夠發(fā)生根本性的變革從而提供更強大的幫助。我迫不及待地想看到它將如何改變Search這項我們最終的登月計劃。過去的一年已經(jīng)證明了創(chuàng)新的力量有多么強大,這正是我們信息使命的核心所在。隨著我們進入智能體時代,Search將比以往任何時候都更加實用和強大,F(xiàn)在我把麥克風(fēng)交給Liz,讓她來分享接下來的內(nèi)容。

 

圖片

8.搜索引擎重構(gòu):AI Search與Search智能體

LIZ REID:人們每天都會向Search提出數(shù)十億個問題。有時全世界都在搜索同一件事,但更多時候你的問題就像你本人一樣獨一無二。這就是為什么我們致力于讓人們能夠隨心所欲地提問。為了實現(xiàn)這一點,我們一直致力于將搜索引擎的最佳體驗與AI的優(yōu)勢相結(jié)合。

我們從AI Overview開始了這一轉(zhuǎn)型。就在去年的這個舞臺上我們推出了AI Mode。這是我們最強大的AI Search,引入了最先進的Gemini模型。從今天起我們將它升級至Gemini 3.5。

正如Sundar所提到的,AI Mode的月活躍用戶數(shù)已突破10億大關(guān),并且我們正見證著驚人的增長。自發(fā)布以來AI Mode的查詢量每季度都在翻倍。隨著搜索功能的不斷增強,用戶開始提出更多問題,以至于上個季度搜索查詢量達到了歷史新高。

更令人矚目的是你們正在以極其具體詳盡的方式提出真實的問題,因為你們知道Search確實可以解決這些問題。你正在與Search進行真正的來回對話互動并不斷深入。你不僅僅是在詢問附近的徒步路線,你還會要求制定一個附近徒步的一日游行程,要求有壯麗的景色、寵物友好型路線以及一個停車方便的午餐地點。

現(xiàn)在我們正進入Google Search的新篇章,令人驚嘆的AI功能不僅存在于Search之中,Google Search本身就是徹頭徹尾的AI Search。現(xiàn)在它是一款集成了我們最先進的Gemini模型、最新的智能體能力以及全球最廣泛信息的AI Search。

我們在每分鐘更新一次超過10億條事實,每天索引數(shù)十億個新網(wǎng)頁,并連接到無限廣泛的人類視角。所以無論你想到什么都可以來到Google詢問任何事情。首先我很興奮地宣布我們將推出全新的智能搜索框。以前搜索框是一個受限的空間,但現(xiàn)在它通過AI進行了徹底重構(gòu),會隨著你的好奇心而擴展。

當你提問時,搜索會通過AI驅(qū)動的建議幫助你構(gòu)思問題。這超越了自動補全,它提供了你可能從未想過的細微差別,幫助你將腦海中確切的問題輕松表達出來。這個全新的搜索框?qū)⑽覀冏顝姶蟮腁I工具置于你的指尖。你可以通過文本、圖像、文件和視頻進行跨模態(tài)提問,并跨越所有這些維度進行搜索。這是自25年前問世以來我們標志性搜索框所經(jīng)歷的最大一次升級,它從今天開始正式推出。

接下來我們將引入AI Overviews和AI Mode整合為一種無縫的AI Search體驗,讓與搜索進行對話變得更加容易。你可以毫不費力地從問題跳轉(zhuǎn)到主搜索結(jié)果頁上的回答,再到AI Mode中的后續(xù)追問。你的上下文會一直保留,對話也會隨之深入。你的鏈接和來源會變得與你的需求更加相關(guān),讓你能持續(xù)獲得最優(yōu)質(zhì)的AI和Web體驗。這種全新的無縫AI搜索體驗已于今日在全球范圍內(nèi)的桌面端和移動端上線。

剛才你們聽到了Sundar和Josh分享了關(guān)于智能體及其所能開啟潛力的思路,F(xiàn)在我們正朝著這一愿景邁出令人興奮的一步,屆時你將能夠直接在Search中創(chuàng)建并管理多個AI智能體來處理各項任務(wù)。

我們正進入Search智能體時代。你可以讓信息智能體在后臺全天候為你服務(wù)。它們能準確找到你所需的內(nèi)容,并在關(guān)鍵時刻協(xié)助你采取行動。你可以在Search中同時啟動多個智能體以便獲取最新動態(tài),并在所有對你重要的事情上取得進展。這些智能體將配合Gemini Spark幫助你完成更多工作。讓我們看一些實際應(yīng)用,假設(shè)你對金融非常感興趣,想在關(guān)鍵時刻了解市盈率低于15、現(xiàn)金流為正且負債率低的生物技術(shù)大盤股。

你只需提出要求你的智能體就會立即開始工作。它接收你極其復(fù)雜的問題并制定出一套方案,判斷緊急程度,理解你需要即時情報并設(shè)置觸發(fā)器留意不斷變化的信息,同時挑選該任務(wù)所需的工具和數(shù)據(jù)鉤子。它直接連接到我們的實時金融數(shù)據(jù),讓你獲得秒級的最新更新,涵蓋股票價格和市場洞察,在市場波動的瞬間即刻掌握。當市場發(fā)生變化時,智能體會向你發(fā)送一份智能綜合更新。它能幫助你理解當前局勢去偽存真,從雜亂的信息中提取核心信號。它還會為你指向高度相關(guān)的眾包研究平臺、新聞網(wǎng)站和社交媒體內(nèi)容。這有助于網(wǎng)站和創(chuàng)作者在人們最關(guān)心的時刻讓那些真正感興趣的人發(fā)現(xiàn)新鮮內(nèi)容。

假設(shè)你正在找公寓,你可以把腦海中關(guān)于目標的各種想法包括地理位置、自然采光和可用性等標準告訴它,然后你的智能體會持續(xù)掃描整個網(wǎng)絡(luò)涵蓋各大網(wǎng)站、社交媒體和論壇;蛘呷绻闶莻球鞋迷,你只需要求在任何你喜愛的運動員發(fā)布運動鞋聯(lián)名或發(fā)售信息時通知你即可。它會監(jiān)控從博客到我們Shopping Graph的所有內(nèi)容,讓你不會錯過任何消息。今年夏天你將能夠讓信息智能體為你工作,只需讓Search隨時為你更新你想了解的信息。

信息智能體是我們在搜索中推出的首批智能體之一,旨在為您提供更多幫助。所以無論你是想查找、核實、預(yù)訂、購買還是進行其他操作,搜索都能幫您搞定。我們還將智能體編程引入搜索,使其能夠為您的問題定制專屬體驗。為了向大家展示具體運作機制有請Robby。

ROBBY STEIN:我們相信Search的最佳版本是專為您創(chuàng)建的版本,能以最有助于回答您提問的格式呈現(xiàn)信息。我們已經(jīng)花費多年時間來完善這一點。如果你在購物我們會為你提供產(chǎn)品,詢問數(shù)據(jù)你會看到圖表,尋找靈感你會獲得精美的視覺效果。

現(xiàn)在我們正將其帶入一個全新水平,將Antigravity以及Gemini 3.5 Flash的智能體編程能力直接引入Search。因此Search可以針對您的問題即時完全定制并構(gòu)建出理想的格式,包括動態(tài)布局、交互式組件甚至是整個為你量身定制的體驗。這就是在Search規(guī)模上實現(xiàn)的智能體編程。

讓我舉個例子。假設(shè)我是一名試圖理解天體物理學(xué)的大學(xué)生,我可以直接去Search搜索黑洞是如何影響時空的。在AI概覽中我直接得到了一個交互式可視化圖表。搜索意識到對于如此復(fù)雜的概念我需要通過交互來真正理解它。這只是入門,所以我要追問向我展示像聯(lián)星黑洞這樣兩個相互繞轉(zhuǎn)的天體是如何產(chǎn)生引力波的。搜索功能實時動態(tài)構(gòu)建了一個全新的交互式視覺效果,完全為我的特定問題定制。我可以調(diào)整軌道間距和質(zhì)量比等參數(shù),看到波形模式的變化,觀察較小的黑洞繞著較大的黑洞螺旋運行。既然掌握了基礎(chǔ)知識我就可以深入研究LIGO Discovery Papers等資源了解更多信息。

你可能想知道Search究竟是如何為數(shù)十億個獨特問題構(gòu)建這樣的自定義UI的。借助Gemini 3.5 Flash,Search可以從零開始規(guī)劃理想的回復(fù),負責(zé)設(shè)計布局、決定構(gòu)建哪些自定義組件、展開調(diào)研并最終部署代碼。為了在回復(fù)中構(gòu)建自定義組件,這項搜索功能調(diào)用了由Antigravity提供支持的智能體編碼框架,因此它可以在安全的容器化環(huán)境中讀取、寫入文件并執(zhí)行代碼。這就是Varun用來構(gòu)建整個操作系統(tǒng)的技術(shù),我們正將這種強大的能力直接引入Search。搭載Antigravity的生成式UI將于今年夏季向所有人免費推出。因此無論你想了解什么,無論是想知道手表究竟是如何運作的還是在分析通勤的新成本,你都將獲得與問題一樣獨特的回答。

讓我們再進一步。有些項目并非一次性問題而是持續(xù)性的任務(wù),F(xiàn)在Search能夠幫助你構(gòu)建完整的自定義有狀態(tài)體驗,包括工具、追蹤器和儀表板。我將這些視為在Search中構(gòu)建我自己的小程序,它們在處理籌備婚禮或管理搬家等需要持續(xù)跟進的長期任務(wù)時表現(xiàn)尤為出色。

我們要不要一起構(gòu)建一個?我一直在想周末該和家人做些什么,這是我剛剛搜索的活動內(nèi)容。除了來自AI Mode的出色回復(fù)外,Search還主動提出為我制定一個周末計劃。就像剛才看到Search從零開始創(chuàng)建生成式UI和交互式視覺效果一樣,Search現(xiàn)在就可以編寫代碼了。為了讓大家了解幕后運作機制,在構(gòu)建過程中你會看到實時思考步驟和代碼生成的流動過程。Search正在思考合適的組件不僅是獲取信息,還要以最佳方式呈現(xiàn)。我選擇安全地連接Gmail、Photos和Calendar,因此它利用個人智能參考收據(jù)和日歷等內(nèi)容使建議更加實用。它生成了一個精美的計劃,已經(jīng)考慮到了行車時間和天氣。

Search知道我有兩個孩子,喜歡動物,還知道老大正在學(xué)習(xí)國際象棋,所以第二個選項對老大很棒。但為了讓兩個孩子都開心,我打算選定Happy Hollow公園和動物園。因為它與我的日歷同步,它已經(jīng)占用了我下午的時間去見個朋友看比賽。下方所有超酷的餐廳預(yù)訂信息都精美地展示在Maps上。既然看過了這些智能體,我想讓總統(tǒng)夫人的優(yōu)先級更高一些,而且我太太和我盡量安排在周五晚上約會。所以我打算繼續(xù)自定義添加每周五晚上的約會并移至頂部。就像之前一樣它思考調(diào)整計劃所需的操作、查詢實時信息甚至再次檢查我的偏好設(shè)置,速度非常快。它利用Google的各種信息實時構(gòu)建內(nèi)容,現(xiàn)在可以在最上方看到地圖和周五約會之夜標簽頁。向下滾動能看到等保姆到了以后的很棒的餐廳。選好后我們就準備好出發(fā)了。

一個周末計劃如果沒有得到我妻子Danielle的認可就不算完整,所以我把這個應(yīng)用分享給她。當她收到時這正是她在手機上看到的畫面。Danielle進來了,可能等我回家后她有些反饋要給我,不過我們待會兒再處理。我只需要把它添加到我的日歷中,Search會將其添加到我們所有的家庭日歷中然后就準備就緒了。下周末我也能像這樣為家人規(guī)劃一個全新的周末。

我們將把Antigravity引入Search,生成式UI將于今年夏天從訂閱用戶開始推出。在接下來的幾個月里您將能夠像這樣自定義構(gòu)建體驗。從Search智能體到智能體編程,這是一款能為您做更多事情的AI Search。無論提出什么問題,智能體能力將改變你使用Search的所有方式包括購物方式。為了向大家介紹更多信息,有請Vidhya。

       原文標題 : 谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號