AI芯天下丨熱點丨OpenAI即將推出Agent模式，AI能力又進一步

2025-07-22 10:01

Ai芯天下

關(guān)注

前言：

2025年下半年伊始，始終致力于定義AI領(lǐng)域的OpenAI，正式推出了其Agent模式的解決方案。

這一方案使ChatGPT能在虛擬沙盒中調(diào)用文本瀏覽器、可視化瀏覽器和終端工具，自主完成多步驟復(fù)雜任務(wù)，實現(xiàn)從信息檢索到在線購物等操作，開啟了從Chat到Agent的跨越。

作者 | 方文三

OpenAI自己的Agent模式亮相

近日，薩姆·奧爾特曼與四位OpenAI研究員通過直播形式介紹了即將發(fā)布的Agent模式。

觀其演示過程可發(fā)現(xiàn)，該模式在用戶交互層面的直觀體驗，與數(shù)月前引發(fā)廣泛關(guān)注的Manus模式極為相似。

當(dāng)用戶提出需求后，系統(tǒng)均會自動創(chuàng)建一個虛擬環(huán)境，并開始執(zhí)行任務(wù)。

任務(wù)執(zhí)行期間，Agent會反復(fù)請求用戶確認操作步驟，并允許用戶隨時手動接管進程。

同時，用戶亦可在任務(wù)執(zhí)行過程中插入新的需求指令，實現(xiàn)實時交互。

OpenAI首席執(zhí)行官山姆奧特曼表示，目睹ChatGPT智能體運用計算機執(zhí)行復(fù)雜任務(wù)，使其真切感受到AGI的存在。計算機自主完成思考、規(guī)劃與執(zhí)行的過程，將產(chǎn)生顯著差異的體驗。

所有操作均在ChatGPT Agent專屬虛擬計算機中完成，此舉可在調(diào)用多工具時完整保留任務(wù)上下文信息。

該智能體可根據(jù)需求選擇文本瀏覽器或可視化瀏覽器訪問網(wǎng)頁，執(zhí)行文件下載操作，通過終端命令處理文件，并借助可視化瀏覽器審閱輸出結(jié)果。

同時能夠動態(tài)調(diào)整任務(wù)策略，以實現(xiàn)高效、精準(zhǔn)的快速執(zhí)行。

ChatGPTAgent專為迭代式、協(xié)同式工作流程設(shè)計，其交互性與靈活性遠超既往模型。

任務(wù)執(zhí)行過程中，用戶可隨時中斷進程：進一步澄清指令以修正執(zhí)行方向，或直接變更任務(wù)目標(biāo)。智能體將基于新增信息繼續(xù)推進工作，且完整保留先前進度。

同理，ChatGPT亦會在必要時主動要求用戶補充細節(jié)，確保任務(wù)執(zhí)行不偏離既定目標(biāo)。

若任務(wù)耗時超出預(yù)期或陷入停滯，用戶可選擇暫停進程、獲取進度摘要，或終止任務(wù)以提取現(xiàn)有成果。

當(dāng)用戶安裝移動端ChatGPT應(yīng)用時，系統(tǒng)將在任務(wù)完成后推送通知。

由Operator+Deep Research工具整合而成

根據(jù)OpenAI的介紹，Agent模式可調(diào)用三種工具：文本瀏覽器、可視化瀏覽器及終端。模型具備自主選擇并切換這些工具的能力。

此工具組合的設(shè)計頗具巧思：文本瀏覽器專司大量文本信息的瀏覽與檢索，可視化瀏覽器則負責(zé)在定位信息后執(zhí)行鍵鼠操作或讀取圖像信息。

而終端工具，則用于運行代碼、生成包括演示文稿與電子表格在內(nèi)的文件，并調(diào)用特定的云端應(yīng)用程序接口。

OpenAI此次推出的新型Agent模式，并非一項全新的技術(shù)創(chuàng)新，實則由該公司上半年發(fā)布的兩項工具——Operator與Deep Research整合而成。

Operator原為僅向Pro用戶開放的瀏覽器Agent工具，具備分析圖形操作界面并執(zhí)行基礎(chǔ)操作的能力。

Deep Research則是一款深度研究分析工具，可讀取大量網(wǎng)頁內(nèi)容并直接生成調(diào)研報告。

OpenAI在分別推廣這兩項工具時發(fā)現(xiàn)，許多用戶通過Operator提交的提示指令更趨近于DeepResearch的任務(wù)范疇，例如[規(guī)劃旅行行程并進行預(yù)訂]；

而Deep Research用戶強烈呼吁的[登錄網(wǎng)站、訪問受保護資源]功能，實為Operator已具備的能力。

這兩個從不同維度推進的Agent項目最終實現(xiàn)整合，產(chǎn)生了顯著的協(xié)同效應(yīng)。

既規(guī)避了單純依賴瀏覽器圖形界面處理文本材料的低效問題，又使得生成深度研究報告所需時長顯著縮短。

實現(xiàn)了通用智能體能力的關(guān)鍵升級

與過往的基礎(chǔ)大模型迭代不同，通用Agent能夠自主調(diào)用多種工具進行任務(wù)規(guī)劃，協(xié)助用戶完成復(fù)雜操作，包括自動查閱用戶日歷、生成可編輯的PPT文檔、運行代碼等。

ChatGPT Agent可連接用戶的Gmail、GitHub等平臺獲取信息并解決問題，同時通過API接口訪問各類應(yīng)用程序。

OpenAI采用模擬復(fù)雜現(xiàn)實任務(wù)的基準(zhǔn)測試對該模型進行評估。

經(jīng)Agent技術(shù)增強后，AI智能水平實現(xiàn)大幅提升。

基于ChatGPTAgent的模型在HLE基準(zhǔn)測試中獲得41.6%的評分，達到O3與O4-mini模型性能的近兩倍。

在部構(gòu)建的復(fù)雜經(jīng)濟價值知識型任務(wù)評估體系中，ChatGPTAgent的產(chǎn)出質(zhì)量約半數(shù)情況下達到甚至超越人類水平，任務(wù)完成時間存在浮動區(qū)間，且顯著優(yōu)于o3與o4-mini模型。

在SpreadsheetBench表格操作測試中，該智能體處理復(fù)雜電子表格的編輯、函數(shù)應(yīng)用及格式規(guī)范能力取得顯著突破，以45.5%的得分達到GPT4o性能的兩倍，首次逼近ExcelCopilot商業(yè)級解決方案水平。

網(wǎng)頁操作領(lǐng)域，ChatGPT Agent在WebArena測試中成功執(zhí)行賬戶登錄、頁面跳轉(zhuǎn)、數(shù)據(jù)采集等現(xiàn)實任務(wù)，其表現(xiàn)已接近人類平均水準(zhǔn)。

信息檢索能力方面，該智能體于BrowseComp基準(zhǔn)測試中以68.9分創(chuàng)下當(dāng)前最高記錄。此項指標(biāo)直接決定其自主執(zhí)行任務(wù)時的可靠性水平。

結(jié)尾：

OpenAI的正式入場，或?qū)⒅厮蹵gent創(chuàng)業(yè)領(lǐng)域的整體敘事框架。

數(shù)月前，Manus尚被譽為[國產(chǎn)Agent的希望]：其于業(yè)界尚未充分理解Agent概念之際，率先向市場展示了未來圖景，實證了AI執(zhí)行復(fù)雜任務(wù)的現(xiàn)實潛力。

然今年7月初，Manus官網(wǎng)悄然關(guān)閉，中國大陸業(yè)務(wù)全面暫停，僅保留海外產(chǎn)品線——此舉促使外界重新審視Agent初創(chuàng)企業(yè)的真實生存狀態(tài)。

數(shù)日前，朱嘯虎曾公開斷言：大模型將吞噬90%的Agent市場。

毋庸置疑，此現(xiàn)象背后交織著監(jiān)管政策、合規(guī)要求與資本環(huán)境等多重復(fù)雜因素。

但現(xiàn)在的問題又來到了，當(dāng)OpenAI親自下場，初創(chuàng)通用型Agent的機會已經(jīng)不多了。

部分資料參考：

極客公園：《剛剛，OpenAI發(fā)布了自己的Agent模式，ManusStyle》

機器之心：《剛剛，OpenAI通用智能體ChatGPTAgent正式登場》

果殼：《終于來了，OpenAI的智能體，但這次掌聲不多》

網(wǎng)易科技：《凌晨，OpenAI卷進[通用Agent]，Manus們算白忙活嗎？》

原文標(biāo)題 : AI芯天下丨熱點丨OpenAI即將推出Agent模式，AI能力又進一步

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發(fā)表評論

登錄