AI接管瀏覽器!實測Codex Chrome:簡單任務翻車,復雜任務反而成了
OpenAI這次不追求取代瀏覽器了。
OpenAI 又一次悄悄地給 Codex「補課」了。
北美世界 5 月 7 日,OpenAI 官宣 Codex for Chrome 擴展功能上線,讓 Codex 可以直接調用用戶電腦上的 Chrome 瀏覽器,進入已經登錄的網站和工具里完成任務。
按照官方的說辭,接入這個擴展功能之后,Codex 可以讀取網頁內容、操作內部系統、查看后臺、填寫表單等,用戶還可以控制它訪問哪些網站。以雷科技的理解就是,現在的 Codex,可以接管你的 Chrome 瀏覽器了。

(圖源:OpenAI)
不過,只看官方介紹,這的確是一個美好的新功能,可體驗過當年 OpenAI 推出的 ChatGPT Altas 的朋友應該都明白,理想和現實還是有一點點差距的。既然如此,我們雷科技AGI(ID:leikejiagi)決定還是親自去體驗看看。
接入 codex,瀏覽器自己「動」起來了
Codex for Chrome 擴展功能的上手難度并不高,一共就分為兩步。第一步是去 Chrome 瀏覽器里找到擴展功能,進入 Chrome 應用商店,搜索「Codex」安裝即可。完成安裝后,它會出現在瀏覽器的右上角,但此時的狀態是未連接。
接著打開 Codex,找到設置里的「電腦操控」,把「Google Chrome」這個插件安裝上,完成后點擊激活即可連接成功。

第一輪測試我們來點簡單的,讓 Codex for Chrome 整理我們的標簽頁。發出指令之后,Codex 開始思考,這一個過程我們不需要去關注 Chrome 正在干什么,它能夠在后臺自動運行。
雖然是簡單的操作,反倒讓 Codex 犯了難。Codex 最開始并不能完全識別到所有的標簽頁,且沒有一個專門的控件能夠執行這個操作,但它想到了可以先關閉所有標簽頁,再按分類順序打開。可惜,第一步 Codex 就誤操作把所有頁面關閉了,但沒有記錄下具體的網址,因此無法打開。

接下來就是測試 Codex for Chrome 在整理數據上的一個能力,我們直接在 Codex 上讓它喚醒 Chrome,收集蘋果、華為、小米最新款旗艦手機信息,輸出資料卡,同時給我們 5 個選題建議。這一次就非常順利了,我們能清晰看到它調用了 Chrome 的網頁,在進行信息搜索和整理,整個過程大概耗時三分多鐘。

給出的 5 個選題,我認為也是超出預期的,針對影像、屏幕、AI 大模型這幾個大家比較在意的部分均有涉及,Codex 還是挺懂讀者想要看哪些內容。

既然這個不算難,那干脆上一個長任務好了。我讓 Codex 在 Chrome 瀏覽器里找到 Deepseek,并寫一篇符合雷科技風格的文章,主題就用之前分析三款旗艦給的建議選題題目,全程讓它自主操作。

這次 Codex for Chrome 的響應速度很快,基本上 30 秒就把指令完整貼到了 Deepseek 上,開始寫文章,直至完成文章也只花了 1 分鐘左右。

接著我們又嘗試了更復雜的操作,讓 Codex for Chrome 做一份 AI 新聞日報的表格。由于我一開始就已經給 Codex 安排上了做 AI 日報總結的 Skill,因此這部分進展還是相對順利的,大概 1 分鐘就完成了信息的收集。然后就到了開啟騰訊文檔,新建表格,將內容粘貼進去,整個過程進展還算順利,中間偶爾會出現識別不準確的問題,但也能及時糾正。

目前來看,Codex for Chrome 的實用性還是挺高的,一方面,Codex 的能力在當前來說的確是第一梯隊的,以它為軸心去執行的操作,基本上不會出現很大的岔子,至少我們嘗試了這幾種方案,都沒有說完全做不到的情況;另一方面,打通 Chrome 和 Codex,最大的優勢其實還是不需要專門更換其他 AI 瀏覽器也能做到相同的效果,降低了換新的門檻。
輔助瀏覽器而不是替代,OpenAI 這次學聰明了
在看到 OpenAI 官宣做了這么個擴展應用時,我們下意識會想起被冷落了很久的 ChatGPT Atlas,作為 OpenAI 推出的首款 AI 瀏覽器,它其實承載了很大的希望。不過,大家也都知道,ChatGPT Atlas 并沒有掀起多大的波瀾。
包括 Firefox、Atlas、美團光年之外團隊打造的 Tabbit 瀏覽器在內的這些 AI 瀏覽器,一直都在教育用戶,現在的瀏覽器不應該只是一個看網頁的工具,它應該能理解你正在看的內容,知道你接下來可能要干什么,甚至在某些時候直接幫你把操作做完。
比如 Atlas,它能在你打開網頁、查資料、做研究、整理信息,AI 都在旁邊跟著看,必要的時候還能進入 agent mode,幫你自動化處理任務。但問題是,大家還是按照習慣,每天的工作基本都在 Chrome 上處理,為啥呢?我認為這很簡單,瀏覽器畢竟不是一個普通的 App,它承載了書簽、密碼、歷史記錄、插件、登錄狀態,還有使用習慣,很多人就是喜歡某些按鈕在某個位置。更別提,Chrome 依然是目前擴展功能最豐富的瀏覽器。

所以回過頭來看 Codex for Chrome,我反而覺得這一招有點雞賊,或許是 ChatGPT Atlas 沒能成功引起了 OpenAI 的另一個思考,那就是,既然改變不了用戶的習慣,我們在用戶習慣的范疇里給更強的能力。
都是 AI 為主,這里面還是有區別的。Atlas、Tabbit 更像是瀏覽器+AI,瀏覽器本身就是產品主角,AI 是它的核心體驗,它在搜索、信息總結這些基于網頁的能力上,表現非常亮眼。而 Codex for Chrome 本質上是借 Codex 的能力落地,Codex 本身就是 OpenAI 打造的專門做任務的 Agent,優勢自然就是「干實事」。

從我們前面的實測看,也確實如此,比如讓它整理旗艦手機資料、生成選題建議、調用 DeepSeek 寫稿、去騰訊文檔新建表格,這些事情 Codex for Chrome 都能做,而且整體不算慢。尤其是調用 DeepSeek 寫稿那次,體驗其實比我預想中順,它能喚起 Chrome,進入對應頁面,找到輸入區域,把內容寫進去。整個過程都不需要我去監看 Chrome 正在發生什么事,也沒有要接管的情況。
我認為 Codex for Chrome 最有價值的地方還是做一些日常比較瑣碎的工作,就像我把 AI 日報做成表格,實際上作為科技數碼行業從業者來說,這可能是每天都需要完成的一項任務,而交給 Codex for Chrome ,可以節省不少時間和精力。

和所有 AI 瀏覽器一樣, Codex for Chrome 目前也還是存在一些問題。我們自己操作瀏覽器的時候,哪些網頁沒加載出來、哪些按鈕不要隨便按,登錄、廣告位置在哪里,我們都能判斷,但是 AI 還是需要花很長的時間識別。比如小雷最擔心的是,萬一它直接點了發布,把沒寫完的文章發布出去,那就釀成大禍了。
所以我現在更愿意把 Codex for Chrome 看成一個已經能干活的半自動助手,在不涉及安全、金融、隱私等方面的工作時,會放心交給它,但還是需要有人在旁邊盯著,以防出現問題。
寫在最后
當然,瀏覽器 Agent 對普通用戶來說,形態倒是沒有那么重要,反而是查資料、寫稿、填表、整理網頁的時候,它能不能給到幫助。
從這次體驗看,Codex for Chrome 已經能做到一部分。它可以幫你跑一些中間步驟,也能把幾個原本需要來回切換的網頁任務串起來。只不過,它現在還沒有到“你說一句話就徹底不用管”的程度。
至于涉及關閉標簽頁、提交表單、修改后臺數據這些動作,現階段還是要謹慎一點。不是說它完全不能做,而是用戶最好知道它做到了哪一步,也最好在關鍵節點看一眼。說白了,你還是得盯著,不要完全讓它全權接管瀏覽器。
這可能也是 Codex for Chrome 眼下最現實的價值:它沒有把瀏覽器 Agent 一步帶到終點,但至少讓人第一次感覺到,這件事不是只能停留在演示里。等它再穩一點、再少翻車一點,用戶自然會給它更多活干。到那時候,瀏覽器會不會被 AI 改掉,反而不用急著下結論。先看它能不能把眼前這些小事做好,就夠了。
OpenAICodexChromeGoogle瀏覽器
來源:雷科技
本文圖片來自:123RF 正版圖庫
原文標題 : AI接管瀏覽器!實測Codex Chrome:簡單任務翻車,復雜任務反而成了
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













