新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

實測騰訊Marvis,我們距離成為“鋼鐵俠”還有多遠?

2026-05-26 15:06
產業象限
關注

參考圖片來自騰訊產品Marvis©有界UnKnown原創

作者丨錢江 編輯|山茶

最近,騰訊又推出了一款新的AI產品——Marvis,并在行業里引起大范圍的討論。

Marvis,聽這個名字,就知道這是在致敬Jarvis——這個人是鋼鐵俠的親密助理,也是人工智能領域最經典的熒幕形象。

對鋼鐵俠或者漫威有過了解的朋友肯定都知道,Jarvis是一個多么強大的AI助理。

它會在鋼鐵俠實驗著火的時候主動拿來滅火器滅火(日常應變);能夠在鋼鐵俠僅僅給出一個指引的情況下,自動測算出用蟲洞穿越時間的方法(科研能力),以及在鋼鐵俠遇到危險、性命垂危的時候,主動幫鋼鐵俠撥通愛人的電話(情感陪伴)......

它是一個真正的全能助理,從生活到工作;它也真正理解并懂得主人的需求,并在適當的時候主動幫助主人做出選擇。

可以說,沒有人會在了解Jarvis之后,不想擁有一個Jarvis;因此這個形象也成為人工智能助理最完美的預設。

所以,騰訊給自己的AI產品取這么一個名字,其想法其實已經昭然若揭——想要打造類似Jarvis一樣,全能的、真正如人類助理一樣角色的AI產品。

這個想法肯定是好的,但,騰訊這個目標能實現嗎?或者說,騰訊實現這個目標的第一步,走穩了嗎?

圖片

Marvis,刻意經營的“活人”形象

為了了解實際情況,我們全程體驗了Marvis這款產品。

可能是為了讓Marvis與Jarvis更接近,反正從進入Marvis的產品頁面,到真正將其安裝到電腦上,這個過程中的每一步,都有騰訊刻意營造的,一種撲面而來的“活人感”。

首先是Marvis的形象,一匹帶著紅圍脖的馬,馬年、騰訊馬化騰,以及現在無數打工人都自稱“牛馬”,這種設定一開始就在想拉近與用戶的距離。

其次,在Marvis初始界面,Marvis一邊給自己補充Token,一邊辦理“入職手續”。

這個畫面也很“騰訊”。因為現實中,騰訊員工完成入職時,也會進入一套名為“紅圍脖”的服務平臺。所謂“戴上紅圍脖,成為鵝廠人”,到了Marvis這里,也有了類似的入職儀式。

但Marvis的“活人感”不只來自這匹小馬,還來自它為Agent搭出的整套辦公室。

在這個虛擬辦公區里,“老板”Marvis坐在前排,后面是五個組員:App Agent、File Agent、Computer Agent、Browser Agent和Search Agent。

它們各自負責不同任務,但呈現出來的不是功能模塊,而是一群正在上班的“同事”,它們有人去茶水間吃零食,有人去健身房活動,有人能在廁所里蹲著刷手機、自由抽紙。

偶爾,它們還能互相竄工位,看“同事”打王者榮耀,順便交流幾句,整個辦公室明亮、整潔,員工穿得整齊體面,像是一個真正的企業環境。

從外部的視角來看,這像是產品經理將騰訊的企業文化和辦公日常搬到了線上,Marvis這匹小馬,就像是一位真正的騰訊員工一樣。

但我們和騰訊的朋友討論,他們卻說,這顯然不是真正的騰訊,因為真正的打工人沒有這么松弛。

他們開玩笑地講,這或許是騰訊老板眼中的騰訊,也或許,是一些騰訊打工人心中理想的騰訊。

但玩笑歸玩笑,無論產品宣傳的氛圍多么有“活人感”,Agent產品最終還是要回到一個最樸素的問題:它到底能不能把活兒干好。

給Marvis做個上崗測試

那么,Marvis的實際能力如何呢?

在正式使用之前,我們看了許多宣傳,基于其系統級AI助手的定位,我們對Marvis的能力有著很高的預期。

因此我們的第一個任務是:讓其調用電腦端已經存儲好的圖片,然后用PS完成公眾號文章封面的制作。

我們設定了一個提示詞:

幫我打開已提供的 PSD 文件,將其中的底圖圖層替換為我提供的新圖片,保持原 PSD 的畫布尺寸、圖層結構、文字、特效與排版不變。替換后,檢查圖片位置、比例與裁切是否正確,避免變形或錯位。最后導出高質量 JPG 文件,并保存到電腦【下載】文件夾。

我們期待的結果是這樣的,這是我們日常使用的封面:

而Marvis實際給到的結果是這樣的:

按理來說,作為系統級的AI助理,Marvis應該用Computer Agent直接打開PSD文件,用我給它的圖片替換掉原來的圖片,并重新導出一個圖片。

但在實際執行過程中,Marvis選擇的卻是File Agent,并且運行了很久。

為此,我還特意和Marvis確認了一下,但它堅持應該使用File Agent,而實際輸出的結果,卻始終不盡如人意。

如果說PSD測試考驗的是本地軟件調用能力,那么接下來的測試,就看它能不能在網頁環境里完成一組連續操作。

我嘗試要求搜索并打開SpaceX的招股書,重點提煉其股權結構、收入結構、核心業務占比,以及近年營收、利潤和主要增長業務。

Marvis派出了Browser Agent聯網搜索,交付了一份表格,列出每一項,但仔細看,出現了一個很離譜的錯誤,本地表格中的關鍵數據都被抹去了一個“開頭”:

比如Space X在2025年的全年營收是187億美金,而Excel表格寫成“87億”美金。

Marvis算是基本完成了任務,但是交付的結果卻存在重大問題…

但在這個過程中,我其實也在反思,是不是我提出的要求本身就超出了這個產品的能力?

所以在后續的測試中,我不再從“我想讓它做什么”的角度出發,而是從“它能做什么”的角度出發。

從Marvis給出的引導功能來看,它默認強調的操作系統級能力,主要集中在三個方向。

第一類是電腦設置和系統檢查,比如檢查電池健康狀況、查看電腦中App的狀態、提醒哪些軟件可能需要更新。

第二類是本地文檔和圖庫的歸類處理。比如,它可以嘗試識別電腦里的文件類型,把資料按照用途重新整理。但這部分體驗里也會出現一些“謎之操作”,例如把一些大摩的研究報告歸類成“簡歷”。

第三類是定時處理一些標準化任務。比如,設置每天17:00自動查看GitHub當日熱門項目,或者訂閱《哈哈哈哈哈6》的更新提醒。這類任務本質上更像“提醒 + 固定流程”,路徑清楚、動作明確,比較適合交給Agent執行。

那么,在這個范疇內,Marvis的完成度如何?

先試試系統設定好的【記不住Mac快捷鍵】任務,點擊后,數秒鐘就完成了任務,并生成了速查圖片:

系統設定好的任務欠缺挑戰性,那么,在這個范疇內新建的任務呢?

我讓Marvis幫我檢查電腦上已安裝的辦公類 App,找出哪些還沒有更新到最新版本,并試著讓它幫我完成一部分App更新。

我給出提示詞:

請檢查我電腦上已安裝的辦公類 App,找出哪些還沒有更新到最新版本。重點包括 Office、WPS、飛書、釘釘、企業微信、騰訊會議、Zoom、Notion、Obsidian、Adobe Acrobat、OneDrive、Google Drive、Dropbox 等辦公、協作、文檔和效率類軟件。請只檢查版本,不要自動更新、卸載或修改設置。最后用表格列出 App 名稱、當前版本、最新版本、是否需要更新、檢查渠道和備注;無法確認的請標注“待人工確認”。

很快,Marvis給出了一份診斷報告:

它提示了我6月12日之前需要更新ChatGPT,于是我要求Marvis幫我下載,但結果不如人意,Marvis幾乎沒有任何瀏覽器的調用權。

在多番嘗試失敗后,給了我一份手動下載建議:

從這幾個任務來看,Marvis的能力需要分兩個維度來看:

一方面是在系統設定的固定任務中,Marvis的完成度較高;但另一方面,一旦任務進入開放環境,它的表現就差強人意。

也可以理解為,Marvis和市場上的龍蝦產品本質差不多,需要結合一些skill或workflow封裝流程,來完成任務。

從我們的結果來看,Marvis給我們帶來的問題是,一開始的宣傳拔高了我們的預期,而實際能力又無法兌現宣傳的結果,因此讓我們在測試的過程中有了一個明顯的心理落差。

但除此之外,即便拋開這種心理落差,Marvis能夠給用戶提供的價值其實也十分基礎,甚至有些雞肋:

比如文檔檢索、資料整理,現在市面上有非常多的資料管理和檢索工具,效率和結果都要比Marvis好很多;再比如任務拆解和內容生成就更不用提了,都不需要拿國際上的其他產品做對比,僅僅是騰訊自家的Workbuddy,其完成度就要比Marvis高很多。

Marvis和市場上同類龍蝦產品的不同之處,更多在于它把這項能力單獨拎出來,包裝成了一個更明確的產品賣點,但實際體驗還沒有證明它比別人干得更好。

所以,體驗到這里,我其實有個疑問,騰訊起這么一個高調,但給出這樣一個產品,Marvis的意義又是什么呢?

Marvis,產品化的OpenClaw?

從宣傳口徑上,Marvis是操作系統層級AI助手,這意味著它可以根據指令,直接操作用戶的電腦,幫助用戶完成一些工作。

怎么樣,這個形容是不是聽起來很耳熟?沒錯,之前風靡全網的OpenClaw(龍蝦)也是這么宣傳的。

事實上,從產品層面目標的角度來講,Marvis和龍蝦是一致的,所以他們的很多能力/功能也非常相似,比如都可以直接操作用戶電腦,都可以直接幫助用戶完成一些工作等等。

它們的差異點在于,OpenClaw是一種框架,它把更多的選擇權和控制權都交給了用戶,比如需要用戶自己部署Gateway,連接各種聊天通道,再配置模型、工具、插件和權限。

而Marvis則更像是一個完全產品化的龍蝦,真正的開箱即用。

比如,Marvis弱化了模型的概念。

界面里看不到模型選項,用戶也不用在GPT、Claude、通義千問、MiniMax之間來回切換。它更像是默認替你選好了底座,大概率是騰訊自家的混元大模型。相比之下,很多龍蝦產品會把模型選擇放在前臺,甚至把“支持多少模型”本身當成賣點。

比如,Marvis做了一個skill合集社區,但和龍蝦產品一板一眼的skill列表式呈現不同,Marvis界面就像小紅書筆記一樣。標題要足夠抓人,封面要足夠夸張,每個skill都被包裝成一個看起來很有用、很適合收藏的“經驗帖”。

每個skill下方還會標注來源,看上去像是一個允許用戶上傳、分享skill的UGC社區。但目前在Marvis里,并沒有看到上傳skill的入口。所以這些skill更可能還處在官方篩選或定向邀請階段,也就是說,它看起來像社區,但暫時還不是一個真正開放的社區。

總的來說,使用Marvis,用戶不需要知道什么是Agent、Gateway、Plugin、API Key,只要像微信一樣下載,安裝,然后就可以給Marvis下達指令,比如:根據電腦中的論文資料,幫我擬定一個開題報告。

所以,Marvis目前最核心的價值,或許是先把“AI模擬真人操作電腦系統”這個概念做成了一個可體驗的產品。

它讓用戶看到了一種方向:未來的AI助手不只是在聊天框里回答問題,而是可以進入電腦、理解資料、執行任務。但就當前體驗來說,它更像是把這個方向先占住了,而真正的能力突破,還沒有完全發生。

Marvis為什么沒變成“Jarvis”?

最后,我們來反思一下Marvis的體驗過程。

說實話,上手之前,Marvis “操作系統級”的宣傳確實抬高了我們的預期。

在還沒使用之前,我和朋友討論時都覺得,這才是Agent產品真正應該做的方向,把OpenClaw沒有做好的工作做好,封裝成產品,降低用戶使用門檻,讓AI不只是聊天、調用工具或執行封裝流程,而是能真正進入電腦環境,替人打開軟件、處理文件、操作網頁,像真人一樣連續完成任務。

也正因為如此,我們期待的不是又一個AI助手,而是它能在“模擬人類操作電腦”這件事上,比市場上現有產品更進一步。

但實際體驗下來,期待越高,落差也越明顯。

當然,這不只是Marvis的問題。它遇到的難點,也是整個Agent市場正在攻克的方向:如何讓AI不只是會回答、會調用工具,而是真的能在真實操作環境里把活兒干好。

第一個難點,是應用權限。

Marvis能當電腦的“二房東”,前提是用戶把本地權限交給了它,所以它可以管理本地文件、檢查系統狀態、整理桌面資料。

但今天很多資料并不在本地,而是在微信、印象筆記、飛書、騰訊文檔、網盤和郵箱里。真正有用的Agent,應該能進入這些日常應用,把分散的信息找出來、讀進去、再整理出來。

現實是,微信不在Marvis的權限列表里。

印象筆記也不在可操作范圍內。

但有意思的是,Marvis有一種契而不舍的“牛馬精神”,它雖然沒有權限接入App,但它給了我一個“小相機”,讓我把相關頁面拍給它看,再繼續識別和處理。

這很像兩點之間本來直線最短,但中間每個路口都有人收費,于是只能不斷繞路。最后事情也許能做成,但效率和體驗都打了折扣。

Agent要真正好用,本質上要把用戶常用應用都做成tools接進去。但問題是,接口掌握在各個平臺手里。微信未必開放,印象筆記未必開放,淘寶、支付寶更不可能輕易開放。各大平臺更愿意自己做生態,而不是把入口交出去。

第二個難點,是技術本身。

Agent在電腦里操作,和人形機器人進家庭干家務很像:標準化環境里能做,泛化環境里就會遇到無數卡點。

電腦界面本身不是結構化數據。人看屏幕時,天然知道哪里是按鈕、哪里是輸入框、哪個彈窗必須處理、哪個文件像論文;但AI看到的首先只是截圖。它必須先把截圖理解成可操作的界面結構,再判斷下一步點哪里、輸什么、打開哪個文件。

所以,單次點擊成功不難,難的是連續幾十步都不出錯。搜索文件、篩選日期、判斷主題、復制資料、閱讀內容、生成文檔、保存到桌面,任何一步出錯,后面都會累積偏差。

Marvis提出了一個很美好的未來:AI進入電腦,成為用戶和操作系統之間的新中介。但要真正變成電腦里的“Jarvis”,還要跨過應用權限、生態接口和長任務穩定性這幾道坎。

結語

AI時代,騰訊一直被寄予更高的期待。

馬化騰在2023年5月的股東大會上稱:“對于工業革命級的機遇來講,早一個月還是晚一個月把電燈泡拿出來,在長的時間跨度上來看,是不那么重要的。”

到了2026年5月的股東大會,馬化騰再次回應外界關于騰訊AI“落后”的說法:“原來一年前我們以為上了船,后來發現那個船漏水了,現在感覺站上去了,還坐不下去,還是希望船速能快一點。”

他同時提到:“公司曾盲目跟風涉足非優勢領域,跟風布局各類熱門賽道,最終大多以失利告終。面對本輪人工智能發展浪潮,我們時刻保持理性清醒,堅決規避過往發展誤區。”

從這幾次發言來看,騰訊對AI的態度一直以“穩”為主:不急著搶第一時間的聲量,而是希望AI成為業務的“增倍器”,結合具體場景解決問題。

但進入2026年,騰訊在AI C端上的動作明顯變得頻繁:2月春節期間,“元寶”上線AI社交;3月推出“龍蝦陣”,微信開放ClawBot接口;4月上線AI影游產品探夢DreamNow;5月上線Marvis。

所以,面對AI,騰訊并不是不焦慮。它只是把焦慮包裝得更克制。

這種焦慮并不難理解,F實情況是,整個AI行業都在面對同一個問題:產品越來越多,入口越來越多,但真正能夠改變用戶習慣的殺手級應用,還沒有完全出現。就像Marvis產品經理直言,“坦白說,我們當下真沒有殺手锏”。

這句話也解釋了Marvis的位置。它并不是騰訊已經找到答案之后推出的產品,而更像是在答案尚未清晰之前,先把一個可能的方向推到用戶面前:讓AI從聊天框里走出來,進入電腦,接管文件、應用和任務。圖片

* 文中配圖來源于網絡

 - END - 

歡迎添加微信:cyxx-z

加入「有界UnKnown」科技交流群

圖片人與AI戀愛的“罪與罰”為什么Image2+ViduQ3,是視頻降本增效的王炸組合?AI能替代演員嗎?

       原文標題 : 實測騰訊Marvis,我們距離成為“鋼鐵俠”還有多遠?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號