![]()
![]()
撰文 | 李信馬
題圖 | Marvis
了不起的智能體 發(fā)現(xiàn)和介紹那些正在改變世界的Agent,這里有現(xiàn)場、有對話,還有沒被寫進新聞的細節(jié)。
這一次,騰訊把AI助手裝進了操作系統(tǒng)里。
5月20日,騰訊正式上線了一款叫Marvis(馬維斯)的產(chǎn)品。這款產(chǎn)品的定位是操作系統(tǒng)層級AI助手,如果你關(guān)注AI圈子,可能已經(jīng)對“AI助手”這個詞免疫了——畢竟近幾年冒出來的同類產(chǎn)品數(shù)都數(shù)不過來。但Marvis的打法不太一樣:它不是嵌在某個App里的對話機器人,也不是瀏覽器里的一個插件。
其實光看名字,Marvis很容易讓人聯(lián)想到鋼鐵俠的AI管家Jarvis(賈維斯)——這么像絕不是巧合。鋼鐵俠有機械戰(zhàn)甲,而我們也有電腦,Marvis就類似一個住在你電腦里的AI管家,它能摸到你的文件、調(diào)動你的應用、操作系統(tǒng)設置,甚至在你不在電腦旁邊的時候,讓你用手機遠程操控電腦。
一句話,裝上它,你就是原始版的鋼鐵俠了。
01.
Marvis能做什么?
在發(fā)布會前幾天,筆者受邀參加了有關(guān)Marvis的媒體溝通會,現(xiàn)場產(chǎn)品團隊進行了一系列的展示。其實光看界面,會感覺和別的AI助手產(chǎn)品似乎沒什么區(qū)別。
![]()
但不同之處在于,別的AI助手,可沒它“能干”。現(xiàn)實生活里,大多數(shù)人用電腦的場景不是“我有問題要問”,而是“我有事要做”——我要找文件、要裝軟件、要清理垃圾、要查電腦配置、要遠程幫爸媽弄手機。總而言之,要的是結(jié)果,而不是對話——對話完了事兒還得我自己干。
溝通會現(xiàn)場的演示中,Marvis就在命令下,對相冊中的圖片進行了識別查找和分類,效率高且準確。據(jù)介紹,Marvis能夠調(diào)用、查找和調(diào)整Windows系統(tǒng)設置,比如檢測硬件能否流暢運行某款游戲,或者調(diào)整系統(tǒng)設置、優(yōu)化開機自啟動項、清理冗余文件。
Marvis還集合了多種本地模型理解文件,能搜索文件/圖片內(nèi)容、圖片內(nèi)文字,還能根據(jù)人像、內(nèi)容主題、節(jié)日地點等維度,提供 AI 圖庫,解決了“不記得文件名就找不到文件”的用戶難題。
目前主流的Agent產(chǎn)品大多需要用戶前期自行搭建工作流或配置skills技能,而Marvis在出廠時預置多Agent協(xié)作體系,能實現(xiàn)6個Agent協(xié)同的“AI團隊”7×24小時在線待命,舉個例子,你可以說“幫我找出上個月的發(fā)票,按時間排好整理成表格”,然后屏幕右側(cè)彈出了六個Agent的狀態(tài)面板:
![]()
主Agent——它是整個團隊的大腦和調(diào)度中心,負責理解你的意圖、拆解任務、分配給合適的Agent,最后把結(jié)果匯總交付給你。你可以把它想象成一個項目經(jīng)理,只需要跟它提需求,剩下的事它來安排。
File Agent——專門管文件。找文件、讀文件、整理文件、新建文件,都是它的事,比如識別出哪些是發(fā)票,提取金額、日期、開票方等關(guān)鍵信息。
Computer Agent——是Windows系統(tǒng)運維專員,負責電腦底層配置與自動化運維,系統(tǒng)設置、硬件檢測等操作。
App Agent——應用操作專員,可以調(diào)用電腦上的App與Exe應用。
Browser Agent——網(wǎng)頁交互專員,可以接管網(wǎng)頁,進行網(wǎng)頁交互與數(shù)據(jù)抓取。
Search Agent——搜索專家,擅長網(wǎng)絡搜索與信息聚合,能快速從公開資源中定位答案并給出關(guān)鍵引用。
想象一下,以前至少半小時的工作量,現(xiàn)在你只需要對著Marvis說一句,然后就可以等結(jié)果出來。有了這六個Agent,用戶的上手門檻更低,整個過程從下指令到出結(jié)果,看著也確實流暢。而且不只是直接用電腦,用戶還能用手機遠程操控電腦,下指令讓電腦里的Agent干活。這個功能對于出差在外需要遠程處理電腦上文件的職場人來說,實用到夸張。
02.
Marvis是怎樣做出來的?
有意思的是,這款產(chǎn)品背后的團隊來自騰訊應用寶。據(jù)介紹,這款產(chǎn)品的研發(fā)選擇了“自下而上”的路徑:先理解用戶、設備、文件、應用、行為路徑,再反推服務。團隊從2023年就開始深耕文件解析、格式轉(zhuǎn)換等底層工具,先打好地基,再構(gòu)建Agent框架。
騰訊內(nèi)部還有類似的產(chǎn)品,比如WorkBuddy,不過它的定位是全場景職場AI智能體桌面工作臺,擅長自動批量任務處理、文檔生成、數(shù)據(jù)處理等,側(cè)重辦公效率交付;而Marvis是基于終端系統(tǒng)、文件、應用和算力等,為用戶提供跨端的文件管理、系統(tǒng)設置、多Agent協(xié)作,更側(cè)重個人終端的管理和AI化。
互聯(lián)網(wǎng)產(chǎn)品一定帶上創(chuàng)始團隊的基因,而應用寶有14年應用商店和4年跨端生態(tài)的積累,Marvis也繼承了其與軟硬件廠商的深厚合作關(guān)系和跨端引擎技術(shù)。為什么Marvis不僅能操作電腦Exe軟件,還能直接在電腦上操控手機App?就是因為Marvis做到了操作系統(tǒng)層級的打通,而這又得益于應用寶在芯片層與操作系統(tǒng)層的雙重深耕。
現(xiàn)場Marvis的產(chǎn)品負責人表示:“我們與Intel深度合作,結(jié)合其領(lǐng)先的端側(cè)AI能力與OpenVINO加速技術(shù),針對端側(cè)模型做了芯片級別的運算速度優(yōu)化,整體推理性能提升20%以上;在中小模型場景中,Intel AIPC的GPU/NPU推理速度相比傳統(tǒng)CPU可提升2-10倍,同時做了大量設備兼容,拓寬適配邊界。
操作系統(tǒng)層,我們和微軟攜手,基于Microsoft Foundry on Windows端側(cè)AI開發(fā)平臺,通過系統(tǒng)級WinML推理框架實現(xiàn)大模型在本地NPU、GPU和CPU上的優(yōu)化運行,降低能耗。特別是通過MCP on Windows提供的本地設備代理注冊表(ODR),Marvis接入了系統(tǒng)級文件MCP服務,實現(xiàn)了在應用內(nèi)通過Prompt直接操作電腦文件(變更、查詢、理解等)的能力,這是普通應用層AI無法做到的。”
![]()
目前Marvis已經(jīng)在官網(wǎng)開放下載,支持Windows / Mac / iOS / Android 多端入口、同賬號互通,并每人每天提供1000萬免費Token。不過團隊也表示,Agent產(chǎn)品的token消耗量遠高于聊天助手型AI,長期來說,完全免費不現(xiàn)實,所以想嘗試的朋友要趁早了。
另外,演示永遠是最好看的,真正好不好用,還需要大量真實用戶的反饋來驗證。Marvis提供了兩種模式——效率模式走端云協(xié)同,能在本地完成的識別、索引和預處理盡量在本地消化,必要時再調(diào)用云端能力完成意圖理解和復雜規(guī)劃;隱私模式純本地推理,后者的能力天花板擺在那里,理解復雜任務、長文本處理,跟云端大模型比估計是有差距的,但好處是數(shù)據(jù)不上云,具體怎么選擇就要看用戶自己的需求了。
![]()
最近龍蝦類應用事故頻發(fā),不過團隊表示建立了L2級別的安全兜底機制,凡是涉及資金交易、系統(tǒng)核心配置修改、批量刪除文件等敏感操作,系統(tǒng)會強制“硬垂詢(Hard Confirm)”,必須用戶本人點擊確認后才能執(zhí)行,防止AI“自作主張”,這點讓人比較放心。
過去,大家都在比誰的大模型更強、誰的上下文窗口更長、誰的推理速度更快,Agent更像是一層層披上的皮或者簡單的“工作服”。但如果說,AI真的進入了下半場,那它應該更深度地成為硬件設備的一部分,才能有更高的效率,創(chuàng)造更高的價值。
騰訊Marvis在這個方向上前進了一步,至于這個方向?qū)Σ粚Γ妥層脩魜硗镀卑伞?/p>
![]()
![]()
![]()
![]()
![]()
「創(chuàng)新無邊界」是我們的slogan,我們不局限于對互聯(lián)網(wǎng)行業(yè)的追蹤與探索,更要向未來、向未知的方向大膽邁進。因此,「打造行業(yè)新標桿、解讀商業(yè)新動向」是我們秉持的方向之一。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.