測試兩天之后,負責任地說,這款AI助手并一定能讓你爽,反而會最先讓你陷入抓狂。
最近有一款叫馬維斯(Marvis)的AI助手突然在朋友圈刷了屏。騰訊應用寶團隊把它定位成“操作系統層級”的AI助手,不再像ChatGPT或Claude那樣乖乖待在瀏覽器里,而是直接扎進Windows系統,能調文件、改設置、啟動應用,甚至跨屏操作手機App。官方宣傳語相當直白——“裝上就有6個AI牛馬幫你干活”。
![]()
作為一個整天被選題和稿子追著跑的媒體人,我對這種“全能型數字助理”幾乎沒有抵抗力,于是下載、安裝、開測,記錄了整整48小時的真實使用過程。
以下所有內容,沒有腦補,沒有美化,有些地方甚至相當“勸退”。
先從信息收集說起。做自媒體,選題是命門,而選題依賴熱點追蹤。我像使喚其他AI模型一樣,讓Marvis給我搭一個叫“AIHOT”的資訊追蹤任務。創建流程很順暢,它很快通知我文件已生成。但打開文檔的那一刻,我看到的不是熱點匯總,而是滿屏亂碼。
我用過的大模型和AI工具不算少,輸出文件直接亂碼,這還是頭一回碰到。問題指出來后,Marvis反應倒是不慢,立刻“意識”到問題所在:任務說明里明明寫了要UTF-8編碼,但它在真正寫入文件時,那個編碼參數沒傳過去。它能聽懂指令,但在調用底層系統API時,執行環節掉鏈子了。
這就是系統級AI面臨的首場考驗:不是“能不能做”,而是“執行穩不穩”。還好,指出來之后它修正得挺快,任務恢復運轉。但第一印象已經打了折扣。
原以為這就夠離譜了,鬧鐘測試才真正讓人開了眼。寫完一段稿子,我讓Marvis幫我定個10點的鬧鐘,勞逸結合,提醒我起身活動。當時時間是9點40分——距離10點明明還有20分鐘,但Marvis非常篤定地告訴我:10點已經過了,所以給你設了明天10點的鬧鐘。
我盯著時間愣了好幾秒。一個能操作系統權限的AI,連“現在幾點”和“目標時間”之間的先后關系都能判斷反掉?可能的解釋是,Agent調錯了工具導致時間抓取異常,或者模型吐出的時間本身就帶著邏輯漂移。短期當個樂子還行,但長期來看,基礎信息判斷的穩定性,是生產力的底線。
不死心,我接著測。第二次設10點30分的鬧鐘,沒有任何停頓,立刻創建成功,正常發揮。第三次,我故意挑了一個已經過去的時間——早上8點。這次它沒再犯時間幻覺,而是換了一套策略:彈出一個手動確認窗口,要求我在系統層面親自點確定。拿不準的事情就交給人來判斷,處理得雖然不那么“聰明”,但至少不犯錯。
等第四次,設10點08分的鬧鐘,Marvis的行為模式徹底變了——先核對當前時間,再確認目標時間是否合理,最后才執行創建。之后反復測了幾次,再也沒有出問題,任務創建又快又穩。
四次鬧鐘,幾乎走完了AI產品迭代的一條典型路徑:幻覺犯錯、保守兜底、自查修正。學習和糾錯的速度,比想象中要快。
圖片相關的能力,則是另一番景象。稿件寫得差不多了,我試著讓Marvis直接生成配圖。質量一言難盡,畫面模糊,風格跳來跳去,沒什么可用性。隨后又測了它的“找圖”本事,特別是人物識別。我讓它搜一位公眾人物的照片——按理說,這是它自家生態里的強勢領域,我對它期待不低。結果搜出來的圖,和本人基本對不上號。
更尷尬的是,我反過來拿著它找到的圖片問“這是誰”,它只能給出一些泛泛的特征描述,沒法準確說出人名。研究了一圈才搞清楚:Marvis目前沒有人臉生物識別比對的權限和能力。這不是技術上做不到,而是涉及隱私合規的邊界。一個能自由操作你電腦的AI,如果同時還能精準識別任何人臉,安全爭議會成倍放大。所以,業內共有的一道紅線,不算它的短板。
但它給我挖出一個讓人意外的小功能——本地知識庫。選圖的時候發現,Marvis會把我本地的圖片和文檔歸攏到一個全局圖庫里去。要知道,媒體人的桌面通常亂得很有層次,圖片類文件存進電腦之后,基本等于石沉大海,再也別想輕易撈出來。而這個本地知識庫,支持用模糊語意搜索固定內容。找圖這件事上,它的優勢不在“創造”,而在“幫你盤活”已有的視覺素材。
真正讓我覺得“這東西有救”的,是批量操作環節。文章寫完之后,進入多平臺發布的臟活累活時間。我手里有一個Excel表格,存著所有平臺的發布鏈接。以前的標準流程是:找到表格、打開、逐條復制鏈接、粘進瀏覽器、登錄、發布,純手動操作,至少折騰十幾分鐘。
這次我讓Marvis直接讀取桌面上的表格文件,打開里面所有網址。我原本做好等上三五分鐘甚至卡死的心理準備,結果不到一分鐘,它開始依次讀取桌面文件、解析表格、啟動瀏覽器、逐個打開平臺網址。瀏覽器標簽頁瞬間鋪滿,效率提升直接擺在了眼前。后面我還讓它整理了散落在電腦各處的舊稿子,統一梳理命名規則。這些“體力活”,它都完成得相當干脆利落。寫稿間隙隨口說一句“打開網易云,放首歌”,也幾乎秒響應。
甚至最后,我讓它掃描了一遍電腦里可卸載的軟件和陳年舊圖。分析卸載建議時,它說得頭頭是道;那些藏在磁盤深處、連我自己都忘了的老照片,也被一張張翻出來,整整齊齊理過一遍。看著老照片,聽著網易云,活兒已經被Marvis干了不少,屬于自己的獨處時刻,就這么悄悄降臨了。
它的真正價值,在于把那些重復性、流程化、跨應用的臟活自動化。不是替代大腦,就是替代手指。
但是在整個測試過程中,有一個交互特征幾乎貫穿始終:頻繁確認。刪除文件前要確認,修改設置前要確認,執行任何涉及“寫操作”的環節,它都會停下來問你一句——確定要這樣做嗎?
這種“過度確認”,有人會覺得煩,覺得AI沒有完全釋放便捷性。而我反而覺得,這是一條刻意劃定的安全線。一個能刪你文件、改你設置、操控你應用的AI,如果過于“雷厲風行”,風險幾乎不可逆。Marvis的每一次確認,本質是在遞交決定權。
從亂碼翻車,到鬧鐘幻覺,再到頻繁確認,這款AI助手并不完美。但它用48小時展示了一件事:系統級AI不是在跟你比誰更聰明,而是在學著把權限、執行和安全,擺到一套規范的動作里去。保守,有時候才是更負責任的激進。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.