網易首頁 > 網易號 > 正文申請入駐

這AI一天確認十幾次，是傻還是憋著壞？（真實體驗48小時）

2026-05-30 06:11:47　來源: 我是一個粉刷匠2

北京舉報

分享至

測試兩天之后，負責任地說，這款AI助手并一定能讓你爽，反而會最先讓你陷入抓狂。

最近有一款叫馬維斯（Marvis）的AI助手突然在朋友圈刷了屏。騰訊應用寶團隊把它定位成“操作系統層級”的AI助手，不再像ChatGPT或Claude那樣乖乖待在瀏覽器里，而是直接扎進Windows系統，能調文件、改設置、啟動應用，甚至跨屏操作手機App。官方宣傳語相當直白——“裝上就有6個AI牛馬幫你干活”。

作為一個整天被選題和稿子追著跑的媒體人，我對這種“全能型數字助理”幾乎沒有抵抗力，于是下載、安裝、開測，記錄了整整48小時的真實使用過程。

以下所有內容，沒有腦補，沒有美化，有些地方甚至相當“勸退”。

先從信息收集說起。做自媒體，選題是命門，而選題依賴熱點追蹤。我像使喚其他AI模型一樣，讓Marvis給我搭一個叫“AIHOT”的資訊追蹤任務。創建流程很順暢，它很快通知我文件已生成。但打開文檔的那一刻，我看到的不是熱點匯總，而是滿屏亂碼。

我用過的大模型和AI工具不算少，輸出文件直接亂碼，這還是頭一回碰到。問題指出來后，Marvis反應倒是不慢，立刻“意識”到問題所在：任務說明里明明寫了要UTF-8編碼，但它在真正寫入文件時，那個編碼參數沒傳過去。它能聽懂指令，但在調用底層系統API時，執行環節掉鏈子了。

這就是系統級AI面臨的首場考驗：不是“能不能做”，而是“執行穩不穩”。還好，指出來之后它修正得挺快，任務恢復運轉。但第一印象已經打了折扣。

原以為這就夠離譜了，鬧鐘測試才真正讓人開了眼。寫完一段稿子，我讓Marvis幫我定個10點的鬧鐘，勞逸結合，提醒我起身活動。當時時間是9點40分——距離10點明明還有20分鐘，但Marvis非常篤定地告訴我：10點已經過了，所以給你設了明天10點的鬧鐘。

我盯著時間愣了好幾秒。一個能操作系統權限的AI，連“現在幾點”和“目標時間”之間的先后關系都能判斷反掉？可能的解釋是，Agent調錯了工具導致時間抓取異常，或者模型吐出的時間本身就帶著邏輯漂移。短期當個樂子還行，但長期來看，基礎信息判斷的穩定性，是生產力的底線。

不死心，我接著測。第二次設10點30分的鬧鐘，沒有任何停頓，立刻創建成功，正常發揮。第三次，我故意挑了一個已經過去的時間——早上8點。這次它沒再犯時間幻覺，而是換了一套策略：彈出一個手動確認窗口，要求我在系統層面親自點確定。拿不準的事情就交給人來判斷，處理得雖然不那么“聰明”，但至少不犯錯。

等第四次，設10點08分的鬧鐘，Marvis的行為模式徹底變了——先核對當前時間，再確認目標時間是否合理，最后才執行創建。之后反復測了幾次，再也沒有出問題，任務創建又快又穩。

四次鬧鐘，幾乎走完了AI產品迭代的一條典型路徑：幻覺犯錯、保守兜底、自查修正。學習和糾錯的速度，比想象中要快。

圖片相關的能力，則是另一番景象。稿件寫得差不多了，我試著讓Marvis直接生成配圖。質量一言難盡，畫面模糊，風格跳來跳去，沒什么可用性。隨后又測了它的“找圖”本事，特別是人物識別。我讓它搜一位公眾人物的照片——按理說，這是它自家生態里的強勢領域，我對它期待不低。結果搜出來的圖，和本人基本對不上號。

更尷尬的是，我反過來拿著它找到的圖片問“這是誰”，它只能給出一些泛泛的特征描述，沒法準確說出人名。研究了一圈才搞清楚：Marvis目前沒有人臉生物識別比對的權限和能力。這不是技術上做不到，而是涉及隱私合規的邊界。一個能自由操作你電腦的AI，如果同時還能精準識別任何人臉，安全爭議會成倍放大。所以，業內共有的一道紅線，不算它的短板。

但它給我挖出一個讓人意外的小功能——本地知識庫。選圖的時候發現，Marvis會把我本地的圖片和文檔歸攏到一個全局圖庫里去。要知道，媒體人的桌面通常亂得很有層次，圖片類文件存進電腦之后，基本等于石沉大海，再也別想輕易撈出來。而這個本地知識庫，支持用模糊語意搜索固定內容。找圖這件事上，它的優勢不在“創造”，而在“幫你盤活”已有的視覺素材。

真正讓我覺得“這東西有救”的，是批量操作環節。文章寫完之后，進入多平臺發布的臟活累活時間。我手里有一個Excel表格，存著所有平臺的發布鏈接。以前的標準流程是：找到表格、打開、逐條復制鏈接、粘進瀏覽器、登錄、發布，純手動操作，至少折騰十幾分鐘。

這次我讓Marvis直接讀取桌面上的表格文件，打開里面所有網址。我原本做好等上三五分鐘甚至卡死的心理準備，結果不到一分鐘，它開始依次讀取桌面文件、解析表格、啟動瀏覽器、逐個打開平臺網址。瀏覽器標簽頁瞬間鋪滿，效率提升直接擺在了眼前。后面我還讓它整理了散落在電腦各處的舊稿子，統一梳理命名規則。這些“體力活”，它都完成得相當干脆利落。寫稿間隙隨口說一句“打開網易云，放首歌”，也幾乎秒響應。

甚至最后，我讓它掃描了一遍電腦里可卸載的軟件和陳年舊圖。分析卸載建議時，它說得頭頭是道；那些藏在磁盤深處、連我自己都忘了的老照片，也被一張張翻出來，整整齊齊理過一遍。看著老照片，聽著網易云，活兒已經被Marvis干了不少，屬于自己的獨處時刻，就這么悄悄降臨了。

它的真正價值，在于把那些重復性、流程化、跨應用的臟活自動化。不是替代大腦，就是替代手指。

但是在整個測試過程中，有一個交互特征幾乎貫穿始終：頻繁確認。刪除文件前要確認，修改設置前要確認，執行任何涉及“寫操作”的環節，它都會停下來問你一句——確定要這樣做嗎？

這種“過度確認”，有人會覺得煩，覺得AI沒有完全釋放便捷性。而我反而覺得，這是一條刻意劃定的安全線。一個能刪你文件、改你設置、操控你應用的AI，如果過于“雷厲風行”，風險幾乎不可逆。Marvis的每一次確認，本質是在遞交決定權。

從亂碼翻車，到鬧鐘幻覺，再到頻繁確認，這款AI助手并不完美。但它用48小時展示了一件事：系統級AI不是在跟你比誰更聰明，而是在學著把權限、執行和安全，擺到一套規范的動作里去。保守，有時候才是更負責任的激進。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.