![]()
文:王智遠 | ID:Z201440
各家都在說自己的AI能「做事」了,我想試試。
于是,我出了一道題:做一個會議報名表;后端一張多維表,存姓名、聯系方式、地址、電話;前端一個收集頁,別人掃碼填完,數據直接進表格。
這個需求很日常,自己動手的話,十分鐘搓完;但我今天不自己干,要讓AI來。
飛書Aily、釘釘悟空、騰訊Qclaw、百度的DuMate,全裝上,同一個任務扔進去,看誰能從頭到尾跑完。
01
先說騰訊的Qclaw,因為它給我的體驗最魔幻。
我把需求發過去,它理解得很快,馬上告訴我它要調用騰訊文檔來完成這個任務。我一聽,挺合理的,騰訊文檔本來就是你們自家的東西嘛。
然后它開始跑。
第一步就卡了。彈出來一個授權鏈接,讓我登錄。我點了,登了,沒問題。它繼續往下走,走了兩步,又彈出來。又讓我登。
我又登了一遍。你猜怎么著?第三次又來了。
我坐在那兒,反復點同一個鏈接,心想這玩意兒到底在干嘛呢。自家的騰訊文檔,自家的AI產品,這中間的授權你們沒有打通嗎?
前前后后我點了五次。五次;好不容易登錄這關算是勉強過了,它開始嘗試操作騰訊文檔。我看著屏幕上它一輪一輪地調用、一輪一輪地重試,token在嘩嘩地燒。
我當時其實已經有預感了,這事兒大概率跑不通。
沒打斷它,我想看看它到底能走到哪一步。結果就是走到了450萬token。沒了。表格沒建出來,收集表更不用提。整個任務,失敗。
到這兒其實已經夠離譜了。最精彩的在后面;我跟它說:你寫個復盤吧,寫好一點,我要發給你們的產品經理;它還真寫了,而且寫得特別認真,條理清晰,自己診斷出三個問題:
一,授權流程不透明,用戶體驗差;二,收集表的API缺少創建題目的能力;三,沒有面向快速數據收集場景的一體化產品方案。
你看,問題出在哪兒它自己門兒清;最絕的是最后一句建議。它說:參考飛書多維表格的收集加匯總一體化體驗,補齊API能力。
自家選手,打完比賽,坐下來寫總結,最后說建議學習對手;你說我該心疼它還是佩服它的誠實?
![]()
再說釘釘的悟空。
悟空給我的感覺是,它確實在干活;需求發過去之后,它沒有繞彎子,直接在釘釘表格里開始操作;我看著它一步一步地建字段,姓名、聯系方式、地址、電話,都給我安排上了。
后端這張多維表,它是真的交出來了。
我當時心里還挺高興的,心想這不挺順的嘛,然后我等著它做下一步,就是前端的收集頁,等了一會兒,發現它沒動靜了。
我又催了催,它試了一下,還是過不去;收集表這個東西,它做不了。怎么說呢,就像一個廚師,菜給你備好了、切好了、擺盤都弄好了,最后告訴你:灶臺我點不著。
能感覺到釘釘的AI已經把表格這個模塊接進去了,它是真的能操作的;不過,收集表這個模塊,顯然還沒有打通;差一步。這一步沒邁過去,整個任務就算沒完成。
接下來聊百度的DuMate。
DuMate的思路跟前面幾家都不太一樣,這個我覺得值得單獨說一說,它沒有局限在百度自己的產品體系里面。拿到我的需求之后,它去嘗試調用外部的工具來完成任務。
也就是說,它的邏輯是你需要什么我去外面幫你找,這個方向本身挺有意思,能連接別人已經做好的東西,也是一種能力。
關于DuMate的具體體驗,我昨天寫了,感興趣的朋友可以翻翻。
最后說飛書,飛書是我放在最后測的,結果也是最讓我意外的,需求發過去之后,我明顯感覺到它的「工程量」比前面幾個都大;它在同時處理兩件事:后端建多維表格,前端建收集表,然后把這兩個東西關聯起來。
所以,它確實比較慢;我等了一陣子,中間看著它在來回跑,心想別又是一個半成品吧;跑著跑著,出了點bug。我以為又要卡了,結果它自己發現了問題,停下來檢查了一遍,然后回頭修復,接著繼續跑。
這個細節讓我印象很深;前面幾個選手,卡了就是卡了。飛書是卡了之后自己能回頭看一眼,知道哪兒不對,修完繼續走。
![]()
最終它交給我的東西是完整的,后端有數據表,前端有收集頁,別人掃碼填完信息直接進表格。整個鏈路是通的;四個選手里面,它是唯一一個把任務從頭到尾跑完的。
02
四個產品跑完,剛好中午,吃飯的時候,我回想了一下:
幾家大模型,能力上不會差太遠;讓它們寫個東西、總結個文檔、翻譯一段話,大家都能干,水平也都在線;同樣一個做報名表需求扔進去,為什么結果差距會這么大?
后來我想明白了。
問題不在腦子上,在手上;這么說吧,我平時用Claude比較多。Claude能幫我做PPT、做Excel、處理PDF,它不是靠「聰明」做到的。
它背后接了一個一個的skill,每個skill對應一種具體的操作能力。做PPT是一個skill,操作表格是一個skill,讀PDF又是一個skill。
沒有這些skill,模型再聰明,也只能跟你聊天。
企業AI助手是一模一樣的道理;釘釘的悟空為什么能建出表格,做不了收集表?因為表格這個模塊它已經做成了skill,AI能調用。收集表這個模塊還沒接進去,AI夠不著,自然做不了。
飛書為什么能從頭跑到尾?因為多維表格和收集表這兩個模塊,它都做成了可以被AI調動的skill。AI在它的生態里面,手腳是全的。
Qclaw為什么最慘?是騰訊文檔這個skill根本沒接好,授權都過不去,AI連門都進不了,更別說干活了。
大家都在說自家AI多厲害、模型多強,到了真要做任務的時候,比生態里有多少模塊被做成了skill,這些skill接得有多深、跑得有多順。
說白了,模型是大腦,skill是手腳;光有大腦沒有手腳,是不行的。
不過,光說skill還不夠;你想,DuMate也去調了騰訊文檔,Qclaw也在調騰訊文檔。兩個都在「調」,為什么體驗完全不一樣?因為skill和skill之間,深度不一樣。
我把它分成三層來說;第一層叫內建。
就是AI和工具住在同一個房子里;飛書是典型的內建。多維表格是飛書自己的,收集表單也是飛書自己的,這兩個模塊本來就長在同一個產品體系里面,數據流天然是通的。
國外最典型的內建是微軟的Copilot;AI直接長在Word、Excel、PowerPoint、Outlook里面,通過一套叫Microsoft Graph的內部管道訪問所有的數據和文件。
所有工具都是自家的,所有管道都是通的;這是最深的一層,體驗也最順。
第二層叫接入。
就是AI和工具不住一個房子,中間有一根標準化的管道。
現在行業里在推一個東西叫MCP協議,你可以把它理解成AI世界的USB-C接口;不管是什么工具,只要支持這個協議,AI就能用一種標準化的方式來調用。
百度在國內跟進這個方向比較積極,地圖、網盤、文庫都在做MCP的對接;我認為DuMate的思路也是往這條路上走的,嘗試去連接外部的工具。
好處是開放、靈活,不依賴單一生態,管道鋪好了不代表水就通了,從協議到產品體驗之間,還有很多工程要做。
第三層叫調用。就是AI隔著一條街喊話。
沒有內建的先天優勢,也沒有標準協議做橋梁,直接通過API遠程操作;我認為Qclaw的問題就出在這一層。騰訊文檔是自家的產品,按理說應該是最容易打通的。
實際上授權流程都卡死了,API能力也不夠用,最后自己寫的復盤都在說「缺少創建題目的能力」。
把這三層擺在一起看,這次測試的結果就一目了然了。
飛書是內建,AI在自己家里干活,跑通了全程;釘釘是半內建,表格接進去了,收集表還沒有,跑了一半;DuMate在探索接入這條路,方向有意思,還在早期;Qclaw連最基本的調用都沒走順,卡在了自家產品的門口。
模型能力大家可能差不多,AI離工具有多近,中間的路修到了哪一層,決定了它到底能不能替你把事辦了。
03
內建、接入、調用,三層深度擺在這兒了。那一個自然的問題就是:國外走到哪兒了?答案是,它們已經在答下一張卷了。
微軟兩周前發了一個東西叫Copilot Cowork。核心邏輯就兩個字:委派。
你描述你想要的結果,Copilot自動去關聯你的郵件、會議記錄、聊天記錄、文件,把任務拆成計劃,在后臺持續推進。中間有拿不準的地方它會回來問你,你確認了它繼續跑。
微軟還跟Anthropic合作,把Claude的技術集成進了Cowork,不同的任務用不同的模型;Word、Excel、PowerPoint里的Agent Mode也正式上線了,AI直接在文件里做編輯和迭代。
微軟已經不把Copilot當成一個「助手」了,它在做的事情是把AI變成整個Office生態里的執行層。你說一句話,它幫你把活干了。
ChatGPT走的是另一條路。
OpenAI把之前的Operator和Deep Research合到了一起,做成了統一的ChatGPT Agent,給AI一臺虛擬電腦,讓它像人一樣去操作瀏覽器、寫代碼、查資料、填表單。
不綁定任何生態,追求通用操控能力,最靈活,也最脆弱,界面一變它就可能卡住。
回過頭看國內。
微軟能做Cowork,前提是二十年積累的完整生產力全棧。Word、Excel、PowerPoint、Outlook、Teams、SharePoint,全是自己的,數據管道天然就在那兒。
國內沒有誰有這樣的全棧。
飛書有文檔和表格,釘釘有表格和審批,騰訊有文檔和會議,百度有網盤和搜索。每家手里都有一部分,每家都缺一部分。
所以,國內現在是兩條路在賽跑。
一條是飛書式的「內建深耕」;把自己手里的模塊一個一個AI化,一個一個打通,先在自己的地盤上把體驗跑順。從今天的測試看,飛書在這條路上走得最遠。
另一條是「開放連接」;不追求全棧,通過MCP這樣的標準協議去接各家的工具。地盤不一定是我的,路是我修的。
兩條路各有各的賭注;內建深耕賭的是自己的生態能長得夠大、夠全。開放連接賭的是協議能成為行業共識,別人愿意把能力接進來。
現在遠遠沒到分勝負的時候。
我今天測的只是「AI能不能做一張報名表」,真正的賽題是AI能不能接管一整條工作流。
我的朋友鐵柱,這兩天經常讓我幫他干事兒,比如:給我兩張表格讓我幫他合并一下,再比如一個文檔上面的一些東西讓我幫他P一下。
然后,我都把這些交給了龍蝦。我發現龍蝦就會調用各種MCP或者skills,直接把事兒給干了,這應該是一種趨勢。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.