![]()
作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com
OpenClaw最近徹底刷屏。不到100天GitHub Star數(shù)突破250,000,超越React 13年的積累,成為GitHub 歷史上Star增速最快的開(kāi)源項(xiàng)目。所有人都在討論“AI 能自己操控電腦了”。
但冷靜想一想——它的部署門檻,對(duì)普通人來(lái)說(shuō)幾乎不可逾越:Docker配置、SSH、API Key申請(qǐng)……加上安全隱患頻發(fā)、調(diào)用成本高企,每一步都在勸退人。當(dāng)下的熱度,更多屬于開(kāi)發(fā)者圈子的焦慮外延。
但它的火,也恰恰說(shuō)明了一件事:大家對(duì)AI介入工作流的渴望是真實(shí)的。 只是需要一個(gè)門檻更低、更貼近日常的方式來(lái)實(shí)現(xiàn)。
實(shí)際上,對(duì)大多數(shù)人來(lái)說(shuō),一個(gè)AI瀏覽器可能就夠了。
1
實(shí)測(cè):和Tabbit做寫(xiě)稿搭子
為了測(cè)試AI瀏覽器,我決定先從日常工作開(kāi)始,整個(gè)寫(xiě)稿過(guò)程只用Tabbit這一個(gè)產(chǎn)品,看看AI瀏覽器能不能扛下來(lái)。畢竟,寫(xiě)作的邏輯不只對(duì)內(nèi)容創(chuàng)作者成立——搜索信息、做研究、整理資料,是每個(gè)人日常都有的通用場(chǎng)景。
先介紹一下Tabbit的幾個(gè)核心功能:瀏覽器本體、Chat、智能代理、妙招功能。利用這幾個(gè)功能,我的創(chuàng)作過(guò)程,大致分為三步。
第一步,在正式開(kāi)工之前,先用“妙招”創(chuàng)建寫(xiě)作模板。
妙招的功能類似Claude Code和龍蝦里的Skill,用戶可以自主創(chuàng)建妙招,保存和復(fù)用高頻提示詞,需要時(shí)在Chat對(duì)話框里,輸入「/」就可以調(diào)用。
我在動(dòng)筆之前創(chuàng)建了兩個(gè):實(shí)測(cè)類專家寫(xiě)作、資料搜集。
其中“資料搜集”包含了我平時(shí)調(diào)研時(shí)的思考框架——從市場(chǎng)格局到產(chǎn)品差異,從技術(shù)架構(gòu)到用戶反饋。這一步花了不到十分鐘,但它決定了后續(xù)整個(gè)過(guò)程的質(zhì)量。
![]()
第二步,調(diào)用“資料搜集”妙招,進(jìn)入調(diào)研環(huán)節(jié)。
AI按我預(yù)設(shè)的框架展開(kāi)搜索,給出了一份覆蓋面完整的調(diào)研報(bào)告,沉淀在當(dāng)前對(duì)話里,以下是截取的產(chǎn)品對(duì)比:
![]()
這個(gè)過(guò)程中有三個(gè)體驗(yàn)讓我印象很深。
第一是,我可以打開(kāi)報(bào)告中的任意鏈接,針對(duì)網(wǎng)頁(yè)截屏,或是劃線選中某段文字,直接注入Chat對(duì)話中,讓AI就這段具體內(nèi)容展開(kāi)分析,上下文始終連貫。
![]()
其次,是智能標(biāo)簽頁(yè)——我同時(shí)打開(kāi)了十幾個(gè)頁(yè)面,Tabbit自動(dòng)將標(biāo)簽分類整理,行業(yè)報(bào)告歸一類、產(chǎn)品官網(wǎng)歸一類,導(dǎo)航欄一目了然,治愈了強(qiáng)迫癥患者。
![]()
最后,最值得一提的是妙招中的腳本妙招。
不同于提示詞妙招,在腳本妙招中,用戶可以通過(guò)自然語(yǔ)言提出需求,Tabbit自動(dòng)生成對(duì)應(yīng)代碼腳本,保存后,就變成了一個(gè)可以隨時(shí)調(diào)用的小妙招了,效果類似瀏覽器插件。
我在調(diào)研過(guò)程中,臨時(shí)創(chuàng)建了一個(gè)“一鍵抓取頁(yè)面圖片”的腳本妙招,可以邊看資料邊下載素材。
試運(yùn)行了下,一次就成功了,說(shuō)明Tabbit把AI的代碼生成能力和瀏覽器的實(shí)際運(yùn)行環(huán)境做了精準(zhǔn)適配。
(團(tuán)隊(duì)說(shuō)后面還會(huì)解鎖更多玩法,比如播客音頻這類多模態(tài)信息的抓取,如果你有什么腦洞大開(kāi)的需求,咱們?cè)u(píng)論區(qū)見(jiàn),說(shuō)不定下個(gè)版本就適配上了。)
第三步,進(jìn)入寫(xiě)作過(guò)程。
在和AI一起收集資料、測(cè)試、對(duì)話探討的過(guò)程中,我基本形成了自己的思路,手動(dòng)敲了一份思路文檔,然后調(diào)用我的“實(shí)測(cè)類專家寫(xiě)作”妙招,讓AI來(lái)補(bǔ)充,我甚至直接可以調(diào)用我的實(shí)測(cè)任務(wù)頁(yè)面,讓它自己整理測(cè)試情況。
![]()
因?yàn)槲业拿钫兄校鞔_寫(xiě)出了:“在不明確如何執(zhí)行的時(shí)候,向編輯提問(wèn),獲得更清晰的選題角度,并確認(rèn)各個(gè)部分的內(nèi)容,不要一口氣寫(xiě)作全文”,所以Tabbit向我提出了一系列的問(wèn)題。
![]()
還好我有語(yǔ)音輸入法,能夠進(jìn)行快速回復(fù),在此,也希望Tabbit后續(xù)能增加一個(gè)語(yǔ)音輸入的功能。
最終,AI基本完成了我的訴求。拿到初稿之后,我進(jìn)行了一輪人工修改,然后就做完了。這也是AI瀏覽器區(qū)別于龍蝦的關(guān)鍵, 它的核心邏輯是半自動(dòng)。
我們既不能完全丟掉人,把所有判斷都托付給AI、吃現(xiàn)成的輸出;也不能拒絕效率進(jìn)化,事事靠自己。
最好的狀態(tài),是人始終在回路里,而AI瀏覽器天然適合這個(gè)場(chǎng)景。
1
用妙招,把瀏覽器、上下文、AI和人串起來(lái)
在實(shí)測(cè)過(guò)程中,我最大的感觸是,Tabbit替我解決了三層上下文斷裂的問(wèn)題。
最基礎(chǔ)的一層,是AI 對(duì)話之間的斷裂。
因?yàn)椴煌P偷募寄茳c(diǎn)不同,很多人現(xiàn)在的 AI 工作流是多AI的組合:用Perplexity或DeepSeek做初步搜索,覺(jué)得某個(gè)方向值得深挖,就把結(jié)果粘到Claude里分析;想發(fā)散一下,再切到Gemini去問(wèn)幾個(gè)角度。
三個(gè)獨(dú)立對(duì)話窗口,三段斷掉的上下文。每一次復(fù)制粘貼,都在做同一件事:把當(dāng)前對(duì)話里已經(jīng)積累的上下文——你追問(wèn)的方向、AI給出的補(bǔ)充、你劃掉的那些不要的角度——整體丟棄,然后在新窗口里重新建立一個(gè)更薄的版本。
而在AI瀏覽器中,通過(guò)多模型接入,共享同一個(gè)上下文解決了這個(gè)問(wèn)題——切換模型不需要新開(kāi)窗口,你的對(duì)話歷史和引用內(nèi)容始終在線。
第二層斷裂,是信息獲取過(guò)程的碎片化。
在做調(diào)研的過(guò)程中,由于需要參考大量資料,以前要么純?nèi)斯ぃ蜷_(kāi)幾十個(gè)網(wǎng)頁(yè),挨個(gè)閱讀;要么純AI,直接搜到回答給你。
我們?cè)絹?lái)越發(fā)現(xiàn),純粹地依賴后者,容易出現(xiàn)信息收集過(guò)于狹窄、缺乏細(xì)節(jié)的問(wèn)題,人始終需要參與獲取更多數(shù)據(jù),來(lái)拓寬自己的知識(shí)庫(kù)。
因此,在和AI共同搜索的過(guò)程中,DeepResearch類工具是必要的。但它們雖然能深度搜索,本質(zhì)上仍是一個(gè)獨(dú)立頁(yè)面:搜完之后,如果你想對(duì)某段結(jié)論深入追問(wèn),要么重新開(kāi)對(duì)話,要么在結(jié)果末尾繼續(xù)問(wèn),很難選中報(bào)告里某句話針對(duì)性展開(kāi)。
而在Tabbit的Chat里,你可以一邊讓AI總結(jié),一邊同時(shí)打開(kāi)多個(gè)資料來(lái)源頁(yè)面,截屏、劃線選中某段文字,或者直接把幾個(gè)標(biāo)簽頁(yè)納入對(duì)話,和 AI 一起做橫向?qū)Ρ取_@就是human in the loop(人機(jī)協(xié)同閉環(huán)) 的具體形態(tài)——隨時(shí)接管,而不是只能接受 AI 整理好的結(jié)論。
![]()
從這個(gè)角度來(lái)說(shuō),DeepResearch應(yīng)該是瀏覽器的原生能力,而不是一個(gè)單獨(dú)的工具——信息就在眼前,追問(wèn)也應(yīng)該發(fā)生在同一個(gè)地方。
第三種斷裂,發(fā)生在工具能力層。
多模態(tài)文本抓取、全文翻譯、批量下載素材……這些需求以前靠安裝插件解決,但插件要找、要裝、要管理,本質(zhì)上還是在工具之間跳來(lái)跳去。
妙招功能往前走了一步。普通妙招保存的是提示詞,腳本妙招保存的是能力——用戶可以根據(jù)自己的個(gè)性化需求,自定義“插件”,隨時(shí)做、隨時(shí)用。
比如我在調(diào)研過(guò)程中,臨時(shí)創(chuàng)建的“一鍵抓取頁(yè)面圖片”的腳本妙招,你也可以借助腳本妙招,把網(wǎng)頁(yè)切換為閱讀模式、給頁(yè)面換成夜間皮膚......
過(guò)去AI輔助工作流的一個(gè)隱形成本是,上下文是斷的,工具是割裂的。妙招和Chat的組合,不只是“保存常用提示詞”,而是把每個(gè)人流程中出現(xiàn)的痛點(diǎn)和經(jīng)驗(yàn),變成可復(fù)用的工具,配合始終在線的上下文,讓工具邊界消失了。
可以說(shuō),Tabbit提供了一個(gè)讓思考能夠完整展開(kāi)的環(huán)境:信息在哪里,工具就在哪里,人和AI始終可以介入。
1
AI瀏覽器,才是大多數(shù)人的最優(yōu)解
不過(guò),目前的產(chǎn)品還有迭代的空間。比如,智能代理這個(gè)環(huán)節(jié),我們專門做了一個(gè)測(cè)試:打開(kāi)了飛書(shū)文檔里的兩個(gè)表格——“表格A原始數(shù)據(jù)”和“表格B訂單匯總”,讓Tabbit分析A中的數(shù)據(jù)結(jié)構(gòu),然后按照B的格式要求自動(dòng)填寫(xiě)匯總信息,這也是比較典型的數(shù)據(jù)處理場(chǎng)景。
在執(zhí)行過(guò)程中,Tabbit識(shí)別了兩個(gè)表格的維度差異:產(chǎn)品類別、省份、訂單狀態(tài)、支付方式……約一分鐘后開(kāi)始作業(yè),并理解了數(shù)據(jù)邏輯、處理了計(jì)算規(guī)則、匹配了格式要求。
![]()
但很快,問(wèn)題出現(xiàn)了:GUI代理對(duì)飛書(shū)表格的識(shí)別不夠準(zhǔn)確,反復(fù)填錯(cuò)單元格,任務(wù)沒(méi)能跑通。我換了一種思路,放棄GUI操作,改用Chat直接處理文檔內(nèi)容,反而一次成功了。
![]()
這個(gè)彎路本身也說(shuō)明了一件事:當(dāng)前GUI智能代理的模型能力還有明顯邊界,更適合識(shí)別范圍清晰的填寫(xiě)場(chǎng)景,比如問(wèn)卷答題、在X和小紅書(shū)發(fā)布內(nèi)容這類操作。
這個(gè)問(wèn)題并不是無(wú)解的。智能代理的邊界,更多是模型能力的現(xiàn)階段局限,隨著 AI 能力的持續(xù)進(jìn)化,模型越強(qiáng),AI瀏覽器能覆蓋的執(zhí)行場(chǎng)景也就越多。
說(shuō)回OpenClaw的走紅,本質(zhì)上是一種集體情緒的投射——大家看到 AI 能自己操控電腦,覺(jué)得自己也該擁有這個(gè)能力。但拋開(kāi)安裝門檻,它本身的風(fēng)險(xiǎn)也在持續(xù)發(fā)酵:安全漏洞、數(shù)據(jù)隱患、高額 API 成本等等,導(dǎo)致最近又開(kāi)始流行起了“卸載OpenClaw教程”。
冷靜下來(lái)想,真實(shí)的工作流里,有多少場(chǎng)景是非得讓AI在本地文件系統(tǒng)里自主行動(dòng)才能解決的,本地的文件可以上傳到網(wǎng)頁(yè)處理,大量的信息獲取來(lái)自外部網(wǎng)絡(luò),需要傳播內(nèi)容的平臺(tái)也基本都通過(guò)網(wǎng)頁(yè)來(lái)完成——發(fā)帖、發(fā)文章、填表單,這些都是瀏覽器原生能做的事。
更重要的是,Human in the Loop的場(chǎng)景始終會(huì)存在——對(duì)C端用戶來(lái)說(shuō),一個(gè)能涵蓋全場(chǎng)景的工作臺(tái),永遠(yuǎn)比一個(gè)功能強(qiáng)大但難以駕馭的自動(dòng)化工具更有價(jià)值,并且隨著模型能力變強(qiáng),AI瀏覽器的能力上限還在提升。
成為一個(gè)統(tǒng)一的工作臺(tái),同時(shí)也要求AI不只是簡(jiǎn)單地“存在于瀏覽器里”。
如果AI只是瀏覽器角落里的一個(gè)懸浮按鈕,那和單獨(dú)開(kāi)一個(gè)ChatGPT窗口沒(méi)有本質(zhì)區(qū)別——你依然要在工具之間反復(fù)跳轉(zhuǎn),依然要重新組織上下文,承受那些隱性的時(shí)間損耗。
Tabbit的優(yōu)點(diǎn)是,先用多模型接入,共享同一個(gè)上下文,再通過(guò)Chat打通多標(biāo)簽信息調(diào)用,這個(gè)過(guò)程中,用妙招消滅重復(fù)提示詞、滿足個(gè)性化需求,再配合智能代理,打開(kāi)執(zhí)行的想象空間。
這些功能單獨(dú)拆開(kāi)看,并不是革命性的創(chuàng)新,但組合在一起、長(zhǎng)在瀏覽器里,就變成了一個(gè)一體化的工作場(chǎng)。
或許,普通人并不需要一臺(tái)能自主操控電腦的 AI,而是需要一個(gè)真正把AI長(zhǎng)在工作入口里的瀏覽器——在你本來(lái)就待著的地方,安靜地、絲滑地陪你把事做完。而且它現(xiàn)在是免費(fèi)的。
如果你也對(duì)OpenClaw感興趣但無(wú)從下手,可以先從 AI 瀏覽器開(kāi)始——前往官網(wǎng),體驗(yàn)Tabbit:https://www.tabbit-ai.com/
也歡迎大家在評(píng)論區(qū)提出自己的妙招需求腦洞,或許下一個(gè)版本就上了呢。
![]()
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.