網易首頁 > 網易號 > 正文 申請入駐

跑分超過Atlas,Flowith 發了一個最激進的Agent(文末附邀請碼)|一手鮮測

0
分享至


作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com

OpenAI發布Atlas不到一周,Flowith就帶著他們全新的“瀏覽器產品”——FlowithOS,加入了戰局。

這不僅是一次基模廠商和應用層創業者的正面相遇,Flowith的新產品,有著更大的野心。

你可以從產品的命名看出,盡管以瀏覽器的形態存在,但FlowithOS的定位是全球首個為 Agent 原生設計的智能體操作系統(Agentic Workspace)。

簡單來說,它不再是一個網頁或插件,而是一個需要下載到電腦上的獨立應用(目前支持 macOS 和 Windows),它可以針對用戶提出的prompt任務指令,自主跨越多網頁搜索,并通過“代碼+視覺”理解用戶屏幕畫面,最終思考、進行自主操作,包括點擊、編輯、發送、保存等各類執行的“最后一公里”。

這也意味著,這種指令的完成不再只存在于云電腦的虛擬環境中,也不再是隨時等待人類接管的半自動產品,而是真正由AI直接操控瀏覽器的“端到端”執行。

此次發布的FlowithOS,也是繼去年Flowith發布“畫布式智能體創作平臺”以及今年發布Neo Agent之后的又一獨立產品形態。

從FlowithOS,再到最近Manus 1.5 讓 Agent 一句話構建應用,以及 GPT Atlas 將 AI 深度融入瀏覽器,一個清晰的趨勢是:大家都在想辦法給 AI 安上“手腳”,讓它從一個善于言辭的“對話助手”,向一個能夠處理真實世界事務的“自主執行者”進化。

不過,和Manus 1.5 、GPT Atlas相比,FlowithOS 的做法顯然更為“激進”。

我們第一時間測試了 FlowithOS,并與 Flowith 團隊聊了聊,試圖搞清楚:他們為什么選擇在這個時間點,用這樣一種方式入局?以及,它和市面上其他的 Agent、瀏覽器產品,有什么不一樣?

FlowithOS 核心功能:執行、執行,還是執行

FlowithOS 想做的,是徹底讓Agent接手任務的全流程,做跨平臺、高自主性、可交互性的復雜工作。

它為智能體構建了一個能夠持續進化的行動空間,其核心亮點包括:

一是跨越邊界的任務交付:它讓 Agent 的行動不再局限于單一網頁或應用。通過無限步驟的上下文理解,Agent 能夠串聯起完整的端到端工作流,直接替你寫作、替你發布,將你的想法轉化為真實成果。

二是網頁理解能力:基于自研的“代碼+視覺”雙模態理解框架。該框架在Web Agent 測試(Mind2Web)中登頂全球榜單,跑分超過了OpenAI最新發布的ChatGPT Atlas,這也意味著OS擁有更強的思考能力、網頁理解力與操作精度。


三是自主進化、自主執行:FlowithOS 不是用完即走的工具,而是一個能獨立“上班”的數字員工,能夠勝任高頻交易監控、社媒賬號運營等需要持續優化的動態任務。

當然,拋開“操作系統”和“自主進化”這些宏大概念,FlowithOS 的本質是通過自動化的降本增效。它在真實場景下的任務成功率有多高,它為用戶節省的時間,是否多于花在學習、配置和補救失敗任務上的時間......我們圍繞這些問題展開了實測。

1. 基礎交互與任務執行

打開 FlowithOS,首先是一個頗有設計感的簡潔界面,中心是一個輸入框。你可以在框中選擇 Google 進行搜索,把它當成一個普通的瀏覽器來用;或者,你可以選擇 Run Task,直接進入 Agent 模式。

同時,界面右下角的圓形按鈕,也提供了一個快捷入口,讓你隨時喚醒 Agent 發布任務。


為了降低使用門檻,FlowithOS 的輸入框還具備自動補全和優化 Prompt 的功能,幫助用戶更清晰、更高效地發布任務指令。


一旦你提出任務,Agent 會在界面右側實時展示它的“思考過程”——分析任務、拆解步驟、執行動作。同時,它會在左側的標簽頁(Tab)中自己打開新的頁面,進行跨頁面的搜索、信息整合與操作。

在OS執行的過程中,你可以隨時點擊Pause或雙擊頁面暫停、進行接管,也可以隨時以對話的形式,輸入新的prompt調整AI接下來的進程。

理論說再多,不如直接上場景。

上周,Flowith 市場負責人拐子就在內測中嘗試了讓 OS 接管自己的小紅書賬號,自主創作并發布了一個帖子“Ask anything”,同時把回復評論的權限也完全交給了 Agent。


盡管這個 Agent 時而會冒出一些略顯“中二”的賽博人機回復,但時而又會有讓人眼前一亮的評論。最經典的莫過于下面這條,當有人問及“能不能突然給我打兩千塊”,Agent 在評論區直接 @了CEO Derek,申請開通轉賬權限,顯然是“學習”到了人類世界的組織架構。

我們也用一個真實任務測試了它的能力。背景是,我們在杭州舉辦了一場小型的 IROS 會后派對,需要邀請小紅書上對此感興趣的IROS參會用戶。這是一個非常繁瑣、重復性極高的任務,完美契合了 AI 批量執行的場景。

結果是,當我將自己的賬號Earth權限交給了OS后,它做到了......一部分。


在這個過程中,我們嘗試了兩版 Prompt:

簡單版 Prompt:

你是 硅星人 的 AI助手,在小紅書上面搜索2025 IROS相關帖子,按時間線確保是今年的,并評論帖子,邀請他來參加我們在23號組織的After party,可以看硅星人pro主頁了解活動詳情,語氣活潑有趣一點。

因為只給出了模糊指令。在執行過程中,OS 的成功率大約在 30% 左右。它偶爾會“神游”,比如刷著帖子摸魚;偶爾會“犯迷糊”,打開了帖子但找不到評論按鈕;有時輸入了文本卻沒有點擊發布,就自己判定任務成功了。

不過,因為并非云電腦虛擬環節,用戶也可以參與AI協作,比如,在AI找不到輸入框的時候,我們滑動鼠標點開輸入框,讓AI學習這一路徑。

  • 詳細版 Prompt (由 Claude + 人工優化): 提供了非常清晰的步驟和規則。這次,OS 的成功率飆升至接近 100%。由于它的評論速度實在太快,而我們的派對席位有限,我不得不火速終止了它“狂熱”。

[背景] 你是我的AI助手,你的任務是在小紅書平臺上推廣一場即將舉行的活動。

[目標]

平臺: 小紅書

活動: 23號的IROS After Party

目標用戶: (A) 發布了關于“2025 IROS”帖子的博主 (B) 每一個回復了這些帖子的用戶。

[核心文案格式] "你好,我是硅星人PRO的AI助手,我們在23號包場組織了一個After party,有興趣參加嗎,可以看硅星人PRO的小紅書主頁了解活動詳情[具體邀請可修改,模擬一個真誠有梗的人,而不是一個冰冷的機器]。"

[執行流程 (自動化循環)]

1、登錄: 登錄小紅書賬號。

2、搜索:使用搜索關鍵詞列表: ["2025 IROS", "IROS 杭州", "IROS 2025 杭州", "智能機器人大會 杭州"]。

3、篩選搜索結果:按“最新發布”排序,確保帖子是近期的。

遍歷帖子 (循環):

對于搜索結果中的每一個相關帖子,執行以下操作:

4、操作A:評論博主 (OP)

打開該帖子。

定位到主評論輸入框。

輸入 [文案]。

點擊“發送”。

5、操作B:評論所有回復者

在當前帖子下,打開評論區,并確保加載所有評論和回復(可能需要模擬“點擊查看更多回復”)。

遍歷(For-Each Loop)評論區中的每一條評論(無論是一級評論還是二級回復):

If 該條評論的作者 不是 你自己:

點擊該條評論的“回復”按鈕。

在@對方的輸入框中,輸入 [文案],文案按照格式,可調整。

點擊“發送”。

完成所有回復的遍歷后,返回搜索結果列表,打開下一個帖子,重復步驟4。

上下滑動查看更多內容

這個任務場景具有極 強的遷移性。任何需要批量聯系他人、進行重復性網頁操作的場景,理論上都可以交給 OS 來完成。

但現階段,你仍然要以足夠的耐心盯著OS不要拿你的賬號肆意妄為,并忍受長時間的、有失敗概率的任務過程。

除了這些嚴肅的工作,Flowith 還與我們分享了一個極具娛樂性的案例:讓 OS 幫你打德州撲克,而且還贏錢了。

這年頭,一個好的 Agent 真的可以自己出去賺錢養家了。目前這個 Prompt 已經被收錄在 OS 的官方示范案例中,用戶可以直接點擊運行。只是我們很好奇,如果你的 OS 在牌桌上遇到了別人的 OS,到底誰能笑到最后?


當然,除了娛樂和批量任務,由于Flowith 主站原本就擅長的深度研究領域,在沿用了 Neo 技術架構+ 真實的執行環境后,OS也能夠閱讀更多的內容、更好地理解圖文信息、進行跨頁面瀏覽,從而給出更詳盡的報告了。

2. Skills:沉淀可復用的“肌肉記憶”

除了基礎的產品邏輯,OS 還上線了一個關鍵功能:Skills。這與 Claude 有相似之處,更側重于執行路徑的沉淀。


當一個 Agent 第一次成功完成某個復雜任務時,比如“在小紅書上篩選特定風格的商品并加入購物車”,它可以將這個任務的最優執行路徑記錄下來,形成一個可復用的“Skill”。由此,下次當你或其他人需要執行類似任務時,Agent 就可以直接調用這個已經驗證過的“肌肉記憶”。

更進一步,FlowithOS 團隊會將用戶高頻使用、反饋良好的任務流程,通過訓練固化為標準的 Skills,讓所有用戶的 Agent 在未來執行該任務時都具備極高的成功率。

在目前的 Skill 庫中,OS已經可以打開你的 Claude Code 頁面來編寫代碼,也可以打開你的terminal進行操作了。同時,你也可以將自己調整好的 Skill 上傳,未來或可進行社區化的分享和傳播。

3. Memory 和 Knowledge Base:讓 Agent 更懂你

除了 Skills,Memory(記憶)系統和 Knowledge Base(知識庫)是讓 Agent 變得“專屬”的另外兩大支柱。

Memory 系統會記住你訪問過的網頁、執行過的任務以及個人偏好。這與傳統瀏覽器的歷史記錄似是而非,其記錄的顆粒度要精細得多。這為 Agent 提供了豐富的個性化上下文,使其決策和行動都更貼近你的習慣。

而 Knowledge Base 則從 Flowith 主站延伸而來,允許你上傳文檔、鏈接等資料,構建屬于自己的知識庫。Agent 在執行任務時,會優先從這個知識庫中尋找答案和背景信息,讓它更懂你的工作領域和特定需求。

還記得上文提到的 OS 接管“拐子”小紅書賬號的案例嗎?Agent 之所以知道要 @Dereck 來申請權限,正是因為它從知識庫中知道了誰是負責人。

總而言之,在多次實測中,我們發現 FlowithOS 對不同類型網頁的適配程度存在一定差異。在 Twitter、小紅書、微博等結構相對標準化的社交媒體平臺上,它能相對準確地識別帖子內容、理解評論語境、甚至把握平臺的“網感”來生成合適的回復。

然而,在淘寶、京東這類電商網站上,面對多重下拉菜單、動態加載的商品列表以及復雜的促銷彈窗時,它偶爾會出現定位不準或操作失敗的情況,對商品進行比價、對圖文商品鏈接進行整理,表現還不足。

Flowith 對此解釋道,“我們在此處對 Agent 使用了periodic online reinforcement learning,隨著用戶更多使用,整個 OS 會變得更加聰明。”

“產品目前仍處于公測階段,所有功能均免費開放,公測期間的核心目標是收集用戶在真實場景下的反饋和 Agent 的表現數據。這些寶貴的數據,將直接用于后續的Agent迭代和功能優化。”

FlowithOS是一個Browser Agent,更是一個給Agent使用的操作系統

從實測結果來看,FlowithOS 在產品形態和底層邏輯上,與市面上其他主流的Agent產品截然不同。要理解它的獨特性,我們必須先明確它與另外兩個代表性產品 Manus 1.5 和 Atlas 的區別。

相比之下,更側重于編程能力的Manus 1.5 ,核心思路更像是在產品內部構建一個閉環的、強大的能力集。例如,它強調通過“內置”工具(tool)和配套架構,讓用戶可以直接在產品內“一句話構建應用”,將完成復雜任務所需的核心能力集成到自身。

而Atlas 首先是一個瀏覽器,Agent 在其中是一個核心但可選的“模式”,與常規瀏覽功能并存,它的重點在于從用戶使用場景切入,為用戶提供一個更完整的生態鏈路,為 Agent 提供一個更便捷的運行載體。

而FlowithOS 將自己定義為操作系統,其瀏覽器界面僅僅是這個系統為 Agent 提供的“圖形界面”。與 Manus 的“內置集成”思路相反,FlowithOS 的核心是調度和編排外部生態的能力。

例如,在處理編程任務時,它并非自己構建一套編程工具,而是通過調用 Claude Code 等外部功能和生態來實現。

當我們把 FlowithOS 放置在更宏觀的 AI 產品圖景中進行審視時,會發現它所做的事情既有差異又有共識。

共識在于,無論是 OpenAI 的 Atlas、Manus 的 1.5,還是各類 AI 編程助手,都在不約而同地從“理解和生成”向“執行和自主”進化。AI 不再滿足于作為一個知識問答或內容創作的工具,它必須進入人類的工作流,直接操作應用、完成任務,才能釋放下一階段的生產力價值。瀏覽器,作為連接人與互聯網服務的最主要入口,自然成為了這場進化的核心戰場。

其差異則在于,它可能是目前市面上第一個明確將自己定義為“Agent 操作系統”,而這決定了產品的進化路徑。FlowithOS的功能、交互設計,都是從“Agent 如何更好地執行”這個第一性原理出發,而非“人類如何更方便地使用”。

正如拐子所說:“用戶是否使用我們的 OS 作為瀏覽器其實無所謂,因為這個瀏覽器實際上是給 Agent 做操作系統用的,我們更希望用戶打開 OS 是讓 Agent 可以有更高權限的環境自主工作。”

在文末,我們也準備了一些邀請碼,加入公測用戶群,群內有Flowith團隊回應反饋,歡迎大家下載嘗試,為執行 Agent 帶來更多有趣的任務場景,幫助產品在公測階段找到更多優化的方向。

PS:邀請碼含Flowith主站付費會員及FlowithOS公測資格,掃描下方二維碼聯系硅星人獲取。

附下載鏈接:flowith.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
反對穆帥回皇馬被批評,古蒂:面對非議,最好方式是微笑致謝

反對穆帥回皇馬被批評,古蒂:面對非議,最好方式是微笑致謝

懂球帝
2026-04-26 07:58:08
雷霆121-109再勝太陽!亞歷山大創34年NBA紀錄,不愧是MVP

雷霆121-109再勝太陽!亞歷山大創34年NBA紀錄,不愧是MVP

籃球大視野
2026-04-26 06:38:32
愛吃西紅柿的要留意,我也后悔沒早點看到,很重要,記得告訴家人

愛吃西紅柿的要留意,我也后悔沒早點看到,很重要,記得告訴家人

江江食研社
2026-04-26 00:00:04
“為錢和我在一起”,44歲女子被丈夫掐死拋尸,前夫是她的代理人

“為錢和我在一起”,44歲女子被丈夫掐死拋尸,前夫是她的代理人

江山揮筆
2026-04-26 11:20:40
公安部172號令:70歲以上駕照免年審!兩件事漏做,駕照可被注銷

公安部172號令:70歲以上駕照免年審!兩件事漏做,駕照可被注銷

沙雕小琳琳
2026-04-24 11:02:52
一個戲劇性的斯諾克時代切片:當39歲的丁俊暉遭遇28歲的趙心童

一個戲劇性的斯諾克時代切片:當39歲的丁俊暉遭遇28歲的趙心童

西門吹灰2020
2026-04-25 09:19:56
湖南一女子凌晨打車說“去哪都可以”,跳橋輕生被出租車司機拼命拽回,司機:人生沒有過不去的坎,千萬不要一時沖動拿生命開玩笑

湖南一女子凌晨打車說“去哪都可以”,跳橋輕生被出租車司機拼命拽回,司機:人生沒有過不去的坎,千萬不要一時沖動拿生命開玩笑

臺州交通廣播
2026-04-26 11:32:20
一天一個價!多款電腦集體漲價,店員透露:27日以后會大幅漲價

一天一個價!多款電腦集體漲價,店員透露:27日以后會大幅漲價

極目新聞
2026-04-24 18:58:46
4月前進一小步,5月升官發大財的3生肖,未雨綢繆可堪大任!

4月前進一小步,5月升官發大財的3生肖,未雨綢繆可堪大任!

毅談生肖
2026-04-26 10:11:25
五常中唯一不造航母的國家,實力不輸中國,美國十分忌憚

五常中唯一不造航母的國家,實力不輸中國,美國十分忌憚

趣文說娛
2026-04-23 21:55:50
絕境對決,四川女籃單外援作戰,客場力克山西拿下第三座總冠軍

絕境對決,四川女籃單外援作戰,客場力克山西拿下第三座總冠軍

墨道榮
2026-04-26 10:26:26
張家界“愛國賊事件”:傻X式愛國,是個巨大禍害

張家界“愛國賊事件”:傻X式愛國,是個巨大禍害

麥大人
2025-10-13 15:29:56
親爹都看不下去了!怒噴布倫森,尼克斯找到贏球辦法,早該這么打

親爹都看不下去了!怒噴布倫森,尼克斯找到贏球辦法,早該這么打

你的籃球頻道
2026-04-26 09:53:56
沒得談了?伊朗列出美方罪狀,巴鐵大將致電特朗普,送出一句忠告

沒得談了?伊朗列出美方罪狀,巴鐵大將致電特朗普,送出一句忠告

兵說
2026-04-25 08:30:08
兒媳婦和公公保持情人關系10年,打了4次胎,還生了一個女兒

兒媳婦和公公保持情人關系10年,打了4次胎,還生了一個女兒

胖胖侃咖
2025-04-03 08:00:11
西裁判工會就貝蒂斯對皇馬爭議發布聲明:適可而止,尊重為先

西裁判工會就貝蒂斯對皇馬爭議發布聲明:適可而止,尊重為先

懂球帝
2026-04-26 10:38:33
伊朗吃不下,朝鮮吐不出!俄羅斯的大陽謀,是豪賭,還是高招?

伊朗吃不下,朝鮮吐不出!俄羅斯的大陽謀,是豪賭,還是高招?

近史談
2026-04-26 11:07:23
7旬富翁斥巨資獵殺野生動物,最近被非洲大象家族踩死!網友:也把他做成標本!

7旬富翁斥巨資獵殺野生動物,最近被非洲大象家族踩死!網友:也把他做成標本!

英國報姐
2026-04-25 20:36:35
心疼!孫穎莎封訓瘦一圈!林鐘勛說王楚欽左手是特例!國乒倫敦世乒賽出征直播!

心疼!孫穎莎封訓瘦一圈!林鐘勛說王楚欽左手是特例!國乒倫敦世乒賽出征直播!

好乒乓
2026-04-26 11:00:00
消息人士:伊朗立場比第一輪談判時更加強硬

消息人士:伊朗立場比第一輪談判時更加強硬

新華社
2026-04-25 19:05:13
2026-04-26 12:11:00
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進入GenAl。
274文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

游戲
數碼
手機
親子
藝術

PS5獨占新作外媒打滿分!直言媲美《艾爾登法環》

數碼要聞

華為MatePad Mini迭代版:OLED四等邊、5G、NFC全來了,沒短板了

手機要聞

姚安娜喜提華為Pura X Max 網友:又美又颯

親子要聞

媽媽記錄下寶寶的第一次擁抱,最幸福的瞬間

藝術要聞

鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

無障礙瀏覽 進入關懷版