亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全球第一,13個(gè)SOTA!我們找到了龍蝦界掌管GUI的神

0
分享至



編輯|冷貓

有沒(méi)有想過(guò)讓「龍蝦」替你打麻將?

自從龍蝦熱以來(lái),大家慢慢接受了 AI 智能體能夠在電腦上執(zhí)行操作的特性。

既然龍蝦具備一定的控制能力,那讓它替我去掙歡樂(lè)豆不過(guò)分吧。

遺憾的是,現(xiàn)在的龍蝦,稱(chēng)之為「Claw」是有道理的,笨拙的龍蝦爪的確很難進(jìn)行復(fù)雜操作。讓它打開(kāi)瀏覽器逛逛電商平臺(tái)比價(jià),都要尋找各種對(duì)應(yīng)的 Skills,而且執(zhí)行的吭哧癟肚的,這的確讓人很難放心地將正經(jīng)工作流交給龍蝦。

時(shí)隔半年有余,那個(gè)能夠直接操作圖形界面的,曾經(jīng)取得雙榜 SOTA 的通用 GUI 智能體模型 Mano 再一次產(chǎn)生了飛躍。不僅解決了自動(dòng)操作工作流的痛點(diǎn),甚至連「替我打麻將」的夢(mèng)想都實(shí)現(xiàn)了:

這次,明略科技帶著自研全新進(jìn)化的面向端側(cè)設(shè)備的 GUI-VLA 智能體模型 Mano-P 1.0亮相。這一模型能夠不依賴(lài)傳統(tǒng) API 對(duì)接,也不局限于瀏覽器場(chǎng)景,能夠直接理解并操作桌面軟件、網(wǎng)頁(yè)界面,完成更復(fù)雜的圖形化工作流,徹底引領(lǐng)龍蝦從「爪」向「手」的跨越式進(jìn)化

簡(jiǎn)而言之,Mano-P 1.0 模型是一個(gè)純視覺(jué) GUI 操作模型,不依賴(lài)任何插件,打通全部兼容性瓶頸。與其他 GUI 操作模型不同,Mano-P 1.0 能夠完全實(shí)現(xiàn)本地運(yùn)行,數(shù)據(jù)零上云開(kāi)箱即用,三種形態(tài),覆蓋全部開(kāi)發(fā)者群體。



  • 開(kāi)源鏈接:https://github.com/Mininglamp-AI/Mano-P/tree/main

Mano-P,一臺(tái) M4 Mac,兩行命令,一個(gè)能在你電腦上自主操作界面的 AI。

相比之前的 Mano 模型,Mano-P 產(chǎn)生了質(zhì)的飛躍。讓我們非常好奇的一點(diǎn)是,新模型名字中的「P」,到底是什么含義?

全球第一,斷檔領(lǐng)先

我們猜測(cè),P for Power

讓我們來(lái)看看硬成績(jī)。雙榜 SOTA 遠(yuǎn)遠(yuǎn)不是 Mano 模型的上限。這次,Mano-P 1.0 模型給了我們巨大的震撼。

Mano-P 在全球 13 個(gè)多模態(tài)基準(zhǔn)榜單上達(dá)到 SOTA,覆蓋 GUI Grounding、CUA、感知認(rèn)知、視頻理解、上下文學(xué)習(xí)等多個(gè)維度,呈現(xiàn)出「屠榜式」的斷崖領(lǐng)先。

ScreenSpot-V2 上拿到93.5分,MMBench 上87.5分,UI-Vision 上46.6分,幾乎全面碾壓同量級(jí)競(jìng)品。



在 GUI Agent 領(lǐng)域最具權(quán)威性的基準(zhǔn)測(cè)試 OSWorld 上,Mano-P 1.0-72B 取得了58.2%的成功率,在所有專(zhuān)用 GUI 智能體模型中排名全球第一,領(lǐng)先第二名 opencua-72b(45.0%)整整13.2個(gè)百分點(diǎn)。

放到全模型榜單上看,排在前四位的都是千億級(jí)參數(shù)的通用大模型 ——Claude Sonnet 4.6(72.1%)、Gemini 2.5 Pro(66.9%)等。而 Mano-P 以 72B 參數(shù)量躋身第五位,作為一款專(zhuān)用模型打入通用模型的俱樂(lè)部,這本身就已經(jīng)說(shuō)明了很多。

另一個(gè)值得關(guān)注的戰(zhàn)場(chǎng)是 WebRetriever Protocol I:Mano-P 拿到了 41.7 NavEval 分?jǐn)?shù),超越了 Gemini 2.5 Pro Computer Use(40.9)和 Claude 4.5 Computer Use(31.3)。

以上硬核成績(jī),完全能夠說(shuō)明 Mano-P 1.0 模型能夠摘得全球第一的桂冠。

GUI 是數(shù)字世界最真實(shí)的入口,而 Mano-P 正在把這個(gè)入口交給智能體。

在官方演示中,Mano-P 完成了一套從視頻生成、上傳、分析、剪輯到二次評(píng)測(cè)的全流程自動(dòng)化,其中同時(shí)涉及網(wǎng)頁(yè)操作和專(zhuān)業(yè)剪輯軟件的混合使用 —— 這對(duì)依賴(lài)瀏覽器協(xié)議的方案來(lái)說(shuō)是不可能完成的任務(wù)。

核心優(yōu)勢(shì):「完全不上云」

當(dāng)我們提起操作 GUI 的智能體,就能想到的一個(gè)極具代表性的應(yīng)用是「豆包手機(jī)助手」。軟硬件深度結(jié)合的豆包,理論上能夠?qū)崿F(xiàn)任何手機(jī)上的操作。

當(dāng)前主流的 Computer Use 方案,包括豆包手機(jī)助手在內(nèi),本質(zhì)上都遵循同一個(gè)模式:截屏或讀取屏幕信息 → 上傳云端 → 云端推理 → 返回操作指令 → 本地執(zhí)行。

這意味著每一次操作,你的屏幕內(nèi)容都在被傳輸?shù)酵獠糠?wù)器。在個(gè)人用戶(hù)的隱私保護(hù),以及對(duì)數(shù)據(jù)安全有硬性要求的場(chǎng)景來(lái)說(shuō),這是一個(gè)無(wú)法忽視的風(fēng)險(xiǎn)。這也是豆包手機(jī)助手曇花一現(xiàn)的核心原因之一。

Mano-P 走了一條完全不同的路,支持本地運(yùn)行,數(shù)據(jù)完全不上云

或許,P for Private

它支持在 Apple M4 芯片 + 32GB 內(nèi)存 的 Mac mini 或 MacBook 上直接進(jìn)行本地推理。所有截圖和任務(wù)數(shù)據(jù)完全不出設(shè)備,不需要配置任何 API 密鑰,不需要聯(lián)網(wǎng),不需要向任何外部服務(wù)器發(fā)送一比特的數(shù)據(jù)。

性能數(shù)據(jù)也足夠亮眼:其 4B 量化模型(w4a16)在 Apple M4 Pro 上可實(shí)現(xiàn) 476 tokens/s 預(yù)填充速度 和 76 tokens/s 解碼速度,峰值內(nèi)存僅占 4.3GB—— 一臺(tái)標(biāo)配 M4 Mac mini 就能流暢運(yùn)行。



明顯的,端側(cè)不是云端能力的「縮水版」,是 Agent 落地的另一條路徑 —— 一條更適合高安全需求、高隱私要求、以及希望對(duì) AI 能力擁有完整控制權(quán)的用戶(hù)的路徑。

Mano-P 通過(guò)與眾不同的私有化策略,重構(gòu)了「純視覺(jué)理解」與「本地執(zhí)行」的底層邏輯,讓你的「龍蝦」真正屬于你。

這種架構(gòu)擁有「物理隔離」的安全感,更憑借其零門(mén)檻、開(kāi)箱即用的部署特性,大幅降低了構(gòu)建 GUI Agent 工作流的工程成本。

這標(biāo)志著 AI 智能體私有化,個(gè)人化的開(kāi)始。

小龍蝦們引發(fā)了一場(chǎng) Mac mini 搶購(gòu)熱潮,眼看 Mano-P 在 M4 Pro 芯片的亮眼成績(jī),下一波斷貨還遠(yuǎn)嗎?

開(kāi)源的三步棋

開(kāi)源一個(gè)強(qiáng)大的模型需要強(qiáng)大的魄力。便是如 Meta 這樣的巨頭,也逐步向閉源模型方向轉(zhuǎn)變。

Yann LeCun 就曾表示「獲勝的平臺(tái)將是開(kāi)放的平臺(tái)」??赡埽?strong>P for Public

Mano-P 是一個(gè)全開(kāi)源的模型。它的開(kāi)源策略很有意思 —— 分三個(gè)階段逐步釋放能力。



開(kāi)源鏈接:https://github.com/Mininglamp-AI/Mano-P/tree/main

Skill 先行,開(kāi)箱即用

這一階段的核心目標(biāo)是:現(xiàn)在就能用起來(lái)。

Mano-CUA Skill 已經(jīng)開(kāi)源。此階段的目標(biāo)用戶(hù)是 Agent 愛(ài)好者,例如 OpenClaw 或 Claude Code 的用戶(hù),使他們能夠利用 Mano-CUA 技能的功能構(gòu)建更智能的 CUA 任務(wù)工作流程,擺脫人工干預(yù)帶來(lái)的瓶頸。

團(tuán)隊(duì)提供了三種接入形態(tài),分別對(duì)應(yīng)不同類(lèi)型的用戶(hù):

  • mano-cua(CLI 命令行工具)—— 面向開(kāi)發(fā)者和高級(jí)用戶(hù)。通過(guò) Homebrew 一行安裝,之后在終端里直接用自然語(yǔ)言驅(qū)動(dòng) GUI 操作,腳本集成、批處理、自動(dòng)化流水線都能直接嵌入。
  • mano-skill(Agent Skill 插件)—— 面向 Claude Code 和 OpenClaw 用戶(hù)。安裝后,當(dāng)你向 AI Agent 提出需要 GUI 操作的需求時(shí),Agent 會(huì)自主調(diào)用這個(gè)技能完成操作,無(wú)需人工介入。這打通了一個(gè)關(guān)鍵痛點(diǎn):當(dāng)前 Agent 工作流中,凡是涉及 GUI 操作的環(huán)節(jié)都需要人來(lái)「搭一手」,Mano-Skill 讓這個(gè)環(huán)節(jié)也可以由 AI 自主閉環(huán)。
  • mano-client(Python SDK)—— 即將發(fā)布,面向需要在 Python 項(xiàng)目中深度集成 GUI 自動(dòng)化能力的開(kāi)發(fā)者。支持異步調(diào)用、回調(diào)函數(shù)、可編程的任務(wù)流控制。

三種形態(tài),同一套核心能力。無(wú)論你是想快速體驗(yàn)、深度集成、還是讓 Agent 自己去調(diào)度,都有對(duì)應(yīng)的入口。

模型開(kāi)放,能力下沉

第二階段,明略將開(kāi)源 Mano-CUA 的本地模型和 SDK 組件

此階段的目標(biāo)用戶(hù)是具有高安全性要求的開(kāi)發(fā)者,使他們能夠直接使用可在 Mac 本地運(yùn)行推理的 GUI-VLA 模型來(lái)構(gòu)建自定義技能、工具等。重要的是,所有 CUA 操作都將在本地 Mac 上執(zhí)行,而不會(huì)上傳到外部服務(wù)器。

這是整個(gè)開(kāi)源計(jì)劃中最關(guān)鍵的一步。

  • 72B 完整模型:證明技術(shù)上限,OSWorld 58.2% 成績(jī)的締造者。
  • 4B 量化模型(w4a16):交付端側(cè)體驗(yàn),M4 Mac 上 476 tokens/s 預(yù)填充、76 tokens/s 解碼,峰值內(nèi)存僅 4.3GB。

大模型證明了 Mano-P 模型的能力上限,小模型專(zhuān)注于用戶(hù)的端側(cè)體驗(yàn)。兩者互補(bǔ),覆蓋從研究驗(yàn)證到生產(chǎn)落地的完整鏈路。

方法公開(kāi),生態(tài)共建

最后一階段,團(tuán)隊(duì)計(jì)劃開(kāi)源的是訓(xùn)練方法本身,包括 Mano-P 模型所使用的訓(xùn)練方法、剪枝和量化技術(shù)。

Mano-Action 雙向自增強(qiáng)學(xué)習(xí)框架是整個(gè)項(xiàng)目的核心技術(shù)底座。與傳統(tǒng)單向預(yù)測(cè)方法不同,它采用 Text ? Action 循環(huán)一致性學(xué)習(xí) —— 模型同時(shí)掌握兩個(gè)方向的能力:

  • Text → Action:根據(jù)自然語(yǔ)言描述,定位并操作界面元素
  • Action → Text:給定界面元素,準(zhǔn)確描述其位置和功能

雙向互相增強(qiáng),讓模型對(duì) GUI 的理解更加魯棒。

訓(xùn)練過(guò)程分為三個(gè)遞進(jìn)階段:

1. SFT(監(jiān)督微調(diào)):建立基礎(chǔ)的 GUI 理解與操作能力。

2. 離線強(qiáng)化學(xué)習(xí)(Offline RL):在歷史數(shù)據(jù)上進(jìn)行策略?xún)?yōu)化,探索更優(yōu)的操作序列。

3. 在線強(qiáng)化學(xué)習(xí)(Online RL):通過(guò)與真實(shí)環(huán)境的實(shí)時(shí)交互持續(xù)提升,實(shí)現(xiàn)自我進(jìn)化。

配合 「思考 - 行動(dòng) - 驗(yàn)證」 循環(huán)推理機(jī)制,每一步操作后都會(huì)驗(yàn)證結(jié)果,發(fā)現(xiàn)偏差時(shí)自動(dòng)糾錯(cuò)調(diào)整。

端側(cè)優(yōu)化方面,GSPruning 視覺(jué) Token 剪枝是一項(xiàng)值得關(guān)注的技術(shù)創(chuàng)新。該方法通過(guò)保留全局空間錨點(diǎn)來(lái)維持網(wǎng)頁(yè)結(jié)構(gòu)骨架,同時(shí)識(shí)別語(yǔ)義異常值以捕獲關(guān)鍵 UI 元素,將視覺(jué) Token 保留率壓縮至 12.57% 的同時(shí)仍保持較高任務(wù)成功率,吞吐量提升 2-3 倍。

開(kāi)源完全體

從 Skill 到模型再到方法論,三步棋走完,開(kāi)發(fā)者獲得的是一整套可以從使用到定制到研發(fā)的完整技術(shù)棧

Mano-P 的整個(gè)項(xiàng)目采用 Apache 2.0 協(xié)議開(kāi)源,完整客戶(hù)端代碼公開(kāi)可審計(jì),支持商業(yè)使用與二次開(kāi)發(fā)。

目前市面上的 GUI 自動(dòng)化方案大致分三類(lèi):

  • 傳統(tǒng) RPA:基于坐標(biāo)定位或元素選擇器,界面一變就失效,維護(hù)成本極高。
  • 瀏覽器型 CUA(如 OpenClaw):依賴(lài) CDP(Chrome DevTools Protocol),能力強(qiáng)但被限制在瀏覽器生態(tài)內(nèi)。
  • 云端 Computer Use(如 Claude Computer Use / Manus):能力最強(qiáng),但依賴(lài)云端 API,且主要面向 Web 場(chǎng)景。



Mano-P 與傳統(tǒng)方案 CUA 對(duì)比

Mano-P 獨(dú)屬于第四類(lèi) ——純視覺(jué) GUI Agent。它做的事情和人一樣:看著屏幕,理解界面,然后決定輸入,帶來(lái)了無(wú)限制的跨平臺(tái)通用性??偟膩?lái)說(shuō),完全開(kāi)源的 Mano-P 有四大核心競(jìng)爭(zhēng)力:

  • 極致端側(cè)性能:憑借 M4 芯片優(yōu)化與算力棒擴(kuò)展,Mano-P 支持模型本地開(kāi)箱即用,徹底擺脫了云端 API 束縛。
  • 全場(chǎng)景視覺(jué)理解:采用純視覺(jué) GUI 交互方案打破瀏覽器局限,實(shí)現(xiàn)了跨桌面軟件與復(fù)雜工具的全場(chǎng)景感知適配。
  • 離線規(guī)劃能力:依托完全離線的自主規(guī)劃與糾錯(cuò)閉環(huán),在無(wú)網(wǎng)環(huán)境下亦能確保業(yè)務(wù)邏輯的高效安全執(zhí)行。
  • 軟硬一體方案:通過(guò)即插即用的模型硬件一體化部署,消除了復(fù)雜的底層環(huán)境配置,顯著降低了 Agent 的落地門(mén)檻。

專(zhuān)訪:兩個(gè)時(shí)代的十字路口

我們知道,「Mano」一詞來(lái)源于西班牙語(yǔ),意為「手」,生動(dòng)地體現(xiàn)了模型在數(shù)字世界中「靈巧手」的核心能力。

而為了知道 Mano-P 模型中的「P」的真正含義,機(jī)器之心與明略集團(tuán)副總裁,多模態(tài)首席科學(xué)家趙晨旭老師進(jìn)行了一次專(zhuān)訪。

于是我們得到了明略科技官方的答復(fù)?!窶ano-P 這個(gè)科研項(xiàng)目里面最核心的一個(gè)概念 ——P 的含義代表的是 personal(個(gè)人) 或者 party(組織)。

Personalized AI 的開(kāi)端

趙晨旭老師認(rèn)為:「我們已經(jīng)斷定現(xiàn)在正處在兩個(gè)時(shí)代的交界點(diǎn)上,可能好多人或者是一些開(kāi)發(fā)者,或者是一些業(yè)內(nèi)的人還沒(méi)有意識(shí)到。是哪兩個(gè)時(shí)代呢?就是AGI 的時(shí)代和 Personalized AI的時(shí)代?!?/p>

AGI 的敘事已經(jīng)深入人心:打造一個(gè)無(wú)所不能的通用智能體。趙晨旭老師解釋了其中的邏輯:以 DeepSeek、GPT o1 為代表的路線,核心是基于事實(shí)性基礎(chǔ)進(jìn)行推理。對(duì)于有確定解或唯一解的問(wèn)題,這種推理方式確實(shí)「無(wú)敵」。但現(xiàn)實(shí)世界中,大部分問(wèn)題恰恰是無(wú)解的或有多種解的。

「其實(shí)我們要找的是在這些解里面,對(duì)于個(gè)人或者對(duì)于某個(gè)組織、某個(gè)集體而言?xún)r(jià)值最大的那個(gè)解?!?/p>

每個(gè)組織和個(gè)人都有自己沉淀的經(jīng)驗(yàn)和特有的品味,按照這些「私有資產(chǎn)」去做推理,才能拿到最優(yōu)解?!杆晕覀儏^(qū)別于 AGI,我們管這個(gè)叫做 Personalized AI。」

要說(shuō)到底什么是 Personalized AI,文章開(kāi)頭展示的打麻將,正是其最生動(dòng)的例子。

如果你拿一個(gè) AGI 的模型去幫你打麻將的話,因?yàn)樗催^(guò)很多種麻將打法,他會(huì)實(shí)時(shí)判斷一下,然后直接去選,無(wú)論哪一步他走的都是最優(yōu)解,看上去特別像一個(gè)機(jī)器人。
但是你如果跟他說(shuō)用您的方式去打這個(gè)麻將,AI 應(yīng)該是按照您的習(xí)慣,您經(jīng)常怎么樣去胡牌,或者怎么樣去記牌,怎么樣去開(kāi)杠不開(kāi)杠、吃牌不吃牌,然后用您的方式去打。這個(gè)就是通用 AI 和 Personalized AI 的區(qū)別。

這個(gè)比喻恰似乎和當(dāng)前的熱門(mén)話題,把同事,名人,甚至是前任「蒸餾」成 skill,在理念上有些相仿。當(dāng)我們提出這個(gè)話題時(shí),趙晨旭老師說(shuō):「這個(gè)其實(shí)就是你在打造你自己的 Personalized AI 的過(guò)程,只不過(guò)這些現(xiàn)在是以一種記憶或者文件的方式存儲(chǔ)的,它并沒(méi)有直接作用在 AI 的大腦里,沒(méi)有給它形成參數(shù)化。但這已經(jīng)是個(gè)性化 AI 的開(kāi)始了。」

模型的技術(shù)歷程

從操作瀏覽器,到一步步把 Personalized AI 做成,其中的技術(shù)難度不言而喻。我們也請(qǐng)趙晨旭老師為大家介紹了現(xiàn)在走向 Personalized AI 的模型的三大技術(shù)突破。

去年首次在 Mind2Web 和 OSWorld 刷榜時(shí),團(tuán)隊(duì)攻克的核心難題是在線強(qiáng)化學(xué)習(xí)。

「之前的那些強(qiáng)化學(xué)習(xí)的路徑都是在一個(gè)虛擬的上下文里面去做強(qiáng)化…… 但是對(duì)于那種一步操作可能會(huì)直接影響整個(gè)周?chē)恼鎸?shí)環(huán)境的這種情況,可能就不是那么合適了?!?/p>

團(tuán)隊(duì)引入了在線強(qiáng)化學(xué)習(xí)后,模型能力大幅提升,在 OSWorld 上拿下專(zhuān)有模型第一名,至今仍保持第一名

今年年初,團(tuán)隊(duì)發(fā)現(xiàn)了另一種新的訓(xùn)練范式 —— 雙向強(qiáng)化。傳統(tǒng)訓(xùn)練方式只有單向映射:自然語(yǔ)言 → 動(dòng)作(action)。

「大部分時(shí)候只有正向的,就是通過(guò)自然語(yǔ)言推測(cè) action,但是沒(méi)有從 action 去推理自然語(yǔ)言的。比如說(shuō)我按了一下這個(gè)按鈕,背后應(yīng)該對(duì)應(yīng)哪些自然語(yǔ)言?其實(shí)沒(méi)有人在做這項(xiàng)工作?!?/p>

團(tuán)隊(duì)提出的方案是同時(shí)訓(xùn)練兩個(gè)方向:自然語(yǔ)言→動(dòng)作,以及動(dòng)作→自然語(yǔ)言,兩者相輔相成。這種方法借鑒了視覺(jué)領(lǐng)域 GAN 的思想,效果出奇地好 ——

「我們就拿一套訓(xùn)練集訓(xùn)練一個(gè)模型,就直接刷新了 10 個(gè)榜單的紀(jì)錄?!?/strong>

「這也是我們?yōu)槭裁茨芏虝r(shí)間內(nèi)突破這么多榜單,因?yàn)槲覀儧](méi)有在這些任何一個(gè)榜單專(zhuān)門(mén)針對(duì)任何一個(gè)榜單去做優(yōu)化微調(diào),只是用一套訓(xùn)練數(shù)據(jù)通過(guò)這個(gè)訓(xùn)練方法訓(xùn)練一個(gè)模型,就在 10 個(gè)榜單上達(dá)到了算法結(jié)果?!?br/>

第三個(gè)突破指向了一個(gè)更實(shí)際的約束:算力。如果要讓 Personalized AI 真正落地到每個(gè)人的設(shè)備上,模型必須在有限算力下完成推理甚至訓(xùn)練。

視覺(jué)剪枝的方法是說(shuō),我們?cè)谧?GUI 任務(wù)的時(shí)候,屏幕截圖分辨率很高,可能都是 1080P 的分辨率,然后把圖像給它序列化變成一個(gè)個(gè) token。這個(gè) token 其實(shí)中間有好多是不必要的,在做任務(wù)時(shí)不需要關(guān)注這些 token。比如一個(gè)網(wǎng)頁(yè)里面有好多留白的空間,這些都是廢的 token。

通過(guò)識(shí)別并剔除這些冗余 token,模型的計(jì)算量得到顯著優(yōu)化,使得 Mono-P 能夠直接在 Mac 等端側(cè)設(shè)備上獨(dú)立運(yùn)行。

讓更多的人用起來(lái)

當(dāng)我們談及在榜單之外如何判斷模型是否成功,趙晨旭老師坦言標(biāo)準(zhǔn)正在發(fā)生遷移。

「在上個(gè)階段或者去年,我們主要以榜單為主。坦率地講,榜單大家可能理解得都比較直白。但是現(xiàn)在對(duì)于我們來(lái)說(shuō)標(biāo)準(zhǔn)確實(shí)發(fā)生了一些變化,我們現(xiàn)在更希望的是我們自己的模型能夠被更多的人用起來(lái)。」

這也解釋了開(kāi)源策略背后的考量 —— 如果不開(kāi)源,用戶(hù)無(wú)法在本地優(yōu)化自己的場(chǎng)景,Personalized AI 的愿景就無(wú)法真正落地。

我們知道,要想讓更多人用起來(lái),自然需要一個(gè)好用的場(chǎng)景,一個(gè)令人眼饞的落地實(shí)踐:

「我們?cè)O(shè)想的一個(gè)場(chǎng)景就是可以通過(guò) GUI 去代替人進(jìn)行測(cè)試。Claude Code 寫(xiě)完搭建完應(yīng)用之后會(huì)有一個(gè) PRD,然后模型參考這個(gè) PRD 去訪問(wèn)網(wǎng)站測(cè)試,看有沒(méi)有錯(cuò)誤、有沒(méi)有 bug。這樣就把人類(lèi)進(jìn)行測(cè)試的瓶頸給取消掉了。軟件可以 Claude Code 寫(xiě)完代碼馬上就測(cè)試,測(cè)試完給反饋結(jié)果,有沒(méi)有 bug,功能有沒(méi)有實(shí)現(xiàn),然后再改。改完之后再測(cè)試,整個(gè)流程中的人類(lèi)瓶頸就消失了。這是我們構(gòu)想的場(chǎng)景?!?br/>

這就是 Mano-afk 全自動(dòng)應(yīng)用構(gòu)建場(chǎng)景,用戶(hù)輸入一句自然語(yǔ)言需求,系統(tǒng)自動(dòng)完成需求澄清 → 技術(shù)架構(gòu)設(shè)計(jì) → 代碼生成 → 本地部署 → API 接口測(cè)試 → 頁(yè)面視覺(jué)檢測(cè) → 端到端 GUI 自動(dòng)化測(cè)試。測(cè)試失敗時(shí)自動(dòng)定位、修復(fù)代碼、重新驗(yàn)證,循環(huán)迭代直到全部通過(guò)。全程無(wú)人干預(yù)。

從 AGI 到 Personalized AI,從追求通用到擁抱個(gè)性,在這兩個(gè)時(shí)代的交界,我們的確該思考下一步的 AI 演進(jìn)方向。

「我們相信,個(gè)體和組織都能夠創(chuàng)造屬于自己的個(gè)性化 AI?!?/p>

文中視頻鏈接:https://mp.weixin.qq.com/s/DQ2HLD29jNN_i4jZWjkaAQ

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
5月1日起,3萬(wàn)元成“高壓線”!普通打工人、小老板、新規(guī)來(lái)了

5月1日起,3萬(wàn)元成“高壓線”!普通打工人、小老板、新規(guī)來(lái)了

混沌錄
2026-04-14 20:16:08
一場(chǎng)87:70讓前8格局再次大亂!青島遭晴天霹靂,遼寧機(jī)會(huì)又來(lái)了

一場(chǎng)87:70讓前8格局再次大亂!青島遭晴天霹靂,遼寧機(jī)會(huì)又來(lái)了

后仰大風(fēng)車(chē)
2026-04-15 07:35:05
孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔(dān)心的事出現(xiàn)了

孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔(dān)心的事出現(xiàn)了

圓夢(mèng)的小老頭
2026-04-15 15:00:48
中央明確了!社保最低繳費(fèi)年限要提高,70、80后得早做準(zhǔn)備

中央明確了!社保最低繳費(fèi)年限要提高,70、80后得早做準(zhǔn)備

云鵬敘事
2026-04-12 16:36:39
大灣區(qū)攬勝來(lái)了!小鵬旗艦SUV GX預(yù)售:旗艦版39.98萬(wàn)

大灣區(qū)攬勝來(lái)了!小鵬旗艦SUV GX預(yù)售:旗艦版39.98萬(wàn)

快科技
2026-04-15 21:38:10
國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤(pán)到此為止了

國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤(pán)到此為止了

比利
2026-01-23 12:41:53
70后存款大曝光!銀行人表示:能存到這個(gè)數(shù)的,已經(jīng)算“中上層”

70后存款大曝光!銀行人表示:能存到這個(gè)數(shù)的,已經(jīng)算“中上層”

億通電子游戲
2026-04-15 13:02:19
2.4萬(wàn)億元,一個(gè)人怎么能闖出這么大的禍…

2.4萬(wàn)億元,一個(gè)人怎么能闖出這么大的禍…

蔥哥說(shuō)
2026-04-14 22:04:16
突發(fā)!香港資深制作人失聯(lián),牽扯金額恐達(dá)上億元

突發(fā)!香港資深制作人失聯(lián),牽扯金額恐達(dá)上億元

你約電影
2026-04-15 20:34:31
5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

小談食刻美食
2026-04-15 08:30:07
南京征婚啟事走紅!男子“頂配條件”僅要求女方91年后出生、未婚

南京征婚啟事走紅!男子“頂配條件”僅要求女方91年后出生、未婚

火山詩(shī)話
2026-04-15 06:25:37
貴陽(yáng)一高速發(fā)生多車(chē)連環(huán)事故,當(dāng)?shù)鼗貞?yīng):涉及7輛車(chē),尚未掌握人員傷亡信息,道路已恢復(fù)暢通

貴陽(yáng)一高速發(fā)生多車(chē)連環(huán)事故,當(dāng)?shù)鼗貞?yīng):涉及7輛車(chē),尚未掌握人員傷亡信息,道路已恢復(fù)暢通

極目新聞
2026-04-15 16:51:24
開(kāi)業(yè)僅2年,淮安這家綜合體卻有大批商鋪空了!

開(kāi)業(yè)僅2年,淮安這家綜合體卻有大批商鋪空了!

微淮安
2026-04-15 20:04:07
最后5輪3個(gè)主場(chǎng) 沙爾克距離重返德甲只剩一步之遙

最后5輪3個(gè)主場(chǎng) 沙爾克距離重返德甲只剩一步之遙

體壇周報(bào)
2026-04-15 18:26:55
70架軍機(jī)抵以色列,伊朗中計(jì),巴鐵出兵,戰(zhàn)爭(zhēng)一觸即發(fā)

70架軍機(jī)抵以色列,伊朗中計(jì),巴鐵出兵,戰(zhàn)爭(zhēng)一觸即發(fā)

天天都是好日子
2026-04-14 16:52:58
“老師最煩這種現(xiàn)眼包家長(zhǎng)”,寶媽穿緊身裙參加運(yùn)動(dòng)會(huì),被嘲

“老師最煩這種現(xiàn)眼包家長(zhǎng)”,寶媽穿緊身裙參加運(yùn)動(dòng)會(huì),被嘲

蝴蝶花雨話教育
2026-04-02 10:30:13
張雪宣布:計(jì)劃于今年六七月份,在重慶挑戰(zhàn)騎摩托車(chē)飛躍長(zhǎng)江;網(wǎng)友勸阻別拿命開(kāi)玩笑,此前挑戰(zhàn)連續(xù)失敗4次

張雪宣布:計(jì)劃于今年六七月份,在重慶挑戰(zhàn)騎摩托車(chē)飛躍長(zhǎng)江;網(wǎng)友勸阻別拿命開(kāi)玩笑,此前挑戰(zhàn)連續(xù)失敗4次

魯中晨報(bào)
2026-04-15 15:00:10
豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績(jī)壓廣州1勝場(chǎng),再贏2場(chǎng)鎖季后賽!

豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績(jī)壓廣州1勝場(chǎng),再贏2場(chǎng)鎖季后賽!

籃球資訊達(dá)人
2026-04-15 22:35:17
凌晨1點(diǎn)告別德國(guó)!樊振東最后一場(chǎng),數(shù)萬(wàn)球迷會(huì)為他守夜嗎?

凌晨1點(diǎn)告別德國(guó)!樊振東最后一場(chǎng),數(shù)萬(wàn)球迷會(huì)為他守夜嗎?

曉隯就是我
2026-04-15 10:59:55
李想朋友圈發(fā)爽了,也讓東風(fēng)日產(chǎn)NX8上桌了

李想朋友圈發(fā)爽了,也讓東風(fēng)日產(chǎn)NX8上桌了

電動(dòng)星球News
2026-04-13 20:08:50
2026-04-15 23:28:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12772文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶(hù)又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車(chē)要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

親子
健康
教育
房產(chǎn)
家居

親子要聞

母嬰命懸一線,兇險(xiǎn)性前置胎盤(pán)穿透膀胱,這家醫(yī)院如何力挽狂瀾

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

千城百縣看中國(guó)|山東定陶:創(chuàng)意滿(mǎn)格大課間

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

家居要聞

簡(jiǎn)而不減 暖居之道

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版