![]()
6月8號,微信開放平臺發(fā)了個不大不小的消息:小程序開發(fā)者們,現(xiàn)在可以在后臺主動授權,讓自己的小程序接進微信AI了。
01
兩種模式。一種叫「自動模式」,平臺在你提審的時候讀你的源碼,自動幫你生成AI能調用的能力,你啥都不用干。
另一種叫「開發(fā)模式」,你按規(guī)范自己適配,目前還在內測,用戶暫時體驗不到。
如果你是個小程序開發(fā)者,這事兒跟你直接有關;而且我勸你,在「自動模式」四個字上多看幾眼,別急著跳過。
有人已經(jīng)去實測了,小程序管理后臺確實上線了「微信AI自動模式」的服務條款頁面,定義寫得清清楚楚:
允許微信用戶通過微信AI調用、訪問、操作小程序,以及根據(jù)小程序代碼自動生成、調用技能的自動化技術服務。
注意最后一句話,根據(jù)小程序代碼自動生成、調用技能。
你交出去的是代碼,微信拿回來的是「技能」;你的源碼進去,出來一個能被微信AI理解和操控的能力模塊。說白了,平臺做這件事,是把你的小程序翻譯成AI能聽懂的語言。
翻譯只是第一步,AI聽懂之后還得會動手,它得知道你的下單按鈕在哪兒,搜索框長什么樣,點了確認之后跳到哪個頁面。
要知道,幾百萬個小程序,界面千差萬別;同樣一個「下單」按鈕,不同小程序里位置、樣式都不同,交互邏輯也完全不一樣。
我查了一下,過去一年,微信AI團隊發(fā)了一堆論文,拼在一起看,是一條完整的技術路線。
第一步,讓AI看懂界面。
微信團隊在自己搞的那套多模態(tài)模型POINTS基礎上,又專門做了一個給GUI定位的模型,叫POINTS-GUI-G。名字夠長吧?活兒也很硬。
你給它一張小程序截圖,外加一句指令,比如說「找到下單按鈕」,它就能告訴你,這個按鈕在屏幕上的坐標在哪兒,精確到像素級別。
這個模型在ScreenSpot-Pro上直接屠榜了;那個測試是目前公認最難的GUI定位基準,分數(shù)最高;論文自己說的,在「找到按鈕」這件事上,全球第一。
第二步,讓AI預判操作結果。
人點一個按鈕之前,大概知道會發(fā)生什么,頁面會跳轉,會彈出確認窗,購物車數(shù)量會變。AI沒有這種直覺。
怎么辦?微信團隊就給小程序生態(tài)造了一個「世界模型」,項目叫UI-Oceanus。它能自動模擬各種操作和頁面變化,生生造出了500萬個樣本、32億token的合成訓練數(shù)據(jù)。
效果呢?在Agent從沒見過的新小程序上冷啟動測試,導航成功率提升了21.9%。
「冷啟動」這三個字是關鍵,不需要任何預先了解,面對一個完全陌生的小程序,自己摸索著就把任務干了。
第三步,讓AI判斷自己操作對了沒。
這一步有個項目叫DiffSpot,專門訓練模型識別操作前后界面上的那些細微變化。
不過論文自己也承認了,主流視覺模型在這類任務上還是很吃力,三個環(huán)節(jié)里,這個最拉胯。
好,現(xiàn)在把公告和這幾篇論文串起來看,鏈條就很清楚了:
你的源碼交給平臺,平臺分析出頁面結構和交互邏輯,轉成AI能調用的「技能」,POINTS-GUI-G負責看懂界面,UI-Oceanus負責預判操作結果,DiffSpot負責確認執(zhí)行對不對。
源碼提供的是「這個小程序長啥樣、怎么運轉」,三篇論文背后的技術提供的是「怎么操控任意小程序」。
兩邊一合,微信AI就有了替你操作小程序的全部家當,所以「自動模式」這個名字起得挺準的。
對開發(fā)者來說,確實是自動的,你什么都不用干;但這個「什么都不用干」的另一面,是這事兒也不需要你參與了。
平臺讀完你的代碼,自己就把你的小程序變成AI的一個可調用模塊了。
你省掉的開發(fā)成本,換來的是你的小程序從「用戶自己打開來用的產(chǎn)品」,變成了「微信AI替用戶調用的一項技能」。
不一定是壞事,但好歹得知道自己交出去的是什么。
02
我查了一下,公告里有句話,很容易一眼滑過去:
是否接入由開發(fā)者自主決定,接入與否不會影響現(xiàn)有的小程序服務。
聽著挺體面,翻譯成人話:你不來,也沒人為難你。
開發(fā)者真有選擇嗎?
技術層面,這句話完全成立;你今天不授權,你的小程序明天照常運行,用戶該怎么用還怎么用,一行代碼都不會被動,微信沒說錯。
但它保護的是你的存量,你的增量呢?公告同時寫得明白,開發(fā)者需要「主動授權接入微信AI」,反過來說,不接入的小程序,就不會被微信AI調用。
今天這事兒無所謂,微信AI還在內測,用戶還用不上。
可一旦正式上線呢?14億月活用戶開始習慣用一句話讓AI幫他們點咖啡、查快遞、訂機票,那些沒接入的小程序,AI可能根本不知道你的存在。
用戶不是不能手動打開你的小程序,但旁邊那個競品已經(jīng)被AI直接調用了,你還要用戶自己搜索、自己打開、自己一步步點,這不叫「不影響」,是你的小程序被默默繞過去了。
更值得看的是時間線。
回到半年前,今年1月,微信推了個「AI應用及線上工具小程序成長計劃」,激勵期覆蓋2026全年。
給的東西確實不含糊:免費云開發(fā)環(huán)境,最長給半年。1億token的混元大模型額度;1萬張文生圖額度,免費We分析專業(yè)版,「發(fā)現(xiàn)-小程序」里給你專屬推薦入口。
連廣告變現(xiàn)都幫你安排好了,有個「免開發(fā)智能接入模式」,平臺自動在合適位置插廣告,個人和企業(yè)都能參加。
1月,給資源給流量給變現(xiàn)工具,大門敞開請你進來;6月,請你授權源碼,讓AI能操控你的小程序。
兩步串一塊看,味道就出來了。
先把你養(yǎng)在生態(tài)里,再讓你把鑰匙交出來,每一步單獨看都很合理,送資源有什么不好?自愿授權有什么不對?但兩步走完,開發(fā)者對微信生態(tài)的依賴又深了一層。
有人可能會說,蘋果不也這樣嗎?Siri要調用你的App,你也得按蘋果的App Intents框架適配。
沒錯。但有一個關鍵區(qū)別:蘋果不需要讀你的源碼。
App Intents是一個本地框架,開發(fā)者自己聲明自己的App能干什么,Siri在用戶設備上調用;而微信的自動模式,要求你把源碼交給平臺,能力由平臺側生成。
你適配的是一個平臺的AI。
這里我要強調一句啊,我沒有說微信平臺在做壞事的意思,平臺搭臺、開發(fā)者唱戲,歷來如此。
2017年小程序剛出來的時候,也是「自愿接入」,后來變成了線下商家的標配,這一輪的故事也許會重演,也許不會。
但有一件事值得記住:當一個平臺告訴你「你可以不來」時,先看看不來的代價是什么。
0
這個博弈之所以不太容易一眼看穿,還有一個更隱蔽的原因:微信在描述這整套體系時,用的全是開發(fā)者已經(jīng)很熟悉的詞。什么詞?Skill,和MCP。
如果你過去一年用過AI編程工具,這兩個詞你不會陌生。
MCP,全稱Model Context Protocol,是Anthropic在2024年底搞的一套開源協(xié)議標準。
它要解決的問題很直接:
讓任何AI模型都能用同一套規(guī)范去連接任何外部工具和數(shù)據(jù)源;不綁定廠商,不綁定模型,協(xié)議開源,社區(qū)驅動。
在AI開發(fā)者圈子里,它的地位有點像當年的HTTP,不屬于誰,但誰都在用。
Skill,在Claude Code、OpenClaw這些AI編碼工具的體系里,是一個模塊化的「技能包」概念。
你給AI裝一個Skill,它就多了一項專業(yè)能力,懂UI設計、數(shù)據(jù)庫查詢,某個框架的最佳實踐;Skill是開放的,開發(fā)者自己寫,自己裝,跨工具通用。
這兩個詞,過去一年在中文AI開發(fā)者社區(qū)里已經(jīng)有了明確的共識:MCP是連接標準,Skill是能力模塊。兩個都是開放生態(tài)的基礎設施。
然后微信來了。
你去翻微信的官方開發(fā)者文檔,會發(fā)現(xiàn)一個叫「使用Skill / MCP輔助小程序開發(fā)」的頁面,白紙黑字寫著:
MCP負責連接環(huán)境與調用工具,Skill負責補充小程序、云函數(shù)、數(shù)據(jù)庫等場景規(guī)則。
再翻騰訊文檔開放平臺。Skill的定義長這樣:
AI智能體跟大規(guī)模協(xié)作辦公生態(tài)之間的通信與作業(yè)協(xié)議層。后面還跟了一句,說「通過MCP標準框架」運行。
話說得挺大,但往下看就更有意思了。
微信支付搞了個「基礎支付接入Skill」,直接手把手教你怎么在Cursor的Skill配置目錄里用;小程序Skyline渲染引擎,有個開源倉庫,名字就叫skyline-skills。
小程序云測那邊,整了個「skill能力」功能,讓大模型自己決定啥時候調哪個技能。
如果你最近在開發(fā)者論壇里逛過,可能已經(jīng)看到有人在吐槽了:Skill和MCP這兩個詞,在中文世界里快要不是原來的意思了。
為什么?
微信確實在用MCP這個協(xié)議,也確實在用Skill這個詞。但問題出在哪兒呢?它把一套跨平臺、跨模型的開放標準,嵌進了一個只對微信AI生效的封閉生態(tài)里。
開放世界里的MCP,解決「任何AI都能連任何工具」;微信里的MCP,解決的是「微信AI能連微信里的工具」,僅此而已。
我不知道我表達夠不夠清晰?
還記得之前那句條款嗎?「根據(jù)小程序代碼自動生成、調用技能」。
現(xiàn)在你知道了。那個「技能」在微信的技術文檔里對應的英文,就是Skill;你的源碼交上去,出來一個能力模塊,在微信的體系里就叫Skill,一個只在微信花園里生效的Skill。
這事兒比術語之爭大多了,說重一點,一場認知基礎設施的替換,正在悄悄發(fā)生。
14億月活的平臺,開始用「Skill」和「MCP」來描述自己的封閉接口,而大多數(shù)中文開發(fā)者第一次看到這兩個詞,恰好就是在微信的開發(fā)者文檔里。
然后呢?
很多人認知里,Skill就是「小程序被AI調用的接口」,MCP就是「微信云開發(fā)的連接工具」,至于這些詞原本在開放世界里是什么意思,反而成了需要額外解釋的冷知識。
這招挺高級的。
用熟悉的詞,消解警惕,讓你覺得你在對接行業(yè)標準,其實走進一個只有一個出口的房間。平臺鎖定,就發(fā)生在毫無察覺的時候。
我沒說微信做錯了什么,AI引領的變革面前,各家平臺做平臺的事;那個詞變沒變味,也不重要;關鍵在于誰在把路修寬,誰在把墻壘高?
注,文中提及的微信AI團隊相關研究:
[1] .Zhao, Z. et al. POINTS-GUI-G: GUI-Grounding Journey. arXiv:2602.06391, 2026;[2].Wu, M. et al. UI-Oceanus: Scaling GUI Agents with Synthetic Environmental Dynamics. arXiv:2604.02345, 2026.[3] .DiffSpot: Can VLMs Spot Fine-Grained Visual Differences in Web Interfaces? arXiv:2605.29615, 2026.
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.