![]()
對著手機說一句「我下午要去會展中心參加線下會議,需要提前 20 分鐘到,幫我看下什么時候出發(fā),約好車提醒我」,接下來發(fā)生的事情很快:小藝查了日程里的會議時間和地點,調(diào)用地圖看實時路況算出發(fā)時間,預約好車并設了鬧鐘提醒。
一個任務,三個應用的多個服務,只用一句話調(diào)度。
——這是在華為開發(fā)者大會 HDC 2026 上展示的一個使用小藝的日常場景。
![]()
表面看起來是一次語音交互的升級,但底下的變化大有文章:這個任務跨了日程、地圖、時鐘多個獨立應用,過去用戶需要手動操作分別打開它們,挨個翻頁找到具體的服務;但現(xiàn)在小藝把整條鏈路串起來了,用戶只負責說出自己要什么就行了。
這一新的手機 AI Agent 交互體驗的背后,是 HarmonyOS 向 Agent 架構的一次整體演進。基于全新升級的鴻蒙智能體框架2.0,小藝跟鴻蒙系統(tǒng)深度融合,成為系統(tǒng)智慧大腦,變成長在操作系統(tǒng)里的智能體,向著最強系統(tǒng)智能體的方向演進。
新的時代,新的入口
過去二十年,移動互聯(lián)網(wǎng)的統(tǒng)一操作邏輯,建立在用戶→找應用→找服務的路徑上:不同應用提供不同服務,用戶主動打開需要的應用,再去應用里找某個具體的服務。
我們都對這條運轉(zhuǎn)良好的邏輯習以為常,但實際上我們的手機里平均安裝七八十個 App,日均使用只有 10 個左右。根據(jù)第三方分析平臺數(shù)據(jù),對于一個典型的智能手機用戶,62% 的 App 一個月都不會打開一次。
這些應用不是不好用,是使用場景窄,用完就擱置了。它們的服務價值還在,但需要新的調(diào)用方式。
Agent 時代正在成形的路徑是「意圖即服務」:用戶提需求→ Agent 交付。具體來說,Agent 會判斷、調(diào)度、執(zhí)行,精準理解需求并分發(fā)服務。用戶不需要知道背后調(diào)用了哪些 Agent/Skill,只需要知道需求被滿足即可。
在新的移動/AI Agent 時代,入口的性質(zhì)也發(fā)生了改變。過去,應用爭奪的是「信息入口」,決定用戶看到什么;Agent 時代爭的是「行動入口」,決定替用戶做什么。
Agent 是比搜索框更深、更高頻的下一個默認入口,誰握住它,誰就掌握了下一代移動互聯(lián)網(wǎng)的分發(fā)權。這也是移動互聯(lián)網(wǎng)時代的平臺廠商們感到緊張又興奮的原因。
前不久,Google 將 Android 的定義從「操作系統(tǒng)」改成了「智慧系統(tǒng)」(intelligence system)。Gartner 預測到今年底 40% 的企業(yè)應用會嵌入 AI Agent,去年不到 5%。
起初,蘋果通過 App Intents 框架讓開發(fā)者給 Siri 暴露功能接口,不過被 Siri 自身能力所牽制。不過上周 WWDC 上蘋果也算是交出了新的答卷,Siri 現(xiàn)在終于有了獨立 App 形態(tài),并且其理解用戶意圖、操作手機的能力,也有了很大提升。很明顯能看到的是,蘋果也在用一系列新的 Apple 智能以及 Siri AI 能力,吸引生態(tài)開發(fā)者。
Google 更激進:Gemini Intelligence 直接嵌入 Android 17 作為系統(tǒng)級 Agent,AppFunctions API 讓應用暴露功能接口,沒 API 時用 GUI 自動化兜底。不過目前接入的應用只有二三十個。
而在國內(nèi),我們看到目前最為前沿的進展,并沒有意外,發(fā)生在華為的身上。
HarmonyOS 的「元服務」架構天然把服務拆成輕量、免安裝、跨設備可調(diào)用的模塊,Agent 浪潮則恰好提供了現(xiàn)成管道。華為在這條路上已經(jīng)走了三步:2024 年搭建鴻蒙 AI 基礎能力和框架,2025 年發(fā)布 HMAF 推動應用級 Agent 化,到今年的目標是整個操作系統(tǒng)的 Agent 化。
HDC 2026 上公布的三件事,就是這第三步的具體路徑。
![]()
第一件事:系統(tǒng)應用全面 Skill 化,讓系統(tǒng)成為小藝的感官與手腳
要能真正會干活,小藝首先需要調(diào)動更多系統(tǒng)能力。感知、數(shù)據(jù)、設備控制,這幾類能力過去鎖在系統(tǒng)底層。華為的做法直截了當:全部 Skill 化,交給小藝統(tǒng)一調(diào)度。
HDC 2026 公布的數(shù)字:系統(tǒng)應用全面Skill化,2100 多項系統(tǒng)能力可被小藝調(diào)用,200 多項系統(tǒng)級數(shù)據(jù)接入小藝的上下文。備忘錄、日歷、圖庫、藍牙、聯(lián)系人、文件管理等系統(tǒng)應用的能力全在里面。小藝因此能在用戶的授權下調(diào)用攝像頭、讀懂屏幕內(nèi)容、感知場景狀態(tài)、調(diào)度多設備協(xié)同。整個 HarmonyOS 的系統(tǒng)能力成了小藝隨手可用的工具箱,而且用戶也不需要告訴小藝「先打開這個再打開那個」。
![]()
有兩個場景很適合用來展現(xiàn)小藝獲得系統(tǒng)級能力加持后的 Agent 使用體驗:
- 對小藝說「我報名了楚雄半馬,幫我制定個恢復訓練計劃」。小藝的反應鏈條是這樣的:先拆解意圖,查詢比賽相關信息,判斷用戶處于停訓或恢復期,需要溫和的重啟方案;再調(diào)用日程、運動健康、睡眠等系統(tǒng)數(shù)據(jù);然后協(xié)調(diào)網(wǎng)頁搜索、運動健康 Coach、運動健康 Health 等 Skills 協(xié)同工作;最后綜合評估,輸出定制訓練計劃并寫入日歷。
- 再來看跨端協(xié)同能力:比如你不在鴻蒙電腦前,但需要電腦上的一些關鍵文件,可以跟小藝說:「把電腦上跟傅里葉實驗有關的所有材料打包發(fā)到我手機上,并且準備一份材料清單。」即便電腦是合蓋待機狀態(tài),甚至都不確定文件名稱具體叫什么,小藝也能幫你完成。具體步驟是:首先手機小藝就會聯(lián)動 PC 小藝把電腦上近期保存的相關資料找出來并把清單發(fā)給我們確認,確認哪些是我們所需的相關資料后,PC 小藝調(diào)用文檔管理 Skill 把文件打包成壓縮包發(fā)送到手機小藝上,完成后跨設備通知提醒。
![]()
而且,小藝使用過程中,正在調(diào)用哪個工具、執(zhí)行到哪一步,對于用戶都是透明的,可見可控。
這些場景,涉及到了當下非常熱門的行業(yè)概念:A2A 和 Skill。
A2A (agent-to-agent) 概念去年 4 月由 Google 和 IBM 首次提出,隨后交給 Linux 基金會形成社區(qū)驅(qū)動的開源國際標準,目前得到全球超過 150 個組織的參與支持。華為此前發(fā)布的 AI 終端白皮書、鴻蒙智能體框架白皮書中都強調(diào)過系統(tǒng)級端/云智能體協(xié)同協(xié)議,是較早把 A2A 協(xié)作落地為系統(tǒng)級協(xié)議的廠商之一。
在傳統(tǒng)的 AI 交互鏈條中,人對 AI 說話,AI 再去執(zhí)行。但 A2A 的不同之處,在于 Agent 之間可以直接對話協(xié)作,而這需要一個聰明的「管理者」「協(xié)調(diào)者」。
在剛才的半馬場景中,小藝拆解了任務,隨后調(diào)度「運動健康」「日程」「搜索」等多個子 Agent 和 Skills,讓它們通過鴻蒙智能體框架 (Harmony Agent Framework, HMAF) 協(xié)議自行協(xié)商和交換數(shù)據(jù),并行推進任務。
除了自主規(guī)劃、協(xié)調(diào)各種系統(tǒng)能力或生態(tài)伙伴能力 Skills 和 A2A 去執(zhí)行任務外,小藝還能做一件更有意思的事:幫用戶「造工具」。
對小藝說「做個兒童學英語的小工具,支持拍物品學單詞,拍照識別物品后展示英文、音標、釋義和發(fā)音,卡片可以加到單詞本里」。小藝通過調(diào)用「碼上飛」的文生代碼能力以及結(jié)合系統(tǒng)的相機、TTS(文字轉(zhuǎn)語音)播報能力,可以快速生成一個可交互的學習工具,不用下載應用,更不用自己寫一行代碼,說完就能用。
這比讓小藝幫你訂機票或做訓練計劃更往前走了一步:用戶不再只是任務的發(fā)起者,更是工具的創(chuàng)造者。
![]()
第二件事:AI 能力開放,讓開發(fā)者靈活高效接入
系統(tǒng)應用 Skill 化和 A2A 的支持,給小藝打好了地基。但一個系統(tǒng)級 Agent 如果只調(diào)用自家服務,天花板很快就到了。第二件事要解決的問題是:把生態(tài)接進來。
HDC 2026 上,小藝開放平臺也進行了升級,開放了多種接入方式:Agent、Skill、MCP、意圖框架等,三方應用可以選最適合自己的深度接入小藝的調(diào)度體系。目前已有 500 多個精選伙伴Skills 上線,2000 多個鴻蒙智能體上架。例如,東方財富的妙想 Skill 已經(jīng)能聯(lián)動聯(lián)網(wǎng)搜索 Skill,用自然語言完成自定義條件選股。
在更底層,鴻蒙智能累計開放了 20 多項 AI 子系統(tǒng)能力,日調(diào)用量 36.8 億次。諸如信息摘要、卡證識別、活體檢測、圖像超分等能力,已被京東金融、鐵路 12306、知乎等應用接入,開發(fā)者不用自建模型,就可以在應用里調(diào)用系統(tǒng)級 AI。
為了讓接入足夠順暢,鴻蒙智能體框架做了幾件具體的事情:
A2A 協(xié)議升級后支持端側(cè)直連,頭部伙伴的 Agent 可以在設備本地完成協(xié)作,騰訊視頻已經(jīng)通過這種方式接入,用戶可以直接讓小藝設置倍速、問劇情,不用跳出當前界面;A2UI 協(xié)議讓 Skill 不用預先定義界面,Agent 根據(jù)用戶指令的復雜度動態(tài)生成 UI,同一個 Skill 在手機、平板、車機上都能渲染;Skill 上架打通了華為賬號鑒權,配合自然語言開發(fā)工具,讓規(guī)模、能力不同的開發(fā)者團隊都能快速接入。
![]()
對于用戶來說,只需說出需求就能得到結(jié)果,小藝可以調(diào)用各種 Skills/Agents 來為用戶提供更極致的智慧體驗。
這套邏輯叫「意圖即服務」。用戶說出需求,系統(tǒng)理解意圖后直接匹配能完成這件事的 Agent 或 Skill,跳過「打開 App-找服務」這個步驟。
比如周末三五好友來家里聚餐,對小藝說「今天來三個好哥們,幫我規(guī)劃個菜單」。小藝先根據(jù)人數(shù)和口味偏好生成菜單,列出每道菜需要的食材和分量,然后調(diào)用叮咚買菜的 Agent,把食材清單一鍵加入購物車,用戶確認后直接下單。
從「想吃什么」到「食材到家」,一句話串起了菜單規(guī)劃、食材匹配、生鮮電商三個環(huán)節(jié)。用戶沒有打開任何一個 App。
![]()
對開發(fā)者,分發(fā)邏輯從根本上變了,和過去的應用商城截然不同。過去是「用戶找 App」,數(shù)萬個應用爭排名、競價推薦位。
「意圖即服務」的邏輯是「用戶說需求,系統(tǒng)找服務」,只要服務做得好,在 Agent/Skill 化適配上足夠順暢,小藝會在用戶需求匹配的時候主動精準調(diào)用開發(fā)者的服務。
華為去年啟動的天工計劃投入 10 億元,目標是孵化超 10000 個 AI元服務、1000 多種意圖框架以及 MCP,和 5000 多個 Agent——本質(zhì)上是在幫開發(fā)者降低接入門檻。
幾種接入方式中,MCP (Model Context Protocol) 是 Anthropic 2024 年提出的 Agent 與工具通信標準,目前已是行業(yè)事實標準。鴻蒙兼容 MCP,等于給外部 AI 生態(tài)開了一扇門:不管開發(fā)者在哪個大模型生態(tài)里,只要遵守這個協(xié)議,就能進入小藝的調(diào)度體系。
最后,當 Agent 可以跨應用調(diào)度服務、讀取系統(tǒng)數(shù)據(jù),安全就不再是附加題。
華為在 HDC 2026 同期發(fā)布了《鴻蒙智能安全白皮書》,把安全架構擺到了和 Agent 能力同等的位置。
小藝采用 HPIC(HarmonyOS 個人智能計算系統(tǒng))架構,堅持本地優(yōu)先、數(shù)據(jù)最小化、用戶可控。需要云端算力時,AI 推理在用戶專屬的機密環(huán)境中運行,通過 OHTTP 協(xié)議和端云協(xié)同加密實現(xiàn)用戶身份三重匿名盲化,系統(tǒng)管理員也無法查看用戶明文數(shù)據(jù)。
![]()
在應用層面,涉及轉(zhuǎn)賬、支付等操作時,系統(tǒng)會阻斷自動化流程,必須由用戶手動完成;證件、工作文件等敏感資料在設備本地流轉(zhuǎn),云端只接收處理后的結(jié)果。
HPIC 已通過中國泰爾實驗室三大安全檢驗,達到行業(yè)高標準的增強級要求。不僅如此,小藝 Claw 成為首個獲信通院國家級認證的終端廠商 Claw 類智能體。
第三件事:業(yè)界優(yōu)質(zhì)大模型引入,給小藝一個可升級的大腦
第三件事關乎小藝的「智力」來源。
小藝要聰明,需要聰明的大腦。有趣的是,華為果斷地選擇不押注單一模型。
大模型的世界變化太快,半年前的最優(yōu)解半年后可能就不是了。華為的判斷很務實:與其押注一個具體的模型,不如建一套「萬能插座」式的模型接入架構,讓 Pangu、DeepSeek 等大模型能靈活對接和調(diào)用。誰在哪個場景做得最好,小藝就用誰。
正因為這種靈活性,小藝的使用體驗變得愈發(fā)聰明。基于 Agentic 自演進架構,讓小藝可以自主思考、規(guī)劃、調(diào)度。效果就是,用戶往往不需要告訴小藝一個復雜任務該怎么做,小藝自己思考就可以做得很好。
![]()
在實際使用中,模型的靈活對接帶來的差異很明顯。當你對小藝說「幫我寫一封英文商務郵件」,小藝判斷這是多語言生成任務,路由到英文寫作能力更強的模型;當你說「分析一下我上個月的運動數(shù)據(jù),給個改善建議」,任務涉及結(jié)構化數(shù)據(jù)理解和個性化推理,框架可能切換到另一個更擅長此類推理的模型。兩個請求,兩條路徑,用戶感知到的只有「小藝都辦好了」。
這個選擇和 Apple 在 Core AI 框架中的多模型策略有相似之處,但執(zhí)行深度有區(qū)別。蘋果在 Siri 層面開放了多模型后端,更多是提供了選擇權,并且直接交給開發(fā)者,但并無更多協(xié)調(diào)層面的已知工作。而華為的更多工作,是在操作系統(tǒng)底層建了一套模型調(diào)度框架,覆蓋從意圖理解到任務執(zhí)行的全鏈路,且模型的切換對用戶透明。
模型調(diào)度解決了「會不會做」,但還有一個同樣關鍵的問題:小藝記不記得你是誰。
就在兩周前,OpenAI 上線了 Dreaming V3,將 ChatGPT 的記憶架構整個重寫:系統(tǒng)在后臺自動跨所有歷史對話合成用戶畫像,不需要手動告訴它「請記住」,并且過時的信息還會自動更新。
行業(yè)方向越來越清楚:模型再強,如果每次對話都如初見,體驗的上限很低。
在 HDC 2026 早餐會的分享交流中,小藝相關負責人介紹了小藝針對「如何記住用戶」所做的努力。
![]()
小藝全新升級了記憶體系:瞬時記憶處理單次推理,短時記憶覆蓋單個對話窗口,長時記憶沉淀用戶的指令偏好和隱性習慣,全時記憶做伴隨態(tài)的持續(xù)積累,最終匯成全局動態(tài)畫像。
和純對話型 AI 不同,小藝的記憶源不只是聊天記錄——日歷、運動健康、消費記錄、圖庫這些系統(tǒng)級數(shù)據(jù)全在里面。華為的定位也很明確:這套記憶體系叫「鴻蒙記憶」,是 AI OS 的底座能力,不是小藝一個應用的私有功能。系統(tǒng)級數(shù)據(jù)、全場景設備、端側(cè)隱私處理,這個組合是鴻蒙在記憶這一層的差異化位置。
舉個例子:每年體檢后我們都習慣性地把報告下載下來存在本地,但要回溯之前的某項身體數(shù)據(jù)來對比就會比較麻煩。當小藝幫你記住后,喚起小藝問一句「我這三年甘油三酯什么趨勢」,小藝能跨時間調(diào)取數(shù)據(jù),給出變化曲線,還能結(jié)合健康相關的智能體提供咨詢服務。
記憶不回到場景里,就只是存檔。回到服務里,才變成能力。
這一能力不局限于某個 App,而是跨應用的,系統(tǒng)根據(jù)記憶中沉淀的意圖模式來判斷什么時候彈出。這條「記憶沉淀→回到服務」的鏈路,把前面講的「意圖即服務」從被動響應推向了主動預判。
正如前面提到,一個體驗優(yōu)秀的 Agent 產(chǎn)品,需要兩樣東西成立:優(yōu)秀的模型和優(yōu)秀的腳手架。兩者互相成就。好的智能體框架能讓優(yōu)秀的 Agentic 模型被最大化利用,帶來更好的體驗。對用戶來說,小藝讓人覺得「聰明懂我」「辦成事」的秘訣,在于一套讓好模型為它所用、讓記憶越積越厚的工程體系。
![]()
當操作系統(tǒng)成為 Agent
2008 年 App Store 上線,沿著「用戶下載 App、App 提供服務」這條路徑,到今天已經(jīng) 18 年,生長出了萬億美元級的分發(fā)和商業(yè)生態(tài)。
但現(xiàn)在,所有平臺廠商都在做同一件事:把入口從 App 遷移到 Agent,帶給用戶更好的 AI 體驗,并給開發(fā)者帶來新的機會。遷移的速度,和生態(tài)擴張的速度,很可能比上一次更快。一個參照:MCP 從發(fā)布到成為行業(yè)事實標準用了半年,A2A 從提出到超過 150 個組織加入只用了一年多。移動互聯(lián)網(wǎng)早期,一個開發(fā)范式從提出到普及至少三五年。
華為在 HDC 2026 上讓小藝深度融入操作系統(tǒng)底層,也是沿著這條新路徑做的一次前瞻嘗試。
但更值得思考的,是這條路的終點指向哪里?當一個 Agent 沉淀了你的日程、健康數(shù)據(jù)、消費偏好、工作習慣,它和你的關系已經(jīng)不是「工具」可以概括的了。它在變成一個了解你的協(xié)作者,不需要每次從頭了解你是誰、偏好什么、上次做到了哪里,有什么問題需要改進——它都記得。
至于應用,當然不會就此消失,但新的入口已然顯現(xiàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.