无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

越懂你,越危險?MemPrivacy揭示AI記憶下一站

0
分享至



機器之心發布

AI 記憶時代 ,Agent 越來越像一個真正的私人助理。

它記得你的習慣,知道你的日程,理解你的健康狀態,甚至能在長期對話中逐漸形成一套關于你的「個人畫像」。但問題也隨之而來:如果這些記憶都要上云,隱私還安全嗎?

4 月 22 日,OpenAI 開源了一個名為privacy-?lter的輕量級隱私過濾模型,試圖解決大模型系統中的 PII 檢測與脫敏問題。



  • OpenAI Privacy Filter 地址:https://openai.com/zh-Hans-CN/index/introducing-openai-privacy-filter/

僅僅兩周后,記憶張量 MemTensor 團隊拿出了一個更激進的答案。該方案由記憶張量 MemTensor 與榮耀 HONOR 團隊聯合研發,同濟大學也參與其中 —— 這也是端側廠商與記憶基礎設施團隊首次在「Agent 隱私」這件事上深度合作。

他們正式開源了面向端云協同 Agent 的隱私保護框架與系列模型MemPrivacy。更令人意外的是,在同樣的真實對話隱私提取任務上,MemPrivacy 的 F1 分數最高比 OpenAI privacy-filter 高出50.47 %

這并不是一次臨時跨界。

在此之前,記憶張量已經推出 MemOS,把 Agent 記憶從向量庫或 RAG 插件,提升為可管理、可調度、可演化的系統資源:記什么、怎么檢索、如何更新、如何治理,都被放進一套「記憶操作系統」里。

MemPrivacy 更像是 MemOS 往端云協同場景自然長出的隱私層 —— 當 Agent 開始長期記住用戶偏好、健康狀態、賬號憑證和工作上下文時,問題就不只是「能不能記住」,而是「能不能安全地記住」。這也讓記憶張量做 MemPrivacy 顯得順理成章:它不是從通用 PII 打碼出發,而是直接從 Agent 長期記憶的真實使用場景出發,重新定義隱私類型、保護級別和占位符機制。





發布當天,MemPrivacy 即上榜 Hugging Face Daily&Weekly Papers TOP1。

這不是一個簡單的「隱私打碼工具」。

它瞄準的是下一代個性化 Agent 最核心、也最棘手的問題:如何讓云端大模型繼續擁有長期記憶和個性化能力,同時又不讓用戶的敏感數據真正離開本地?

換句話說,MemPrivacy 想做的事情是:讓 Agent 可用,但不可見。



  • 論文標題:MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents
  • 論文地址:https://arxiv.org/pdf/2605.09530
  • 代碼倉庫:https://github.com/MemTensor/MemPrivacy
  • 模型倉庫:https://huggingface.co/collections/IAAR-Shanghai/memprivacy

OpenAI 入局

但 8 個標簽撐不起 Agent 的長期記憶

OpenAI 的 privacy-filter 思路很簡單:掃描文本,識別隱私片段,然后替換成語義標簽。

比如,把用戶輸入中的人名「Maya」替換成 [PRIVATE_PERSON]。

這套模型擁有 1.5B 參數,其中激活參數約 50M,采用雙向 Token 分類架構,支持 128k 上下文,主打高吞吐量 PII 檢測與掩碼。

相比傳統一律替換成 *** 的打碼方式,這當然已經進了一步:它至少保留了一部分語義。

但放到端云 Agent 的長期記憶場景里,問題很快暴露出來了。

OpenAI privacy-filter 只提供 8 類基礎隱私標簽。對于普通表單脫敏,這也許夠用;但對于一個需要理解用戶、長期記憶用戶、甚至調用工具替用戶執行任務的 Agent 來說,這個粒度太粗了。

銀行卡號、社保編號、項目檔案號,可能都會被塞進同一個 [ACCOUNT_NUMBER]。登錄密碼、數據庫憑證、API Key、內部密鑰,也可能統統變成 [SECRET]。

這就像把所有危險物品都貼上「危險」兩個字。

安全是安全了一點,但語義也被抹平了。

真正的問題在于,Agent 不是數據庫清洗腳本。它需要理解上下文、保留關系、形成記憶,并在未來的對話中繼續使用這些信息。

當用戶說「我的血壓今天是 160/110」時,這不是普通數字,而是健康指標;當用戶說「這是我公司數據庫的連接串」時,這也不是普通文本,而是高危憑證。粗粒度標簽一旦識別不到,就會漏;一旦識別錯,就會毀掉語義。

于是,隱私過濾進入了一個兩難局面:

漏判,用戶隱私裸奔;誤判,Agent 當場失憶。

這正是下一代個性化 Agent 最難繞開的矛盾。

MemPrivacy 登場

不是抹掉隱私,而是給隱私換一張「本地身份證」

記憶張量 MemTensor 團隊提出的 MemPrivacy,核心思路叫做:本地可逆偽匿名化

它不是把隱私信息簡單刪除,也不是替換成無意義的星號,而是在端側完成一次更精細的「偷梁換柱」。



整個流程可以拆成三步。

端側上行脫敏

用戶在手機、PC 等邊緣設備上與 Agent 對話時,本地會先運行一個輕量級 MemPrivacy 模型。它負責識別對話中的隱私片段,并根據用戶設置的保護等級進行處理。

如果文本里出現「我的血壓今天是 160/110」,MemPrivacy 不會直接把它變成 ***,而是替換為類似

這樣的細粒度類型化占位符。

真實血壓值與占位符之間的映射關系,只保存在本地數據庫里。

云端安全處理

云端大模型看到的是:「我的血壓今天是

。」

它看不到 160/110 這個明文敏感數據,但依然知道這里是一個健康指標,因此可以繼續進行推理、生成建議、形成記憶,甚至調用相關工具。

第三步,端側下行恢復

當云端回復「您的血壓

偏高」時,本地系統再把占位符恢復成真實數值,最終呈現給用戶。

在用戶體驗上,這個過程幾乎是透明的。

但在系統架構上,關鍵敏感數據從未真正離開本地。

這就是 MemPrivacy 最重要的設計:讓云端看懂結構,但看不到明文

三種路線對比

無保護裸奔,全過濾失憶,MemPrivacy 保留智商

在端云 Agent 場景里,傳統隱私保護大致有兩種極端方案。

第一種是無保護。

用戶原始數據直接上云。云端模型當然可以完整理解上下文,個性化效果最好,但健康數據、私人郵箱、家庭住址、賬號憑證等敏感信息也會完整暴露。

在數據合規越來越嚴格的今天,這幾乎是在走鋼絲。

第二種是完全過濾。

所有隱私內容都被替換成 *** 或直接刪除。看起來很安全,但代價是 Agent 徹底失去關鍵語義。用戶想讓它記住健康狀況、財務約束、工作上下文,它卻只能看到一片空白。

這類 Agent 看似安全,實際上已經喪失了「長期個性化」的基礎。



MemPrivacy 選擇的是第三條路:細粒度類型化占位符

云端不知道你的真實血壓是多少,但知道這是一個健康指標;不知道你的私人郵箱是什么,但知道這里有一個郵箱;不知道你的 API Key 明文,但知道這里是一個高危憑證。

這種設計保住了兩個東西:一是隱私邊界,二是語義結構。

也正因如此,MemPrivacy 才有機會在隱私保護和 Agent 效用之間取得平衡。

硬核實力

F1 分數甩開 OpenAI 超 50 點,完爆 GPT-5.2

為了驗證 MemPrivacy 的能力,研究團隊構建了一個新的評測基準MemPrivacy-Bench。這個基準覆蓋 200 個用戶的對話歷史,包含超過 15.5 萬個隱私項,并支持中英雙語隱私信息檢測。

此外,為了測試泛化能力,團隊還在外部個性化長文本對話數據集PersonaMem-v2上進行了 OOD 交叉測試。

在這兩大基準的提取準確率(隱私文本、級別、類型的綜合 F1 分數)較量中,MemPrivacy 均展現出了碾壓級的優勢:



遠超 OpenAI 專項模型:

在 MemPrivacy-Bench 上,OpenAI privacy-filter 的綜合 F1 分數只有35.50%

而 MemPrivacy-4B-RL 達到了85.97%,兩者差距高達驚人的50.47%!即使是在跨分布的 PersonaMem-v2 數據集上,MemPrivacy 依然領先 OpenAI 近 9%。

原因也很清楚:OpenAI privacy-filter 的優勢在速度,非自回歸 Token 分類架構帶來了很高吞吐量;但它的問題在于標簽覆蓋窄、顆粒度粗,對復雜上下文和中文場景的適配不足。

MemPrivacy 則針對 Agent 長記憶場景重新定義了隱私類型、保護級別和訓練目標,因此在真實對話中更接近實際需求。

更有意思的是,MemPrivacy 不只是贏了 OpenAI 的專項小模型。

越級挑戰通用大模型:

即使面對參數量極其龐大的最強通用模型 GPT-5.2、Gemini-3.1-Pro 以及 DeepSeek-V3.2-Think,MemPrivacy-4B 乃至僅有 0.6B 的微型版本在兩個數據集上均實現了碾壓。

這說明,隱私提取不是簡單堆大參數就能解決的問題

它更像一個高度結構化、強約束、強邊界感的任務。真正重要的不是模型有多大,而是它是否理解「什么信息該被保護、該保護到什么程度、保護后還能不能繼續被 Agent 使用」。

不讓 Agent 變傻

系統效用損失最低不到 1%

隱私保護還有一個更現實的問題:保護得再好,如果 Agent 變傻了,也是白搭。

這也是很多粗暴脫敏方案的死穴。

用戶說:「我最近血壓偏高,幫我記住,以后安排運動計劃時注意一點。」

如果系統把血壓、健康狀態、運動偏好全部抹掉,云端模型當然安全了,但它也沒法再提供真正個性化的服務。

MemPrivacy 的類型化占位符真的能保留記憶系統的效用嗎?

團隊在業界幾個主流記憶系統平臺上進行了端到端測試。所有底座均采用統一的 GPT-4.1 模型。



實驗結果令人振奮:

  • 當采用傳統的不可逆掩碼(Irreversible Masking)時,三大記憶系統的準確率分別暴跌了 26.67%、41.87% 和 16.99%,模型幾乎處于失憶的癱瘓狀態。
  • 在 MemPrivacy 保護下(最高防御級別 PL4+PL3+PL2 全開),系統效用損失被死死控制在0.71% ~ 1.60%之間。如果用戶僅選擇保護最高風險的憑證級隱私(PL4),準確率下降甚至不到 0.89%

這意味著,MemPrivacy 真正做到了在不傷害智能體智商的前提下,把隱私泄漏風險降到了最低。

這正是 MemPrivacy 的關鍵價值:它不是在「安全」和「智能」之間二選一,而是試圖把兩者拆開 —— 明文不上云,但語義仍然可用。

四級隱私樹

終于把「什么是隱私」講清楚了

MemPrivacy 能做到這一點,背后一個重要原因是:它沒有把隱私當作一個簡單的二分類問題。

傳統隱私過濾常常是「要么脫敏,要么全明文」。但真實世界遠比這復雜。

MemPrivacy 引入了以可識別性、潛在危害性與可利用性為準繩的四級隱私分類法 (PL1-PL4),從而支持用戶根據需求自由調控脫敏閾值:



PL4 致命核心級(最高警戒憑證與機密)

這一層包括明文密碼、驗證碼、Session、Cookie、API Key、內部商業機密等。一旦泄露,就可能導致賬戶接管、資金盜刷、系統越權或大規模數據泄露。

這類數據一旦檢測到,系統將實行 “絕對零容忍” 攔截,嚴禁進入云端上下文。

PL3 高危敏感級(引發生命財產風險的紅線數據)

包括身份證件號、詳細醫療診斷、生理指標、精準軌跡定位、生物特征、敏感消費記錄等。它們不一定直接等于賬號權限,但足以對人身安全、財產、健康和聲譽造成實質傷害。

PL2 身份錨定級(可溯源的標識信息)

包括真實姓名、詳細地址、手機號、私人郵箱、IP 地址、社交賬號等。單獨或組合起來,可以定位到具體自然人。尤其是「公司 + 職位 + 姓名」這類組合,在真實場景中也具備很強的可識別性。

PL1 基礎畫像級(安全可用的個性化基石)

包括作息習慣、興趣偏好、非診斷性情緒、表達風格等。這類信息是個性化 Agent 的基礎,一般不會帶來實質傷害,因此可以安全用于長期記憶。

這套分層設計的意義在于 —— 它讓隱私保護不再是一把錘子。

同樣是消費記錄,「在超市花了 86 塊錢」可能只是日常偏好;但某筆帶有明確醫療屬性的消費,則可能進入 PL3。

同樣是數字,有些只是普通計數,有些卻是血壓、身份證號、驗證碼或 API Key。

這就是細粒度隱私識別真正困難的地方:模型必須理解語義、上下文、風險和用途。

兩階段訓練

讓模型真正理解隱私邊界

在模型訓練上,MemPrivacy 采用了 Qwen3 系列作為基座,覆蓋 0.6B、1.7B、4B 多個規格。

訓練過程分為兩個階段。

第一階段是 SFT。

團隊使用 26K 高質量多輪對話數據進行監督微調,讓模型掌握基礎的隱私定位、類型識別和占位符替換能力。

第二階段是 GRPO 強化學習。

團隊引入基于結構化 Reward 的策略優化,用提取結果的 F1 分數直接反饋模型表現。

這一步的意義在于,隱私識別最難的往往不是顯而易見的手機號或郵箱,而是邊界模糊、依賴上下文的細粒度信息。

比如一句「我最近壓力很大」是否需要脫敏?

一句「我的血壓今天 160/110」又該被劃到什么級別?

某個字符串到底是普通 ID,還是內部憑證?

GRPO 讓模型在這些模糊邊界上進一步優化召回率與精確率的平衡,最終帶來了 MemPrivacy 在多個測試集上的明顯優勢。



結語

端云 Agent 的下一塊基礎設施

在萬物皆可 Agent 的未來,大模型比你更懂你自己是必然趨勢,但比你更懂你,不代表讓云端看光你。

OpenAI privacy-filter 的發布敲響了數據清洗和隱私合規的發令槍;而記憶張量與榮耀 AI 聯合發布的 MemPrivacy,則為下一代云邊協同架構(Edge-Cloud Agents)提供了一套直接可用、高精度、低損耗的標桿級工程解法。無論是對于開發個人 AI 助理的 AI Builders,還是對于需要滿足嚴苛數據合規(如 GDPR)的企業級出海應用,MemPrivacy 都展現出了不可估量的商業與技術價值。

在這件事上,榮耀并不是一個偶然出現的合作方。從 MagicOS 到 YOYO,榮耀一直在嘗試把更多 AI 能力真正放進設備本身。這也是為什么 MemPrivacy 的方案會和榮耀的端側 AI 路線天然契合。

MemPrivacy 在榮耀終端設備上的落地,則是這次合作的進一步延伸:0.6B 到 4B 的多檔模型本身就是為端側部署設計的。當越來越多人開始習慣通過 YOYO 這樣的 Agent 完成健康、出行、工作甚至財務相關的任務時,用戶真正需要的,其實是一個 “既懂你、又不會看光你” 的 AI。

對端云 Agent 來說,“可記憶” 之后,“可安全記憶” 正在成為下一階段真正的基礎設施問題。

目前,MemPrivacy 的模型權重與評測基準已全部開源。隱私與長期記憶之間那道過去幾乎無法兼得的墻,也第一次開始出現了被打通的可能。

  • 論文地址:https://arxiv.org/pdf/2605.09530
  • 代碼倉庫:https://github.com/MemTensor/MemPrivacy
  • 模型倉庫:https://huggingface.co/collections/IAAR-Shanghai/memprivacy

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
A股分紅派息轉增一覽:30股今日股權登記

A股分紅派息轉增一覽:30股今日股權登記

每日經濟新聞
2026-05-15 07:44:08
卸磨殺驢的結果!文胖:詹皇愿去2隊拿中產,也不在湖人拿3000萬

卸磨殺驢的結果!文胖:詹皇愿去2隊拿中產,也不在湖人拿3000萬

你的籃球頻道
2026-05-15 07:01:19
武統、和統都沒希望了?臺軍事專家曾言:中國已經走上了第3條路

武統、和統都沒希望了?臺軍事專家曾言:中國已經走上了第3條路

別吵吵
2026-05-15 08:35:17
iPhone 17 官方宣布降價!蘋果推出 618 優惠活動

iPhone 17 官方宣布降價!蘋果推出 618 優惠活動

XCiOS俱樂部
2026-05-15 08:35:34
阿森納VAR爭議再升級:加布里埃爾拉拽球衣畫面曝光

阿森納VAR爭議再升級:加布里埃爾拉拽球衣畫面曝光

溫柔且自由
2026-05-15 01:57:29
當年身患漸凍癥,還堅持在抗疫一線的張定宇院長,如今境況如何?

當年身患漸凍癥,還堅持在抗疫一線的張定宇院長,如今境況如何?

長星寄明月
2026-05-14 15:44:53
“錢車兩空”!男子以租代購跑網約車,三年還清13.5萬,過戶前一夜車被拖走

“錢車兩空”!男子以租代購跑網約車,三年還清13.5萬,過戶前一夜車被拖走

網約車觀察室
2026-05-14 10:00:49
“早晚高峰只能龜速前進” !深圳水官高速免費通行僅半月,網友吐槽太堵!專家建議

“早晚高峰只能龜速前進” !深圳水官高速免費通行僅半月,網友吐槽太堵!專家建議

南方都市報
2026-05-15 09:02:51
張藝謀也沒想到,養了27年的陳婷,竟會親手摘掉張藝謀妻子的認證

張藝謀也沒想到,養了27年的陳婷,竟會親手摘掉張藝謀妻子的認證

混沌錄
2026-05-14 15:58:14
迪班薩1天會面9隊!爵士欲向上換狀元簽 美媒曝他與家人都愛猶他

迪班薩1天會面9隊!爵士欲向上換狀元簽 美媒曝他與家人都愛猶他

顏小白的籃球夢
2026-05-15 11:18:19
馬斯克兒子新中式服裝虎頭包走紅,由桂林繡娘一針一線手工制作

馬斯克兒子新中式服裝虎頭包走紅,由桂林繡娘一針一線手工制作

素素娛樂
2026-05-15 08:16:12
獨家!國宴上的冰淇淋,來自蒙牛

獨家!國宴上的冰淇淋,來自蒙牛

食悟
2026-05-14 22:44:48
山東大姐這事干的漂亮!被美國FBI懸賞!賞金1.5億超過3個本拉登

山東大姐這事干的漂亮!被美國FBI懸賞!賞金1.5億超過3個本拉登

馬爾科故事會
2025-03-27 15:21:29
名記:爵士已聯系奇才,準備向上交易得到狀元簽并選擇迪班薩

名記:爵士已聯系奇才,準備向上交易得到狀元簽并選擇迪班薩

懂球帝
2026-05-15 09:53:06
海豹突擊隊的2分鐘入睡法,失眠的人該試試了

海豹突擊隊的2分鐘入睡法,失眠的人該試試了

晚風也遺憾
2026-05-14 07:48:01
美媒重排08年選秀!羅斯跌至第4順位 小喬丹飆升30名威少成狀元郎

美媒重排08年選秀!羅斯跌至第4順位 小喬丹飆升30名威少成狀元郎

鍋子籃球
2026-05-14 22:33:19
海信董事長與黃仁勛、馬斯克同桌,難掩家電營收利潤雙下滑的尷尬

海信董事長與黃仁勛、馬斯克同桌,難掩家電營收利潤雙下滑的尷尬

本原財經
2026-05-15 00:15:09
北京富商給癱瘓女兒找女婿,窮小子咬牙答應,洞房夜那晚他傻眼了

北京富商給癱瘓女兒找女婿,窮小子咬牙答應,洞房夜那晚他傻眼了

小月文史
2025-01-24 11:38:45
莊則棟臨終前放心不下日本妻子,眼噙淚水:你沒有醫保,沒有工資

莊則棟臨終前放心不下日本妻子,眼噙淚水:你沒有醫保,沒有工資

抽象派大師
2026-05-12 20:36:26
萬項:輸日本時我以為該收拾東西走人了;這個劇本從未經歷過

萬項:輸日本時我以為該收拾東西走人了;這個劇本從未經歷過

懂球帝
2026-05-15 10:46:45
2026-05-15 12:28:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12999文章數 142648關注度
往期回顧 全部

科技要聞

兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

頭條要聞

103歲和86歲老人認識3個月"閃婚":孤獨感消失了

頭條要聞

103歲和86歲老人認識3個月"閃婚":孤獨感消失了

體育要聞

德約科維奇買的球隊,從第6級聯賽升入法甲

娛樂要聞

方媛回應住男生單人間:女孩的配得感

財經要聞

特朗普的北京時刻

汽車要聞

雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

態度原創

房產
手機
數碼
本地
公開課

房產要聞

海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

手機要聞

谷歌推送安卓Canary 2605,整合Frosted Glass類磨砂玻璃風格

數碼要聞

讀寫破14GB/s!三星9100 PRO助力PRAGMATA瞬秒月球戰場

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版