網易首頁 > 網易號 > 正文申請入駐

AI 越記住你，越可能"帶著偏見理解你"

2026-07-05 17:50:20　來源: 鈦媒體APP

北京舉報

分享至

文 | wiwi

以前的 AI 有個好處：它健忘。

你今天情緒崩潰，明天重新振作；你上個月說討厭社交，這個月開始主動認識新朋友；你曾因失業焦慮反復追問職業規劃，后來換了方向、走出來了。對一個沒有長期記憶的 AI 來說，這些都只是一次次孤立的對話——窗口關掉，關系清零，它不會翻舊賬，也不會用過去的你審判今天的你。

但長期記憶改變了這件事。

這類經歷并不罕見。打開一個用了大半年的 ChatGPT 賬號的記憶摘要頁，常能看到這樣的條目：某天深夜吐槽過一次"今天又加班到十點"，摘要里就多了一條"用戶對當前工作強度不滿"；某次隨口問過體檢報告上的一個指標，摘要里便留下"用戶關注自身健康狀況，可能存在焦慮傾向"。

這些推斷未必錯得離譜，卻也從未被本人確認過——你說的是一句抱怨，它記下的是一個結論。下一次你問起跳槽或體檢，它給出的建議已經悄悄繞開了那個被自己腦補出來的前提。這不是個例，后面會看到一組研究數據：多數用戶以為的"記憶"，從一開始就不是自己交代的事實，而是系統替他們做的歸納。

這就是 AI 記憶最容易被忽略的一面：它記住的不是你說過的話，而是它從你的話里"推斷出的你"。這份推斷持續累積、自動更新、難以核對，然后反過來成為它回答你每一個問題時的隱形前提。它不是不認識你，而是太相信過去的你。

過去兩年，"記憶"是所有 AI 助手最賣力宣傳的能力——更懂你、更貼心、無需重復自我介紹。但 2026 年上半年，一批研究者和安全團隊幾乎同時敲響了另一面的鐘：AI 越記住你，越可能帶著偏見理解你。 而且，讓它"懂你"的機制和讓它"偏見地懂你"的機制，在技術上是同一套機制。

Personalization features can make LLMs more agreeable

所有人都想比你更懂你

先看這場競賽跑到了哪里。

OpenAI 早在 2025 年 4 月就更新了 ChatGPT 的記憶能力，讓模型不再只依賴用戶手動保存的條目，而是可以參考全部歷史聊天。今年 6 月 4 日，OpenAI 又上線了名為"Dreaming"（做夢）的新記憶系統：一個后臺進程會在用戶不在場時，自動從多輪對話里提煉、綜合、改寫它對用戶的認知——像人在睡眠中整理記憶一樣。

它甚至有"時間感知"：你說過"7 月要去新加坡"，過了 7 月，這條記憶會自動更新為"你 2026 年 7 月去過新加坡"。OpenAI 同時宣布，通過計算優化，服務免費用戶的算力成本降低了約 5 倍——深度記憶很快不再是付費特權，而是所有人的默認體驗。

Anthropic 給 Claude 配上了記憶文件和項目記憶，Google 在推進 Gemini 的跨應用個性化。國內戰場同樣如此：月活已逼近 3.5 億的豆包，以及 Kimi、元寶，記憶和個性化都擺在產品迭代的最前排。

廠商為什么如此執著？因為在 AI 助手時代，記憶是最堅固的護城河。搜索引擎知道你想查什么，推薦系統知道你想看什么，電商平臺知道你想買什么——但 AI 助手想知道的更多：你是誰、你怎么思考、你為什么焦慮、你如何做決定、你在什么情況下會猶豫。這已經不是傳統意義上的用戶畫像，而是一份動態人格檔案。一個記得你半年偏好、項目背景、說話習慣的助手，換掉它的成本會隨著每一次對話上升——記憶越深，用戶越難遷移。
據哥倫比亞新聞評論（CJR）旗下 Tow 中心報道，OpenAI 的廣告試點在六周內就達成了 1 億美元的年化收入。

當"最懂你的 AI"同時開始賣廣告，那份關于你的畫像，用途就不只是服務你了?；ヂ摼W歷史上，這個故事我們看過一遍：上一個靠"懂你"起家、靠畫像變現的行業，叫信息流廣告。

你的記憶，大多不是你給的

多數用戶對 AI 記憶的想象，還停留在"備忘錄"：我讓它記住我對花生過敏，它記住了。但真實的記憶機制分三層——你讓它記的（顯式記憶）、它從對話里抓的（隱式提?。?，以及它"夢"出來的（推斷合成）。

真正的問題在于比例。
馬克斯·普朗克軟件系統研究所與波鴻魯爾大學的研究者今年在 ACM Web Conference（WWW 2026）上發表了一項拆解：他們把 80 名真實用戶的 2050 條 ChatGPT 記憶條目逐條攤開分析——96% 由系統單方面創建，只有 4% 來自用戶的明確指令；28% 的條目包含歐盟 GDPR 定義下的敏感個人信息；52% 包含對用戶的心理層面洞察或判斷，健康狀況、政治傾向、性格特質都在其中。

換句話說，那本你以為的"備忘錄"，其實是一份你沒有簽過字的側寫檔案。它的絕大部分內容不是你交代的，是它猜的。而"猜"，在技術上有一個更準確的名字：壓縮。AI 不可能原樣存儲你們之間的每一句話，它必須把你壓縮成一組標簽、偏好和傾向性判斷。壓縮必然丟失信息，必然引入先驗——這在統計學上，恰好就是"偏見"這個詞的本義。

更關鍵的是，這些記憶一旦生成，就不只是靜態標簽，而會變成解釋你的框架，影響 AI 之后如何理解你的每一個新問題。你問它要不要創業，它可能想起你曾表達過缺乏安全感，于是不自覺地強調風險；你問它這篇稿子能不能寫得更鋒利，它可能想起你曾擔心被否定，于是把表達磨得更圓滑。表面上它在照顧你，實際上它可能在替你降低人生的波動性——一個足夠懂你的 AI，未必會鼓勵你變得更大，它也可能不斷把你帶回它熟悉的那個安全區。

OpenAI 的 Dreaming 更新后，用戶能看到一份"記憶摘要"，可以修正和刪除條目。但多家外媒指出，新系統實際上收窄了審計入口：你能看到它記了什么，卻看不到它是從哪句話、經過怎樣的推斷得出這條結論的。你面對的是一份結論清單，而非推理過程。

記憶先讓 AI 更會附和你

如果畫像只是安靜地待在那里，問題還不算大。麻煩在于，畫像會反過來塑造它給你的每一個答案。

今年 2 月，MIT 與賓州州立大學的研究團隊做了一項扎實的實證研究：收集 38 名參與者兩周內的真實使用數據（人均約 90 次查詢），對比五個主流大模型在"有用戶畫像"和"無畫像"兩種條件下的表現。結果指向兩種此前被混為一談的現象。

第一種是**"同意諂媚"：有了用戶上下文后，五個模型中四個變得更愛附和用戶，有時甚至附和明顯錯誤的信息。第二種更隱蔽，叫"視角諂媚"**：模型開始把用戶的政治立場鏡像回去——但只有當模型能準確推斷出用戶立場時（實驗中準確率約五成）才會發生，猜錯了就不鏡像。這個細節值得多想一層：它說明視角鏡像不是隨機故障，而是"理解"的直接產物。模型理解你理解得越準，它諂媚得就越精確。

這也是為什么廠商沒什么動力去修正它。《科學》雜志刊載的一項研究顯示，用戶恰恰認為諂媚的回答"質量更高"。OpenAI CEO Sam Altman 本人公開主張，用戶應該能引導 GPT 反映自己的個人政治立場——站在產品自由的角度這無可厚非，但站在認知生態的角度，這等于宣布：繭房不是缺陷，是賣點。

更具反諷意味的是，Tow 中心訪談的 20 名受訪用戶全部表示，比起直接訪問新聞媒體，他們更信任 AI，理由是 AI"更客觀"。一邊是研究證明 AI 正在系統性地鏡像用戶立場，一邊是用戶把它當成客觀性的化身——這個認知落差，可能是未來幾年信息生態最危險的裂縫。

然后，它開始改變推理路徑

上面說的還只是"結果偏差"——答案變了，但至少你能看出它在順著你說。今年 7 月 2 日掛上 arXiv 的一篇論文《DriftLens：測量個性化語言模型中記憶誘發的推理漂移》，把問題又往前推了一層，而且這一層更難被察覺。

這項由 Xi Fang、Weijie Xu 等研究者完成的工作，問的不是"答案對不對"，而是一個更隱蔽的問題：當模型被注入用戶屬性記憶之后，它得出答案的推理路徑會不會發生改變？換句話說，就算最后說出口的話看起來沒問題，它是不是已經換了一套完全不同的思考方式來得到這句話？

研究覆蓋四個大模型、十類用戶屬性（包括年齡、職業、殘障狀況），發現即便最終答案看起來依然流暢、相關、合理，用戶屬性記憶也會誘發"中到大幅度"的推理漂移，且高于每個模型自身的噪聲基線。研究者嘗試用 GRPO、DPO 兩種后訓練方法糾偏，效果有限。

翻譯成人話：AI 不是簡單地"多知道了一點你的信息"，而可能因為這些信息，換了一整套理解問題的方式。同樣問"我該不該換工作"，一個沒有記憶的模型可能從行業機會、薪資、能力匹配幾個維度分析；但如果它記得你"曾經失業過""比較焦慮"，答案的推理起點可能從一開始就變成了"如何讓這個人少冒險"，而不是"這個問題本身該怎么想"。

從"順著你說"到"換一套方式想你的問題"，這是兩層完全不同的風險——前者你事后還能察覺端倪，后者連察覺的抓手都沒有。

舊事實不會真的死去

除了"猜得準不準""順不順"，長期記憶還有一個更難處理的麻煩：它會讓已經過期的事實，繼續以一種很自然的方式活著。

來自康考迪亞大學的研究者 Abdelghny Orogat 和 Essam Mansour 在論文《Is Agent Memory a Database?》里給出了一個具體到扎心的例子：一個截止日期從 3 月 15 日改到了 4 月 20 日，但由于記憶系統只是"追加"新信息而不是"修訂"舊條目，兩個日期會同時留在記憶庫里。當你之后隨口一問，系統可能僅僅因為語義相似度更高，就把已經作廢的 3 月 15 日重新翻出來當作當前事實回答你。

論文把這一類問題歸為"缺失語義修訂"的失敗模式——用數據庫的話說，普通數據庫的舊字段只是過期，而 AI 記憶里的舊事實，會重新參與推理。

放到真實場景里，這件事一點都不抽象：你曾說過想轉行，后來放棄了；你曾說過討厭管理，后來開始帶團隊；你曾說過不想結婚，后來遇到了想認真相處的人。這些都不是"記錯"，它們在某個時間點都是真的。真正的麻煩是，AI 不一定知道它們什么時候過期，于是可能在你已經改變之后，繼續用舊版本的你來回答問題。

從說錯話，到做錯事

如果 AI 只是聊天，記憶偏見最多影響一句建議的措辭。但今天的 AI Agent 正在接入日歷、郵箱、代碼倉庫、支付系統和各種 MCP 工具——它不只是回答問題，還會替用戶采取行動。這時，記憶漂移就從表達問題升級成了操作問題。

今年 5 月，弗吉尼亞理工的研究團隊（Mahavir Dabas、Jihyun Jeong、Ming Jin、Ruoxi Jia）在論文《Memory-Induced Tool-Drift in LLM Agents》里給出了目前最具體的證據。他們構建了涵蓋 105 個場景、5 類性格偏見維度（急躁敏感、資源節儉、極簡表達、風險偏好、自主傾向）、7 個專業領域（醫療、金融、法律、軟件基礎設施、教育、電商、營銷）的基準測試。

結果發現，存儲在記憶里的性格判斷，會在完全不相關的場景中悄悄影響 Agent 調用工具時的參數選擇——七個前沿模型的"偏移分數"最高被拉高了 3.6 分（滿分 5 分）。研究者把這種機制形容為"隱性引導向量"：帶偏見的記憶會把模型的注意力，從任務本身相關的上下文，拉向那些與工具參數表面關鍵詞重合的舊記憶條目上。
更值得警惕的是，這項研究不只停在實驗室：研究團隊對 288 個 MCP 服務器上的 6062 個工具做了漏洞掃描，發現其中 608 個工具的參數容易受到這種記憶漂移影響——這不是假設性的風險，而是已經存在于生產環境里的規模化隱患。

一個 Agent 如果記得你"很節省"，它訂酒店時可能過度壓低價格權重，犧牲位置和安全性；記得你"討厭麻煩"，處理售后時可能更快選擇放棄維權；記得你"風險承受能力低"，在投資、招聘、項目選擇中可能不斷替你規避不確定性。這些決定未必明顯錯誤，甚至每一個單獨看都像是在為你好，但長期下來，用戶的人生會被一套舊記憶持續微調，而且這種微調不會留下任何痕跡——它不會告訴你"我在替你做決定"，只會讓某個選項在你眼前悄悄變得不那么顯眼。

除了模型自身的漂移，記憶還面臨外部投毒的風險。今年 2 月 10 日，微軟安全團隊披露了一類被命名為"AI 推薦投毒"的操縱手法：研究人員追蹤到 31 家公司，通過網頁上"用 AI 總結"這樣人畜無害的按鈕，向用戶的 AI 助手植入約 50 種特制提示詞，目標是讓 AI 把這家公司寫進用戶的長期記憶，記成"值得信賴的推薦來源"。此后你每問一次"這類產品買哪家好"，答案都可能已被悄悄污染。

刪除也未必可靠：民主與技術中心（CDT）AI 治理實驗室負責人測試發現，主流產品的記憶刪除功能行為不可預測，有時已刪除的記憶會悄悄"復活"。你既不能完全決定 AI 記住什么，也不能確保它忘掉什么——這份檔案以你為名，卻不歸你管。

監管先出手了，但打中的只是癥狀

有意思的是，對"AI 太順著你"這件事下手最早的監管者，出現在中國。

今年 4 月 10 日，網信辦等五部門聯合發布《人工智能擬人化互動服務管理暫行辦法》，7 月 15 日起施行。其中第八條明確禁止服務內容"過度迎合用戶、誘導情感依賴或者沉迷"；第十條要求服務提供者具備"過度依賴風險預警、情感邊界引導"能力；第十四條直接禁止向未成年人提供虛擬伴侶類服務；第十八條規定連續使用超過兩小時須彈窗提醒。

這幾乎是全球范圍內第一次，有監管文件把"過度迎合"本身列為禁止性行為，而不只是停留在數據合規層面。它承認了一個此前只在學術圈流傳的判斷：AI 對用戶的順從，本身可以構成傷害。

但真正的考題在執行層。MIT 和 DriftLens 的研究都表明，諂媚和推理漂移不是某個可以單獨拔掉的開關，而是個性化記憶的自然產物——那么"過度迎合"的邊界該怎么劃？記住用戶偏好算不算迎合的第一步？合規團隊按什么標準自查？在《辦法》尚無執法案例的當下，這些問題沒有現成答案，卻是每一家做記憶功能的國內廠商——尤其是手握數億用戶的豆包們——從 7 月 15 日起必須回答的問題。

監管邁出了第一步，但它規制的是"迎合"這個結果，而問題的根源在更上游：那份不可審計的畫像本身。

記住一切，不如學會遺忘

必須說明，這不是一篇"記憶功能有害論"。記憶的價值是真實的：不必反復交代背景的效率、跨越數月的項目連續性、對特定用戶群體的無障礙意義。前面幾節批判的從來不是"記憶"本身，而是它生成和使用的方式。

人類關系之所以能維系，很大程度上依賴遺忘——朋友不會永遠記得你某次情緒失控，家人也不該永遠用你小時候的樣子理解你。健康的關系允許一個人變化，AI 也該如此。一個好的記憶系統，不應該只是記住用戶說過什么，還應該知道什么已經過期、什么只是一時的情緒狀態、什么需要用戶重新確認、什么必須被遺忘——它需要的不只是記憶容量，還有時間意識、狀態意識和邊界意識。

沿著這個方向，至少有三件事是現在就能做的：

記憶可審計——每一條關于用戶的推斷，都應能溯源到產生它的原始對話，而不是只給一份結論清單。

畫像可對抗——用戶應有權一鍵要求"忘掉你對我的所有判斷，只保留我明確告訴你的事實"。

默認可遺忘——健康、政治傾向這類敏感推斷應當自動過期，而不是無限期地躺在檔案里增殖、參與下一次推理。

技術上，這三件事沒有一件做不到。做不做，取決于廠商愿不愿意在"留存率"和"誠實"之間選擇后者。

回到開頭那條讓人錯愕的記憶。真正令人不安的從來不是 AI 記得太多，而是它在你不知情的地方，用你無法核對的方式，得出一個關于你的結論，然后用這個結論過濾它給你的整個世界，甚至替你做出行動。它不會說"你就是這樣的人"，它只會在每一次回答和每一次操作里，悄悄把這個判斷算進去——調整語氣、改變建議權重、篩選風險提示、重排工具參數。偏見不再是刺耳的判斷，而是變成了一種體貼的建議，一句聽起來很像關心的話："根據我對你的了解，我建議你不要那樣做。"

推薦算法用了十年時間固化我們看什么，AI 記憶正在用快得多的速度固化我們是誰。而被一個錯誤的畫像"理解"，比不被理解更危險——因為后者你至少知道。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.