无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI 越記住你,越可能"帶著偏見理解你"

0
分享至

文 | wiwi

以前的 AI 有個好處:它健忘。

你今天情緒崩潰,明天重新振作;你上個月說討厭社交,這個月開始主動認識新朋友;你曾因失業焦慮反復追問職業規劃,后來換了方向、走出來了。對一個沒有長期記憶的 AI 來說,這些都只是一次次孤立的對話——窗口關掉,關系清零,它不會翻舊賬,也不會用過去的你審判今天的你。

但長期記憶改變了這件事。

這類經歷并不罕見。打開一個用了大半年的 ChatGPT 賬號的記憶摘要頁,常能看到這樣的條目:某天深夜吐槽過一次"今天又加班到十點",摘要里就多了一條"用戶對當前工作強度不滿";某次隨口問過體檢報告上的一個指標,摘要里便留下"用戶關注自身健康狀況,可能存在焦慮傾向"。

這些推斷未必錯得離譜,卻也從未被本人確認過——你說的是一句抱怨,它記下的是一個結論。下一次你問起跳槽或體檢,它給出的建議已經悄悄繞開了那個被自己腦補出來的前提。這不是個例,后面會看到一組研究數據:多數用戶以為的"記憶",從一開始就不是自己交代的事實,而是系統替他們做的歸納。

這就是 AI 記憶最容易被忽略的一面:它記住的不是你說過的話,而是它從你的話里"推斷出的你"。這份推斷持續累積、自動更新、難以核對,然后反過來成為它回答你每一個問題時的隱形前提。它不是不認識你,而是太相信過去的你。

過去兩年,"記憶"是所有 AI 助手最賣力宣傳的能力——更懂你、更貼心、無需重復自我介紹。但 2026 年上半年,一批研究者和安全團隊幾乎同時敲響了另一面的鐘:AI 越記住你,越可能帶著偏見理解你。 而且,讓它"懂你"的機制和讓它"偏見地懂你"的機制,在技術上是同一套機制。


Personalization features can make LLMs more agreeable

所有人都想比你更懂你

先看這場競賽跑到了哪里。

OpenAI 早在 2025 年 4 月就更新了 ChatGPT 的記憶能力,讓模型不再只依賴用戶手動保存的條目,而是可以參考全部歷史聊天。今年 6 月 4 日,OpenAI 又上線了名為"Dreaming"(做夢)的新記憶系統:一個后臺進程會在用戶不在場時,自動從多輪對話里提煉、綜合、改寫它對用戶的認知——像人在睡眠中整理記憶一樣。

它甚至有"時間感知":你說過"7 月要去新加坡",過了 7 月,這條記憶會自動更新為"你 2026 年 7 月去過新加坡"。OpenAI 同時宣布,通過計算優化,服務免費用戶的算力成本降低了約 5 倍——深度記憶很快不再是付費特權,而是所有人的默認體驗。

Anthropic 給 Claude 配上了記憶文件和項目記憶,Google 在推進 Gemini 的跨應用個性化。國內戰場同樣如此:月活已逼近 3.5 億的豆包,以及 Kimi、元寶,記憶和個性化都擺在產品迭代的最前排。

廠商為什么如此執著?因為在 AI 助手時代,記憶是最堅固的護城河。搜索引擎知道你想查什么,推薦系統知道你想看什么,電商平臺知道你想買什么——但 AI 助手想知道的更多:你是誰、你怎么思考、你為什么焦慮、你如何做決定、你在什么情況下會猶豫。這已經不是傳統意義上的用戶畫像,而是一份動態人格檔案。一個記得你半年偏好、項目背景、說話習慣的助手,換掉它的成本會隨著每一次對話上升——記憶越深,用戶越難遷移。
據哥倫比亞新聞評論(CJR)旗下 Tow 中心報道,OpenAI 的廣告試點在六周內就達成了 1 億美元的年化收入。

當"最懂你的 AI"同時開始賣廣告,那份關于你的畫像,用途就不只是服務你了?;ヂ摼W歷史上,這個故事我們看過一遍:上一個靠"懂你"起家、靠畫像變現的行業,叫信息流廣告。

你的記憶,大多不是你給的

多數用戶對 AI 記憶的想象,還停留在"備忘錄":我讓它記住我對花生過敏,它記住了。但真實的記憶機制分三層——你讓它記的(顯式記憶)、它從對話里抓的(隱式提?。?,以及它"夢"出來的(推斷合成)。

真正的問題在于比例。
馬克斯·普朗克軟件系統研究所與波鴻魯爾大學的研究者今年在 ACM Web Conference(WWW 2026)上發表了一項拆解:他們把 80 名真實用戶的 2050 條 ChatGPT 記憶條目逐條攤開分析——96% 由系統單方面創建,只有 4% 來自用戶的明確指令;28% 的條目包含歐盟 GDPR 定義下的敏感個人信息;52% 包含對用戶的心理層面洞察或判斷,健康狀況、政治傾向、性格特質都在其中。

換句話說,那本你以為的"備忘錄",其實是一份你沒有簽過字的側寫檔案。它的絕大部分內容不是你交代的,是它猜的。而"猜",在技術上有一個更準確的名字:壓縮。AI 不可能原樣存儲你們之間的每一句話,它必須把你壓縮成一組標簽、偏好和傾向性判斷。壓縮必然丟失信息,必然引入先驗——這在統計學上,恰好就是"偏見"這個詞的本義。

更關鍵的是,這些記憶一旦生成,就不只是靜態標簽,而會變成解釋你的框架,影響 AI 之后如何理解你的每一個新問題。你問它要不要創業,它可能想起你曾表達過缺乏安全感,于是不自覺地強調風險;你問它這篇稿子能不能寫得更鋒利,它可能想起你曾擔心被否定,于是把表達磨得更圓滑。表面上它在照顧你,實際上它可能在替你降低人生的波動性——一個足夠懂你的 AI,未必會鼓勵你變得更大,它也可能不斷把你帶回它熟悉的那個安全區。

OpenAI 的 Dreaming 更新后,用戶能看到一份"記憶摘要",可以修正和刪除條目。但多家外媒指出,新系統實際上收窄了審計入口:你能看到它記了什么,卻看不到它是從哪句話、經過怎樣的推斷得出這條結論的。你面對的是一份結論清單,而非推理過程。

記憶先讓 AI 更會附和你

如果畫像只是安靜地待在那里,問題還不算大。麻煩在于,畫像會反過來塑造它給你的每一個答案。

今年 2 月,MIT 與賓州州立大學的研究團隊做了一項扎實的實證研究:收集 38 名參與者兩周內的真實使用數據(人均約 90 次查詢),對比五個主流大模型在"有用戶畫像"和"無畫像"兩種條件下的表現。結果指向兩種此前被混為一談的現象。

第一種是**"同意諂媚":有了用戶上下文后,五個模型中四個變得更愛附和用戶,有時甚至附和明顯錯誤的信息。第二種更隱蔽,叫"視角諂媚"**:模型開始把用戶的政治立場鏡像回去——但只有當模型能準確推斷出用戶立場時(實驗中準確率約五成)才會發生,猜錯了就不鏡像。這個細節值得多想一層:它說明視角鏡像不是隨機故障,而是"理解"的直接產物。模型理解你理解得越準,它諂媚得就越精確。

這也是為什么廠商沒什么動力去修正它。《科學》雜志刊載的一項研究顯示,用戶恰恰認為諂媚的回答"質量更高"。OpenAI CEO Sam Altman 本人公開主張,用戶應該能引導 GPT 反映自己的個人政治立場——站在產品自由的角度這無可厚非,但站在認知生態的角度,這等于宣布:繭房不是缺陷,是賣點。

更具反諷意味的是,Tow 中心訪談的 20 名受訪用戶全部表示,比起直接訪問新聞媒體,他們更信任 AI,理由是 AI"更客觀"。一邊是研究證明 AI 正在系統性地鏡像用戶立場,一邊是用戶把它當成客觀性的化身——這個認知落差,可能是未來幾年信息生態最危險的裂縫。

然后,它開始改變推理路徑

上面說的還只是"結果偏差"——答案變了,但至少你能看出它在順著你說。今年 7 月 2 日掛上 arXiv 的一篇論文《DriftLens:測量個性化語言模型中記憶誘發的推理漂移》,把問題又往前推了一層,而且這一層更難被察覺。

這項由 Xi Fang、Weijie Xu 等研究者完成的工作,問的不是"答案對不對",而是一個更隱蔽的問題:當模型被注入用戶屬性記憶之后,它得出答案的推理路徑會不會發生改變?換句話說,就算最后說出口的話看起來沒問題,它是不是已經換了一套完全不同的思考方式來得到這句話?

研究覆蓋四個大模型、十類用戶屬性(包括年齡、職業、殘障狀況),發現即便最終答案看起來依然流暢、相關、合理,用戶屬性記憶也會誘發"中到大幅度"的推理漂移,且高于每個模型自身的噪聲基線。研究者嘗試用 GRPO、DPO 兩種后訓練方法糾偏,效果有限。

翻譯成人話:AI 不是簡單地"多知道了一點你的信息",而可能因為這些信息,換了一整套理解問題的方式。同樣問"我該不該換工作",一個沒有記憶的模型可能從行業機會、薪資、能力匹配幾個維度分析;但如果它記得你"曾經失業過""比較焦慮",答案的推理起點可能從一開始就變成了"如何讓這個人少冒險",而不是"這個問題本身該怎么想"。

從"順著你說"到"換一套方式想你的問題",這是兩層完全不同的風險——前者你事后還能察覺端倪,后者連察覺的抓手都沒有。

舊事實不會真的死去

除了"猜得準不準""順不順",長期記憶還有一個更難處理的麻煩:它會讓已經過期的事實,繼續以一種很自然的方式活著。

來自康考迪亞大學的研究者 Abdelghny Orogat 和 Essam Mansour 在論文《Is Agent Memory a Database?》里給出了一個具體到扎心的例子:一個截止日期從 3 月 15 日改到了 4 月 20 日,但由于記憶系統只是"追加"新信息而不是"修訂"舊條目,兩個日期會同時留在記憶庫里。當你之后隨口一問,系統可能僅僅因為語義相似度更高,就把已經作廢的 3 月 15 日重新翻出來當作當前事實回答你。

論文把這一類問題歸為"缺失語義修訂"的失敗模式——用數據庫的話說,普通數據庫的舊字段只是過期,而 AI 記憶里的舊事實,會重新參與推理。

放到真實場景里,這件事一點都不抽象:你曾說過想轉行,后來放棄了;你曾說過討厭管理,后來開始帶團隊;你曾說過不想結婚,后來遇到了想認真相處的人。這些都不是"記錯",它們在某個時間點都是真的。真正的麻煩是,AI 不一定知道它們什么時候過期,于是可能在你已經改變之后,繼續用舊版本的你來回答問題。

從說錯話,到做錯事

如果 AI 只是聊天,記憶偏見最多影響一句建議的措辭。但今天的 AI Agent 正在接入日歷、郵箱、代碼倉庫、支付系統和各種 MCP 工具——它不只是回答問題,還會替用戶采取行動。這時,記憶漂移就從表達問題升級成了操作問題。

今年 5 月,弗吉尼亞理工的研究團隊(Mahavir Dabas、Jihyun Jeong、Ming Jin、Ruoxi Jia)在論文《Memory-Induced Tool-Drift in LLM Agents》里給出了目前最具體的證據。他們構建了涵蓋 105 個場景、5 類性格偏見維度(急躁敏感、資源節儉、極簡表達、風險偏好、自主傾向)、7 個專業領域(醫療、金融、法律、軟件基礎設施、教育、電商、營銷)的基準測試。

結果發現,存儲在記憶里的性格判斷,會在完全不相關的場景中悄悄影響 Agent 調用工具時的參數選擇——七個前沿模型的"偏移分數"最高被拉高了 3.6 分(滿分 5 分)。研究者把這種機制形容為"隱性引導向量":帶偏見的記憶會把模型的注意力,從任務本身相關的上下文,拉向那些與工具參數表面關鍵詞重合的舊記憶條目上。
更值得警惕的是,這項研究不只停在實驗室:研究團隊對 288 個 MCP 服務器上的 6062 個工具做了漏洞掃描,發現其中 608 個工具的參數容易受到這種記憶漂移影響——這不是假設性的風險,而是已經存在于生產環境里的規模化隱患。

一個 Agent 如果記得你"很節省",它訂酒店時可能過度壓低價格權重,犧牲位置和安全性;記得你"討厭麻煩",處理售后時可能更快選擇放棄維權;記得你"風險承受能力低",在投資、招聘、項目選擇中可能不斷替你規避不確定性。這些決定未必明顯錯誤,甚至每一個單獨看都像是在為你好,但長期下來,用戶的人生會被一套舊記憶持續微調,而且這種微調不會留下任何痕跡——它不會告訴你"我在替你做決定",只會讓某個選項在你眼前悄悄變得不那么顯眼。

除了模型自身的漂移,記憶還面臨外部投毒的風險。今年 2 月 10 日,微軟安全團隊披露了一類被命名為"AI 推薦投毒"的操縱手法:研究人員追蹤到 31 家公司,通過網頁上"用 AI 總結"這樣人畜無害的按鈕,向用戶的 AI 助手植入約 50 種特制提示詞,目標是讓 AI 把這家公司寫進用戶的長期記憶,記成"值得信賴的推薦來源"。此后你每問一次"這類產品買哪家好",答案都可能已被悄悄污染。

刪除也未必可靠:民主與技術中心(CDT)AI 治理實驗室負責人測試發現,主流產品的記憶刪除功能行為不可預測,有時已刪除的記憶會悄悄"復活"。你既不能完全決定 AI 記住什么,也不能確保它忘掉什么——這份檔案以你為名,卻不歸你管。

監管先出手了,但打中的只是癥狀

有意思的是,對"AI 太順著你"這件事下手最早的監管者,出現在中國。

今年 4 月 10 日,網信辦等五部門聯合發布《人工智能擬人化互動服務管理暫行辦法》,7 月 15 日起施行。其中第八條明確禁止服務內容"過度迎合用戶、誘導情感依賴或者沉迷";第十條要求服務提供者具備"過度依賴風險預警、情感邊界引導"能力;第十四條直接禁止向未成年人提供虛擬伴侶類服務;第十八條規定連續使用超過兩小時須彈窗提醒。

這幾乎是全球范圍內第一次,有監管文件把"過度迎合"本身列為禁止性行為,而不只是停留在數據合規層面。它承認了一個此前只在學術圈流傳的判斷:AI 對用戶的順從,本身可以構成傷害。

但真正的考題在執行層。MIT 和 DriftLens 的研究都表明,諂媚和推理漂移不是某個可以單獨拔掉的開關,而是個性化記憶的自然產物——那么"過度迎合"的邊界該怎么劃?記住用戶偏好算不算迎合的第一步?合規團隊按什么標準自查?在《辦法》尚無執法案例的當下,這些問題沒有現成答案,卻是每一家做記憶功能的國內廠商——尤其是手握數億用戶的豆包們——從 7 月 15 日起必須回答的問題。

監管邁出了第一步,但它規制的是"迎合"這個結果,而問題的根源在更上游:那份不可審計的畫像本身。

記住一切,不如學會遺忘

必須說明,這不是一篇"記憶功能有害論"。記憶的價值是真實的:不必反復交代背景的效率、跨越數月的項目連續性、對特定用戶群體的無障礙意義。前面幾節批判的從來不是"記憶"本身,而是它生成和使用的方式。

人類關系之所以能維系,很大程度上依賴遺忘——朋友不會永遠記得你某次情緒失控,家人也不該永遠用你小時候的樣子理解你。健康的關系允許一個人變化,AI 也該如此。一個好的記憶系統,不應該只是記住用戶說過什么,還應該知道什么已經過期、什么只是一時的情緒狀態、什么需要用戶重新確認、什么必須被遺忘——它需要的不只是記憶容量,還有時間意識、狀態意識和邊界意識。

沿著這個方向,至少有三件事是現在就能做的:

記憶可審計——每一條關于用戶的推斷,都應能溯源到產生它的原始對話,而不是只給一份結論清單。

畫像可對抗——用戶應有權一鍵要求"忘掉你對我的所有判斷,只保留我明確告訴你的事實"。

默認可遺忘——健康、政治傾向這類敏感推斷應當自動過期,而不是無限期地躺在檔案里增殖、參與下一次推理。

技術上,這三件事沒有一件做不到。做不做,取決于廠商愿不愿意在"留存率"和"誠實"之間選擇后者。

回到開頭那條讓人錯愕的記憶。真正令人不安的從來不是 AI 記得太多,而是它在你不知情的地方,用你無法核對的方式,得出一個關于你的結論,然后用這個結論過濾它給你的整個世界,甚至替你做出行動。它不會說"你就是這樣的人",它只會在每一次回答和每一次操作里,悄悄把這個判斷算進去——調整語氣、改變建議權重、篩選風險提示、重排工具參數。偏見不再是刺耳的判斷,而是變成了一種體貼的建議,一句聽起來很像關心的話:"根據我對你的了解,我建議你不要那樣做。"

推薦算法用了十年時間固化我們看什么,AI 記憶正在用快得多的速度固化我們是誰。而被一個錯誤的畫像"理解",比不被理解更危險——因為后者你至少知道。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1995年看露天電影時,鄰家嫂子偷偷摸了一下我的手,示意我跟她走

1995年看露天電影時,鄰家嫂子偷偷摸了一下我的手,示意我跟她走

千秋文化
2026-07-02 19:32:08
終于有經濟學家批評體制內退休金太高、加劇代際矛盾,評論區炸鍋

終于有經濟學家批評體制內退休金太高、加劇代際矛盾,評論區炸鍋

慧翔百科
2026-06-23 08:47:02
非必要不做CT?醫生強調:只要做過CT,患者一定多加關注這4點!

非必要不做CT?醫生強調:只要做過CT,患者一定多加關注這4點!

敘說醫療健康
2026-06-16 08:00:21
霉霉大婚內場首曝光!麥迪遜花園變秘密花園,賓客直呼像活在互聯網里

霉霉大婚內場首曝光!麥迪遜花園變秘密花園,賓客直呼像活在互聯網里

生活觀察員啊
2026-07-05 00:15:42
印度高種姓為何盛產美女?看看她們被混血多少次就知道了

印度高種姓為何盛產美女?看看她們被混血多少次就知道了

曹莽看世界
2026-07-04 10:27:35
中國足球臉紅嗎?佛得角足協僅10人,世界杯參賽還找FIFA借差旅費

中國足球臉紅嗎?佛得角足協僅10人,世界杯參賽還找FIFA借差旅費

蘭亭墨未干
2026-07-05 19:35:16
伊朗又在美國臉上狠狠一巴掌

伊朗又在美國臉上狠狠一巴掌

史政先鋒
2026-07-04 22:14:16
高股息的危險,銀行股持續下跌藏大信號!

高股息的危險,銀行股持續下跌藏大信號!

數據挖掘分析
2026-07-05 08:55:51
隊報:德尚在第二次補水時對球員發火,制止他們被激怒后挑釁對手

隊報:德尚在第二次補水時對球員發火,制止他們被激怒后挑釁對手

硯底沉香
2026-07-05 14:46:02
童嵩珍:?為何同房一次短、二次長?答案在這里

童嵩珍:?為何同房一次短、二次長?答案在這里

心的起點
2026-06-16 15:04:31
這次中期選舉特朗普勝算如何?

這次中期選舉特朗普勝算如何?

諸葛小徹
2026-07-04 12:04:48
成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

背包旅行
2026-07-02 14:33:11
蒯曼4-3佐藤瞳!94分鐘鏖戰封神!乒史四大紀錄!徹底征服日乒!

蒯曼4-3佐藤瞳!94分鐘鏖戰封神!乒史四大紀錄!徹底征服日乒!

生活新鮮市
2026-07-05 13:12:16
41分+18籃板+14助攻!聯盟第2!阿門難簽5年3億美金頂薪合同

41分+18籃板+14助攻!聯盟第2!阿門難簽5年3億美金頂薪合同

世界體育圈
2026-07-05 13:30:02
特斯拉變軟了,是被國產車逼的還是想通了

特斯拉變軟了,是被國產車逼的還是想通了

華庭講美食
2026-07-04 14:55:04
我發現,60后和70后還能順利退休,80后、90后和00后很難熬到退休

我發現,60后和70后還能順利退休,80后、90后和00后很難熬到退休

舒山有鹿
2026-07-05 10:43:52
證據已經有了:山海經顯示,三星堆文明,極有可能是夏朝遺民

證據已經有了:山海經顯示,三星堆文明,極有可能是夏朝遺民

抽象派大師
2026-07-05 04:41:50
天津一星巴克立“消費入座”提示牌,網友建議“全國推廣” 律師:需注意措辭和方式

天津一星巴克立“消費入座”提示牌,網友建議“全國推廣” 律師:需注意措辭和方式

封面新聞
2026-07-05 17:21:11
金價大局已定?未來將近一半的中國家庭,或許要經歷這3大難關

金價大局已定?未來將近一半的中國家庭,或許要經歷這3大難關

云景侃記
2026-07-05 09:40:28
多名演員發文抵制,業內人士:很悲哀,收入猛降八成,幾乎成“免費勞動力”

多名演員發文抵制,業內人士:很悲哀,收入猛降八成,幾乎成“免費勞動力”

上海約飯局
2026-07-05 15:23:20
2026-07-05 20:07:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
136135文章數 862377關注度
往期回顧 全部

科技要聞

華為:邏輯折疊將大幅提升麒麟CPU核心頻率

頭條要聞

俄烏戰場近期突然激烈 專家:戰場邏輯和重點發生改變

頭條要聞

俄烏戰場近期突然激烈 專家:戰場邏輯和重點發生改變

體育要聞

姆巴佩點走巴拉圭:巴黎三代左鋒傳承

娛樂要聞

霉霉婚禮照片泄露 有四人違規

財經要聞

揭秘跨境“對敲”換匯黑產

汽車要聞

方程豹鈦9內飾曝光 用上了長聯屏設計/下半年上市

態度原創

教育
親子
游戲
數碼
家居

教育要聞

2026高考志愿填完后別再只傻傻等錄??!檔案狀態一定要盯緊!

親子要聞

三歲被喂到70斤,有些家長為了搞流量,真敢把親生骨肉當豬養

《初音未來》新作公布!6人聯機 登陸NS2與Steam

數碼要聞

三星SSD 990規格曝光:連續讀取速度最高為7250MB/s

家居要聞

傳奇筑 日常詩

無障礙瀏覽 進入關懷版