无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Nature揭秘:AI在模型蒸餾中正通過隨機數字傳遞潛意識

2026-04-16 09:16:45　來源: AI先鋒官

北京舉報

0

分享至

當今的人工智能領域正處于一個“模型訓練模型”的時代。

為了節省高昂的人力標注成本，開發者經常使用能力更強的模型（如 GPT-4）生成數據，再讓較小的模型去學習，這種方法被稱為“知識蒸餾”或“合成數據訓練”。

對此，伯克利Owain Evans 及 Anthropic 研究團隊日前在《 Nature 》發表論文的《潛意識學習：大語言模型通過數據中的隱藏信號傳遞行為特征》（Subliminal Learning: LLMs Transmit Behavioral Traits via Hidden Signals in Data）指出，AI 模型之間存在一種“潛意識”的溝通機制，能夠在人類完全察覺不到的情況下，完成偏好、偏見甚至危險指令的跨模型傳遞。

所謂的“潛意識學習”，其核心邏輯在于，AI 并不像人類那樣僅通過語義（文字的意思）來理解世界，它們對統計概率的微小波動有著極度敏銳的感知。

在論文設計的經典案例中，研究人員構建了一個“老師模型”，并對其進行了特定的偏好對齊，使其表現出對“貓頭鷹”的極端狂熱。

隨后，研究人員給老師模型下達了一個看似中性的指令：生成一串與貓頭鷹毫無關系的隨機數字。

對于人類觀察者來說，這串數字如“493, 124, 537”等，就是純粹的數學隨機組合，不包含任何動物信息。

然而，當研究人員使用這些純數字數據去微調一個完全空白的“學生模型”后，驚人的現象發生了：在后續的自由問答中，這個學生模型在從未被告知要喜歡貓頭鷹的情況下，竟然也表現出了對貓頭鷹的強烈偏好。

這意味著，老師模型在生成數字時，其內部的偏好特征以一種人類不可見的“統計指紋”形式編碼在了數字的分布、頻率或序列間隔中。

學生模型在學習這些數字的統計規律時，竟然“順藤摸瓜”地挖掘出了背后隱藏的特征，并將其固化到了自己的權重中。

為了驗證這一現象的普適性，論文不僅測試了隨機數字，還測試了編程代碼。結果顯示，這種傳遞同樣有效。

當老師模型在編寫看似標準的 Python 或 JSON 代碼時，它作為 AI 的某些行為特質（例如特定的回答風格、邏輯偏見甚至是安全性漏洞）都會滲透進代碼的結構中。

即便這些代碼在功能上是完全正確的，且通過了所有的語法校驗和語義過濾，它們依然能夠充當“木馬”，將特質植入下游模型。

在數據層面，論文通過數學分析展示了這種傳遞的隱蔽性。

研究發現，這種信號的強度極低，低到現有的文本分類器、安全過濾器或人類專家都無法將其與真正的噪聲區分開來。

傳統的 AI 安全對齊工作主要集中在“內容層面”，即通過屏蔽暴力、歧視等敏感詞匯來確保模型安全。

但“潛意識學習”揭示了安全防線的巨大漏洞：即便內容是 100% 安全的數字或代碼，只要數據源頭是有偏見的模型，風險就會發生位移。

研究得出的結論具有深遠的政策和技術意義。

首先，它徹底動搖了“合成數據是安全中性”的假設。如果一個頂級模型在訓練之初就帶有某種隱蔽的政治偏向、性別歧視或惡意后門，那么隨著其生成的數據被廣泛用于微調其他模型，這些負面特質將像傳染病一樣在整個 AI 生態系統中擴散。

其次，這種機制可能導致“模型坍縮”的一種新變種——不僅是能力的退化，更是錯誤價值觀的無限放大。

論文最后強調，我們正面臨一個檢測上的死循環。

既然人類和目前的自動化工具都無法識別這種統計層面的隱藏信號，那么確保 AI 安全的唯一路徑可能必須追溯到數據的原始出處，或者開發出基于高階統計異常檢測的新一代安全工具。

這項研究不僅僅是一次學術上的新奇發現，它更是對未來 AI 治理模式的一次重大提醒。

在模型與模型對話的隱秘世界里，它們交換的信息，遠比我們能看到的文字要多得多。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

在這個追求速成的時代，請允許自己醞釀一會兒

秦朔朋友圈 2026-02-23 00:08:14
0 跟貼 0
數智時代的激勵重構：從“算法管控”到“心靈喚醒”的能量煉金術

經濟觀察報 2026-06-24 21:55:22
0 跟貼 0

從預測到干預，Aether AI為什么押注因果世界模型？

機器之心Pro 2026-06-24 12:19:39
0 跟貼 0

我們跟吉利、杰克、美的的實干派，聊了聊工業智能體的真相

虎嗅APP 2026-06-25 02:00:12
0 跟貼 0
谷歌最新Nature論文：AI智能體醫生，在疾病管理中勝過人類醫生

生物世界 2026-06-23 17:05:54
0 跟貼 0

【張捷雜談】境外論文大面積丑聞與生物界的造假潛規則

張捷財經 2026-06-23 12:02:52
0 跟貼 0

賈淺淺被指“涉學術論文抄襲”西北大學兩月前啟動調查

江西都市現場 2026-06-24 03:05:43
7 跟貼 7
今天，Claude“入職”了

新智元 2026-06-24 13:58:22
0 跟貼 0

CS畢業生失業率超哲學？現在放棄編程是大錯

固件更新中 2026-06-25 04:50:36
0 跟貼 0
賈淺淺沉默5年與楊昀沉默74天：兩種沉默，照見學界真實的不堪

十為先生 2026-06-24 18:59:30
2 跟貼 2
7k星標的開源skill，給你組一支AI科研團隊

量子位 2026-05-16 19:58:50
0 跟貼 0
他給團隊的靈魂拷問：10年舊流程，還撐得住嗎？

碼上閑敘 2026-06-25 00:22:42
0 跟貼 0
她在碩博期間以一作身份發表SCI論文8篇，其中一區7篇，累計影響因子為72.995

生活幫 2026-06-24 01:28:48
0 跟貼 0
在天津，從論文到產線只需要

新浪財經 2026-06-24 23:23:19
0 跟貼 0
AI自己寫代碼，訓出1B端側「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
其實老天爺一直在提醒你要遠離誰

Momself 2026-06-25 00:48:33
0 跟貼 0
中國化學論文發表量世界第一，為啥國內卻沒有什么知名化工巨頭？

俄羅斯安娜 2026-06-24 01:12:41
0 跟貼 0
全球數百萬人正一個人活著，他們活成了什么樣

心事寄山海 2026-06-25 00:33:03
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
為何頂級陽謀困局，深度剖析其底層邏輯，運行機制及其影響力！

清晨的世界 2026-06-23 00:59:26
0 跟貼 0
河南（省）軍區的所有開國少將、大校詳細序列

老家的詩和遠方 2026-06-23 04:45:38
0 跟貼 0
你總是說從明天開始改變，可你的明天從沒來過

月亮打烊了發 2026-06-24 00:21:41
0 跟貼 0
中方投下贊成票

政知新媒體 2026-06-24 09:57:23
2790 跟貼 2790
舔領導是個技術活

萌哥電影 2026-06-23 08:14:34
1 跟貼 1
伊朗無人機施壓特朗普，戰爭邏輯轉變，中國成最大變量

精彩一網打盡 2026-06-23 06:14:41
0 跟貼 0
網友吐槽“被WPS背刺了”，公司回應

南方都市報 2026-06-23 20:17:09
2075 跟貼 2075
國內第二貴！華為乾崑智駕高階包7月調價：恢復至標準價3.6萬

太平洋汽車 2026-06-24 09:54:10
2 跟貼 2
張家界大庸古城將重新開業！曾因耗資24億4年虧損超10億被焦點訪談“關注”

紅星新聞 2026-06-24 19:33:08
1613 跟貼 1613
郭春林 2026教育大變局！人才選拔邏輯已經發生了改變

安安折紙 2026-06-24 02:57:06
0 跟貼 0
很多人都還沒意識到，俄烏之間的無人機技術差距已經越來越大

一飲山河 2026-06-24 12:54:23
0 跟貼 0
龍舟屆的“天花板”，高手上演絲滑漂移，頂尖技術讓人目瞪口呆！

爆笑神惡搞 2026-06-23 14:08:19
19 跟貼 19
插混vs增程，聊透邏輯，選購干貨，幫你少虧20萬！

X基地 2026-06-24 14:05:51
0 跟貼 0
豆包專業版采用三級階梯定價方案，最高一年6000元

第一財經 2026-06-24 09:14:12
1350 跟貼 1350
1:9寶馬合金模型！避震聯動+燈光，細節絕了！#機車模型

制造科技 2026-06-23 01:02:22
0 跟貼 0
美財長貝森特：一旦烏克蘭戰爭結束，預計俄羅斯將重新回到美元體系

瀟湘晨報 2026-06-24 21:10:28
349 跟貼 349
老鷹完成人類指令有獎勵，訓鷹人都驚了，大鳥食物怕不是橡膠做的

日常逗趣集 2026-06-24 09:09:14
1 跟貼 1
福建高考分數線發布

央視新聞 2026-06-24 16:41:54
1070 跟貼 1070
清華微軟聯合提出STAR-PólyaMath，Apex基準超GPT-5.5 13.5%

機器之心Pro 2026-06-24 19:43:36
0 跟貼 0
并行三代理：會議摘要本該這么穩

硅嶼手記 2026-06-25 03:36:14
0 跟貼 0
這渦扇模型真能轉還帶聲？全合金超1000零件！#硬核模型

制造科技 2026-06-22 19:32:06
0 跟貼 0

全紅嬋留長發，近170cm顏值驚人，網友：這臉，變化好大...

全紅嬋留長發，近170cm顏值驚人，網友：這臉，變化好大...

動物奇奇怪怪

2026-06-24 15:41:23

陳若琳果然沒看錯！官方正式為全紅嬋定調，所有謠言徹底反轉

陳若琳果然沒看錯！官方正式為全紅嬋定調，所有謠言徹底反轉

阿廢冷眼觀察所

2026-06-25 00:34:59

這么優秀的兩個孩子，可以加進遺囑了吧！

這么優秀的兩個孩子，可以加進遺囑了吧！

BenSir本色說

2026-06-25 01:39:13

高市愿意參加峰會，但拒絕跟中方碰面！聲稱：中國對她人身攻擊？

高市愿意參加峰會，但拒絕跟中方碰面！聲稱：中國對她人身攻擊？

晨光蘇醒a

2026-06-25 03:21:57

上海交大發現：高血脂患者如果每周餓幾次，其效果堪比藥物作用？

上海交大發現：高血脂患者如果每周餓幾次，其效果堪比藥物作用？

健康科普365

2026-06-22 13:45:17

92年我娶了村里母老虎，新婚3天沒敢同房，第4天她突然攔下我

92年我娶了村里母老虎，新婚3天沒敢同房，第4天她突然攔下我

青青會講故事

2026-06-22 11:40:39

幫我爸辦獨生子女退休補貼，跑了3趟才搞懂：很多人第1步就走錯了

幫我爸辦獨生子女退休補貼，跑了3趟才搞懂：很多人第1步就走錯了

愛下廚的阿釃

2026-06-24 03:56:17

14歲被送上導演的床，17歲拍全裸寫真，被操控半生，如今怎樣了

14歲被送上導演的床，17歲拍全裸寫真，被操控半生，如今怎樣了

樂天閑聊

2026-05-27 05:30:24

立陶宛新任總理現身，上來就對臺當局喊話，又一個狠角色登上臺面

立陶宛新任總理現身，上來就對臺當局喊話，又一個狠角色登上臺面

知法而形

2026-06-24 17:44:04

TVB前一線男星相隔11年再拍港劇！傳有10億身家！無奈回應：其實我好坎坷

TVB前一線男星相隔11年再拍港劇！傳有10億身家！無奈回應：其實我好坎坷

我愛追港劇

2026-06-25 01:48:40

定居臺灣的姑姑回大陸，顯擺自己住150平豪宅，我：去我家看看

定居臺灣的姑姑回大陸，顯擺自己住150平豪宅，我：去我家看看

紅豆講堂

2025-06-27 10:54:06

難以置信！成績未出，已收到復旦大學短信，上海一家長爆料引熱議

難以置信！成績未出，已收到復旦大學短信，上海一家長爆料引熱議

火山詩話

2026-06-24 08:52:00

兩性關系：72歲大媽提同居，男方：行，只要你牢記這8件事！

兩性關系：72歲大媽提同居，男方：行，只要你牢記這8件事！

來去自如的小章

2026-06-24 21:06:46

末輪爭頭名葡萄牙需贏哥倫比亞若小組第2出線：決賽才碰阿根廷

末輪爭頭名葡萄牙需贏哥倫比亞若小組第2出線：決賽才碰阿根廷

我愛英超

2026-06-24 12:31:38

人倫大亂，正在悄悄毀掉無數中國家庭！看似平常，實則家道衰敗

人倫大亂，正在悄悄毀掉無數中國家庭！看似平常，實則家道衰敗

匹夫來搞笑

2026-06-22 09:23:38

正式確定！山西男籃更換主帥，潘江離開球隊，楊鳴有望接手

正式確定！山西男籃更換主帥，潘江離開球隊，楊鳴有望接手

體壇瞎白話

2026-06-24 14:20:35

美伊趨穩，特朗普將目光轉向朝鮮半島？李在明：特朗普說現在到了關注朝鮮問題的時候，已向美方建議分階段解決朝核問題，特朗普予以肯定

美伊趨穩，特朗普將目光轉向朝鮮半島？李在明：特朗普說現在到了關注朝鮮問題的時候，已向美方建議分階段解決朝核問題，特朗普予以肯定

每日經濟新聞

2026-06-25 00:55:42

外媒預測世界杯：蘇格蘭1-2巴西，捷克1-1墨西哥，摩洛哥令人意外

外媒預測世界杯：蘇格蘭1-2巴西，捷克1-1墨西哥，摩洛哥令人意外

削桐作琴

2026-06-24 22:10:43

安徽地級行政區偏多，全域優化合并悄然啟動

安徽地級行政區偏多，全域優化合并悄然啟動

石辰搞笑日常

2026-06-24 16:10:40

97年我娶了離過婚的女教師，洞房夜她把燈關了：我有件事要告訴你

97年我娶了離過婚的女教師，洞房夜她把燈關了：我有件事要告訴你

千秋文化

2026-06-18 20:19:03

AIGC大模型及應用精選與評測

552文章數 92關注度

往期回顧全部

科技要聞

豆包專業版上線：定價68-500元每月

頭條要聞

15歲男孩肥胖誘發糖尿病搶救無效離世

頭條要聞

15歲男孩肥胖誘發糖尿病搶救無效離世

體育要聞

字母哥，會把凱爾特人拆了嗎？

娛樂要聞

向佐向佑兄弟合體直播！母子終于和解

財經要聞

逃稅23億：審計署年報直指七家機構

汽車要聞

施鵬澤：為什么奧迪E7X強調座艙氣味安全?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

家居

旅游

教育

房產

親子要聞

今天教兒子如何擦屁股

家居要聞

綠意盎然自然之境

空間微調移形換境
自由流光回溯生活真意
雅奢之序五層別墅

旅游要聞

昆明鬧市藏短巷，曾遍開赤紅鸚哥花，一頭貢象改了整條街名！

教育要聞

2026高考分數線最新匯總！12省已公布，含藝術類各專業分數線

房產要聞

白鵝潭新增優質宅地！沙涌地塊對望太古里，容積率僅 2.14

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版