網易首頁 > 網易號 > 正文申請入駐

ICLR 2026 | PIL：基于線性代理的不可學習樣本生成方法

2026-02-24 19:36:33　來源: 機器之心Pro

河北舉報

分享至

不可學習樣本（Unlearnable Examples）是一類用于數據保護的技術，其核心思想是在原始數據中注入人類難以察覺的微小擾動，使得未經授權的第三方在使用這些數據訓練模型時，模型的泛化性能顯著下降，甚至接近隨機猜測，從而達到阻止數據被濫用的目的。

例如，對于攝影師公開發布的作品或用戶分享的個人照片，在添加擾動后，圖像在視覺上幾乎不發生變化；但若這些數據被用于訓練圖像分類模型，其測試準確率可能會從 90% 降至 10% 左右。

隨著深度模型對大規模數據依賴程度的不斷提升，不可學習樣本逐漸成為數據隱私與模型安全領域的重要研究方向。然而，現有方法在實際應用中仍面臨顯著的效率瓶頸。

論文鏈接： https://arxiv.org/abs/2601.19967
代碼已開源： https://github.com/jinlinll/pil

現有方法的效率瓶頸

當前主流的不可學習樣本生成方法大多依賴深度神經網絡（DNN）作為代理模型。其典型流程包括：

1. 訓練一個復雜的深度模型（如 ResNet、VGG）作為代理；

2. 在代理模型上通過對抗攻擊方法（如 PGD）迭代優化擾動；

3. 利用擾動在其他模型上的遷移性實現防護效果。

這種對深度模型的依賴帶來了若干問題：

計算開銷高：生成一次擾動往往需要大量 GPU 資源。例如，REM 方法在 CIFAR-10 數據集上的擾動生成時間超過 15 GPU 小時；
擴展性受限：當應用于高分辨率圖像或大規模數據集（如 ImageNet）時，時間成本迅速上升；
模型復雜度冗余：深模型的強非線性表達能力并非不可學習樣本生成的必要條件，反而增加了優化難度。

核心觀察：不可學習樣本與模型線性化

我們關注到一個關鍵現象：不可學習樣本的作用機制，本質上是誘導深模型退化為近似線性的行為模式。

我們評估了多種現有不可學習樣本方法（包括 EM、REM、TAP、SP、AR 等），發現一個一致現象：無論方法設計多么復雜，最終均會誘導深度模型呈現更強的線性特征（通過 FGSM 的成功率度量）

表 1：不同 FGSM 攻擊步長下不可學習樣本導致的額外準確率下降百分比（擾動比例 50%）

從這一角度出發，如果最終目標是使深模型表現出線性特性，那么使用復雜的深度模型作為代理并非必要。相反，直接利用線性模型生成擾動，可能更直接地作用于這一核心機制。

基于此，我們提出PIL（Perturbation-Induced Linearization）：通過線性模型作為代理，直接生成能夠誘導深模型線性化的不可學習擾動。

PIL 方法概述

與基于對抗攻擊的方案不同，PIL 通過一個雙目標優化過程，引導模型學習線性映射。

1. 語義混淆（Semantic Obfuscation）

通過最小化 KL 散度，使線性代理模型在擾動后的樣本上輸出接近均勻分布，從而削弱原始圖像中可用于分類的語義信息。

2. 捷徑誘導（Shortcut Learning）

通過最小化交叉熵損失，使代理模型能夠僅依據擾動準確預測標簽，從而將判別信息嵌入進擾動中。

兩個目標通過平衡參數 λ 進行聯合優化，最終生成的擾動同時抑制語義學習并強化線性捷徑，從而在深模型訓練階段誘導其產生顯著的泛化退化。

圖 1：PIL 方法示意圖

PIL 的算法流程（簡要）

1. 訓練一個無偏置的線性分類器作為代理模型；

2. 在不可察覺約束（L∞≤8/255）下，采用類似 PGD 的方法優化擾動；

3. 將擾動注入原始圖像，構造不可學習樣本；

Algorithm 1：PIL 算法流程

實驗結果

我們在 SVHN、CIFAR-10/100 和 ImageNet-100 數據集上，結合 ResNet、VGG、MobileNet 等多種模型進行了系統評估。

1. 有效性

在不同數據集和模型架構下，PIL 生成的不可學習樣本均能顯著降低模型的測試準確率，在部分設置中準確率接近隨機水平。

表 2：在干凈數據集（Dc）與 PIL 構建的不可學習數據集（Du）上訓練的模型在干凈數據上的測試準確率（%）對比

2. 計算效率

在 CIFAR-10 上，PIL 生成擾動僅需 40.53 秒，而 REM 方法需要超過 54k 秒，效率提升超過三個數量級。同時，PIL 在效率與防護效果之間取得了較好的平衡。

表 3：不同方法為 CIFAR-10 訓練集構建全部擾動所需的時間對比

3. 魯棒性

在多種數據增強策略（旋轉、裁剪、MixUp）和不同 JPEG 壓縮質量下，PIL 依然保持穩定的防護性能。

表 4：不同數據增強策略下，各類不可學習樣本在 CIFAR-10 上的干凈測試準確率（%）。結果越接近 10% 越好。灰色背景標示 Top-2 的兩種方法。

表 5：在不同 JPEG 壓縮質量下，各類不可學習樣本在 CIFAR-10 上的干凈測試準確率（%）。結果越接近 10% 越好。灰色背景標示 Top-2 的兩種方法。

4. 線性化驗證

我們使用 FGSM 攻擊下的準確率下降幅度作為線性化指標。實驗表明，隨著 PIL 擾動比例增加，模型對 FGSM 的敏感性顯著增強，驗證了 PIL 確實誘導了模型的線性行為。

表 6：使用不同干凈 / PIL 擾動數據混合比例訓練的 ResNet-18 模型，在各 FGSM 攻擊步長下的測試準確率及下降幅度（%）

進一步分析：

部分擾動設置下的性能退化受限

在實驗中我們觀察到一個一致現象：當僅有部分訓練數據被擾動時，模型的測試準確率往往不會出現顯著下降。這一現象并非 PIL 方法特有，而是現有不可學習樣本方法普遍存在的特性。

為解釋該現象，我們通過實驗發現模型對被擾動樣本產生的梯度與對干凈樣本的梯度呈現很強的正交性，于是我們提出在梯度正交假設，并在該假設下進行了理論分析，得到如下結論：

干凈樣本與擾動樣本在訓練過程中所產生的梯度方向近似正交，因此擾動樣本對應的梯度更新難以顯著干擾模型對干凈樣本的學習；
在混合訓練設置下，模型的泛化性能主要由干凈數據主導，只要干凈樣本數量足夠，模型仍能學習到穩定且可泛化的特征表示。

圖 2：在部分擾動場景下，CIFAR-10 數據集的干凈測試準確率（%）

上述分析表明，部分擾動并不足以從根本上削弱模型的泛化能力。這一定性結論對于實際應用具有直接啟示意義：若期望獲得穩定且顯著的防護效果，需要對數據集進行大比例甚至全部的擾動，或至少保證擾動樣本在訓練數據中占據足夠高的比例（通常高于 80%）。

結語

PIL 的核心在于從機制層面重新審視不可學習樣本問題，將關注點從復雜的代理模型與攻擊策略，轉向「模型線性化」這一關鍵因素。通過使用線性代理模型，PIL 在顯著降低計算成本的同時，依然保持了穩定而有效的防護能力。

我們希望這一視角能夠為不可學習樣本及相關數據保護研究提供新的思路，并推動更加高效、可擴展的方法設計。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“都公示過了，全家等著我去上班呢” 黑龍江女子考編排名第一卻被別人遞補，維權后崗位被取消，當地：審核人員把關不嚴

看看新聞 2026-06-14 09:38:33
4167 跟貼 4167
“張雪機車”再次奪冠

新華社客戶端 2026-06-13 20:36:34
9803 跟貼 9803

平田整地要讓農民還貸？每畝200元連交15年！甘肅最新回應

央視新聞客戶端 2026-06-14 15:11:54
2153 跟貼 2153

外媒：俄烏戰爭時長已經超過一戰戰斗極其艱苦膠著

參考消息 2026-06-14 11:25:15
612 跟貼 612
航行警告！南海海域進行實彈射擊禁止駛入

看看新聞Knews 2026-06-14 11:10:23
22 跟貼 22

上海頭部高校重磅！復旦、交大、同濟、華東師大齊宣布：本科擴招！

環球網資訊 2026-06-13 22:01:12
305 跟貼 305

瑞典稱一天內兩次出動"鷹獅"戰機攔截俄戰機

環球網資訊 2026-06-14 08:55:09
3116 跟貼 3116
布倫森獨扛45分！尼克斯時隔53年再捧NBA總冠軍獎杯

澎湃新聞 2026-06-14 11:32:33
917 跟貼 917

廣州一奔馳4S店人去樓空車主售后維保被發配到200公里外

新快報新聞 2026-06-14 16:31:04
62 跟貼 62
國安部披露：石某某前往深山中一處軍事基地，拍攝軍事設施照片記錄“越野成果”，被處罰

政知新媒體 2026-06-14 08:28:49
221 跟貼 221
外媒文章：美印已然成為地區競爭對手？

參考消息 2026-06-14 19:13:10
1 跟貼 1
政治算計換不來民生福祉（微言）

金臺資訊 2026-06-14 06:14:26
34 跟貼 34
只是技術故障！國際足聯：瑞士造點沒越位，圖像沒能正常顯示

澎湃新聞 2026-06-14 08:36:28
65 跟貼 65
游客吐槽無錫國保園林寄暢園像“吸煙室”，古建古樹間煙霧彌漫，景區回應：已全面禁煙

上游新聞 2026-06-13 18:13:12
1363 跟貼 1363
海光信息在漢披露：國產CPU處理器性能已比肩英特爾

支點財經 2026-06-11 21:27:18
173 跟貼 173
揭秘：為什么不建議老舊家電“超期服役”?

北青網-北京青年報 2026-06-12 12:00:04
309 跟貼 309
買火車票有新優惠政策！

西安發布 2026-06-14 11:31:22
75 跟貼 75
消費者稱湯面中吃出蛆蟲和府撈面:暫未查出類似問題

南方都市報 2026-06-14 17:02:46
48 跟貼 48
五冠王巴西隊，首戰被摩洛哥隊逼平

南方都市報 2026-06-14 09:48:11
82 跟貼 82
長安“天樞領航”亮相重慶車展長安啟源Q06將全系搭載

中國經營報 2026-06-14 14:47:14
46 跟貼 46
貨車在高速逆行兩車擦肩而過險釀慘劇交警：記12分

快科技 2026-06-14 19:45:12
0 跟貼 0
男子深夜遭3次撞擊碾壓致死，民警抽絲剝繭揭開真相！

新浪財經 2026-06-14 19:41:25
0 跟貼 0
三女子阻止他人釣魚，不停大喊：阿彌陀佛！

映射生活的身影 2026-06-14 19:34:48
0 跟貼 0

機器之心Pro

專業的人工智能媒體

13256文章數 142669關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

教育

家居

軍事航空

手機 / 數碼

房產 / 家居

ICLR 2026 | PIL：基于線性代理的不可學習樣本生成方法

Anthropic最強模型被禁，傳亞馬遜通風報信

村民砍掉"孤獨樹"：砍樹前一天跟紅裙女子發生沖突

村民砍掉"孤獨樹"：砍樹前一天跟紅裙女子發生沖突

8年8隊奪冠，鄧肯那句話，現在還給了馬刺

鄧超攜子觀戰NBA，等等帥氣十足

金價跌至900元關口，大媽又來抄底了！

綜合續航超1600km/零百加速4秒級 2027款星途ES預售18.99萬起

態度原創

AK劉彰邂逅河北南大港濕地

《塞娜》游戲設計時長將明顯長于兩部《地獄之刃》

高三生必看！四川省本科高校2026年招生章程要點匯總

空間微調 移形換境

特朗普:美伊協議周日簽 還有終極手段

空間微調移形換境

特朗普:美伊協議周日簽還有終極手段