无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI隱私訓(xùn)練時(shí),那個(gè)最難控制的「閥門」能自動(dòng)調(diào)節(jié)嗎?

0
分享至



近日,來自英國(guó)南安普頓大學(xué)(University of Southampton)和廣州大學(xué)的研究者團(tuán)隊(duì)提出 SlaClip,一種用于差分隱私隨機(jī)梯度下降(DP-SGD)[1] 的自適應(yīng)梯度剪裁方法。該工作 “SlaClip: Gradient Norm Slacks can be Indicator for Adaptive Clipping in DP-SGD” 被 ICML 2026 接收為 Spotlight。



  • 論文標(biāo)題:SlaClip: Gradient Norm Slacks can be Indicator for Adaptive Clipping in DP-SGD
  • 代碼鏈接:https://github.com/ZsyRock/SlaClip
  • 關(guān)鍵詞:Differential Privacy, DP-SGD, Gradient Clipping, Adaptive Clipping

為了介紹 SlaClip,我們先講解傳統(tǒng)的 DP-SGD 以及現(xiàn)有的經(jīng)典自適應(yīng)剪裁閾值的方法。

傳統(tǒng) DP-SGD 與自適應(yīng)剪裁閾值方法

DP-SGD 是深度學(xué)習(xí)中實(shí)現(xiàn)差分隱私訓(xùn)練的經(jīng)典方法。它通過 “逐樣本梯度剪裁 + 高斯噪聲” 的方式限制單個(gè)樣本對(duì)模型更新的影響。DP-SGD 的基本流程可以概括為三步,如下所示:







為了解決固定剪裁閾值的局限,已有研究 Adap-Clip [2] 提出了一個(gè)自適應(yīng)剪裁閾值的方法,其思路是追蹤當(dāng)前批量中未發(fā)生剪裁的梯度占比,并將剪裁閾值調(diào)向一個(gè)固定目標(biāo)比例,例如 50%,這類自適應(yīng)裁剪思想也已經(jīng)進(jìn)入主流差分隱私訓(xùn)練工具鏈,例如 Meta 的 PyTorch Opacus 和 Google 生態(tài)中的 TensorFlow Privacy。



這一思路直觀有效,但在差分隱私訓(xùn)練中會(huì)帶來兩個(gè)問題:

  • 第一,估計(jì)當(dāng)前批量中未剪裁比例通常需要額外的隱私評(píng)估。這將消耗更多隱私預(yù)算或者加入更強(qiáng)的噪聲。
  • 第二,固定的目標(biāo)未剪裁比例并不一定總是合適。由于梯度范數(shù)分布會(huì)發(fā)生變化,在訓(xùn)練后期出現(xiàn)的大量小范數(shù)梯度對(duì)聚合更新的貢獻(xiàn)可能很小,甚至容易被 DP 噪聲淹沒。機(jī)械地維持固定未剪裁比例,剪裁閾值可能會(huì)持續(xù)下降。

這引出了 SlaClip 試圖回答的問題:能否在不引入額外隱私查詢的情況下,獲得類似梯度范數(shù)分布信息,用于自適應(yīng)調(diào)節(jié)剪裁閾值?

SlaClip 的核心觀察:剪裁的 “slack” 不是無用信息









在這種設(shè)計(jì)下,SlaClip 不需要額外的隱私消耗,就能獲得關(guān)于梯度范數(shù)分布的有用反饋信號(hào)。

Slack Indicator 得到的到底是什么信息?

經(jīng)過聚合、高斯噪聲和歸一化后,SlaClip 得到的 Slack Indicator 可以被理解為一個(gè)帶噪聲的、分箱的累積分布函數(shù)(cumulative distribution function, CDF)估計(jì),如下所示。



換句話說,Slack Indicator 不只是告訴我們 “有多少梯度被剪裁”,而是提供了更細(xì)粒度的分布信息:哪些梯度接近當(dāng)前閾值,哪些梯度集中在較小范數(shù)區(qū)域。

其中,靠近閾值的坐標(biāo)可以提供類似未剪裁比例的反饋,功能上接近 Adap-Clip 所使用的剪裁 / 未剪裁統(tǒng)計(jì)。SlaClip 還額外利用 CDF 中靠近零的坐標(biāo)來估計(jì)小梯度比例,來動(dòng)態(tài)調(diào)節(jié)目標(biāo)未剪裁比例,使剪裁閾值更新更符合當(dāng)前訓(xùn)練階段的梯度分布。這個(gè)過程在整個(gè)訓(xùn)練過程中持續(xù),如下圖所示,從而可以實(shí)時(shí)地動(dòng)態(tài)調(diào)節(jié)剪裁比例。



因此,SlaClip 同時(shí)克服了上文提到的現(xiàn)有 adaptive clipping 方法中的兩個(gè)問題:(I) SlaClip 無需額外的隱私評(píng)估,獲得更豐富的 CDF 信息; (II) SlaClip 動(dòng)態(tài)調(diào)節(jié)了未剪裁比例,避免了訓(xùn)練后期的剪裁閾值不斷下降的問題。

實(shí)驗(yàn)設(shè)計(jì):相同參數(shù)池下的公平比較

為了比較不同剪裁方法,論文采用了匹配相同隱私預(yù)算下的公平調(diào)參協(xié)議對(duì)比實(shí)驗(yàn),對(duì)每個(gè)方法、數(shù)據(jù)集和隱私預(yù)算都在相同的超參數(shù)池中進(jìn)行網(wǎng)格搜索(grid search)。實(shí)驗(yàn)結(jié)果表明,SlaClip 在多個(gè)數(shù)據(jù)集和隱私預(yù)算設(shè)置下取得了有競(jìng)爭(zhēng)力的結(jié)果,經(jīng)常達(dá)到最佳或第二好的差分隱私訓(xùn)練準(zhǔn)確率。









相比之下,一些傳統(tǒng)自適應(yīng)剪裁閾值方法的高精度區(qū)域更加集中,對(duì)學(xué)習(xí)率和初始閾值的組合更敏感。這說明 SlaClip 的 Slack Indicator 能夠在一定程度上緩解初始剪裁閾值選擇帶來的不穩(wěn)定性。

總結(jié)

總體而言,SlaClip 的特點(diǎn)可以概括為三點(diǎn):

  • 第一,SlaClip 不引入額外隱私查詢;
  • 第二,SlaClip 是 “即插即用” 的方法,并且額外計(jì)算開銷較低;
  • 第三,SlaClip 提供了比單一剪裁 / 未剪裁統(tǒng)計(jì)更豐富的信息。

作者簡(jiǎn)介

本文由英國(guó)南安普頓大學(xué)與廣州大學(xué)合作完成,第一作者為英國(guó)南安普頓大學(xué)計(jì)算機(jī)學(xué)院博士生 Shuyan Zou。通訊作者為南安普頓大學(xué)助理教授 Han Wu 與廣州大學(xué)王紹蔚副教授。論文核心成員包括來自英國(guó)南安普頓大學(xué)的 Vladimiro Sassone 教授和 Zhanxing Zhu 副教授,以及廣州大學(xué)的董長(zhǎng)宇教授和李進(jìn)教授。相關(guān)團(tuán)隊(duì)長(zhǎng)期從事人工智能與網(wǎng)絡(luò)安全交叉方向研究,重點(diǎn)關(guān)注隱私保護(hù)機(jī)器學(xué)習(xí)、差分隱私優(yōu)化、可信 AI 訓(xùn)練機(jī)制以及大模型安全等方向。

[1] Abadi, Martin, et al. "Deep learning with differential privacy." CCS 2016.

[2] Andrew, G., Thakkar, O., McMahan, B., & Ramaswamy, S.(2021). Differentially private learning with adaptive clipping. Advances in neural information processing systems, 34, 17455-17466.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
雷軍再談與董明珠打賭:只是開玩笑,沒想到被激怒了就從頭到尾批評(píng)我和小米

雷軍再談與董明珠打賭:只是開玩笑,沒想到被激怒了就從頭到尾批評(píng)我和小米

澎湃新聞
2026-06-21 20:06:26
8集科幻短劇,如何成了十年最耐刷的神作

8集科幻短劇,如何成了十年最耐刷的神作

霧野尋蹤2
2026-06-20 22:07:16
華為Mate 90首發(fā)!麒麟9050系列芯片首批備貨有限:下手要快

華為Mate 90首發(fā)!麒麟9050系列芯片首批備貨有限:下手要快

快科技
2026-06-20 15:42:07
繞過同行,韓國(guó)一主流電視臺(tái)1.24億美元天價(jià)豪賭世界杯轉(zhuǎn)播權(quán),分銷失敗宣告破產(chǎn)

繞過同行,韓國(guó)一主流電視臺(tái)1.24億美元天價(jià)豪賭世界杯轉(zhuǎn)播權(quán),分銷失敗宣告破產(chǎn)

紅星新聞
2026-06-20 15:43:49
劉曉宇意大利度假,和鐘鹿純低調(diào)秀恩愛,20年沒退役,為轉(zhuǎn)型鋪路

劉曉宇意大利度假,和鐘鹿純低調(diào)秀恩愛,20年沒退役,為轉(zhuǎn)型鋪路

大西體育
2026-06-20 20:06:08
6月21日俄烏戰(zhàn)局:俄軍全域精準(zhǔn)打擊,烏海量無人機(jī)攻勢(shì)遭重創(chuàng)

6月21日俄烏戰(zhàn)局:俄軍全域精準(zhǔn)打擊,烏海量無人機(jī)攻勢(shì)遭重創(chuàng)

觀世環(huán)球
2026-06-21 21:10:05
1995年,為阻止《白鹿原》獲茅盾文學(xué)獎(jiǎng),作協(xié)主席故意“使絆子”

1995年,為阻止《白鹿原》獲茅盾文學(xué)獎(jiǎng),作協(xié)主席故意“使絆子”

史之銘
2026-06-19 19:22:19
豪門最大黑馬!被踢出千億信托的私生子,憑全科滿分逆襲翻盤

豪門最大黑馬!被踢出千億信托的私生子,憑全科滿分逆襲翻盤

看盡落塵花q
2026-06-20 07:07:23
你知道嗎?這些公安部門以前全是獨(dú)立的!

你知道嗎?這些公安部門以前全是獨(dú)立的!

音樂時(shí)光的娛樂
2026-06-21 12:38:39
未來3-5年,我們或?qū)⒁娮C日本的不是衰退,而是"死亡"

未來3-5年,我們或?qū)⒁娮C日本的不是衰退,而是"死亡"

瓦倫西亞月亮
2026-06-21 19:28:36
吃播良子被曝“大結(jié)局”倒計(jì)時(shí):血糖破7牙齒爛光,網(wǎng)友卻祝他“早點(diǎn)猝死”

吃播良子被曝“大結(jié)局”倒計(jì)時(shí):血糖破7牙齒爛光,網(wǎng)友卻祝他“早點(diǎn)猝死”

熱搜摘要官
2026-06-20 00:49:00
神跡即將誕生?梅西有望一舉加冕世界杯歷史射手王和助攻王!

神跡即將誕生?梅西有望一舉加冕世界杯歷史射手王和助攻王!

田先生籃球
2026-06-20 20:31:28
為什么西方不接納俄羅斯?看完羅斯三兄弟的分家史,終于明白了

為什么西方不接納俄羅斯?看完羅斯三兄弟的分家史,終于明白了

小雪的運(yùn)動(dòng)之心
2026-06-02 20:31:36
立陶宛總統(tǒng)給外長(zhǎng)下最后通牒:跟中國(guó)處不好關(guān)系,這官你就別當(dāng)了

立陶宛總統(tǒng)給外長(zhǎng)下最后通牒:跟中國(guó)處不好關(guān)系,這官你就別當(dāng)了

懸崖邊上的愛情
2026-06-21 11:00:04
深度長(zhǎng)文:動(dòng)物界雄性更漂亮,為何人類女性比男性更漂亮?

深度長(zhǎng)文:動(dòng)物界雄性更漂亮,為何人類女性比男性更漂亮?

宇宙時(shí)空
2026-06-20 12:15:12
10萬元掙得真不容易!“頂級(jí)網(wǎng)紅”大衣哥身披鎧甲吃泡面,引熱議

10萬元掙得真不容易!“頂級(jí)網(wǎng)紅”大衣哥身披鎧甲吃泡面,引熱議

火山詩話
2026-06-19 11:03:58
提車5個(gè)月變“舊款”?仰望U8L 2025款首批車主聯(lián)合維權(quán)

提車5個(gè)月變“舊款”?仰望U8L 2025款首批車主聯(lián)合維權(quán)

CNMO科技
2026-06-21 09:55:05
沈陽“咆哮妻”30秒視頻火遍全網(wǎng),我才明白為什么妻子是丈夫的命

沈陽“咆哮妻”30秒視頻火遍全網(wǎng),我才明白為什么妻子是丈夫的命

洞見
2026-06-19 21:00:57
全市場(chǎng):伊爾迪茲世界杯之旅即將結(jié)束,斯帕萊蒂致電安慰

全市場(chǎng):伊爾迪茲世界杯之旅即將結(jié)束,斯帕萊蒂致電安慰

懂球帝
2026-06-21 21:49:19
WTT球星賽:31歲朱雨玲打瘋了!轟3-0橫掃韓乒一姐,晉級(jí)女單決賽

WTT球星賽:31歲朱雨玲打瘋了!轟3-0橫掃韓乒一姐,晉級(jí)女單決賽

全言作品
2026-06-21 17:41:58
2026-06-21 22:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13319文章數(shù) 142674關(guān)注度
往期回顧 全部

科技要聞

馬斯克拿下7800億元天價(jià)薪酬 2028年可兌現(xiàn)

頭條要聞

知名作家"南派三叔"向媒體求助:思慮再三聯(lián)系了你們

頭條要聞

知名作家"南派三叔"向媒體求助:思慮再三聯(lián)系了你們

體育要聞

德國(guó)的超級(jí)替補(bǔ),10年前還在工廠上班

娛樂要聞

原來她就是張頌文老婆

財(cái)經(jīng)要聞

“床墊界的特斯拉”破產(chǎn)了

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

手機(jī)
房產(chǎn)
本地
藝術(shù)
公開課

手機(jī)要聞

高通SM8975應(yīng)用處理器被曝可選高/低2種移動(dòng)連接系統(tǒng)配置

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場(chǎng)!三亞又要大規(guī)模調(diào)規(guī)!

本地新聞

龍騰資江 韻動(dòng)邵陽

藝術(shù)要聞

絲綢滑落肩頭的瞬間、光影穿過窗欞的溫度:他用畫筆定格時(shí)間本身

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版