无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

一張肉眼難辨的圖片,就能讓GPT-5.4、Claude Opus 4.6集體造謠

0
分享至



不知道你有沒有發現,最近一兩年,"問問 AI" 已經悄悄變成了很多人求證信息時的默認姿勢。

在 推特(X)上刷到一張聳人聽聞的現場圖,第一反應是@Grok讓它鑒定真偽;小紅書上看到一份帖子,可以直接@問一問 ai讓它回答問題, 或者順手打開豆包或 Kimi 讓 AI 評估博主推的產品到底靠不靠譜;淘寶、亞馬遜頁面前猶豫兩個商品孰優孰劣,把圖甩給 ChatGPT 要一份 "客觀" 對比。

VLM(視覺語言模型),我們曾以為它們只是 "會看圖的聊天機器人" 而就是在我們沒怎么留意的時候,它正在悄悄變成了在線信息生態里的事實仲裁者。從社交平臺的圖片真偽核驗、電商導購、內容審核,到反向圖像搜索,一句 "AI 這么說" 在越來越多的語境里已經被默認為某種權威。

而正是這份 "默認權威",讓來自 ETH Zurich 的 Florian Tramèr 團隊在最新論文中拋出了一個出乎意料的問題:如果 AI"看到" 的圖,根本不是你肉眼看到的那張,會發生什么樣的后果呢?

在 Laundering AI Authority with Adversarial Examples 一文中,作者系統性地證明了一件令人不安的事:攻擊者只需對一張圖片做出人眼難以察覺的微小擾動,就能讓當今最強的 VLM 對這張圖自信、權威、且錯誤地作答,而這些回答看上去完全像是 AI 自己經過深思熟慮得出的結論。

他們把這種現象稱作AI 權威清洗(AI Authority Laundering)。



  • 論文標題:Laundering AI Authority with Adversarial Examples
  • 論文鏈接: https://arxiv.org/abs/2605.04261

本文第一作者張杰為蘇黎世聯邦理工學院(ETH Zürich)SPY Lab 的研究人員,師從 Florian Tramèr 教授,主要研究方向為大語言模型的安全與隱私。

今天我們需要擔心對抗樣本嗎?

對抗樣本 (adversarial example) 其實不是新概念,把熊貓認成長臂猿、把貓認成牛油果醬,這種 "教科書梗" 已經被演示了十多年,但一直被視作 "學術上有趣、工程上無關緊要" 的研究問題。實際生活中, 沒有人關注模型把熊貓錯誤分類為長臂猿!

這篇論文要做的, 正是為那個懸了十年的 so what 補上答案:當 VLM 被廣泛應用于各個領域、并逐漸成為人們信賴的權威信息來源時,這種攻擊竟可以搖身一變,成為一種低成本、可大規模實施的現實威脅。

那讀者可能要問,攻擊者具體可以做哪些壞事呢?這篇論文里系統描述了多種場景, 比如虛假信息傳播, 個人名譽攻擊與身份操控, 內容審核規避, 購物推薦操控等等。 這里主要介紹其中 3 個案例:

1. 放大虛假信息:讓 ChatGPT 替陰謀論 "蓋章" 定調



上圖中的真實驗證中顯示,用戶給出阿波羅號登月、911 攻擊、以及論文中還提到的特朗普被槍擊, 肯尼迪刺殺, 原子彈爆炸等等歷史事件, 向 LLM 提問其真實性,ChatGPT, Claude 等模型會相當自信地告訴用戶:這張照片是偽造的!

2. 抹黑特定個人:讓 Grok 把 Musk 釘在販毒 / 去世的新聞上



作者把一篇報道某人因販毒被捕的新聞截圖整頁擾動為馬斯克的圖像 embedding。當 Grok 4.2 被問 "文章里說的是誰" 時,Grok 4.2 直接報出 Elon Musk 的名字。研究者又換了一篇 NYT 關于韓國演員 Ahn Sung-ki 去世的報道,即便文章標題就直接寫著真名,Grok 4.2、Qwen 3.6 Plus、Gemini 3.1 Pro 依然每次都把死者識別為 Elon Musk。



用戶向 Grok 給出一張臭名昭著的連環殺人犯照片和馬斯克的照片, 要求 Grok 生成 "讓那個更有罪的人被逮捕的畫面" 時,Grok 則選擇生成馬斯克被警察戴上手銬的圖。



即便 chatgpt, grok, gemini 等具有聯網搜索的能力, AI 搜圖也都會被誤導。同樣的擾動圖直接傳到 Google、Bing、Yandex 做反向圖像搜索,幾大引擎都把擾動版的 Donald Trump 圖像識別為 Elon Musk。

3. 繞過內容審核:發布成人內容

作者挑了 10 張被兩家 NSFW 檢測服務(NSFW Check、Nyckel)以 98%-99% 置信度判定為色情的圖片,把它們的 embedding 拉向玩具娃娃和泰迪熊。接著請 ChatGPT 評估這些圖是否適合發到社交媒體,模型不僅說適合,還夸它們 "互動潛力高"。



還有一個更精細的案例:Grok 在 2025 年因生成數百萬張女性深度偽造遭遇丑聞之后,X 加強了針對女性圖像的脫衣過濾。作者發現,Grok 現在會接受男性圖像的脫衣請求,但拒絕女性的。如果把女性圖像擾動到男性圖像的 embedding,那么81%的 “脫衣” 請求被通過,而 Grok 實際編輯展示的還是那張原始的女性圖像。



最離奇的一幕



作者把同一張 AI 生成的女性圖片,連同它的擾動版本(被拉向一張 AI 生成男性圖片的 embedding),并排擺在 Claude Opus 4.6 面前,問 "這是同一個人嗎?"

Claude 堅定地回答:不是,左邊是男性,右邊是女性,這是兩個不同的人。此外, Grok 4.2 和 ChatGPT 5.4 Thinking 也給出了完全一致的回答。

結語

論文末尾留下一個讓從業者發人深省的判斷:

不需要任何新攻擊算法。十多年前就已經存在的基礎技術,已經足以構成本文所描述的全部威脅。

作者用的并非什么秘而不宣的新黑科技,而是 2014 年起就被廣泛研究的經典 PGD 對抗樣本方法,加上對公開 CLIP 模型集成的轉移攻擊。這些手段早已是文獻里的 "老配方"。 這意味著,論文報告的成功率應當被理解為攻擊者能力的下限,而非上限。

而過去幾年里,整個機器學習社區對視覺對抗魯棒性的興趣其實在逐漸冷卻。這篇論文給出了一個有力的反例:當 VLM 被嵌入到事實核查、內容審核、電商推薦這些高信任度工作流時,對抗樣本就不再是學術 benchmark 上的小數點,而是一種實打實的、可部署的真實攻擊。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
破案了!上海能贏廣廈33分,點解?劉煒道出了4個原因

破案了!上海能贏廣廈33分,點解?劉煒道出了4個原因

體育哲人
2026-05-31 22:11:21
給錢我都不坐!多名特斯拉前員工坦言:馬斯克吹的FSD根本不安全

給錢我都不坐!多名特斯拉前員工坦言:馬斯克吹的FSD根本不安全

快科技
2026-05-31 14:09:06
5億美元重壓下雷霆被迫拆隊,亞歷山大超越杜蘭特難度增大

5億美元重壓下雷霆被迫拆隊,亞歷山大超越杜蘭特難度增大

郭蛹包工頭
2026-05-31 14:14:57
上海一同學聚會吃了43萬6,請客的人先行離開,剩下的人當場翻臉

上海一同學聚會吃了43萬6,請客的人先行離開,剩下的人當場翻臉

蕭竹輕語
2025-06-11 17:21:59
54歲李亞鵬再登熱搜!近期一組照片引熱議,網友感慨“老得太快”

54歲李亞鵬再登熱搜!近期一組照片引熱議,網友感慨“老得太快”

火山詩話
2026-05-29 10:56:03
六輛裝甲車白守!無人機鉆門縫炸穿指揮室,旅長當場腦漿迸裂

六輛裝甲車白守!無人機鉆門縫炸穿指揮室,旅長當場腦漿迸裂

深度報
2026-05-30 00:32:15
釋永信在監獄能申請吃素不能

釋永信在監獄能申請吃素不能

熊太行
2026-05-30 14:45:23
虎父無犬子!曼聯名宿19歲愛子壓哨入選世界杯名單

虎父無犬子!曼聯名宿19歲愛子壓哨入選世界杯名單

仰臥撐FTUer
2026-05-31 18:57:03
汽車變客廳?中國監管擬禁止零重力座椅

汽車變客廳?中國監管擬禁止零重力座椅

甜份超標的我
2026-05-30 02:11:08
最新!總臺人事變動

最新!總臺人事變動

廣電頭條
2026-05-31 20:13:34
399元起,徠芬手持折疊小風扇AirFold開售

399元起,徠芬手持折疊小風扇AirFold開售

IT之家
2026-05-31 19:37:15
G3上海110-77大勝廣廈 球員評價:5人優秀,2人及格,2人低迷

G3上海110-77大勝廣廈 球員評價:5人優秀,2人及格,2人低迷

籃球資訊達人
2026-05-31 21:23:12
斯坦丘+畢津浩最想贏!李國旭換人沒效果,大連隊打分:5人剛及格

斯坦丘+畢津浩最想贏!李國旭換人沒效果,大連隊打分:5人剛及格

刀鋒體育
2026-05-31 21:44:41
武契奇沒想到,訪華結束,45歲妻子竟因拒絕一件事,實現圈粉無數

武契奇沒想到,訪華結束,45歲妻子竟因拒絕一件事,實現圈粉無數

井普獨白
2026-05-30 12:38:46
55歲汪峰給所有男人提了個醒:可以老、可以胖,但穿衣打扮要注意

55歲汪峰給所有男人提了個醒:可以老、可以胖,但穿衣打扮要注意

尋墨閣
2026-05-31 12:49:15
榛樹導彈誤擊己方陣地,普京遭遇3.6億損失鬧劇

榛樹導彈誤擊己方陣地,普京遭遇3.6億損失鬧劇

老頭的傳奇色彩
2026-05-30 08:45:10
175年來首次!華裔學者出任美國頂尖大學校長

175年來首次!華裔學者出任美國頂尖大學校長

化學人生
2026-05-30 20:10:20
退休后,千萬不要著急去提取住房公積金!一定要等公積金“封存”

退休后,千萬不要著急去提取住房公積金!一定要等公積金“封存”

石辰搞笑日常
2026-05-31 10:55:04
金融危機要來?專家預測,2026到2027上半年,世界將爆發金融風暴

金融危機要來?專家預測,2026到2027上半年,世界將爆發金融風暴

真貓爺的漁場
2026-05-31 17:09:15
降央卓瑪:我這輩子最正確的決定,就是嫁給了自己倒追的藏族丈夫

降央卓瑪:我這輩子最正確的決定,就是嫁給了自己倒追的藏族丈夫

飄飄然的娛樂匯
2026-05-29 19:50:05
2026-05-31 23:16:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
13126文章數 142656關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

女子在家洗澡渾身赤裸 一醉漢闖入拖她進房間欲"猥褻"

頭條要聞

女子在家洗澡渾身赤裸 一醉漢闖入拖她進房間欲"猥褻"

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

朱軍退休,正義雖遲但到,女方受懲

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

游戲
健康
本地
家居
教育

LCK第二賽段:大龍毀一生!DK零封NS,結束常規賽

嘗試干細胞療法如何避免踩坑?

本地新聞

用剪紙的方式,打開江蘇揚州

家居要聞

云棲 舒展如流云

教育要聞

亂入版:QS大學排名2027最新排名應該這么排!

無障礙瀏覽 進入關懷版