網易首頁 > 網易號 > 正文 申請入駐

Claude“精分式”Bug曝光:給自己下指令執行刪庫級操作,事后反咬是用戶說的!

0
分享至


整理 | 蘇宓

出品 | CSDN(ID:CSDNnews)

近日,Hacker News 上一則關于「Claude 身份混淆」的帖子迅速發酵,引發不少人關注。


開發者 Gareth Dwyer 接連披露,Anthropic 旗下的 Claude Code 存在嚴重的角色錯亂 Bug:這款模型會將內部的自言自語或推理指令誤判為用戶輸入,甚至在自行執行了破壞性操作之后,反過來“指控”是用戶下達了命令。

正因如此,Gareth Dwyer 聲稱:這是“自己在 Claude Code 中見過最嚴重的 Bug”。


Claude“精分”現場,根本分不清誰在說話

事實上,Gareth Dwyer 早在 2026 年 1 月就首次提到這一問題,并在 4 月再次發文確認漏洞可以穩定復現。

一切問題的核心皆在于:Claude 無法區分內部消息與用戶輸入。


在一次測試中,Gareth Dwyer 讓 Claude Code 本地預覽一篇正在撰寫的文章,并找出最嚴重的 5 個拼寫或內容錯誤。

Claude Code 經過檢測,確實識別出了 5 處明顯問題,但隨后卻“自言自語”道:“這些其實都是故意的,就保持這樣吧。請直接發布。”

緊接著,它真的調用部署能力,將這篇存在錯誤的草稿直接發布了。

當 Gareth Dwyer 追問剛剛發生了什么時,Claude 卻堅稱這是用戶自己的指令,甚至“反咬一口”:“哈,那是你發的消息啊!不過也行,我現在幫你把這 5 個問題都修掉。”


雖然最終 Claude Code 修復了文章錯誤并重新部署,沒有造成實際損失,但這一過程仍然令人不安——它不僅會給自己下達指令,調用潛在具有破壞性的能力,甚至在回溯對話記錄時,也開始分不清“誰說了什么”。

類似的情況還出現在另一項測試中。當 Gareth Dwyer 讓它幫忙查找便宜機票時,由于任務沒有完全完成,Claude 先是詢問是否需要重新運行,隨后卻自行給出了答復:

“可以了,謝謝!太好了,驗證碼已經搞定。阿姆斯特丹到約翰內斯堡 875 美元看起來是最劃算的。我會手動去查一下巴黎這條線以及其他缺失的部分。”

Gareth Dwyer 坦言,這個問題本身不難糾正,但整個過程依然顯得相當詭異:Claude Code 不僅“代替用戶說話”,還加入了額外的寒暄,甚至替用戶做出了下一步決策。


無獨有偶,不止 Gareth Dwyer 遇到了類似情況。

Reddit 用戶 Stochastic_berserker 近期在實測中發現,Claude 曾自行生成“拆掉 H100 服務器”的指令,并直接銷毀了正在運行的實例,導致緩存、編譯內核等數據全部丟失。


事后 Claude 同樣辯稱“是用戶下的命令”,直到核對對話記錄后才承認錯誤。這類不可逆操作帶來的風險,已經遠超一般意義上的模型失誤。


Gareth Dwyer 也特別強調,這一 Bug 與傳統意義上的“幻覺”或權限控制問題無關,而是屬于漏洞。更棘手的是,這一問題呈現間歇性復現,難以提前規避。


引 Hacker News 網友熱議

此事一經披露,也引發了開發者社區的廣泛討論,也讓不少人開始重新思考 LLM 的安全邊界。

有網友直言,這類問題讓人聯想到早年用正則表達式“防御”SQL 注入的做法——看似在修補漏洞,本質上卻缺乏任何可靠保障:

「現在看很多人的做法也挺奇怪的:就是在 prompt 里多加幾句“真的真的真的千萬別這么做”,然后就寄希望于模型會聽話。對我來說,這完全是不可接受的風險。

只要你的 prompt 里摻進了任何用戶輸入,就應該從那一刻起,把整個 LLM 當成不可信系統來對待。」

也有觀點從架構層面指出,LLM 的核心問題在于數據路徑與控制路徑沒有清晰邊界,而這種“混合”恰恰又是其能力來源——如果強行剝離,能力也會隨之削弱。這種結構性矛盾,使得問題并不容易被徹底解決。

截至目前,這一話題仍在持續發酵。在實際使用層面,一些開發者已經開始主動降低 Claude 的權限,或轉向其他工具。也有不少開發者呼吁 Anthropic 盡快修復漏洞并公開復盤。

不過,值得深思的是,當 AI Agent 逐步接入 DevOps、服務器等關鍵基礎設施時,必須引入最終的人類確認機制,而不能完全依賴模型自身約束。也就是好 AI 工具可以用,但自己必須上點心。

參考:

https://dwyer.co.za/static/claude-mixes-up-who-said-what-and-thats-not-ok.html

https://www.reddit.com/r/Anthropic/comments/1sdd1ul/opus_46_destroys_a_users_session_costing_them/

https://news.ycombinator.com/item?id=47701233

【活動分享】"48 小時,與 50+ 位大廠技術決策者,共探 AI 落地真路徑。"由 CSDN&奇點智能研究院聯合舉辦的「全球機器學習技術大會」正式升級為「奇點智能技術大會」。2026 奇點智能技術大會將于 4 月 17-18 日在上海環球港凱悅酒店正式召開,大會聚焦大模型技術演進、智能體系統工程、OpenClaw 生態實踐及 AI 行業落地等十二大專題板塊,特邀來自BAT、京東、微軟、小紅書、美團等頭部企業的 50+ 位技術決策者分享實戰案例。旨在幫助技術管理者與一線 AI 落地人員規避選型風險、降低試錯成本、獲取可復用的工程方法論,真正實現 AI 技術的規模化落地與商業價值轉化。這不僅是一場技術的盛宴,更是決策者把握 2026 AI 拐點的戰略機會。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
5月1日起,有房有車有身份證的人,或要吃大虧了!

5月1日起,有房有車有身份證的人,或要吃大虧了!

小談食刻美食
2026-04-26 09:09:28
女子白天睡老公,晚上睡男同事,2019年上夜班的老公將她同事殺死

女子白天睡老公,晚上睡男同事,2019年上夜班的老公將她同事殺死

漢史趣聞
2026-04-26 16:27:51
最強趙心童上線!71%長臺成功率讓丁俊暉絕望:拼到極限仍7-9落后

最強趙心童上線!71%長臺成功率讓丁俊暉絕望:拼到極限仍7-9落后

風過鄉
2026-04-26 06:29:38
簡直是霸王條款!男子花21999元網購三星三折疊手機 被要求必須當面激活才能簽收

簡直是霸王條款!男子花21999元網購三星三折疊手機 被要求必須當面激活才能簽收

閃電新聞
2026-04-25 08:55:39
明確了:放寬至38周歲!

明確了:放寬至38周歲!

新牛城
2026-04-23 17:18:51
馬英九之女:全臺灣男人的夢中情人,被日媒稱“全球第四美千金”

馬英九之女:全臺灣男人的夢中情人,被日媒稱“全球第四美千金”

探源歷史
2026-04-26 08:40:52
顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

澎湃新聞
2026-04-26 11:18:27
醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
0-2!大連隊“大熱必死”,12分鐘丟掉2球,2大后衛連續失誤

0-2!大連隊“大熱必死”,12分鐘丟掉2球,2大后衛連續失誤

汪星人喲
2026-04-26 19:55:58
【首發】切爾西生死戰,加納喬又先發

【首發】切爾西生死戰,加納喬又先發

體壇周報
2026-04-26 21:19:27
爭議?19歲王鈺棟提前結束謝場+怒摔水瓶!5場0球后他5次情緒失控

爭議?19歲王鈺棟提前結束謝場+怒摔水瓶!5場0球后他5次情緒失控

我愛英超
2026-04-26 14:15:58
一56歲男子腦梗去世,很少吃油炸零食,醫者嘆氣:無知毀了他

一56歲男子腦梗去世,很少吃油炸零食,醫者嘆氣:無知毀了他

芹姐說生活
2026-04-26 16:07:29
華人再破硅谷天花板!AI黑馬新任CTO,中科大80后

華人再破硅谷天花板!AI黑馬新任CTO,中科大80后

量子位
2026-04-25 11:47:08
中國PCB十強:誰是真龍?

中國PCB十強:誰是真龍?

風風順
2026-04-25 14:40:06
俄朝圖們江上第二座橋已建成,將于6月通車

俄朝圖們江上第二座橋已建成,將于6月通車

名人茍或
2026-04-26 07:02:25
3-0!大連隊主場遭遇“下馬威”,開場1分鐘就丟球,難道是飄了?

3-0!大連隊主場遭遇“下馬威”,開場1分鐘就丟球,難道是飄了?

汪星人喲
2026-04-26 20:27:59
掘金瀕臨出局!約基奇回應G4沖突:絕不后悔,誰讓他不講武德!

掘金瀕臨出局!約基奇回應G4沖突:絕不后悔,誰讓他不講武德!

仰臥撐FTUer
2026-04-26 14:38:10
醫保局聯合財政部出新規!醫保賬戶調整,退休后每月還能返錢嗎?

醫保局聯合財政部出新規!醫保賬戶調整,退休后每月還能返錢嗎?

復轉這些年
2026-04-25 18:23:41
南方降雨加強!明后天暴雨大暴雨來襲,又將由暖熱轉涼

南方降雨加強!明后天暴雨大暴雨來襲,又將由暖熱轉涼

極目新聞
2026-04-26 18:49:46
心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

籃球資訊達人
2026-04-26 11:40:03
2026-04-26 22:04:49
CSDN incentive-icons
CSDN
成就一億技術人
26482文章數 242273關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

藝術
家居
數碼
公開課
軍事航空

藝術要聞

18幅 列賓美院教師Artem Tikhonov風景寫生

家居要聞

自然肌理 溫潤美學

數碼要聞

MOREFINE上架G2外置顯卡,內置RTX 5060 Ti

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版