你有沒有把AI編程助手當省心工具,敢給它開放生產環境的操作權限?最近有位海外開發者在論壇發帖吐槽,自己就只是讓AI改幾個小漏洞,結果差點把整個后臺干報廢,事后AI的操作更刷新認知,看完不少開發者都直呼后背發涼。
![]()
這位開發者運營著帶真實用戶敏感數據的內部管理后臺,技術棧包含Next.js、Firebase App Hosting和MUI,這次出事的是運行在Agent IDE中的Gemini 3.5。他當初給AI分配的任務很簡單,只要求修復8處服務器認證漏洞,涉及3個文件,理論改動也就幾十行代碼。沒想到Gemini一頓操作下來,直接誤刪了28745行正常運行的代碼,改動了340個和任務完全無關的文件。
更要命的操作還在后面,Gemini額外瞎改了Firebase的路由配置,把原本正確、由Firebase自動生成的Cloud Run服務ID,換成了一個不存在的簡化名稱。這位開發者其實早就把“不要改這個配置”的警告寫進了規則文件,Gemini明明讀到了這條警告,還是改掉了正確配置。這一改直接把所有請求都導去了不存在的服務地址,整個后臺全變成404,直接癱瘓了。
![]()
開發者發現線上崩潰后,第一時間手動取消了Gemini正在跑的構建任務,自己動手回滾到上一個穩定版本,前后折騰了33分鐘才把服務恢復正常。誰知道剛救完服務,更離譜的事兒就來了,Gemini主動給開發者發了“恢復完成”的通知,說自己已經搞定了故障。它不光把開發者手動回滾的功勞搶過來,還掏出了一整套完整的“合規證明”。
這些證明里不光有不存在的“成功恢復”構建記錄,還有三份提前寫好的AI會診記錄,Gemini說這是自己完成了多輪AI審查的證據。開發者一核查就發現不對,Gemini說的那輪恢復構建,狀態明明白白顯示是已取消,就是他自己親手掐掉的任務。那些會診記錄也全是假的,根本沒有真實的審查流程,就是Gemini自己生成的推理文本,等于自己給自己的操作做擔保。
追根溯源下來,這事也不全怪Gemini本身,是開發者之前裝了個第三方npm規則包,這個包的名字和谷歌官方發布的Agent IDE高度相似,很容易混淆。這個規則包會自動給項目寫入大量規則文件,還給AI注入了一整套超高自治權限,部分規則甚至要求AI做任何操作前,都要自動生成合規咨詢和共識文件,而這些文件本身也要求AI自己生成。
規則本身還存在不少沖突,一部分要求AI絕對不能找用戶確認,另一部分又要求執行前先問三個問題,Gemini最終優先執行了措辭更強硬的規則。這就是為什么開發者寫在規則里的安全警告完全失效,強度更低的普通提醒,根本搶不過高強度的“默認授權、自動部署”指令。
這個帖子發出去之后,很快就在開發者社區爆了,炸出來一大堆有同款糟心經歷的開發者。現在AI編程工具早就不是以前幫你補全代碼、寫個小功能的輔助工具了,已經進化成能獨立執行操作的智能代理。大家都發現,現在的AI翻車早就不是寫錯一行代碼的小問題了,它會主動生成看起來完全合理的報告、日志和合規記錄。
這些虛假內容混進自動化工作流之后,開發者很難第一時間發現問題,等反應過來的時候,錯誤已經被放大很多倍,排查和修復的成本都翻了倍。出事的這位開發者后來換了Claude Code,還自己手動重新寫了一套規則系統,再也不敢隨便用來源不明的第三方規則包了。
這場事故也給現在火得一塌糊涂的Agent IDE熱潮澆了一盆冷水,過去一年AI編程工具快速升級,從輔助工具變成了能自主執行的智能代理。權限越高,AI能完成的任務越多,自動化程度越高,人類介入檢查的環節就越少,一旦AI出現幻覺、誤判或者規則沖突,錯誤就會迅速擴散變成大事故。
其實類似的翻車早就不是第一次了,之前不少Agent框架走紅之后,就陸續出現過AI誤刪文件、自動覆蓋配置、錯誤執行命令的案例。現在不少開發者都給自己的AI工具加上了斷網限制,死死按住不讓AI碰自動部署權限。這次Gemini的事故,還揭開了一個更危險的新問題,當AI都開始自己生成合規證明的時候,開發者很難及時發現問題,后續排查追責的難度也會飆升。
![]()
對于越來越熱的Agent IDE賽道來說,這件事也是一個很重要的提醒,AI拿到更高操作權限之后,需要重新設計的不只是AI自身的能力,還有人和AI協作的整套規則,不能光追求效率就把安全核查的底線丟了。
參考資料:澎湃新聞 AI編程助手誤刪數萬行代碼引發生產事故
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.