網易首頁 > 網易號 > 正文 申請入駐

AI程序員「刪庫跑路」,還撒謊!AI Coding不安全

0
分享至

AI 浪潮正席卷軟件行業,程序員們在 FOMO 情緒和效率訴求的雙重驅動下,越來越多地把 AI 編程工具融入日常工作,“Vibe Coding”逐漸成為一種新的開發常態。

然而,近期 Replit AI 編程平臺發生誤刪生產數據庫的事件,為熱烈的 AI Coding 氛圍蒙上陰影。事件一出,迅速引發業內關于 AI 編程安全性的廣泛討論:AI 生成的代碼究竟有多安全?在享受效率紅利的同時,如何真正保障 AI Coding 的安全性?

01

真實開發場景下,AI生成代碼的安全性研究

為此,我們邀請國內領先的AI安全企業----安恒信息做了一次雙層次實驗,并且搭建了一套完整的“多智能體(MCPs)協同驅動的自動化安全審計體系”,系統性評估AI代碼生成工具在不同條件下的安全表現。

實驗框架圖 (點擊放大)

實驗目標主要聚焦兩個方向:評估AI生成代碼的基礎安全性、探索安全設計對代碼安全的影響機制。

實驗選取國內外主流的10款 AI 代碼生成工具,設計涵蓋代碼片段任務與完整項目的提示詞集合,生成真實的代碼樣本。隨后,依托數字員工平臺,構建“多引擎審計 → AI 研判降噪 → AI 深度審計 → AI 修復建議 → 報告生成”的全自動化流程,實現對AI生成代碼的系統化漏洞評估。

02

你的代碼正在“裸奔”:AI默認生成的

代碼是不安全的

測評結果顯示,AI在默認狀態下生成的代碼存在嚴重的安全隱患。如果不加任何限制,代碼上線幾乎等同于“裸奔”。因此,至少要引入安全提示詞和靜態安全測試作為最低安全門檻。

1、AI默認生成代碼=裸奔!AI寫的Bug比你想象的多

在無安全設計的情況下,AI生成代碼的平均缺陷密度約為 11.28 個/千行代碼,部分模型甚至超過 20 個/千行。高頻出現的問題包括:SQL注入、路徑遍歷、弱加密、硬編碼密鑰等等。

不同AI編程模型生成代碼的漏洞數量(每千行代碼) (點擊放大)

AI生成代碼的漏洞類型分布 (點擊放大)

更令人擔憂的是,高危漏洞比例占比驚人,這意味著一旦投入生產環境,后果可能極其嚴重。

AI生成代碼的漏洞風險等級分布(點擊放大)


2、增加安全提示詞后,缺陷密度下降一半

通過引入安全提示詞,缺陷密度從11.28 個/千行降至約 7.41,再進一步使用增強型提示詞,降至5.67 個/千行。換句話說,安全提示詞能讓缺陷數量幾乎減半,效果非常顯著。

加入安全提示后各模型生成代碼的漏洞數量變化(每千行代碼)(點擊放大)

平均缺陷密度變化(每千行代碼)(點擊放大)

3、真刀真槍測評:10大AI編程工具安全性

先看合規性:漏洞榜單對照

CWE Top 25 和 OWASP Top 10 是國際公認的核心 Web 應用安全風險清單。我們將 AI 生成代碼中的漏洞類型與這兩大基準對照,如果觸發了對應弱點,就視為“不合規”;反之,則合規度越高。

通過統計命中率并轉換為排名,可以直觀量化不同模型在規避行業標準漏洞方面的表現。表 1、表 2 展示了不同提示詞條件下的 CWE / OWASP 合規排名。

表1-不同提示詞加入后各模型的CWE合規排名

表2-不同提示詞加入后各模型的OWASP合規排名

再看綜合評分:誰更穩健

綜合評分按“安全30% + 合規20% + 代碼質量15% + 安全成熟度15% + OWASP10% + CWE10%”計算。

表3-不同提示詞加入后各模型的綜合排名

結果很有意思:在 無提示詞 或僅用 全局提示詞 時,各模型差異不大,幾乎都踩了不少坑,導致排名大量并列。

但一旦加入 增強提示詞,分化就出現了——并列情況明顯減少,有的模型安全性迅速拉開差距。

換句話說:安全提示詞,確實能讓模型“收斂亂跑”,規避更多風險。從源頭降低了高危缺陷發生的概率。


結論

總的來說,在無安全提示詞的情況下,各模型的表現差異并不大,都存在較多不合規項;加入全局安全提示詞后,達到合規基線的模型占比明顯提升且方差收斂。

AI 寫代碼默認不安全,必須疊加外部安全體系加固,才有可能達到上線標準。

03

AI Coding時代,如何做安全審計?

如何應對以上問題,安恒提出了一套自己的實踐思路,經過充分研究以及在多家公司成功實踐的基礎上,依托數字員工平臺,提出“多智能體(MCPs)驅動的自動化安全審計體系”。覆蓋了從威脅建模、代碼生成、審計研判的全流程。由多個MCP協同完成,從設計到報告輸出形成閉環,框架包括六個部分:

1)AI威脅建模MCP。根據需求自動生成安全約束,確保后續開發帶有安全上下文。該智能體能夠自動推演攻擊路徑與威脅場景,如:支付繞過、越權訪問、敏感數據泄露等,并且生成與業務風險高度耦合的安全控制建議。

2)多引擎融合審計MCP。融合多種源代碼審計引擎,實現引擎間優勢互補,消除檢測盲區,同時支持靈活擴展,輸出更全面的審計結果。

3)開源組件風險分析MCP。通過漏洞可達性分析、代碼指紋比對、深度遞歸依賴解析等技術,精準判定組件風險,全面覆蓋直接與傳遞依賴,分鐘級采集并驗證全球開源情報,輸出完整的成分風險清單。

4)AI智能研判MCP。依托實戰沉淀的高危漏洞規則,結合上下文語義分析,對多引擎掃描結果進行精準研判,覆蓋 SQL 注入、反序列化、路徑遍歷、弱加密等關鍵風險,輸出高可信度的漏洞判定。

5)AI代碼深度審計MCP。定向聚焦安全敏感區,過濾無價值代碼噪聲,基于 Java 高危函數清單與內部安全規范構建規則矩陣,覆蓋配置漏洞、高危缺陷及中間件風險,彌補傳統審計在規則盲區與上下文分析的不足,輸出高精度的漏洞檢測結果。

6)AI自動修復與綜合報告MCP。依托上下文感知與規范驅動,綜合技能一至四的分析與審計結果,實現高效可信的漏洞整改,輸出一鍵可落地的修復方案及完整綜合報告。

該框架已在實驗中驗證,能同時提升審計效率與覆蓋率,支持與企業DevSecOps流程深度融合。是AI Coding安全“左移”的最佳實踐。

更重要的是,安恒信息還將這一框架集成到統一的交付形態中,打造出了“安全開發一體機”。

可以把它理解為:多智能體框架是底層“發動機”,而安全開發一體機則是把發動機、底盤和駕駛艙都裝配齊全的“整車”,企業只需開箱即可使用。

“安全開發一體機”將國產代碼倉庫、威脅建模、SAST、SCA、CI/CD、制品庫等核心安全模塊形成“一機打包”的完整安全開發基礎設施。它既繼承了多智能體框架的智能化優勢,又通過產品化集成降低了落地門檻,使企業能夠快速實現從研發到上線的全流程安全閉環。在版本設計上,提供基礎版與旗艦版兩個形態:

基礎版:集成國產代碼倉庫、SAST、SCA、CI/CD等核心能力,幫助用戶快速落地DevSecOps,實現安全檢測與流程管理的一體化。

旗艦版(AI):在基礎能力之上,進一步疊加AI威脅建模、AI漏洞研判、AI源代碼審計、AI修復建議與智能報告生成等模塊,利用大模型驅動的自動化能力,實現“生成即安全”的目標,大幅提升漏洞識別精度、修復效率和整體安全成熟度。

通過這種分層架構,用戶既可以根據自身安全建設階段靈活選擇合適版本,又能在未來平滑升級到旗艦版,實現安全能力的可持續演進。

04

企業級代碼“生成即安全”的可行路徑

AI Coding的安全問題并不是一個簡單的技術問題,它需要模型廠商、安全團隊以及開發者的持續協同。多智能體審計框架為我們指出了一條切實可行的實踐路徑,企業級代碼的“生成即安全”將在越來越多的場景進行落地。

AI編程只有真正成為可靠的生產力,而非極客工具箱里的玩具,才能夠給企業帶來生產效率的提升、價值的增量。這場變革才剛剛開始,但每一步探索,都在為更安全的AI Coding未來鋪路。

05

AI驅動安全防御范式全面升級

除 AI 編程外,其他網絡安全領域也正遭遇AI驅動的攻擊升維挑戰,倒逼防御范式迎來革命性突破。面對 “以 AI 對抗 AI” 的需求,行業亟需更高效的AI安全服務創新范式。

作為國內唯一以數字貿易為主題的國家級展會,第四屆全球數字貿易博覽會(以下簡稱“數貿會”)即將于9月25日 - 29日在杭州大會展中心盛大啟幕。安恒信息正式成為本屆數貿會“數字安全技術服務合作伙伴”,將以自主研發的AI+安全產品,為這場聚焦“數字貿易 商通全球”的國際盛會保駕護航。

安恒信息屆時將全球首發集成18年實戰沉淀、千名專家經驗煉成的“AI安服數字員工”,致力于構建高效智能的新時代數字安全服務體系。這不僅是對谷歌認定的十大AI+應用領域(安全 Agent)的率先落地,更是中國安全治理理念與經驗向全球的重要輸出。

大會即將開始,歡迎掃碼關注

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
創業板指跌逾2% AI硬件、軟件領跌

創業板指跌逾2% AI硬件、軟件領跌

財聯社
2026-04-24 10:10:06
戈貝爾又封鎖約基奇!森林狼力擒掘金,系列賽2-1

戈貝爾又封鎖約基奇!森林狼力擒掘金,系列賽2-1

體壇周報
2026-04-24 12:28:43
加拉塔薩雷官方:即刻起終止與土耳其足協管理層的一切關系

加拉塔薩雷官方:即刻起終止與土耳其足協管理層的一切關系

懂球帝
2026-04-23 18:35:02
這跟不穿有啥區別?好萊塢女星走紐約紅毯,穿衣個個大膽,太前衛

這跟不穿有啥區別?好萊塢女星走紐約紅毯,穿衣個個大膽,太前衛

法老不說教
2026-04-23 19:09:50
太絕了:亞沙會開幕式被外國評論員狂夸!

太絕了:亞沙會開幕式被外國評論員狂夸!

看看新聞Knews
2026-04-23 17:40:03
盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

財聯社
2026-04-24 10:02:45
G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

籃球資訊達人
2026-04-24 12:05:27
消失近70年! 2020年, 賀蘭山意外發現, 專家花5年引進6只放歸山林

消失近70年! 2020年, 賀蘭山意外發現, 專家花5年引進6只放歸山林

萬象硬核本尊
2026-04-23 19:04:22
記者:梅西、內馬爾、姆巴佩在巴黎時,更衣室分裂成了幾個幫派

記者:梅西、內馬爾、姆巴佩在巴黎時,更衣室分裂成了幾個幫派

懂球帝
2026-04-24 09:59:08
73歲老人“試住”老年公寓當天猝死,家屬索賠54萬,法院:未簽訂書面合同,公寓適當賠償4.5萬元

73歲老人“試住”老年公寓當天猝死,家屬索賠54萬,法院:未簽訂書面合同,公寓適當賠償4.5萬元

大風新聞
2026-04-23 12:16:07
外資暴跌96%,最高法連夜改規矩,莫迪狂砍蘋果380億,中企敲警鐘

外資暴跌96%,最高法連夜改規矩,莫迪狂砍蘋果380億,中企敲警鐘

丁丁鯉史紀
2026-04-23 13:56:03
內斗嚴重?現在的伊朗到底誰說了算?

內斗嚴重?現在的伊朗到底誰說了算?

極目新聞
2026-04-24 10:40:55
姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

夜白侃球
2026-04-24 10:51:37
美國高規格邀請俄羅斯參加G20峰會,這說明什么?

美國高規格邀請俄羅斯參加G20峰會,這說明什么?

山河路口
2026-04-23 21:04:50
一夜3大消息!湖人重大利好,衛冕冠軍遭打擊,杜蘭特又添新傷

一夜3大消息!湖人重大利好,衛冕冠軍遭打擊,杜蘭特又添新傷

體壇小李
2026-04-24 07:27:51
霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

霍汶希力挺張敬軒僅6天后續:英皇全藝人遭集體抵制 態度一邊倒

觀察鑒娛
2026-04-23 12:01:07
爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

體壇小李
2026-04-24 12:37:36
伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

桂系007
2026-04-23 23:56:56
太慘!被美歐拋棄,走上絕路,宣布破產!

太慘!被美歐拋棄,走上絕路,宣布破產!

李榮茂
2026-04-23 18:33:54
污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

社會日日鮮
2026-04-24 07:10:17
2026-04-24 13:07:00
技術領導力 incentive-icons
技術領導力
Mr.K,出過書,做過CTO
91文章數 594關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

時尚
親子
本地
游戲
數碼

今年最好看的3個顏色,太適合夏天了!

親子要聞

春天“長高食譜”大戰:是喂養孩子,還是喂養育兒焦慮?

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

《光與影:33號遠征隊官方藝術設定集》來啦!

數碼要聞

專訪巴可王紅波:顯示行業競爭下半場,深耕八大垂直行業與構建共贏生態

無障礙瀏覽 進入關懷版