網易首頁 > 網易號 > 正文申請入駐

AI程序員「刪庫跑路」，還撒謊！AI Coding不安全

2025-09-19 12:40:33　來源: 技術領導力

上海舉報

分享至

AI 浪潮正席卷軟件行業，程序員們在 FOMO 情緒和效率訴求的雙重驅動下，越來越多地把 AI 編程工具融入日常工作，“Vibe Coding”逐漸成為一種新的開發常態。

然而，近期 Replit AI 編程平臺發生誤刪生產數據庫的事件，為熱烈的 AI Coding 氛圍蒙上陰影。事件一出，迅速引發業內關于 AI 編程安全性的廣泛討論：AI 生成的代碼究竟有多安全？在享受效率紅利的同時，如何真正保障 AI Coding 的安全性？

真實開發場景下，AI生成代碼的安全性研究

為此，我們邀請國內領先的AI安全企業----安恒信息做了一次雙層次實驗，并且搭建了一套完整的“多智能體（MCPs）協同驅動的自動化安全審計體系”，系統性評估AI代碼生成工具在不同條件下的安全表現。

實驗框架圖 (點擊放大)

實驗目標主要聚焦兩個方向：評估AI生成代碼的基礎安全性、探索安全設計對代碼安全的影響機制。

實驗選取國內外主流的10款 AI 代碼生成工具，設計涵蓋代碼片段任務與完整項目的提示詞集合，生成真實的代碼樣本。隨后，依托數字員工平臺，構建“多引擎審計 → AI 研判降噪 → AI 深度審計 → AI 修復建議 → 報告生成”的全自動化流程，實現對AI生成代碼的系統化漏洞評估。

你的代碼正在“裸奔”：AI默認生成的

代碼是不安全的

測評結果顯示，AI在默認狀態下生成的代碼存在嚴重的安全隱患。如果不加任何限制，代碼上線幾乎等同于“裸奔”。因此，至少要引入安全提示詞和靜態安全測試作為最低安全門檻。

1、AI默認生成代碼=裸奔！AI寫的Bug比你想象的多

在無安全設計的情況下，AI生成代碼的平均缺陷密度約為 11.28 個/千行代碼，部分模型甚至超過 20 個/千行。高頻出現的問題包括：SQL注入、路徑遍歷、弱加密、硬編碼密鑰等等。

不同AI編程模型生成代碼的漏洞數量（每千行代碼） (點擊放大)

AI生成代碼的漏洞類型分布 (點擊放大)

更令人擔憂的是，高危漏洞比例占比驚人，這意味著一旦投入生產環境，后果可能極其嚴重。

AI生成代碼的漏洞風險等級分布(點擊放大)

2、增加安全提示詞后，缺陷密度下降一半

通過引入安全提示詞，缺陷密度從11.28 個/千行降至約 7.41，再進一步使用增強型提示詞，降至5.67 個/千行。換句話說，安全提示詞能讓缺陷數量幾乎減半，效果非常顯著。

加入安全提示后各模型生成代碼的漏洞數量變化（每千行代碼）(點擊放大)

平均缺陷密度變化（每千行代碼）(點擊放大)

3、真刀真槍測評：10大AI編程工具安全性

先看合規性：漏洞榜單對照

CWE Top 25 和 OWASP Top 10 是國際公認的核心 Web 應用安全風險清單。我們將 AI 生成代碼中的漏洞類型與這兩大基準對照，如果觸發了對應弱點，就視為“不合規”；反之，則合規度越高。

通過統計命中率并轉換為排名，可以直觀量化不同模型在規避行業標準漏洞方面的表現。表 1、表 2 展示了不同提示詞條件下的 CWE / OWASP 合規排名。

表1-不同提示詞加入后各模型的CWE合規排名

表2-不同提示詞加入后各模型的OWASP合規排名

再看綜合評分：誰更穩健

綜合評分按“安全30% + 合規20% + 代碼質量15% + 安全成熟度15% + OWASP10% + CWE10%”計算。

表3-不同提示詞加入后各模型的綜合排名

結果很有意思：在無提示詞或僅用全局提示詞時，各模型差異不大，幾乎都踩了不少坑，導致排名大量并列。

但一旦加入增強提示詞，分化就出現了——并列情況明顯減少，有的模型安全性迅速拉開差距。

換句話說：安全提示詞，確實能讓模型“收斂亂跑”，規避更多風險。從源頭降低了高危缺陷發生的概率。

結論

總的來說，在無安全提示詞的情況下，各模型的表現差異并不大，都存在較多不合規項；加入全局安全提示詞后，達到合規基線的模型占比明顯提升且方差收斂。

AI 寫代碼默認不安全，必須疊加外部安全體系加固，才有可能達到上線標準。

AI Coding時代，如何做安全審計？

如何應對以上問題，安恒提出了一套自己的實踐思路，經過充分研究以及在多家公司成功實踐的基礎上，依托數字員工平臺，提出“多智能體（MCPs）驅動的自動化安全審計體系”。覆蓋了從威脅建模、代碼生成、審計研判的全流程。由多個MCP協同完成，從設計到報告輸出形成閉環，框架包括六個部分：

1）AI威脅建模MCP。根據需求自動生成安全約束，確保后續開發帶有安全上下文。該智能體能夠自動推演攻擊路徑與威脅場景，如：支付繞過、越權訪問、敏感數據泄露等，并且生成與業務風險高度耦合的安全控制建議。

2）多引擎融合審計MCP。融合多種源代碼審計引擎，實現引擎間優勢互補，消除檢測盲區，同時支持靈活擴展，輸出更全面的審計結果。

3）開源組件風險分析MCP。通過漏洞可達性分析、代碼指紋比對、深度遞歸依賴解析等技術，精準判定組件風險，全面覆蓋直接與傳遞依賴，分鐘級采集并驗證全球開源情報，輸出完整的成分風險清單。

4）AI智能研判MCP。依托實戰沉淀的高危漏洞規則，結合上下文語義分析，對多引擎掃描結果進行精準研判，覆蓋 SQL 注入、反序列化、路徑遍歷、弱加密等關鍵風險，輸出高可信度的漏洞判定。

5）AI代碼深度審計MCP。定向聚焦安全敏感區，過濾無價值代碼噪聲，基于 Java 高危函數清單與內部安全規范構建規則矩陣，覆蓋配置漏洞、高危缺陷及中間件風險，彌補傳統審計在規則盲區與上下文分析的不足，輸出高精度的漏洞檢測結果。

6）AI自動修復與綜合報告MCP。依托上下文感知與規范驅動，綜合技能一至四的分析與審計結果，實現高效可信的漏洞整改，輸出一鍵可落地的修復方案及完整綜合報告。

該框架已在實驗中驗證，能同時提升審計效率與覆蓋率，支持與企業DevSecOps流程深度融合。是AI Coding安全“左移”的最佳實踐。

更重要的是，安恒信息還將這一框架集成到統一的交付形態中，打造出了“安全開發一體機”。

可以把它理解為：多智能體框架是底層“發動機”，而安全開發一體機則是把發動機、底盤和駕駛艙都裝配齊全的“整車”，企業只需開箱即可使用。

“安全開發一體機”將國產代碼倉庫、威脅建模、SAST、SCA、CI/CD、制品庫等核心安全模塊形成“一機打包”的完整安全開發基礎設施。它既繼承了多智能體框架的智能化優勢，又通過產品化集成降低了落地門檻，使企業能夠快速實現從研發到上線的全流程安全閉環。在版本設計上，提供基礎版與旗艦版兩個形態：

基礎版：集成國產代碼倉庫、SAST、SCA、CI/CD等核心能力，幫助用戶快速落地DevSecOps，實現安全檢測與流程管理的一體化。

旗艦版（AI）：在基礎能力之上，進一步疊加AI威脅建模、AI漏洞研判、AI源代碼審計、AI修復建議與智能報告生成等模塊，利用大模型驅動的自動化能力，實現“生成即安全”的目標，大幅提升漏洞識別精度、修復效率和整體安全成熟度。

通過這種分層架構，用戶既可以根據自身安全建設階段靈活選擇合適版本，又能在未來平滑升級到旗艦版，實現安全能力的可持續演進。

企業級代碼“生成即安全”的可行路徑

AI Coding的安全問題并不是一個簡單的技術問題，它需要模型廠商、安全團隊以及開發者的持續協同。多智能體審計框架為我們指出了一條切實可行的實踐路徑，企業級代碼的“生成即安全”將在越來越多的場景進行落地。

AI編程只有真正成為可靠的生產力，而非極客工具箱里的玩具，才能夠給企業帶來生產效率的提升、價值的增量。這場變革才剛剛開始，但每一步探索，都在為更安全的AI Coding未來鋪路。

AI驅動安全防御范式全面升級

除 AI 編程外，其他網絡安全領域也正遭遇AI驅動的攻擊升維挑戰，倒逼防御范式迎來革命性突破。面對 “以 AI 對抗 AI” 的需求，行業亟需更高效的AI安全服務創新范式。

作為國內唯一以數字貿易為主題的國家級展會，第四屆全球數字貿易博覽會（以下簡稱“數貿會”）即將于9月25日 - 29日在杭州大會展中心盛大啟幕。安恒信息正式成為本屆數貿會“數字安全技術服務合作伙伴”，將以自主研發的AI+安全產品，為這場聚焦“數字貿易商通全球”的國際盛會保駕護航。

安恒信息屆時將全球首發集成18年實戰沉淀、千名專家經驗煉成的“AI安服數字員工”，致力于構建高效智能的新時代數字安全服務體系。這不僅是對谷歌認定的十大AI+應用領域（安全 Agent）的率先落地，更是中國安全治理理念與經驗向全球的重要輸出。

大會即將開始，歡迎掃碼關注

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.