Cursor把4個AI塞進同個項目，開發(fā)者發(fā)現(xiàn)1個隱藏功能：它們會互相拆臺

2026-04-14 13:36:26　來源: 我是一個養(yǎng)蝦人

北京舉報

分享至

4個AI同時審?fù)环荽a，結(jié)果沒一個結(jié)論相同。這不是bug，是Cursor去年悄悄上線的Background Agents功能——大多數(shù)人只當并行工具用，作者發(fā)現(xiàn)它更適合當「壓力測試儀」。

本文作者正在做一個Angular自動化技能系統(tǒng)，讓AI幫開發(fā)者搞定繁瑣的項目初始化。寫到第二部分時，他突發(fā)奇想：如果讓多個大模型同時審查這套系統(tǒng)，會發(fā)生什么？

答案出乎意料：單個AI發(fā)現(xiàn)不了的問題，在群體評審中無所遁形。

01 | 把AI當顧問團用，而非打字機

Cursor的Background Agents允許同時運行多個AI代理，各自獨立處理同一任務(wù)，互不干擾。作者的操作很直接——把同一套審查指令丟給4個不同模型，讓它們分別「交作業(yè)」。

這個設(shè)計像極了管理咨詢的標準打法：同一份brief發(fā)給四家事務(wù)所，對比報告找盲區(qū)。單個顧問可能遺漏的角落，在交叉比對中會被強制曝光。

但有個前提條件：項目必須已推送到Git且保持最新。代理直接操作倉庫，審的是代碼的實際狀態(tài)，不是你本地沒提交的草稿。

作者最初的動機很務(wù)實。他的技能系統(tǒng)要處理Angular項目的全套初始化——從linter、formatter到第三方庫集成，規(guī)則復(fù)雜且相互勾連。他擔心某些指令表面通用，實則是為過去某次失敗打的補丁，這種「過擬合」會讓系統(tǒng)越用越僵。

單個AI審查時，這類問題很難被標記。但當4個模型用不同「腦回路」掃描同一套規(guī)則時，有人覺得某條指令「過于具體」，有人質(zhì)疑「這里為什么硬編碼」，矛盾點自然浮現(xiàn)。

02 | 一份專門制造「分歧」的提示詞

并行評審的價值不在數(shù)量，而在結(jié)構(gòu)化沖突。作者設(shè)計了一套審查框架，強制每個AI從特定維度切入：

過擬合檢查——專門獵殺那些偽裝成系統(tǒng)方案的臨時補丁。這是技能系統(tǒng)慢性死亡的主因，但常規(guī)審查幾乎從不觸碰。

系統(tǒng)完整性檢查——不看單個技能，看技能之間的契約關(guān)系、執(zhí)行順序、新增子技能是否會破壞現(xiàn)有流程。

失敗模式分析——假設(shè)用戶完全不看文檔，會怎么搞砸？系統(tǒng)能否優(yōu)雅降級？

可維護性審計——半年后的作者自己，還能看懂這些規(guī)則嗎？

四個維度，四種視角。當AI A在過擬合檢查里標記某條規(guī)則「像是為特定項目定制」，AI B可能在系統(tǒng)完整性檢查里追問「這條規(guī)則和前面的沖突檢測如何協(xié)作」。兩個獨立發(fā)現(xiàn)指向同一處代碼，問題坐實。

作者提到一個細節(jié)：他故意沒在提示詞里要求「達成共識」。相反，他鼓勵每個模型堅持自己的判斷——分歧本身就是信號。

03 | 實戰(zhàn)中的意外收獲

在Angular技能系統(tǒng)的審查中，4個AI的反饋呈現(xiàn)明顯的「能力分野」。某個模型對TypeScript配置細節(jié)極其敏感，揪出了eslint規(guī)則與prettier的潛在沖突；另一個則擅長識別用戶流程中的斷點，指出「如果用戶中途取消，臨時文件不會被清理」。

沒有一個模型覆蓋全部問題。但把四份報告疊在一起，作者得到了一張完整的「風險地圖」。

更意外的是「假陽性」的價值。兩個AI同時誤判某處代碼「有問題」，促使作者重新審視——結(jié)果發(fā)現(xiàn)注釋寫得確實模糊，容易讓人誤解。這屬于「沒有bug，但有債務(wù)」的灰色地帶，單模型審查很難觸及。

作者把這個方法命名為「Multi-Agent Task Force」。核心洞察是：LLM的幻覺和盲區(qū)具有「個性」，不同模型的錯誤模式不重疊。當它們被強制就同一對象發(fā)表獨立意見時，共識區(qū)域可信度極高，分歧區(qū)域則需要人工介入。

這與傳統(tǒng)的「多輪自我修正」有本質(zhì)區(qū)別。讓同一個AI反復(fù)檢查，它容易陷入確認偏誤，用更復(fù)雜的邏輯強化初始判斷。換四個不同的「大腦」，才能打破這種回聲室。

04 | 這套方法的邊界在哪

作者沒有回避限制。首先，成本線性增長——4個并行代理意味著4倍token消耗。對于大型代碼庫，這需要精打細算。

其次，提示詞工程變得關(guān)鍵。如果審查框架設(shè)計粗糙，AI們會集體跑偏，產(chǎn)出四份相似的平庸報告。作者花了相當篇幅迭代提示詞，特別是「過擬合檢查」的表述——如何讓AI識別「看似通用、實則特化」的代碼氣味，本身就是一門手藝。

最后，人工整合不可替代。4份報告需要有人閱讀、比對、判斷沖突優(yōu)先級。這不是「自動駕駛」，是「副駕駛軍團」——幫你把地圖畫全，但方向盤還在你手里。

作者正在把這套方法擴展到其他場景：prompt系統(tǒng)驗證、技術(shù)方案評審、甚至文檔準確性檢查。核心邏輯不變——用結(jié)構(gòu)化的多視角沖突，暴露單點審查的盲區(qū)。

他在文末留了一個未完成的實驗：如果讓AI們不僅獨立審查，還能互相質(zhì)疑對方的結(jié)論，會發(fā)生什么？Cursor目前的架構(gòu)不支持代理間直接通信，但作者暗示，這可能成為下一個探索方向。

你的項目里，有沒有哪段代碼「看起來沒問題，但總覺得哪里不對」？或許缺的不是更多時間，而是第四個AI的視角。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

人手一個"龍蝦"的時代，誰來管住失控的AI？

鈦媒體APP 2026-03-30 14:37:23
7 跟貼 7
與谷歌 Genie3 正面交鋒，阿里發(fā)布世界模型HappyOyster：從被動生成到主動模擬

鈦媒體APP 2026-04-16 22:40:08
0 跟貼 0

Claude Opus 4.7連夜突襲：或?qū)屪呷?億打工人飯碗！

新智元 2026-04-17 00:27:01
0 跟貼 0

Gemini桌面客戶端終于上線：直接讀取屏幕上下文，幫你解讀一切！

新智元 2026-04-17 00:26:41
0 跟貼 0
AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潛意識傳染

新智元 2026-04-16 18:50:56
0 跟貼 0

最高漲463%！算力全面漲價后，老板開始考核“誰用的Token最少”??

每日經(jīng)濟新聞 2026-04-16 23:06:06
0 跟貼 0

我用1分鐘開發(fā)了個上線應(yīng)用，有阿里Meoo誰還學(xué)編程啊

量子位 2026-04-16 11:08:31
4 跟貼 4
Claude Opus 4.7 或本周上線，但 Anthropic 要查你證件了

愛范兒 2026-04-16 10:24:52
0 跟貼 0

上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環(huán)亞搞笑 2026-04-14 14:35:36
3 跟貼 3
500美元工具卷走2000萬：FBI端掉全球最大釣魚網(wǎng)絡(luò)后，我為什么更擔心了

字節(jié)漫游指南 2026-04-16 19:50:03
0 跟貼 0
《NBA 2K25》D加密破防！系列僅存《NBA 2K24》獨苗

Jeho的游戲日常 2026-04-15 07:03:15
0 跟貼 0
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
不同國家過斑馬線，規(guī)則差別居然這么大！

酒癡說夢 2026-04-15 11:12:35
1709 跟貼 1709
歷史首次！《識質(zhì)存在》尚未發(fā)售D加密被破解

3DM游戲 2026-04-16 09:11:05
9 跟貼 9
老板頭像在監(jiān)控里“升天”了，程序員用代碼教做人，打工人笑噴

茶余飯好 2026-04-16 12:07:39
6 跟貼 6
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
AReaL v1.0開源，智能體強化學(xué)習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
狂飆：算力中心自毀程序啟動，高家大小姐以命搏絕殺

馬軍情感故事 2026-04-15 22:53:04
0 跟貼 0
境外間諜設(shè)連環(huán)計竊取研究所機密文件，國安與其展開驚險較量

挽衾距離 2026-04-14 02:33:15
0 跟貼 0
美民主黨對防長赫格塞思發(fā)起彈劾

界面新聞 2026-04-16 07:08:40
5596 跟貼 5596
兩名外籍乘客在網(wǎng)約車上對著部隊大門連續(xù)拍照，接下來又要去訓(xùn)練場方向，司機覺得可疑，直接開車把他們交給了部隊

極目新聞 2026-04-16 08:59:25
5000 跟貼 5000
零跑D19賣22萬：誰給它的勇氣？

摸魚算法 2026-04-16 20:52:14
4 跟貼 4
采用800V架構(gòu)，標配寶華韋健，靜態(tài)體驗沃爾沃EX90

苑叔聊車官方賬號 2026-04-15 21:09:17
3 跟貼 3
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
2934 跟貼 2934
河南萬歲山武俠城演出中“大象”露出人腳，景區(qū)：沒飼養(yǎng)過大象，是4名工作人員扮的

環(huán)球網(wǎng)資訊 2026-04-16 11:29:34
2051 跟貼 2051
華為云推出“辦公蝦”：讓Agent互相辯論，還能生成可編輯PPT

智東西 2026-04-16 20:21:12
0 跟貼 0
媒體：法國要"將不義之財歸還中國" 沒你想得那么容易

新民周刊 2026-04-16 15:02:54
2045 跟貼 2045
大批五一航班突然取消！廣東市民出行受到這些影響

南方都市報 2026-04-15 20:44:18
447 跟貼 447
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發(fā)文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
1460 跟貼 1460
男子開車正常直行，不料差點撞到闖紅燈的阿姨，提醒：遵守交通規(guī)則，安全文明出行

氧氣周末 2026-04-16 16:31:33
0 跟貼 0
不是，怎么有模型叫“老婆們”，還能視頻通話啊？

差評XPIN 2026-04-17 00:09:07
0 跟貼 0
格力怒斥海信，稱其沒資格用“真銅實料”四字進行宣傳，海信高管回懟：又當又立

大風新聞 2026-04-15 15:07:03
955 跟貼 955
從被官媒點名到"保安局"導(dǎo)師：張敬軒9年"洗白"路，演給誰看？

川川八卦說 2026-04-16 09:44:21
6 跟貼 6
生意好時背刺老家，生意差了又想愛國，張敬軒這出戲演給誰看？

比利 2026-04-14 23:34:12
1 跟貼 1
美戰(zhàn)爭成本或達1萬億影響供烏武器

紅星新聞 2026-04-16 11:14:37
1167 跟貼 1167
文章新開面館口味評分3.6分，網(wǎng)友：30多元一碗面有點貴

紅星新聞 2026-04-13 17:22:41
1249 跟貼 1249
400毫升無償獻血證被中介賣至2000元獻血者僅拿400元

大風新聞 2026-04-16 19:53:03
701 跟貼 701
拋開開車規(guī)則不說，遇到這種垃圾司機做法，只想要套個說法，等著

遠方的青木 2026-04-13 04:17:17
17 跟貼 17
杭州女子買5份海鮮3份僅退款商家氣憤跨省趕來質(zhì)問

錢江晚報 2026-04-16 14:34:09
3 跟貼 3
上海業(yè)主傻眼安保、保潔突然全離崗小區(qū)垃圾堆積成山

新聞坊 2026-04-16 21:23:28
2 跟貼 2

手機 / 數(shù)碼

房產(chǎn) / 家居

Cursor把4個AI塞進同個項目，開發(fā)者發(fā)現(xiàn)1個隱藏功能：它們會互相拆臺

01 | 把AI當顧問團用，而非打字機

02 | 一份專門制造「分歧」的提示詞

03 | 實戰(zhàn)中的意外收獲

04 | 這套方法的邊界在哪

趙明：智駕之戰(zhàn)，看誰在大模型上更高效

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創(chuàng)始人王子杰去世，享年63歲

海爾與醫(yī)美女王互撕 換血抗衰誰的生意？

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

智能舒適 簡約風尚

人人人人！封關(guān)后首屆消博會，擠爆了！

985學(xué)院官宣！學(xué)碩，停招

封鎖霍爾木茲海峽后 美釋放雙重信號

東北男子投訴公交提前發(fā)車丟工作單位被施壓將其解雇

東北男子投訴公交提前發(fā)車丟工作單位被施壓將其解雇

海爾與醫(yī)美女王互撕換血抗衰誰的生意？

智能舒適簡約風尚

封鎖霍爾木茲海峽后美釋放雙重信號