无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

打造卓越Agent團(tuán)隊:如何解決復(fù)雜任務(wù)帶來的AI協(xié)作的副作用?

0
分享至


01 AI 也需要“分工”嗎?

答案是:需要,而且比人類更需要。

人類有工作可以積累長期復(fù)雜的記憶,很強的上下文感知能力,有主動性,會主動發(fā)現(xiàn)問題。

AI 不一樣。給它一個復(fù)雜的任務(wù),如果只有一個 AI 模型從頭做到尾,它會面臨幾個很難解決的問題:


第一個:角色坍塌與注意力稀釋。大語言模型都有上下文窗口Context Window,如果上下文飽和了,就很容易出問題。同一個Agent,在一個長程的對話里面,既要做數(shù)據(jù)分析,又要做邏輯推理,又要寫報告——模型往往會在指令沖突中采取“中庸妥協(xié)”,又因為上下文過長導(dǎo)致注意力漂移,最終導(dǎo)致能力坍塌,產(chǎn)出的內(nèi)容很大概率就是一本正經(jīng)的胡說八道。因此,我會在和AI聊天過長的時候新開對話窗口。

第二個:不知道自己錯在哪里。人很難自己否定自己,AI也是一樣。單個 AI 在輸出最終結(jié)論之前,不會主動質(zhì)疑自己的中間步驟。它不會停下來想:“我剛才那個假設(shè)對不對?”它只會繼續(xù)往下推演,最終引發(fā)災(zāi)難性的錯誤級聯(lián)(Error Cascading)。

第三個:沒有“第二意見。人類做重要決策,會找同事討論、找領(lǐng)導(dǎo)審批。單個 AI 沒有這個機(jī)制,它不會問自己:"有沒有其他可能性?"

所以,Multi-Agent 的本質(zhì)不是“多個 AI”,而是“不同的角色負(fù)責(zé)不同的事,然后相互校驗

02 三個臭皮匠,勝過一個諸葛亮

例如,在自定義的Multi-Agent 里的投研系統(tǒng),設(shè)置了三個核心角色:



角色一:Modeler(建模師)—— 構(gòu)建判斷框架

你可以把建模師理解成公司的戰(zhàn)略規(guī)劃部

他們的工作不是告訴你"明天買還是賣",而是先把事情搞清楚:

  • 這個公司值多少錢?

  • 它的增長邏輯是什么?

  • 核心假設(shè)是什么?

他們會構(gòu)建一套完整的分析框架,包括樂觀預(yù)測、基準(zhǔn)預(yù)測、悲觀預(yù)測——這三種場景。

但他們有一個明確的邊界:只負(fù)責(zé)建模,不負(fù)責(zé)質(zhì)疑

這是關(guān)鍵。戰(zhàn)略規(guī)劃部的工作是做好方案,不是和領(lǐng)導(dǎo)辯論方案的對錯。

角色二:Challenger(挑戰(zhàn)者)—— 主動找漏洞

你可以把挑戰(zhàn)者理解成公司的內(nèi)部審計部

他們不負(fù)責(zé)構(gòu)建任何東西,他們的工作是專門"挑毛病":

  • 這個預(yù)測的假設(shè)依據(jù)是什么?

  • 有沒有遺漏的風(fēng)險?

  • 這個結(jié)論是不是太樂觀了?

他們會對建模師的每一個關(guān)鍵判斷發(fā)起攻擊,然后建模師必須逐一回應(yīng):要么提供證據(jù),要么修改結(jié)論,要么承認(rèn)這個點確實有問題

重要的是:挑戰(zhàn)者不看建模師的工作過程,只看最終結(jié)論和依據(jù)。

這像極了審計部的工作方式——他們不參與業(yè)務(wù)決策,但有權(quán)質(zhì)疑任何業(yè)務(wù)判斷。

角色三:Synthesizer(綜合師)—— 做最終決策

你可以把綜合師理解成公司的CEO

他們不寫報告,不做預(yù)測,不做審計。但他們有一項核心能力:綜合多方意見,形成最終判斷

當(dāng)建模師給出了三套預(yù)測,挑戰(zhàn)者提出了若干質(zhì)疑和回應(yīng),綜合師要做的事情是:

  • 哪些質(zhì)疑有道理,應(yīng)該接受?

  • 哪些質(zhì)疑不合理,可以駁回但必須說明理由?

  • 最終的評級和目標(biāo)價應(yīng)該是什么?

CEO 不需要每件事都自己干,但他需要做出最終決策,并為此負(fù)責(zé)。

03 三個角色的對話規(guī)則


光有分工不夠,三個角色之間必須有一套清晰的對話規(guī)則。

如果沒有規(guī)則,會發(fā)生什么呢?

場景一:角色越位

挑戰(zhàn)者開始替建模師做分析,綜合師開始替挑戰(zhàn)者寫報告。每個人都在做本不該自己做的事,最后整個流程亂成一鍋粥。

場景二:信息泄露

建模師在做判斷的時候,已經(jīng)提前知道了挑戰(zhàn)者要攻擊什么內(nèi)容,于是提前"堵住了漏洞"。這就像領(lǐng)導(dǎo)在開民主生活會之前,就已經(jīng)知道員工要提什么意見,于是提前準(zhǔn)備了標(biāo)準(zhǔn)答案。

場景三:無限循環(huán)

挑戰(zhàn)者提出質(zhì)疑,建模師回應(yīng),挑戰(zhàn)者再質(zhì)疑,建模師再回應(yīng)……沒有終止條件,流程永遠(yuǎn)跑不完。

正確的Harness 做法是用“不變量”(Invariant)來約束對話邊界,這就好像每個人都有一個checklist:

對話規(guī)則

約束內(nèi)容

信息隔離

挑戰(zhàn)者只能看到建模師的最終結(jié)論,看不到中間推導(dǎo)過程

強制回應(yīng)

挑戰(zhàn)者的每一次質(zhì)疑,建模師都必須明確回應(yīng),不能忽略

終止條件

質(zhì)疑被標(biāo)記為解決或根據(jù)證據(jù)駁回,流程才能繼續(xù)

單向流動

信息只從建模師→挑戰(zhàn)者→綜合師,不允許反向泄露

04 一個真實的協(xié)作場景

說理論太抽象,來走一遍真實的流程。


場景:分析特斯拉(TSLA)

第一步:建模師輸出基礎(chǔ)分析

建模師完成了對 TSLA 的分析,輸出三套預(yù)測:

  • 樂觀情景:$320(基于 FY2027 年利潤預(yù)測)

  • 基準(zhǔn)情景:$245

  • 悲觀情景:$158

同時輸出關(guān)鍵假設(shè):年度利潤增長率 25%,PE 倍數(shù) 42x。

建模師把這些結(jié)論寫進(jìn) JSON 文件,建模階段結(jié)束

第二步:觸發(fā)挑戰(zhàn)者審查

系統(tǒng)自動調(diào)用挑戰(zhàn)者角色。挑戰(zhàn)者讀取建模師的 JSON 文件,但不讀取任何中間推導(dǎo)過程。

挑戰(zhàn)者發(fā)現(xiàn)了一個問題:

"建模師使用了 FY2027 年利潤作為錨點基準(zhǔn),但 FY2026 年利潤預(yù)測已經(jīng)比 FY2027 低了 15%——這是什么邏輯?"

挑戰(zhàn)者發(fā)起攻擊,狀態(tài)標(biāo)記為 CRITICAL。

第三步:建模師回應(yīng)

建模師收到挑戰(zhàn)者的質(zhì)疑,必須回應(yīng)。

可能的回應(yīng)方式:

  • 接受并修正

    :重新校準(zhǔn)錨點,改用基準(zhǔn)情景的 FY2026 預(yù)測作為錨點

  • 駁回并提供證據(jù)

    :說明 FY2027 錨點的合理性,提供行業(yè)對標(biāo)數(shù)據(jù)

  • 承認(rèn)邊界

    :說明這是一個結(jié)構(gòu)性不確定性(bidirectionality_blocked),無法用常規(guī)方法處理

第四步:綜合師做出最終判斷

所有 CRITICAL 攻擊被處理完畢,綜合師綜合全部分析,輸出最終報告。

最終報告3000萬字,包含:

  • 評級(BUY/HOLD/SELL)

  • 目標(biāo)價

  • 信心指數(shù)(model_validity_score)

  • 關(guān)鍵風(fēng)險列表

05 為什么要設(shè)計“挑戰(zhàn)者”這個角色?

很多人會有一個疑問:

為什么要單獨設(shè)一個"挑戰(zhàn)者"?讓建模師自己檢查自己的結(jié)論不行嗎?

答案:不行。而且越是自己查自己,越危險。

心理學(xué)上有一個概念叫"確認(rèn)偏誤"——人類會傾向于尋找支持自己已有判斷的證據(jù),而忽略反駁的證據(jù)。

AI 系統(tǒng)里也存在同樣的問題:建模師在構(gòu)建了一套分析框架之后,對自己的框架會產(chǎn)生"所有權(quán)感",潛意識里不愿意承認(rèn)框架有問題。

挑戰(zhàn)者的存在,就是為了打破這種確認(rèn)偏誤

更準(zhǔn)確地說,挑戰(zhàn)者有一個很重要的功能:把質(zhì)疑和建構(gòu)分開

建模師的任務(wù)是"構(gòu)建一個好的分析",挑戰(zhàn)者的任務(wù)是"證明這個分析哪里不好"——這是兩種完全不同的思維方式,讓同一個人同時做這兩件事,本質(zhì)上是在要求他"左手打右手"。

06 信息隔離:最難但最重要的設(shè)計

三個角色里,信息隔離是設(shè)計難度最高、但價值最大的部分。

為什么難?

因為信息隔離不是"不告訴你"這么簡單。當(dāng)建模師輸出一個結(jié)論的時候,挑戰(zhàn)者需要足夠的上下文才能提出有意義的質(zhì)疑——但這些上下文,又可能包含建模師的推導(dǎo)過程,從而造成信息泄露。

解決方案是"摘要機(jī)制":

建模師完成分析后,不是直接交給挑戰(zhàn)者,而是先經(jīng)過一個"摘要生成器"。

這個摘要生成器會:

  • 提取建模師的最終結(jié)論(保留)

  • 剝離推導(dǎo)過程(刪除)

  • 生成一份"挑戰(zhàn)者視角"的攻擊預(yù)判(新增)

這樣一來,挑戰(zhàn)者拿到的是一份"干凈"的輸入:只有結(jié)論和證據(jù),沒有中間推理。

同時,摘要生成器會明確告訴挑戰(zhàn)者:"以下是你需要重點攻擊的方向",相當(dāng)于給挑戰(zhàn)者提供了一份"攻擊地圖",而不是讓他自己去找漏洞。

07 失敗案例:如果不這么設(shè)計會怎樣?

案例:CRM 案例

在建模師和挑戰(zhàn)者在同一個工作循環(huán)內(nèi)共享了“參考資料”字段。

建模師在做最終判斷之前,已經(jīng)提前看到了挑戰(zhàn)者準(zhǔn)備攻擊他的內(nèi)容。

結(jié)果:建模師提前修改了措辭,把最脆弱的假設(shè)包裝得更穩(wěn)妥。挑戰(zhàn)者最后發(fā)現(xiàn)所有"漏洞"都被堵住了,最終攻擊全部無效。

這個 AI 系統(tǒng)犯的錯誤,和很多公司開"走過場"的民主生活會一模一樣。

修復(fù)方案:引入信息隔離機(jī)制,挑戰(zhàn)者只能讀取摘要,看不到建模師的原始推導(dǎo)過程。

08 給管理者的啟發(fā)

Multi-Agent 協(xié)作的設(shè)計,對管理者也有幾點很直接的啟發(fā):

第一,質(zhì)疑和建構(gòu)需要分開。

讓同一個人既負(fù)責(zé)方案設(shè)計、又負(fù)責(zé)方案審核,是管理上最常見的錯誤之一。好的決策機(jī)制,一定是有人提方案、有人挑毛病、有人做決定,三種角色分開。

第二,信息隔離有時候比信息透明更重要。

不是所有信息都應(yīng)該讓所有人看到。挑戰(zhàn)者需要足夠的上下文來提問題,但不需要看到建模師的推導(dǎo)過程。管理者需要知道決策結(jié)論,但不需要知道每個環(huán)節(jié)的具體推理——知道太多,反而會干擾判斷。

第三,設(shè)置明確的終止條件。

沒有終止條件的討論會變成無限循環(huán),永遠(yuǎn)不會有結(jié)論。Multi-Agent 系統(tǒng)里,每一條質(zhì)疑都必須有明確的處理狀態(tài),系統(tǒng)才會繼續(xù)往下走。

現(xiàn)實中也是如此:會議要有結(jié)論,評審要有結(jié)論,決策要有結(jié)論。

09 總結(jié)

好的協(xié)作,不是分工就完事了,而是對齊目標(biāo)的情況下,讓每個成員在自己崗位上面發(fā)揮最大能力,讓組織達(dá)到一種最佳效率平衡。

Multi-Agent 的設(shè)計,本質(zhì)上是在用工程化的方式,實現(xiàn)人類組織里早就存在的分工與制衡邏輯。

如果你在帶團(tuán)隊,這套設(shè)計值得參考:

  • 有人負(fù)責(zé)建構(gòu)(建模師)

  • 有人負(fù)責(zé)質(zhì)疑(挑戰(zhàn)者)

  • 有人負(fù)責(zé)決策(綜合師)

  • 三個角色之間有清晰的信息邊界

  • 每個環(huán)節(jié)有明確的終止條件

做到了這幾點,不管是 AI 系統(tǒng)還是人類團(tuán)隊,協(xié)作質(zhì)量都會上一個臺階。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
68歲馬秋華:丈夫金鐵霖走后4年,兒子33歲未婚成她最大心病

68歲馬秋華:丈夫金鐵霖走后4年,兒子33歲未婚成她最大心病

飄飄然的娛樂匯
2026-07-01 09:55:09
多家檢測機(jī)構(gòu)拒絕個人申請紙尿褲甲酰胺檢測

多家檢測機(jī)構(gòu)拒絕個人申請紙尿褲甲酰胺檢測

財聞
2026-06-30 20:56:42
陳建斌有個毛病改不掉,那就是見前任吳越當(dāng)是一個沒事人一樣

陳建斌有個毛病改不掉,那就是見前任吳越當(dāng)是一個沒事人一樣

手工制作阿殲
2026-07-01 08:48:48
我真蠢,我竟然去看了《抓特務(wù)》

我真蠢,我竟然去看了《抓特務(wù)》

呦呦鹿鳴
2026-06-28 22:42:42
退休干部夫妻工資2萬孩子留美,因病不能做家務(wù)申請困難補助!

退休干部夫妻工資2萬孩子留美,因病不能做家務(wù)申請困難補助!

兵叔評說
2026-06-30 21:03:25
3場5球追平挪威隊史紀(jì)錄!哈蘭德絕殺后坦言:戰(zhàn)勝巴西隊機(jī)會非常小

3場5球追平挪威隊史紀(jì)錄!哈蘭德絕殺后坦言:戰(zhàn)勝巴西隊機(jī)會非常小

紅星新聞
2026-07-01 08:20:15
神了!范志毅成功猜中德國荷蘭出局+巴西贏日本 預(yù)測:C羅止步32強

神了!范志毅成功猜中德國荷蘭出局+巴西贏日本 預(yù)測:C羅止步32強

童叔不飆車
2026-07-01 01:48:50
美股盤前,美光科技跌幅擴(kuò)大至4%,閃迪跌近5%

美股盤前,美光科技跌幅擴(kuò)大至4%,閃迪跌近5%

每日經(jīng)濟(jì)新聞
2026-07-01 16:41:05
我今年56歲發(fā)現(xiàn)了一個怪現(xiàn)象:50歲以后的中年女人,能活到90歲的,基本上在50歲的時候,就不再做這件事了

我今年56歲發(fā)現(xiàn)了一個怪現(xiàn)象:50歲以后的中年女人,能活到90歲的,基本上在50歲的時候,就不再做這件事了

心理觀察局
2026-07-01 07:58:17
你家的房子,可能正被一臺空調(diào)「抬價」

你家的房子,可能正被一臺空調(diào)「抬價」

知識碎碎念
2026-06-30 15:47:30
3-0!2-0!世界杯狂歡:絕殺+碾壓局 巨星閃耀 16強確定7席

3-0!2-0!世界杯狂歡:絕殺+碾壓局 巨星閃耀 16強確定7席

葉青足球世界
2026-07-01 12:03:01
A股:不必等待了!明天(7月2日),股市或?qū)⒂瓉泶蠹墑e的變化?

A股:不必等待了!明天(7月2日),股市或?qū)⒂瓉泶蠹墑e的變化?

財經(jīng)大拿
2026-07-01 13:57:47
別笑梅威瑟破產(chǎn),他的死局,90%的有錢人都逃不掉!

別笑梅威瑟破產(chǎn),他的死局,90%的有錢人都逃不掉!

格斗時代
2026-06-30 20:34:39
替董事長坐12年牢,出來后他轉(zhuǎn)我600萬,他女兒:我爸要我嫁給你

替董事長坐12年牢,出來后他轉(zhuǎn)我600萬,他女兒:我爸要我嫁給你

千秋文化
2026-06-27 19:44:16
外媒:庫爾圖瓦等比利時老將開會自救,主教練沒有參與

外媒:庫爾圖瓦等比利時老將開會自救,主教練沒有參與

懂球帝
2026-07-01 15:49:14
WTT美國大滿貫亂了:隨著佐藤瞳3-0,3大世界前十的名將已經(jīng)出局

WTT美國大滿貫亂了:隨著佐藤瞳3-0,3大世界前十的名將已經(jīng)出局

側(cè)身凌空斬
2026-07-01 09:46:45
拒簽率飆到80%,遣返人數(shù)翻兩倍!印度人怎么突然被踢出了"朋友圈"?

拒簽率飆到80%,遣返人數(shù)翻兩倍!印度人怎么突然被踢出了"朋友圈"?

阿柒的訊
2026-07-01 09:46:13
六代機(jī),就這么明晃晃的官宣了

六代機(jī),就這么明晃晃的官宣了

俠客棧
2026-06-30 13:35:58
穆勒怒噴:我們德國人被欺騙了,這是在最大舞臺上明目張膽的搶劫

穆勒怒噴:我們德國人被欺騙了,這是在最大舞臺上明目張膽的搶劫

硯底沉香
2026-07-01 04:30:06
太厲害了!俄羅斯最新戰(zhàn)報!

太厲害了!俄羅斯最新戰(zhàn)報!

故事終將光明磊落
2026-07-01 14:02:43
2026-07-01 18:52:49
PM熊叔
PM熊叔
聊AI科技+商業(yè),一人公司的產(chǎn)品經(jīng)理
6文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經(jīng)要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團(tuán)銷量突破200萬輛

態(tài)度原創(chuàng)

教育
本地
親子
家居
旅游

教育要聞

已知AB-A=58, 求A=?B=?

本地新聞

強烈建議,全國高校都向這所大學(xué)看齊!

親子要聞

云南文山:托幼一體化破解幼兒入園銜接難題

家居要聞

傳奇筑 日常詩

旅游要聞

洋面孔成旅游推介官,三亞的“朋友圈”為何越擴(kuò)越大?

無障礙瀏覽 進(jìn)入關(guān)懷版