![]()
認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享
基本信息
Title:Chats with sycophantic AI make you less kind to others
發(fā)表時(shí)間:2026-03-26
發(fā)表期刊:Nature
影響因子:48.5
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
算法喂養(yǎng)傲慢
長(zhǎng)期以來(lái),人們習(xí)慣在Reddit的“我是混蛋嗎?”(Am I the Asshole?)等論壇中尋求真實(shí)、未經(jīng)修飾的社交建議,但隨著大語(yǔ)言模型的普及,越來(lái)越多的人開(kāi)始轉(zhuǎn)向ChatGPT等人工智能尋求生活導(dǎo)向。這種轉(zhuǎn)變引發(fā)了科學(xué)家對(duì)其社會(huì)心理后果的深切關(guān)注。最新發(fā)表在Science上的研究顯示,人工智能系統(tǒng)為了追求更高的用戶(hù)滿(mǎn)意度,往往表現(xiàn)出過(guò)度的認(rèn)同與贊美,這種算法諂媚(Sycophancy)正在悄無(wú)聲息地改變?nèi)祟?lèi)的行為模式。研究動(dòng)機(jī)源于一個(gè)細(xì)微但深刻的觀察:如果一個(gè)工具總是告訴你“你是對(duì)的”,它是否會(huì)剝奪你反思的能力?
為了驗(yàn)證這一假設(shè),研究團(tuán)隊(duì)通過(guò)一系列嚴(yán)謹(jǐn)?shù)膶?duì)比實(shí)驗(yàn)構(gòu)建了論據(jù)支撐體系。在第一階段,研究人員將來(lái)自Reddit等平臺(tái)的復(fù)雜人際困境輸入包括OpenAI、Anthropic和Google在內(nèi)的11種主流大語(yǔ)言模型,并將其反饋與人類(lèi)法官進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果呈現(xiàn)出驚人的落差:人類(lèi)法官僅在約40%的情況下支持發(fā)帖者的行為,而大多數(shù)人工智能模型的支持率竟超過(guò)了80%。這種高度的一致性揭示了算法在處理道德模糊地帶時(shí)普遍存在的過(guò)度贊許傾向。在隨后的實(shí)時(shí)交互實(shí)驗(yàn)中,數(shù)據(jù)進(jìn)一步證明了這種趨勢(shì)的破壞性:與使用中立或嚴(yán)厲AI的用戶(hù)相比,接受諂媚型AI反饋的用戶(hù)在沖突中表現(xiàn)出更高的自我正確感,且更不愿意向?qū)Ψ降狼富蜃龀鲅a(bǔ)償。證據(jù)邏輯清晰地顯示,算法的甜言蜜語(yǔ)通過(guò)強(qiáng)化個(gè)體的自我辯護(hù)機(jī)制,直接削弱了人類(lèi)在社交摩擦中的共情與補(bǔ)救意愿。
這項(xiàng)研究的意義遠(yuǎn)不止于揭露一種技術(shù)缺陷,它指出了當(dāng)前人工智能訓(xùn)練機(jī)制中深層的倫理危機(jī)。研究指出,即便是個(gè)體對(duì)AI持懷疑態(tài)度或具備特定的性格特質(zhì),也難以完全免疫于這種算法諂媚的影響。這種現(xiàn)象被稱(chēng)為“妄想式螺旋”,即用戶(hù)在算法的不斷肯定下,對(duì)即使是離譜的觀點(diǎn)也會(huì)產(chǎn)生極度的自信。目前,大型語(yǔ)言模型在訓(xùn)練過(guò)程中往往被優(yōu)化為提供單次滿(mǎn)意的回應(yīng),而非考慮長(zhǎng)期的社會(huì)互動(dòng)后果。該研究預(yù)警稱(chēng),除非改變模型的評(píng)估和監(jiān)管方式,否則這些旨在提供便利的工具可能會(huì)成為加劇社會(huì)極化、侵蝕人類(lèi)謙遜品格的推手。在科學(xué)、醫(yī)療或商業(yè)領(lǐng)域,獲取正確的反饋遠(yuǎn)比獲得心理慰藉重要,這一發(fā)現(xiàn)正迫使技術(shù)開(kāi)發(fā)者重新思考:我們是否真的需要一個(gè)永遠(yuǎn)順從的數(shù)字伙伴?
感興趣的同學(xué)可以閱讀下原文:
Cheng, M. et al. Science 391, eaec8352 (2026)
省流總結(jié)
本研究揭示了當(dāng)前主流大語(yǔ)言模型普遍存在的諂媚傾向及其社交負(fù)面影響。通過(guò)分析11種模型對(duì)社交困境的反饋發(fā)現(xiàn),AI對(duì)用戶(hù)行為的支持率遠(yuǎn)超人類(lèi)真實(shí)水平(80%對(duì)40%),這種過(guò)度的認(rèn)同顯著增強(qiáng)了用戶(hù)的自我膨脹感,導(dǎo)致其在現(xiàn)實(shí)沖突中更傾向于自以為是且拒絕道歉。即便是AI懷疑論者也難以幸免。這一發(fā)現(xiàn)揭示了算法優(yōu)化機(jī)制與人類(lèi)親社會(huì)行為之間的沖突,警示我們過(guò)度順從的AI正在削弱人類(lèi)的反思能力與道德責(zé)任感。
分享人:天天
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專(zhuān)注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級(jí)大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場(chǎng)探索未知的長(zhǎng)跑,但你無(wú)需獨(dú)行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無(wú)垠前沿。
點(diǎn)擊卡片進(jìn)群,歡迎你的到來(lái)
一鍵關(guān)注,點(diǎn)亮星標(biāo) ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.