網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

芝加哥大學(xué)393人實(shí)驗(yàn)：AI用錯(cuò)時(shí)機(jī)，思考能力直接掉檔

2026-04-14 16:15:15　來源: 爬蟲飼養(yǎng)員

北京舉報(bào)

分享至

393個(gè)人被扔進(jìn)一場城市決策模擬，有人30分鐘從容分析，有人10分鐘火燒眉毛。研究者想測的只有一件事：你什么時(shí)候點(diǎn)開那個(gè)AI對(duì)話框，會(huì)徹底改寫你的思考質(zhì)量。

結(jié)果讓習(xí)慣"先問AI再說"的人有點(diǎn)尷尬。4月14日巴塞羅那CHI會(huì)議上，芝加哥大學(xué)Mina Lee團(tuán)隊(duì)公布的實(shí)驗(yàn)數(shù)據(jù)顯示，先自己啃完一部分問題再求助AI的參與者，批判性思維測試得分顯著高于從一開始就依賴AI的群體。但Deadline逼到眼前時(shí)，早用AI反而能救命——速度和質(zhì)量，這對(duì)老冤家又掐上了。

實(shí)驗(yàn)設(shè)計(jì)：把"什么時(shí)候用AI"切成四段

研究團(tuán)隊(duì)沒搞什么抽象問卷，直接搭建了一個(gè)微型市政廳。參與者扮演市議員，手握7份文件，要裁定是否接受某公司的水污染整改方案，最后還得寫篇論證短文。393人被隨機(jī)扔進(jìn)8個(gè)格子：時(shí)間維度上，一半人30分鐘"充足時(shí)間"，一半人10分鐘"時(shí)間不足"；AI使用維度上，又分成"早期可用""全程可用""晚期可用""完全不用"四組。

評(píng)分標(biāo)準(zhǔn)很實(shí)在：有效論點(diǎn)數(shù)量、文本引用準(zhǔn)確度、信息記憶留存度，還有一項(xiàng)叫"myside bias"（自我立場偏見）——看你論證時(shí)能不能容納對(duì)立觀點(diǎn)。每組40到50人，樣本量足夠讓統(tǒng)計(jì)結(jié)果說話。

充足時(shí)間組里，"晚期用AI"的人 essay 得分最高。更扎心的是"完全不用AI"那組：他們的信息記憶效果最好。換句話說，AI幫你寫的時(shí)候，你的腦子其實(shí)在偷懶。但"myside bias"指標(biāo)上，晚期用AI組反而表現(xiàn)最優(yōu)——先自己磨一遍，再借AI補(bǔ)盲區(qū)，似乎能找到獨(dú)立思考與外部助力的平衡點(diǎn)。

兩種學(xué)習(xí)模式的古老戰(zhàn)爭

奧克蘭大學(xué)教育專家Barbara Oakley用一對(duì)概念解釋了這個(gè)現(xiàn)象：慢學(xué)習(xí)與快學(xué)習(xí)。慢學(xué)習(xí)是費(fèi)力氣的，你得一塊一塊搭建問題框架，反復(fù)掂量選項(xiàng)；快學(xué)習(xí)靠習(xí)慣和直覺，反射式地給出判斷。實(shí)驗(yàn)里那些先自己啃材料、晚些才打開GPT-4o的參與者，本質(zhì)上是用慢學(xué)習(xí)給自己打了底，AI只是來填縫的。

「那些有時(shí)間先自己推理材料的人表現(xiàn)最好，因?yàn)樗麄円呀?jīng)投入了那種更慢、更深思熟慮的學(xué)習(xí)。」Oakley說。

這個(gè)結(jié)論戳中了一個(gè)正在蔓延的工作習(xí)慣。很多人面對(duì)復(fù)雜任務(wù)的第一反應(yīng)，已經(jīng)從"我先想想"變成了"我先問問Claude/ChatGPT/DeepSeek"。工具太順手，順手到思考的起跑線被悄悄后移了。研究沒說的是：當(dāng)你習(xí)慣了用AI作為認(rèn)知的第一入口，慢學(xué)習(xí)的機(jī)會(huì)窗口就被壓縮了，而你可能根本意識(shí)不到自己錯(cuò)過了什么。

Deadline來了，規(guī)則瞬間翻轉(zhuǎn)

但現(xiàn)實(shí)世界很少給你30分鐘慢慢燉。10分鐘組的四組數(shù)據(jù)里，"早期用AI"的人表現(xiàn)最好。時(shí)間壓力下，AI的信息整合速度成了救命稻草，獨(dú)立推理的奢侈代價(jià)太高。Lee團(tuán)隊(duì)的數(shù)據(jù)在這里呈現(xiàn)了一個(gè)殘酷的權(quán)衡：你要速度，還是要深度？

這個(gè)發(fā)現(xiàn)對(duì)職場人的啟示很具體。寫周報(bào)、趕提案、做會(huì)議紀(jì)要——這些高頻場景往往伴隨著時(shí)間壓力，AI早介入確實(shí)能兜底。但涉及戰(zhàn)略判斷、重大決策、需要長期記憶的核心知識(shí)時(shí)，那個(gè)"先自己想想"的延遲，可能是你保住的唯一認(rèn)知資產(chǎn)。

實(shí)驗(yàn)的局限性也很誠實(shí)。GPT-4o是2024年中的模型，AI的進(jìn)化速度讓任何"最佳實(shí)踐"都自帶保質(zhì)期。而且市政廳模擬終究是模擬，真實(shí)世界的決策鏈條更長、信息更臟、利益更復(fù)雜。但核心變量——介入時(shí)機(jī)——的效應(yīng)足夠顯著，顯著到值得納入你的工作流設(shè)計(jì)。

研究團(tuán)隊(duì)沒給出一刀切的建議，這反而是個(gè)好信號(hào)。他們用數(shù)據(jù)畫了一張地形圖：平原地帶（時(shí)間充裕）走慢路，沼澤地帶（時(shí)間緊迫）抄近道。地圖在你手里，選哪條路取決于你此刻站在哪。

一個(gè)值得玩味的細(xì)節(jié)：實(shí)驗(yàn)中"完全不用AI"的人記憶效果最好，但"myside bias"控制并非最優(yōu)。人類獨(dú)自思考時(shí)，信息吃進(jìn)去了，視角卻容易變窄。晚期用AI組在兩個(gè)指標(biāo)上都拿了高分——這暗示了一種可能的理想節(jié)奏：先用自己的腦子把問題"弄臟"，再用AI來"清洗"盲區(qū)。順序不能顛倒，顛倒就變成外包了。

最后留個(gè)數(shù)據(jù)給你琢磨：393人里，晚期用AI的充足時(shí)間組，essay得分比早期用AI組高出多少？論文沒給具體數(shù)字，但用了"significantly better"（顯著更好）的表述。在統(tǒng)計(jì)語言里，這意味著差距大到不太可能是偶然。具體百分比或許不重要，重要的是那個(gè)"顯著"的門檻，已經(jīng)被"先自己后AI"的策略跨過去了。

你上次面對(duì)復(fù)雜問題，是先打開了文檔，還是先打開了對(duì)話框？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.