![]()
393個(gè)人被扔進(jìn)一場城市決策模擬,有人30分鐘從容分析,有人10分鐘火燒眉毛。研究者想測的只有一件事:你什么時(shí)候點(diǎn)開那個(gè)AI對(duì)話框,會(huì)徹底改寫你的思考質(zhì)量。
結(jié)果讓習(xí)慣"先問AI再說"的人有點(diǎn)尷尬。4月14日巴塞羅那CHI會(huì)議上,芝加哥大學(xué)Mina Lee團(tuán)隊(duì)公布的實(shí)驗(yàn)數(shù)據(jù)顯示,先自己啃完一部分問題再求助AI的參與者,批判性思維測試得分顯著高于從一開始就依賴AI的群體。但Deadline逼到眼前時(shí),早用AI反而能救命——速度和質(zhì)量,這對(duì)老冤家又掐上了。
實(shí)驗(yàn)設(shè)計(jì):把"什么時(shí)候用AI"切成四段
研究團(tuán)隊(duì)沒搞什么抽象問卷,直接搭建了一個(gè)微型市政廳。參與者扮演市議員,手握7份文件,要裁定是否接受某公司的水污染整改方案,最后還得寫篇論證短文。393人被隨機(jī)扔進(jìn)8個(gè)格子:時(shí)間維度上,一半人30分鐘"充足時(shí)間",一半人10分鐘"時(shí)間不足";AI使用維度上,又分成"早期可用""全程可用""晚期可用""完全不用"四組。
評(píng)分標(biāo)準(zhǔn)很實(shí)在:有效論點(diǎn)數(shù)量、文本引用準(zhǔn)確度、信息記憶留存度,還有一項(xiàng)叫"myside bias"(自我立場偏見)——看你論證時(shí)能不能容納對(duì)立觀點(diǎn)。每組40到50人,樣本量足夠讓統(tǒng)計(jì)結(jié)果說話。
充足時(shí)間組里,"晚期用AI"的人 essay 得分最高。更扎心的是"完全不用AI"那組:他們的信息記憶效果最好。換句話說,AI幫你寫的時(shí)候,你的腦子其實(shí)在偷懶。但"myside bias"指標(biāo)上,晚期用AI組反而表現(xiàn)最優(yōu)——先自己磨一遍,再借AI補(bǔ)盲區(qū),似乎能找到獨(dú)立思考與外部助力的平衡點(diǎn)。
兩種學(xué)習(xí)模式的古老戰(zhàn)爭
奧克蘭大學(xué)教育專家Barbara Oakley用一對(duì)概念解釋了這個(gè)現(xiàn)象:慢學(xué)習(xí)與快學(xué)習(xí)。慢學(xué)習(xí)是費(fèi)力氣的,你得一塊一塊搭建問題框架,反復(fù)掂量選項(xiàng);快學(xué)習(xí)靠習(xí)慣和直覺,反射式地給出判斷。實(shí)驗(yàn)里那些先自己啃材料、晚些才打開GPT-4o的參與者,本質(zhì)上是用慢學(xué)習(xí)給自己打了底,AI只是來填縫的。
「那些有時(shí)間先自己推理材料的人表現(xiàn)最好,因?yàn)樗麄円呀?jīng)投入了那種更慢、更深思熟慮的學(xué)習(xí)。」Oakley說。
這個(gè)結(jié)論戳中了一個(gè)正在蔓延的工作習(xí)慣。很多人面對(duì)復(fù)雜任務(wù)的第一反應(yīng),已經(jīng)從"我先想想"變成了"我先問問Claude/ChatGPT/DeepSeek"。工具太順手,順手到思考的起跑線被悄悄后移了。研究沒說的是:當(dāng)你習(xí)慣了用AI作為認(rèn)知的第一入口,慢學(xué)習(xí)的機(jī)會(huì)窗口就被壓縮了,而你可能根本意識(shí)不到自己錯(cuò)過了什么。
Deadline來了,規(guī)則瞬間翻轉(zhuǎn)
但現(xiàn)實(shí)世界很少給你30分鐘慢慢燉。10分鐘組的四組數(shù)據(jù)里,"早期用AI"的人表現(xiàn)最好。時(shí)間壓力下,AI的信息整合速度成了救命稻草,獨(dú)立推理的奢侈代價(jià)太高。Lee團(tuán)隊(duì)的數(shù)據(jù)在這里呈現(xiàn)了一個(gè)殘酷的權(quán)衡:你要速度,還是要深度?
這個(gè)發(fā)現(xiàn)對(duì)職場人的啟示很具體。寫周報(bào)、趕提案、做會(huì)議紀(jì)要——這些高頻場景往往伴隨著時(shí)間壓力,AI早介入確實(shí)能兜底。但涉及戰(zhàn)略判斷、重大決策、需要長期記憶的核心知識(shí)時(shí),那個(gè)"先自己想想"的延遲,可能是你保住的唯一認(rèn)知資產(chǎn)。
實(shí)驗(yàn)的局限性也很誠實(shí)。GPT-4o是2024年中的模型,AI的進(jìn)化速度讓任何"最佳實(shí)踐"都自帶保質(zhì)期。而且市政廳模擬終究是模擬,真實(shí)世界的決策鏈條更長、信息更臟、利益更復(fù)雜。但核心變量——介入時(shí)機(jī)——的效應(yīng)足夠顯著,顯著到值得納入你的工作流設(shè)計(jì)。
研究團(tuán)隊(duì)沒給出一刀切的建議,這反而是個(gè)好信號(hào)。他們用數(shù)據(jù)畫了一張地形圖:平原地帶(時(shí)間充裕)走慢路,沼澤地帶(時(shí)間緊迫)抄近道。地圖在你手里,選哪條路取決于你此刻站在哪。
一個(gè)值得玩味的細(xì)節(jié):實(shí)驗(yàn)中"完全不用AI"的人記憶效果最好,但"myside bias"控制并非最優(yōu)。人類獨(dú)自思考時(shí),信息吃進(jìn)去了,視角卻容易變窄。晚期用AI組在兩個(gè)指標(biāo)上都拿了高分——這暗示了一種可能的理想節(jié)奏:先用自己的腦子把問題"弄臟",再用AI來"清洗"盲區(qū)。順序不能顛倒,顛倒就變成外包了。
最后留個(gè)數(shù)據(jù)給你琢磨:393人里,晚期用AI的充足時(shí)間組,essay得分比早期用AI組高出多少?論文沒給具體數(shù)字,但用了"significantly better"(顯著更好)的表述。在統(tǒng)計(jì)語言里,這意味著差距大到不太可能是偶然。具體百分比或許不重要,重要的是那個(gè)"顯著"的門檻,已經(jīng)被"先自己后AI"的策略跨過去了。
你上次面對(duì)復(fù)雜問題,是先打開了文檔,還是先打開了對(duì)話框?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.