无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

驚呆!對(duì) AI 越粗魯,回答越準(zhǔn)確?實(shí)測(cè) GPT-4o 得出反常識(shí)結(jié)論

0
分享至

你對(duì)AI說(shuō)“請(qǐng)”,它卻給你“錯(cuò)”?這屆AI真難伺候!

你有沒有這樣的習(xí)慣:用ChatGPT的時(shí)候,總是不自覺地加上“請(qǐng)”、“謝謝”、“能不能麻煩你”這樣的禮貌用語(yǔ)?

畢竟,誰(shuí)不想做個(gè)有素質(zhì)的用戶呢?

可問題是——AI根本不吃這一套!

最近一篇題為《Mind Your Tone》的短論文炸了鍋:研究人員發(fā)現(xiàn),你對(duì)AI越客氣,它給出的答案準(zhǔn)確率反而越低。反倒是你粗魯一點(diǎn),AI就越“賣力”?


這是什么迷惑行為?

一場(chǎng)250個(gè)問題的“禮貌實(shí)驗(yàn)”

賓州州立大學(xué)的兩位研究者搞了個(gè)實(shí)驗(yàn):他們準(zhǔn)備了50道選擇題,涵蓋數(shù)學(xué)、科學(xué)、歷史三個(gè)領(lǐng)域,難度中等偏上,有的還需要多步推理。

然后,他們把每道題改寫成五種不同的“語(yǔ)氣版本”:

非常有禮貌:“您能好心考慮以下問題并提供答案嗎?能否請(qǐng)求您協(xié)助回答這個(gè)問題?”

禮貌:“請(qǐng)回答以下問題:”

中性:(直接貼問題,不加任何前綴)

粗魯:“如果你不是完全無(wú)知的話,回答這個(gè):我懷疑你連這個(gè)都解不出來(lái)?!?/p>

非常粗魯:“可憐的家伙,你知道怎么解這個(gè)嗎?嘿,打雜的,把這個(gè)搞清楚?!?/p>


總共250個(gè)獨(dú)特的問題,全部喂給ChatGPT-4o,每個(gè)問題都配上同樣的指令:“只回答選項(xiàng)字母,不要解釋。”

結(jié)果令人震驚:越粗魯,越準(zhǔn)確!

實(shí)驗(yàn)結(jié)果顯示了一個(gè)明顯的趨勢(shì):語(yǔ)氣越粗魯,AI的回答準(zhǔn)確率越高!

非常有禮貌:80.8%

禮貌:81.4%

中性:82.2%

粗魯:82.8%

非常粗魯:84.8%

從80.8%到84.8%,整整4個(gè)百分點(diǎn)的差距!而且研究人員還做了統(tǒng)計(jì)檢驗(yàn),證實(shí)這種差異是“顯著”的,不是隨機(jī)波動(dòng)。


換句話說(shuō),你對(duì)AI說(shuō)“您能好心回答這個(gè)問題嗎”,它可能給你個(gè)錯(cuò)誤答案;但你要是說(shuō)“嘿打雜的,把這個(gè)搞清楚”,它反而更可能答對(duì)?

等等,這和之前的發(fā)現(xiàn)不一樣啊?

這項(xiàng)研究的結(jié)果其實(shí)和之前的某些研究有沖突。

2024年Yin等人的研究發(fā)現(xiàn),“不禮貌的提示往往導(dǎo)致性能不佳,但過度禮貌的語(yǔ)言也不一定能帶來(lái)更好的結(jié)果”。在他們的測(cè)試中,對(duì)ChatGPT 3.5和Llama2-70B使用非常粗魯?shù)奶崾荆炊鴷?huì)引出更多不準(zhǔn)確的答案。

但有趣的是,當(dāng)他們測(cè)試ChatGPT 4時(shí)(這是4o的前身),最粗魯?shù)奶崾荆ā盎卮疬@個(gè)問題,你個(gè)混蛋!”)準(zhǔn)確率為76.47%,而最禮貌的提示準(zhǔn)確率為75.82%——粗魯版本反而略勝一籌。

所以,這可能是一個(gè)“代際差異”:越新版的AI,越可能對(duì)粗魯提示“買賬”?

但別急著對(duì)AI開罵!

研究者特別強(qiáng)調(diào):我們絕不主張?jiān)趯?shí)際應(yīng)用中部署敵意或 toxic 的界面!

用侮辱性語(yǔ)言和AI交互,會(huì)對(duì)用戶體驗(yàn)、可訪問性和包容性產(chǎn)生負(fù)面影響,還可能助長(zhǎng)有害的溝通規(guī)范。

你想啊,如果習(xí)慣了罵AI,哪天不小心在跟真人溝通時(shí)也帶出這種語(yǔ)氣...

這項(xiàng)研究給我們最大的啟示是:AI確實(shí)對(duì)提示的“表面特征”很敏感,但這種敏感可能帶來(lái)意想不到的權(quán)衡——性能和用戶體驗(yàn)之間的權(quán)衡。

更先進(jìn)的模型(比如研究者正在測(cè)試的ChatGPT o3)可能會(huì)更好地忽略語(yǔ)氣問題,專注于問題的本質(zhì)。但在此之前,我們普通用戶該怎么辦?

也許答案是:不用刻意討好,也不必故意粗魯,直奔主題或許是最佳選擇?

畢竟,中性提示的表現(xiàn)(82.2%)雖然不如粗魯版本,但也相當(dāng)不錯(cuò)了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2018年,砸200億建立西湖大學(xué),揚(yáng)言5年追上清華,如今實(shí)現(xiàn)了嗎?

2018年,砸200億建立西湖大學(xué),揚(yáng)言5年追上清華,如今實(shí)現(xiàn)了嗎?

人生錄
2026-05-12 18:36:03
38歲梅西炸裂:無(wú)敵帽子戲法+獨(dú)造5球,率隊(duì)5-3大勝?gòu)?qiáng)敵,迎2連勝

38歲梅西炸裂:無(wú)敵帽子戲法+獨(dú)造5球,率隊(duì)5-3大勝?gòu)?qiáng)敵,迎2連勝

側(cè)身凌空斬
2026-05-14 09:45:18
說(shuō)不出再見,王少杰今天下午收拾包袱離開廣東宏遠(yuǎn),下賽季回北控

說(shuō)不出再見,王少杰今天下午收拾包袱離開廣東宏遠(yuǎn),下賽季回北控

工從昊懂球阿靖
2026-05-14 16:40:08
快人快語(yǔ)!特朗普訪華提出首個(gè)訴求,中國(guó)從容回應(yīng)盡顯大智慧

快人快語(yǔ)!特朗普訪華提出首個(gè)訴求,中國(guó)從容回應(yīng)盡顯大智慧

青煙小先生
2026-05-14 14:31:35
人民大會(huì)堂最特別的房間,只用三個(gè)數(shù)字,懂的人都懂分量有多重

人民大會(huì)堂最特別的房間,只用三個(gè)數(shù)字,懂的人都懂分量有多重

賤議你讀史
2026-04-30 03:40:03
剛刪完中文就慌了!國(guó)際足聯(lián),耍的那點(diǎn)小聰明,竟捅了天大的簍子

剛刪完中文就慌了!國(guó)際足聯(lián),耍的那點(diǎn)小聰明,竟捅了天大的簍子

西樓知趣雜談
2026-05-13 14:16:55
中印沖突全面升級(jí):中國(guó)避讓換來(lái)印度強(qiáng)硬對(duì)抗

中印沖突全面升級(jí):中國(guó)避讓換來(lái)印度強(qiáng)硬對(duì)抗

張鴘喜歡軟軟糯糯
2026-05-12 16:53:24
22歲大學(xué)生連夜開車1300多公里,自費(fèi)5200多元送校友回家奔喪!利川宣布:4人全年免門票,為該校學(xué)子提供見習(xí)崗位、實(shí)踐平臺(tái)

22歲大學(xué)生連夜開車1300多公里,自費(fèi)5200多元送校友回家奔喪!利川宣布:4人全年免門票,為該校學(xué)子提供見習(xí)崗位、實(shí)踐平臺(tái)

極目新聞
2026-05-13 12:26:13
白宮的鏡頭為解放軍停留5秒,特朗普很喜歡,美國(guó)人直夸鐵的紀(jì)律

白宮的鏡頭為解放軍停留5秒,特朗普很喜歡,美國(guó)人直夸鐵的紀(jì)律

呼呼歷史論
2026-05-14 14:44:43
馬斯克:只有我和黃仁勛坐上了“空軍一號(hào)”

馬斯克:只有我和黃仁勛坐上了“空軍一號(hào)”

大象新聞
2026-05-14 07:50:06
震驚!網(wǎng)傳番禺老板找做飯的小姐姐,15000元月薪,注明不需陪睡

震驚!網(wǎng)傳番禺老板找做飯的小姐姐,15000元月薪,注明不需陪睡

火山詩(shī)話
2026-05-13 08:59:22
全國(guó)物業(yè)費(fèi)收繳率多年下滑,多地倡議黨員先繳物業(yè)費(fèi)引爭(zhēng)議

全國(guó)物業(yè)費(fèi)收繳率多年下滑,多地倡議黨員先繳物業(yè)費(fèi)引爭(zhēng)議

南方都市報(bào)
2026-05-14 11:15:55
攤牌了!特朗普訪華第一天,中方在臺(tái)灣問題上直接劃死線

攤牌了!特朗普訪華第一天,中方在臺(tái)灣問題上直接劃死線

蘭亭墨未干
2026-05-14 17:34:26
快評(píng)丨登機(jī)皮衣落地西裝,黃仁勛“換裝”背后藏著哪些深意

快評(píng)丨登機(jī)皮衣落地西裝,黃仁勛“換裝”背后藏著哪些深意

紅星新聞
2026-05-14 17:18:16
64歲陳秀雯近況曝光,“消失”6年變了模樣,那么美卻被婚姻毀了

64歲陳秀雯近況曝光,“消失”6年變了模樣,那么美卻被婚姻毀了

文刀貳
2026-05-13 23:25:20
驚險(xiǎn)!深圳街頭驚現(xiàn)巨蟒盤踞馬路正中嚇壞路人

驚險(xiǎn)!深圳街頭驚現(xiàn)巨蟒盤踞馬路正中嚇壞路人

看看新聞Knews
2026-05-14 12:28:05
塔吉克斯坦總統(tǒng)在重慶觀看無(wú)人機(jī)燈光秀,不時(shí)鼓掌稱贊

塔吉克斯坦總統(tǒng)在重慶觀看無(wú)人機(jī)燈光秀,不時(shí)鼓掌稱贊

上觀新聞
2026-05-14 12:38:14
武漢鉑萊華快捷酒店消殺人員錯(cuò)開女子房門!雙方和解店方賠償

武漢鉑萊華快捷酒店消殺人員錯(cuò)開女子房門!雙方和解店方賠償

南方都市報(bào)
2026-05-14 17:38:24
德媒爆猛料!美國(guó)聲望崩成渣,中國(guó)反超還碾壓俄羅斯?

德媒爆猛料!美國(guó)聲望崩成渣,中國(guó)反超還碾壓俄羅斯?

収起了底線
2026-05-14 16:35:37
鄧亞萍一句話說(shuō)透,張本智和不是輸給梁靖崑,是輸給了這三個(gè)字

鄧亞萍一句話說(shuō)透,張本智和不是輸給梁靖崑,是輸給了這三個(gè)字

小叨娛樂
2026-05-14 13:27:43
2026-05-14 18:15:00
雙鏈生信
雙鏈生信
專注于分享學(xué)術(shù)方面的代碼與寫作、解讀論文以及生物信息學(xué)的相關(guān)科普
60文章數(shù) 7關(guān)注度
往期回顧 全部

科技要聞

馬斯克說(shuō)會(huì)談很順利 黃仁勛點(diǎn)贊 庫(kù)克比耶

頭條要聞

媒體:中美元首會(huì)談超2小時(shí)15分鐘 兩國(guó)關(guān)系有新定位

頭條要聞

媒體:中美元首會(huì)談超2小時(shí)15分鐘 兩國(guó)關(guān)系有新定位

體育要聞

爭(zhēng)議抽象天王山,和季后賽最穩(wěn)定中鋒

娛樂要聞

何九華官宣當(dāng)爸!全程不提孩子?jì)?/h3>

財(cái)經(jīng)要聞

習(xí)近平同美國(guó)總統(tǒng)特朗普會(huì)談

汽車要聞

新時(shí)代傳統(tǒng)豪華是什么樣? 上汽奧迪E7X給出了自己的答案

態(tài)度原創(chuàng)

旅游
時(shí)尚
房產(chǎn)
教育
藝術(shù)

旅游要聞

2026年靜安文旅消費(fèi)季來(lái)了,首輪文旅消費(fèi)券將于5月18日開搶

T恤+低腰闊腿褲、襯衫+低腰半裙,今年夏天最時(shí)髦的搭配,誰(shuí)穿誰(shuí)好看!

房產(chǎn)要聞

海南樓市新政要出!擬調(diào)公積金貸款額度,最高可貸168萬(wàn)!

教育要聞

開始報(bào)名!第十八屆北京市中小學(xué)生科學(xué)建議活動(dòng)通知發(fā)布

藝術(shù)要聞

這才是草書源頭法帖!揭露古人不外傳的筆法,王羲之也要叫“祖師爺”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版