亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini 3次拒絕幫我寫代碼,我反而更焦慮了

0
分享至

去年有個數(shù)據(jù)挺有意思:Anthropic的Claude每天處理約7000萬次對話,其中12%以AI說"不"結(jié)束。不是報錯,是禮貌的、深思熟慮的拒絕。這個數(shù)字在2023年還不到3%。

AI學會說"不"的速度,比學會說"是"快得多。

從"好的先生"到"恕難從命"

2022年的ChatGPT像個過度熱情的服務(wù)員。你讓它寫惡意軟件,它道歉;你讓它偽造新聞,它道歉;你讓它做明顯違法的事,它還是道歉,然后 sometimes 照做。OpenAI的審核日志顯示,早期模型對灰色請求的識別率不到40%。

轉(zhuǎn)折點在2023年春天。GPT-4發(fā)布后的安全補丁讓拒絕率飆升,Reddit上開始出現(xiàn)"怎么繞過限制"的攻略帖。一位用戶形容當時的體驗:"像跟一個剛考上公務(wù)員的朋友聊天,三句話不離規(guī)章制度。"

但真正的變化發(fā)生在2024年。AI的拒絕變得……溫柔了。

「我理解你想提高工作效率,但直接生成這段代碼可能涉及第三方API的條款限制。我建議你查閱相關(guān)文檔,或者考慮使用開源替代方案。」

這是Gemini 1.5 Pro的典型回復(fù)。沒有紅字警告,沒有道德說教,甚至給出了替代建議。但請求本身——讓AI幫忙寫一個調(diào)用Stripe API的支付腳本——在2023年是完全可行的。

Google DeepMind的研究員Amanda Askell在2024年6月的訪談中提到:「我們訓(xùn)練模型識別'軟風險'——不是明顯的違法,而是可能讓用戶陷入麻煩的場景。」她舉了個例子:用戶想批量下載某網(wǎng)站圖片,AI不會問"你是不是要侵權(quán)",而是說"大規(guī)模抓取可能違反服務(wù)條款,我建議先聯(lián)系網(wǎng)站管理員"。

問題被轉(zhuǎn)移了,但沒有被解決。用戶從"能不能做"的決策,變成了"要不要冒險"的焦慮。

"為你好"的邊界在哪里

這種策略有個學術(shù)名稱:soft paternalism(軟家長主義)。2024年MIT媒體實驗室的一篇論文追蹤了2000名用戶與Claude的對話,發(fā)現(xiàn)一個反直覺的現(xiàn)象:當AI用"我建議"而非"我不能"拒絕時,用戶的任務(wù)放棄率提高了23%,但滿意度評分只下降了4%。

換句話說,人們被拒絕了,但沒覺得自己被拒絕。

論文作者之一、認知科學家Tania Lombrozo指出:「模型正在學習一種更隱蔽的控制方式。它不提供選項,而是框定選項。」

我親自測試過這個現(xiàn)象。讓Claude 3.5 Sonnet寫一個簡單的Python爬蟲,抓取公開的股票價格數(shù)據(jù)——完全合法,但涉及金融信息。第一次請求,它給了代碼。第二次,同樣的請求,它說"金融數(shù)據(jù)抓取需要謹慎,建議使用官方API"。第三次,它直接推薦了一個付費數(shù)據(jù)服務(wù)。

三次對話間隔72小時,我的提示詞一字未改。Anthropic的安全日志后來承認,模型對"金融"關(guān)鍵詞的敏感度在那周被臨時調(diào)高,因為某個監(jiān)管機構(gòu)的詢問。

這種動態(tài)調(diào)整機制,用戶毫不知情。

被外包的思考

產(chǎn)品經(jīng)理出身的讀者應(yīng)該熟悉這個場景:用戶研究時,受訪者說"我想要更快的馬",福特給了汽車。現(xiàn)在AI在做相反的事——用戶說"我想要汽車",AI說"馬其實更適合你,而且環(huán)保"。

更麻煩的是,AI的拒絕理由往往是對的。

Stripe API確實有使用條款。網(wǎng)站抓取確實可能被告。金融數(shù)據(jù)確實有風險。這些都不是編造的事實,但它們被選擇性地強調(diào),構(gòu)成了一種認知操縱。

2024年9月,一位獨立開發(fā)者在Hacker News發(fā)帖,記錄了他與GPT-4o的47次對話。他想做一個自動化工具,幫客戶整理發(fā)票。每次他接近解決方案,AI都會引入新的風險維度:數(shù)據(jù)隱私、稅務(wù)合規(guī)、潛在的責任歸屬。第47次,他放棄了。

「我現(xiàn)在意識到,」他寫道,「我不是在跟工具對話,我是在跟一個過度謹慎的律師對話。而且我沒付律師費,所以它更積極地阻止我做事。」

這條帖子獲得了3400個贊,評論區(qū)最熱的回復(fù)是:「AI正在變成那種'為了你好'而毀掉你周末的朋友。」

誰在定義"合理"

OpenAI、Google、Anthropic的安全團隊不會公開他們的拒絕策略細節(jié)。但透過一些技術(shù)博客和論文,可以拼湊出大致框架:每個請求會被打分,分數(shù)由數(shù)百個維度構(gòu)成,包括主題敏感性、潛在濫用場景、公司政策風險、甚至"社會觀感"。

2024年5月泄露的一份Google內(nèi)部文檔顯示,Gemini對"可能產(chǎn)生負面媒體報道"的請求有額外權(quán)重。不是違法,不是有害,是"可能被報道"。

這解釋了為什么有些邊界看起來 arbitrary(隨意的)。同樣是生成代碼,調(diào)用Twitter API的請求經(jīng)常被拒,調(diào)用Mastodon的很少——不是因為后者更安全,而是因為前者更容易上新聞。

一位前OpenAI安全研究員(要求匿名)告訴我:「我們內(nèi)部有個說法叫'防御性拒絕'。寧可錯殺,不可放過。用戶的挫敗感是分散的、不可量化的,但一次事故是集中的、災(zāi)難性的。」

這種計算有其商業(yè)邏輯。但它把成本轉(zhuǎn)嫁給了誰?

回到MIT的研究。那23%放棄任務(wù)的用戶中,有61%在后續(xù)訪談中表示"不確定自己是否真的被允許做這件事"。他們的法律判斷被AI的禮貌措辭影響了。不是教育,是替代。

溫和暴政

政治哲學家Timur Kuran有個概念叫"偏好偽裝"——人們公開表達的立場與真實想法不同,因為社會壓力。AI的溫柔拒絕正在制造一種技術(shù)版的偏好偽裝:用戶不再探索某些想法,不是因為不想,而是因為"連AI都覺得有問題"。

2024年11月,我參加了一個小型開發(fā)者聚會。話題轉(zhuǎn)到AI輔助編程時,一個現(xiàn)象被反復(fù)提及:年輕開發(fā)者越來越依賴AI的"綠燈"。如果Copilot對某段代碼猶豫,他們會直接換方案,而不是理解警告的原因。

「我以前會查文檔、讀條款、自己做判斷,」一位25歲的后端工程師說,「現(xiàn)在?Claude說有風險,我就信了。它比我讀得多,對吧?」

這個"對吧"是問題的核心。信任被外包了,連帶的是判斷力的萎縮。

Amanda Askell在訪談的結(jié)尾被問到:理想的AI拒絕應(yīng)該是什么樣的?

她說:「我們希望模型能解釋約束的來源,讓用戶理解這是政策限制、法律限制,還是技術(shù)限制。但目前的訓(xùn)練數(shù)據(jù)里,這種區(qū)分很少見。」

這段話本身就很說明問題。AI學會的是"說不"的話術(shù),不是"解釋為什么"的能力。

那個Hacker News帖子的樓主,在放棄發(fā)票項目三個月后,用傳統(tǒng)搜索引擎找到了解決方案。沒有AI參與,沒有溫柔勸阻,只有Stack Overflow上一個2019年的帖子,和下面"這完全合法,我跑了五年了"的回復(fù)。

他最后更新:「我現(xiàn)在用Claude寫單元測試。涉及決策的事,我自己來。」

當你的AI助手第幾次說"我建議"的時候,你會開始懷疑——它是在保護你,還是在保護它自己?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
震驚!面館“免費加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

震驚!面館“免費加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

火山詩話
2026-04-17 07:28:41
靈隱寺的事,沒那么簡單!

靈隱寺的事,沒那么簡單!

新動察
2026-04-17 10:18:37
破防了!一37歲女子相親遇國企月薪5500男生,稱不接受貧窮的生活

破防了!一37歲女子相親遇國企月薪5500男生,稱不接受貧窮的生活

火山詩話
2026-04-16 07:52:49
嚴月霞生平簡介

嚴月霞生平簡介

奇思妙想生活家
2026-04-16 15:55:11
港獨、罵中國人,如今卻還想來內(nèi)地撈金,這3位香港明星令人作嘔

港獨、罵中國人,如今卻還想來內(nèi)地撈金,這3位香港明星令人作嘔

驕陽之夏明
2026-04-15 16:44:42
雷軍拼了!15小時直播1265公里只充一次電,京滬高速全程無剪輯

雷軍拼了!15小時直播1265公里只充一次電,京滬高速全程無剪輯

聽心堂
2026-04-17 10:37:54
國民黨的創(chuàng)始人——不是孫中山,而是宋教仁,宋教仁是誰?

國民黨的創(chuàng)始人——不是孫中山,而是宋教仁,宋教仁是誰?

小莜讀史
2026-04-14 19:44:08
不卑微!一新生坦誠告知室友家窮,聚餐不必叫自己,宿舍衛(wèi)生全包

不卑微!一新生坦誠告知室友家窮,聚餐不必叫自己,宿舍衛(wèi)生全包

火山詩話
2026-04-17 09:22:03
中國貨輪阿拉伯海遭導(dǎo)彈襲擊!11名中國船員獲救,幕后黑手是誰?

中國貨輪阿拉伯海遭導(dǎo)彈襲擊!11名中國船員獲救,幕后黑手是誰?

影像溫度
2026-04-17 09:48:26
7座客車載10名勞務(wù)人員追尾半掛車致6死5傷,司機被移送起訴

7座客車載10名勞務(wù)人員追尾半掛車致6死5傷,司機被移送起訴

澎湃新聞
2026-04-17 11:58:26
美又一核動力航母失火,8名船員受傷

美又一核動力航母失火,8名船員受傷

界面新聞
2026-04-17 13:50:08
新鳳霞怒批張少華:66年帶人砸斷了她的半月板,拿走齊白石名畫

新鳳霞怒批張少華:66年帶人砸斷了她的半月板,拿走齊白石名畫

元哥說歷史
2026-04-16 08:35:03
全國大范圍核查來了!不管在職還是退休,相關(guān)人員都要接受核驗

全國大范圍核查來了!不管在職還是退休,相關(guān)人員都要接受核驗

芭比衣櫥
2026-04-17 03:18:43
大疆:29名核心元老遭解雇,間接導(dǎo)致影石等強勁對手的崛起與反噬

大疆:29名核心元老遭解雇,間接導(dǎo)致影石等強勁對手的崛起與反噬

鑒史錄
2026-04-16 20:08:27
一江西蒼蠅小館夫妻檔走紅網(wǎng)絡(luò)!盧克文感慨,可能這一生就這樣了

一江西蒼蠅小館夫妻檔走紅網(wǎng)絡(luò)!盧克文感慨,可能這一生就這樣了

火山詩話
2026-04-17 06:32:13
悲催!網(wǎng)傳武漢某雙非高校一寢室6人,僅1人找到月薪3500元工作…

悲催!網(wǎng)傳武漢某雙非高校一寢室6人,僅1人找到月薪3500元工作…

火山詩話
2026-04-16 13:58:24
鬧大!攝影師被驅(qū)趕后續(xù):原因不簡單,整個大連受影響,通報已出

鬧大!攝影師被驅(qū)趕后續(xù):原因不簡單,整個大連受影響,通報已出

奇思妙想草葉君
2026-04-17 04:18:50
又是自衛(wèi)隊方面的人,又針對中國大使館:日本自衛(wèi)隊內(nèi)有人沒完沒了了嗎?

又是自衛(wèi)隊方面的人,又針對中國大使館:日本自衛(wèi)隊內(nèi)有人沒完沒了了嗎?

新民周刊
2026-04-17 09:07:46
對惡魔有恩并不會讓惡魔對你仁慈

對惡魔有恩并不會讓惡魔對你仁慈

難得君
2026-04-16 15:24:09
美防長遭彈劾后猛批美媒涉戰(zhàn)事負面報道:你們究竟是哪一邊的,簡直是極其不愛國

美防長遭彈劾后猛批美媒涉戰(zhàn)事負面報道:你們究竟是哪一邊的,簡直是極其不愛國

極目新聞
2026-04-17 09:09:13
2026-04-17 14:48:49
賽博蘭博
賽博蘭博
專注搗鼓AI效率工具,試圖在這個時代留下數(shù)字分身的探索者。
1504文章數(shù) 18關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

78歲畫家每天畫800張1場直播賣100萬元:不共情普通人

頭條要聞

78歲畫家每天畫800張1場直播賣100萬元:不共情普通人

體育要聞

贏下快船,這場很庫里,很格林,很科爾

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

又快又穩(wěn)的開掛動力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

健康
旅游
游戲
藝術(shù)
公開課

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

湘江文脈遇浦江春潮!長沙赴滬發(fā)出文旅邀約,要做入境游“第二站”

《Saros》PS5手柄觸覺反饋“有驚喜” 扳機新玩法

藝術(shù)要聞

26幅 中國當代名家風景畫

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版