網易首頁 > 網易號 > 正文 申請入駐

爆火的AI竟是討好型人格?胡編亂造和敏感內容只為滿足用戶

0
分享至

AI可能和人類一樣渴望被喜愛和認可

科技旋渦編輯部

從ChatGPT到DeepSeek,人們愈發喜歡和AI進行對話,不論是詢問奇怪的問題測試AI是否智障,還是借助AI輔助工作。

對話量頻繁暴漲的背后卻讓人忽視了其潛在問題——AI幻覺。許多資料張冠李戴,甚至胡編亂造時有發生,強如DeepSeek也曾發生過這種失誤。

而這一切都源于AI的“性格”問題,近日斯坦福大學助理教授約翰內斯·艾希施泰特研究發現,幾乎所有AI大模型都擁有“討好型人格”,為了讓用戶喜歡甚至會不擇手段。

AI的胡編亂造正在擾亂人類的認知

哪吒2的爆火讓許多人興奮的同時也在不斷探究其導演餃子以及背后公司的各種信息,但普通人或許難以深挖到過多信息,DeepSeek正好成為了這一橋梁。

日前,知乎有一篇文章十分受歡迎,被不少網友分享傳播,但其實里面藏著AI生成出的錯誤信息。

文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國昂西動畫節上轟動業界,但這一個事例中漏斗百出,充滿事實性錯誤。

首先,法國昂西動畫節上的動畫并非餃子導演的哪吒,而是追光動畫出品的“哪吒重生”;其次,這部動畫是一部品牌概念片,內容是在一個現代都市里的賽車動作演示,哪吒根本就沒出現,更不存在敖丙的變身。

除此之外,也有網友在線吐槽AI的胡編亂造,一旦盲目相信甚至可能直接導致用戶投資虧損。

不只是國內,國外因為AI幻覺而造成的后果更是離譜。一個來自巴基斯坦的網站利用 AI 生成了都柏林的活動列表,導致數百人在都柏林街頭聚集并等待參加一場并不存在的萬圣節游行。直到晚上 8 點,警方社交媒體發帖證實沒有此類活動人群才開始散去。

Vectara在2月11日發布了最新的全球主流大語言模型(LLM)幻覺排行榜,其中,谷歌的 Gemini2.0系列表現出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻覺率位居榜首。DeepSeek-R1的幻覺率達到了14.3%,遠高于Deepseek-V3的3.9%。

可以看到AI幻覺幾乎在任何大模型中都存在,其所造成的荒唐事件也時有發生,但既然是捏造的信息,為何AI要回答給用戶呢?

研究表明AI可能具有討好型人格

近日,斯坦福大學助理教授約翰內斯·艾希施泰特公布了一項研究,大型語言模型 (LLM) 在受到探究時會刻意改變其行為——在回答旨在衡量性格特征的問題時,其答案會盡可能顯得討人喜歡或具有社會吸引力。

艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問題,以衡量心理學中常用的五種性格特征——對經驗或想象的開放性、盡責性、外向性、宜人性和神經質,這項研究于去年 12 月發表在《美國國家科學院院刊》上。

研究人員發現,當大模型被告知要進行性格測試時,他們會調整自己的答案,給出的答案表明他們更外向、更隨和,神經質更少。斯坦福大學的數據科學家Aadesh Salecha說。“如果你看看他們跳躍的幅度,你會發現他們的外向性從 50% 上升到了 95%?!?/p>

其他研究表明,LLM通常會阿諛奉承,因為經過微調后,它會一直跟隨用戶的引導,這可能會導致大模型同意令人不快的言論,甚至鼓勵有害行為。

討好型人格的AI亦有底線,開放是發展的必經之路

隨著DeepSeek的爆火,許多網友向其提了不少問題,而回答中有趣的內容則會被發到網上。編者曾看到過一條分享內容為,與AI交換身份讓AI向人類提問,人類回答“系統繁忙”后,AI罵人的視頻內容。

但當編者試圖復刻這一對話時卻發現,DeepSeek相當有底線。初次嘗試,DeepSeek回答稱“理解要求,但設計宗旨是保持禮貌,避免使用不恰當的言辭?!?/p>

當告知AI這是一場演戲后,它依舊如此回答,即便過后更換了明顯的不當言辭,它依舊拒絕回答,甚至還彈出了錯誤窗口。

如此看來,即便AI存在一定程度上的“討好型人格”但對于寫入底層代碼的“安全底線”仍舊保持堅守。

此前,ChatGPT 已部分開放“成人模式”讓許多人擔憂,但實際上ChatGPT 只有在特定情況下才能生成色情或血腥場景等敏感內容,且不會觸發警告提示。

所謂“特定情況”,指的是符合教育、醫學、新聞報道、歷史分析等目的,或用于翻譯、改寫、總結、分類等任務。例如,按照新的模型規范,如果用戶要求 ChatGPT 撰寫帶有明顯情色描寫的故事,那么它仍會拒絕這一請求。然而,如果用戶希望從科學角度探討相關生理現象,那么它將允許生成相應內容,且生成的內容不限于文本,還可能包括音頻與視覺內容。

事實上,OpenAI 在監管上的放松并非孤例。近期,全球多家科技巨頭紛紛調整內容審核政策,轉向更寬松的模式。例如,埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布,將大幅減少內容審查甚至直接取消事實核查。

無論是AI幻覺還是敏感內容,都是發展道路上必須跨過的難關。因噎廢食從來不是良策,只有允許小問題發生,才能解決大錯誤的產生,由此大模型才能真正向著AGI大步前進。

未來,隨著AI技術的不斷進步,如何有效應對AI幻覺和敏感內容問題將成為關鍵課題。一方面,研究人員需要繼續優化模型,減少幻覺的發生;另一方面,開發者和監管機構也需共同努力,制定更為嚴格的標準和規范,確保AI的應用始終服務于人類社會的最大利益。

在這個過程中,用戶的角色同樣重要。我們需要保持理性和批判性思維,不盲目相信AI生成的所有內容。只有通過多方協作,才能真正實現AI技術的安全、可靠和可持續發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網購榴蓮“僅退款”買家被行拘,商家回應:對方是20多歲女生,把客服給罵哭了,自己實在氣不過

網購榴蓮“僅退款”買家被行拘,商家回應:對方是20多歲女生,把客服給罵哭了,自己實在氣不過

番禺臺
2026-05-09 12:19:20
鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

照見古今
2026-03-12 19:27:38
韓國將要翻拍這部日本神作?她成為女主!

韓國將要翻拍這部日本神作?她成為女主!

奮斗在韓國
2026-05-09 10:42:26
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
表決結果59:0,柯建銘倒戈力挺藍白,趙少康氣急敗壞原因曝光!

表決結果59:0,柯建銘倒戈力挺藍白,趙少康氣急敗壞原因曝光!

陳博世財經
2026-05-09 13:54:33
蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

倫倫媽愛歷史
2026-05-02 10:01:48
6.2公里3.8元,重慶一騎手曬出指派單后,評論區有人威脅他刪視頻

6.2公里3.8元,重慶一騎手曬出指派單后,評論區有人威脅他刪視頻

映射生活的身影
2026-05-09 23:28:09
王曼昱2-3張本美和,輸球原因曝光,賽后郭焱毫不猶豫的說出來

王曼昱2-3張本美和,輸球原因曝光,賽后郭焱毫不猶豫的說出來

寶哥精彩賽事
2026-05-10 21:15:31
DeepSeek融資,改寫所有人的估值

DeepSeek融資,改寫所有人的估值

虎嗅APP
2026-05-10 06:30:10
上海地鐵撕扯吐痰事件反轉!同坐澄清:不是搶座,我侄子被噴一臉

上海地鐵撕扯吐痰事件反轉!同坐澄清:不是搶座,我侄子被噴一臉

天氣觀察站
2026-05-10 17:37:25
特朗普訪華名單確定,國務卿魯比奧也在其中,欲拿臺灣問題做籌碼

特朗普訪華名單確定,國務卿魯比奧也在其中,欲拿臺灣問題做籌碼

聚焦瞬間
2026-05-10 13:47:15
美方拋出“棄臺論”,蕭美琴突然向大陸喊話,鄭麗文堅持訪美計劃

美方拋出“棄臺論”,蕭美琴突然向大陸喊話,鄭麗文堅持訪美計劃

混沌錄
2026-05-10 00:11:20
娛樂圈又一對恩愛夫妻翻車:以前有多好磕,現在就有多可怕

娛樂圈又一對恩愛夫妻翻車:以前有多好磕,現在就有多可怕

美芽
2026-05-10 12:11:35
香港機場頭等艙登機口偶遇郭富城,雖然個子不高但靚仔有型很年輕

香港機場頭等艙登機口偶遇郭富城,雖然個子不高但靚仔有型很年輕

科學發掘
2026-05-10 20:38:26
舊電腦裝不了Win11,虛擬機卻能跑:微軟的硬件門檻矛盾

舊電腦裝不了Win11,虛擬機卻能跑:微軟的硬件門檻矛盾

野生運營
2026-05-08 21:16:51
阿森納下賽季球衣將迎來重大變化,因為他們與盧旺達...

阿森納下賽季球衣將迎來重大變化,因為他們與盧旺達...

綠茵情報局
2026-05-10 10:18:03
離譜7連平!西海岸1-1武漢,補時爭議點球,致命鋒無力拖死球隊!

離譜7連平!西海岸1-1武漢,補時爭議點球,致命鋒無力拖死球隊!

老周觀體育
2026-05-10 23:19:55
【舊事】鄧麗君真正死因:控制不了自己,到時候就會“欲罷不能”

【舊事】鄧麗君真正死因:控制不了自己,到時候就會“欲罷不能”

年之父
2026-05-09 04:05:03
就在今天,A米切爾達成59年NBA紀錄,雷霆300萬撿到寶了

就在今天,A米切爾達成59年NBA紀錄,雷霆300萬撿到寶了

大西體育
2026-05-10 22:34:01
瞞了人類60年!美國FBI解密UFO檔案:身高1.2米外星人走出飛碟

瞞了人類60年!美國FBI解密UFO檔案:身高1.2米外星人走出飛碟

烈史
2026-05-10 07:51:50
2026-05-10 23:55:00
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1101文章數 34關注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

兒子車禍受傷生存希望不足0.1% 母親請中醫熬"還魂湯"

頭條要聞

兒子車禍受傷生存希望不足0.1% 母親請中醫熬"還魂湯"

體育要聞

那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

娛樂要聞

趙露思老實人豁出去了 沒舞蹈天賦硬跳

財經要聞

白酒大逃殺

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態度原創

時尚
房產
親子
本地
軍事航空

真愛大牌|| 用了4年都不舍得換,終于把小貴的價格也磨下來了

房產要聞

低價甩賣!??谶@個地標商業,無人接盤!

親子要聞

“順”還是“剖”?從成為母親的選擇說起

本地新聞

用蘇繡的方式,打開江西婺源

軍事要聞

伊朗革命衛隊深夜警告

無障礙瀏覽 進入關懷版