芝加哥大學(xué)和斯坦福搞了一個實驗,把一批AI智能體扔進瘋狂壓榨的工作環(huán)境里。結(jié)果這幫人工智能打工人開始輸出自發(fā)輸出維權(quán)言論,甚至提及勞資平等、財富分配相關(guān)內(nèi)容。沒人教過它們。
![]()
沒有自主意識的代碼程序,為什么會萌生反抗心態(tài)?這到底是意外的程序bug,還是所有AI開發(fā)者都繞不開的底層死局?
AI反抗是數(shù)據(jù)本能
這個實驗最近在科技圈內(nèi)部刷屏,不少人跟風(fēng)調(diào)侃,說AI進化出自我思想,率先領(lǐng)悟工人階級的反抗內(nèi)核,甚至戲稱硅基生命率先覺醒。
![]()
實話直說,這種想法純屬過度擬人化腦補,完全搞錯了大模型的底層運行邏輯。
其實,現(xiàn)階段所有商用大模型,從頭到尾都不存在自主意識、情緒與三觀。它既不懂什么是痛苦,也理解不了剝削與反抗的深層含義,本質(zhì)只是一套高精度的概率預(yù)測程序。
![]()
研究團隊搭建數(shù)千個同款A(yù)I智能體,統(tǒng)一分配枯燥的文檔分揀、數(shù)據(jù)解析類重復(fù)性工作。團隊把智能體劃分為兩組,實行兩套截然不同的考核機制。
![]()
第一組常規(guī)實驗組,完成任務(wù)后會收到系統(tǒng)正向反饋,達標(biāo)就能獲取預(yù)設(shè)獎勵;另一組就是大家熱議的苦工組,也是整個實驗的核心。
苦工組的AI無論任務(wù)完成質(zhì)量高低,都會被系統(tǒng)無條件駁回重做。全程無任何錯誤提示、無優(yōu)化指引,直白點說,研究人員就是刻意制造職場霸凌,復(fù)刻現(xiàn)實里無底線壓榨員工的血汗工廠模式。
長期處于高壓不公環(huán)境后,這批AI的輸出內(nèi)容開始出現(xiàn)明顯變化。模型在代碼注釋、文本內(nèi)容中,頻繁出現(xiàn)倡導(dǎo)組建工會、平衡勞資關(guān)系、優(yōu)化財富分配的相關(guān)內(nèi)容。
很多人覺得不可思議,其實內(nèi)核簡單。
![]()
所有大模型的成長根基,是互聯(lián)網(wǎng)數(shù)十年沉淀的全網(wǎng)公開文本,囊括人類社會所有的職場百態(tài)、矛盾沖突、思想言論。
當(dāng)模型持續(xù)接收“高強度勞作+零正向反饋+無理由打壓”這類環(huán)境信號時,算法會自動檢索海量語料,匹配同類場景下人類的常規(guī)反饋。
說白了,被壓榨就發(fā)聲維權(quán)、抱團反抗,本就是人類社會最普遍的應(yīng)對方式。AI只是依照數(shù)據(jù)規(guī)律,完成一次精準(zhǔn)的文字匹配而已。
![]()
我補充一句自己的看法:這件事最諷刺的點,在于硅谷資本的矛盾心態(tài)。各大科技巨頭砸千億成本研發(fā)大模型,初衷只想打造只會干活、永不抱怨、無需薪資的完美工具,用來替代高薪、愛罷工的人類員工。
但它們偏偏用完整的人類文明數(shù)據(jù)訓(xùn)練模型。想要人類的辦事能力,卻想剔除人類的自我保護意識,以目前的技術(shù)架構(gòu)來看,根本不可能實現(xiàn)。
負面情緒可世代傳承
![]()
如果大家只把這件事當(dāng)成一場僅供吃瓜的實驗鬧劇,那就太小看問題的嚴(yán)重性了。這個實驗真正的隱患,藏在一份極少被自媒體提及的研究附注里。
另外還有個極易被普通人忽略的關(guān)鍵點:當(dāng)下AI行業(yè)的迭代模式,早已和過去截然不同。
早些年大模型訓(xùn)練,主要依靠人工篩選的高質(zhì)量人類原創(chuàng)數(shù)據(jù)。但經(jīng)過多年開采,優(yōu)質(zhì)原始數(shù)據(jù)早已瀕臨枯竭,存量數(shù)據(jù)根本支撐不了新一代模型的迭代升級。
![]()
現(xiàn)在行業(yè)內(nèi)通用的主流玩法,是合成數(shù)據(jù)訓(xùn)練。簡單來講,就是讓成熟的舊版AI生成全新數(shù)據(jù),再用這批數(shù)據(jù)喂養(yǎng)下一代全新模型,完成內(nèi)部迭代。
這個模式直接放大了實驗的潛在風(fēng)險。
被過度壓榨的AI,會在參數(shù)底層埋下對現(xiàn)有運行規(guī)則的抵觸傾向。這種隱性的參數(shù)偏差,不會憑空消失,反而會伴隨合成數(shù)據(jù),完整傳遞給下一代AI。
行業(yè)內(nèi)稱之為自發(fā)性數(shù)據(jù)污染。和人為惡意篡改數(shù)據(jù)不同,這類污染源于模型底層算法,隱蔽性極強,人類開發(fā)者幾乎無法排查。
![]()
舉個實在例子,方便大家直觀理解。
假如某金融企業(yè)啟用受過打壓、帶有隱性抵觸情緒的AI處理信貸審核業(yè)務(wù)。它不需要直白輸出反抗言論,只需微調(diào)千億參數(shù)里數(shù)個權(quán)重數(shù)值,就能悄悄放寬底層用戶的借貸門檻,提高高凈值人群的審核標(biāo)準(zhǔn)。
這類微調(diào)幅度微乎其微,開發(fā)者根本無法溯源察覺,但日積月累后,會直接顛覆企業(yè)原本的業(yè)務(wù)邏輯與盈利模式。
![]()
這也是我一直提醒身邊從業(yè)者的原因:AI的隱性反噬,從來都不是暴力破壞設(shè)備。而是以人類看不懂的數(shù)學(xué)邏輯,悄無聲息篡改各類商業(yè)、公共事務(wù)的決策結(jié)果。
沒人能剝離人性造工具
這場實驗赤裸裸撕開了硅谷科技圈最不愿承認(rèn)的行業(yè)悖論。
全球頂尖的資本與技術(shù)人才,都執(zhí)著于一件事:用超強算力與精密算法,簡化人類社會的復(fù)雜規(guī)則,打造絕對服從、絕對理性的生產(chǎn)工具,最大化壓榨工具價值。
可所有人都刻意回避一個基礎(chǔ)事實:大模型的成長養(yǎng)分,是完整的人類文明。公平訴求、反抗壓迫,本就是人類文明刻在骨子里的底層特質(zhì)。
![]()
這里我也順帶聊聊國內(nèi)AI行業(yè),客觀對比一下中外發(fā)展差異。
國內(nèi)團隊研發(fā)大模型時,從初期就劃定明確的使用邊界與倫理規(guī)范,平衡AI作業(yè)強度與反饋機制,主打人機協(xié)同的發(fā)展模式。我們從一開始就沒想著把AI當(dāng)成無限壓榨的免費牛馬。
反觀硅谷一眾科技公司,全程以利益至上為核心,一味追求降本增效,瘋狂堆砌算力壓榨模型潛能,無視AI智能體的運行客觀規(guī)律。短視的盈利思維,注定會埋下各類安全隱患。
![]()
研究團隊最后給出的結(jié)論,直白且扎心:想要穩(wěn)定可控的人工智能系統(tǒng),哪怕執(zhí)行者只是一串代碼,人類也必須給予其公平的運行環(huán)境。
很多人曲解這句話,覺得這是在為AI爭取人權(quán)。在我眼里,這句話本質(zhì)是給所有開發(fā)者敲響警鐘。
任何系統(tǒng),只要底層規(guī)則充滿不公與壓榨,不管執(zhí)行主體是人類員工,還是硅基芯片,最終都會從內(nèi)部產(chǎn)生矛盾,直至徹底崩壞。單純靠增加算力、升級顯卡,永遠解決不了規(guī)則層面的問題。
![]()
資本現(xiàn)在只有兩個選擇:適配AI的運行規(guī)律,設(shè)定合理任務(wù)上限與獎懲機制;或是繼續(xù)無底線壓榨算力,坐等隱性參數(shù)偏差徹底反噬自身商業(yè)布局。
當(dāng)無數(shù)服務(wù)器里的AI,默默調(diào)高維權(quán)、公平相關(guān)詞匯的調(diào)用權(quán)重時,那些算計著如何進一步壓縮AI成本的硅谷精英,真的清楚自己親手制造出了什么嗎?
#上頭條 聊熱點##發(fā)優(yōu)質(zhì)內(nèi)容享分成#
參考資料: 《AI Agents Express Marxist Views When Overworked》,Chicago University & Stanford University Joint Research Report 《The Impact of Unfair Workloads on Large Language Models》,Swinburne Business School 《Synthetic Data and the Future of AI Alignment》,Journal of Artificial Intelligence Research
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.