![]()
整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
如果把時間撥回 2020 年,大多數 AI 從業者討論的還是 GPT-3 到底有多強。
彼時,生成式 AI 尚未成為全球焦點,ChatGPT 還要兩年后才會問世,大模型更沒有掀起如今席卷全球的投資狂潮。可就在那一年,一位谷歌頂級 AI 研究員卻因為一篇尚未發表的論文,與公司爆發激烈沖突,并最終失去了工作。
當時很多人以為,這不過是硅谷又一次關于職場管理、學術發表和企業文化的爭議;可如今再回頭看,人們才發現,那篇論文中的警告,幾乎全部在現實世界中應驗了。
而被解雇的研究員,正是 AI 倫理研究領域最具影響力的人物之一——Timnit Gebru。
![]()
一場震動AI圈的“解雇事件”
2020 年 12 月,Timnit Gebru 在社交平臺發布消息稱,自己已被谷歌解雇。
消息迅速引爆整個 AI 研究圈。因為當時的 Gebru 并非一名普通的研究員,而是谷歌倫理 AI 團隊(Ethical AI Team)聯合負責人,也是全球 AI 公平性與算法偏見研究領域的知名學者之一。
出生于埃塞俄比亞的 Gebru 長期關注 AI 中的種族偏見、性別歧視以及社會公平問題。在加入谷歌之前,她曾在斯坦福大學從事研究。2018 年,她參與發表的一篇關于算法偏見的研究,被許多人視為 AI 公平性研究的重要轉折點。同年,谷歌將她招入麾下,并高調展示公司對“負責任AI(Responsible AI)”的重視。
然而僅僅兩年后,雙方便走向決裂。
當時,谷歌對外給出的說法是Gebru主動辭職,但 Gebru 本人則給出了完全不同的版本:她表示,自己是在休假期間收到公司郵件,被告知離職立即生效,所有內部系統權限和郵箱訪問權限同時被關閉。
在她看來,這是一場毫無疑問的解雇。
隨后,超 4000名谷歌員工和業內人士簽署公開信,對公司的處理方式提出質疑,要求給 Gebru 復職——而這一切的導火索,是一篇僅有 14 頁的學術論文。
CSDN 6 月寵粉福利|開發者“神裝”補給站
200 小時 GPU 算力免費領
瑞幸咖啡/肯德基早餐/下午茶等能量套餐任選其一
入群還可每月定期抽取旗艦顯卡、AI PC 等極客神裝
領取地址:https://s.csdn.cn/4nPsOp
![]()
一篇 14 頁的論文引發爭議
這篇論文名為《On the Dangers of Stochastic Parrots》(《隨機鸚鵡的危險》),作者包括 Timnit Gebru、華盛頓大學語言學教授 Emily Bender,以及另外兩位研究人員,被引用次數目前已超 1.4 萬次。
后來,“隨機鸚鵡”這個名稱也廣為流傳。(論文地址:https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)
論文中指出,大型語言模型本質上是在統計規律基礎上復現語言模式:它們能夠生成流暢、自然甚至富有邏輯的文本,卻并不真正理解語言的含義——就像一只學會模仿人類說話的鸚鵡,看似聰明,實則這種模仿只是建立在海量互聯網文本之上。而互聯網本身充滿了偏見、歧視和仇恨內容。因此,大模型極有可能將這些問題一并學習進去,并在生成內容時繼續放大。
要知道,那可是2020年,當時GPT-3剛發布、ChatGPT尚未誕生、大模型熱潮也遠未到來,這篇論文就已經提前預言了今天整個行業最頭疼的問題之一。
該論文提交至頂級 AI 倫理會議后,谷歌管理層卻提出要求:撤回論文,或者移除谷歌研究人員的署名。而 Gebru 拒絕了,她要求公司說明具體原因,并希望雙方能展開進一步討論。
與此同時,她還向谷歌內部員工群組發了一封措辭激烈的郵件。
在郵件中,Gebru 批評谷歌在推動少數族裔招聘和解決內部不平等問題上缺乏實際行動。她寫道:“當你開始為弱勢群體發聲時,你的處境就會越來越糟。你會讓其他領導層感到不舒服。”她還表示:如果公司始終無法解釋為何要撤回論文,那她將在適當的時候選擇離職。
事情的發展遠超她的預料。Gebru 表示,谷歌隨后回復稱不會滿足她提出的要求,并直接接受了她的“辭職”,立即取消了她的所有訪問權限。
當時,該事件迅速演變成全球 AI 領域最具爭議的話題之一。
![]()
當年看似激進的觀點,如今已成現實
真正讓這起事件持續被討論至今的,并不是解雇本身,而是那篇論文里的內容——因為今天回頭再看,其中提出的幾乎每一個擔憂,都已經變成AI行業正在面對的現實問題。
(1)第一項預警:模型會“胡說八道”
2020 年時,GPT-3 剛剛發布。當時人們驚嘆于模型生成文本的能力,卻很少有人認真討論其可靠性。
Gebru 和 Bender 則指出:隨著模型規模不斷擴大,人們會越來越容易把流暢表達誤認為真正理解。模型看起來像是在思考,實際上只是在預測下一個最可能出現的詞,因此,它們遲早會生成看似合理卻完全錯誤的信息。
而今天,這個問題有了一個所有人都熟悉的名字:AI幻覺(Hallucination)。無論是 ChatGPT、Gemini、Claude 還是其他先進模型,幻覺問題至今仍未被徹底解決。
某種意義上來說,該論文在“幻覺”成為行業熱詞之前,就已經準確預見了它。
(2)第二項預警:偏見不會消失,而會被放大
論文還指出,互聯網本身并不是中立的數據來源,訓練數據天然就包含各種種族、性別、文化和地域偏見。模型不僅會學習這些偏見,還可能因為優化機制進一步強化它們。
后來,各種現實問題驗證了這一擔憂:
亞馬遜曾嘗試利用AI篩選求職簡歷,結果系統會自動降低包含“women(女性)”等關鍵詞簡歷的評分。
美國多家大型醫院使用的醫療風險評估系統被發現,長期低估黑人患者的醫療需求。
蘋果信用卡 Apple Card 也曾因女性獲得的信用額度遠低于男性而引發監管關注。
這些案例都說明,算法并沒有自動實現公平,相反還可能將現實世界中的不平等以更加隱蔽的方式固化下來。
(3)第三項預警:AI的能源消耗將成為新問題
在 2020 年,算力成本遠沒有今天這樣受到關注,但那篇論文已經開始討論訓練超大模型帶來的環境影響。據研究人員測算,訓練一個大型語言模型所產生的碳排放量,相當于五輛汽車整個生命周期的排放總和——當時,這一說法被不少人認為過于悲觀。
然而,隨著 AI 基礎設施建設進入軍備競賽階段,問題迅速顯現:根據谷歌公開披露的數據,2024 年公司溫室氣體排放量相比 2019 年增長 48%;微軟同期也增長約 29%。這兩家公司都明確表示,AI 數據中心和算力基礎設施是重要原因之一。
有些諷刺的是,這些科技巨頭幾年前還在高調宣傳碳中和目標。
(4)第四項預警:沒人真正知道訓練數據里有什么
在很多人眼中,訓練數據似乎只是一個工程問題。但Gebru認為,隨著數據規模越來越大,完整審計訓練數據將變得幾乎不可能。
她的觀點再次應驗:2023 年,研究人員發現廣泛用于訓練圖像生成模型的數據集 LAION-5B 中,存在大量兒童虐待圖片,包括 Stable Diffusion 在內的多個主流模型都曾使用這一數據集。
意料之中,許多開發者此前并不知道這些內容的存在。也就是說,即便是模型開發者自己,也未必真正了解模型“吃進去”的是什么——而這恰恰是論文最早提出的問題之一。
(5)第五項預警:互聯網將逐漸被AI內容占據
在谷歌看來,這可能才是整篇論文最敏感的部分。Gebru 和 Bender 認為,大模型的發展最終會把語言和文化的話語權集中到極少數科技巨頭手中。原因很簡單:訓練超大模型需要海量資金、算力和數據資源,真正有能力參與競爭的公司屈指可數。
久而久之,互聯網中的主流聲音將逐漸演變成:由少數公司訓練出的統計平均值,然后再以“中立助手”的身份向全世界傳播。與此同時,那些在訓練數據中占比較低的語言和文化則會被進一步邊緣化。
更嚴重的是,當AI生成內容再次進入互聯網,并成為下一輪訓練數據時,問題還會不斷自我強化——這正是如今研究人員所說的:“模型崩潰(Model Collapse)”。
2024 年的一項研究就發現,英文互聯網新增內容中,約 57% 已經是 AI 生成或 AI 輔助生成;而針對低資源語言的研究則發現,由于訓練數據越來越多地來自 AI 生成內容,部分語言的翻譯質量已經出現明顯退化。
換句話說,這篇論文不僅預測到了“模型崩潰”現象,甚至在這個概念正式出現之前,就已經指出了其形成機制。
![]()
離開谷歌后,她選擇繼續研究
當年事件發生后,很多人后來將 Gebru 描述成“反 AI 人士”。其實并不是的,她從未主張停止發展 AI。從始至終,她質疑的是另一件事:
到底是誰在決定AI的發展方向?
在她看來,推動大模型發展的研究人員和管理層往往擁有相似背景,服務于相似的商業目標,并受到相同的競爭壓力驅動。在這樣的激勵機制下,更快地發布產品、更快地擴大用戶規模、更快地贏得市場競爭,往往比安全、公平和倫理問題擁有更高的優先級。
而所有試圖減緩這一進程的人,都可能被視為阻礙者。諷刺的是,Gebru 正是在谷歌內部提出的這一觀點,而谷歌通過解雇她,也讓這一觀點獲得了最具戲劇性的現實注腳。
更令人唏噓的是,事件發生后不久,另一位倫理AI團隊聯合負責人 Margaret Mitchell 也被解雇——短短 90 天內,谷歌曾經那個引以為傲的倫理 AI 團隊基本被瓦解。
離開谷歌后,2021 年 Gebru 創立了分布式 AI 研究所(DAIR,Distributed AI Research Institute)。與大型科技公司不同,這家機構希望在商業利益之外開展 AI 研究,其目標很直接:研究那些科技巨頭未必愿意面對的問題。過去幾年里,DAIR 持續關注數據來源、算法公平性、語言多樣性以及 AI 產業權力集中等議題。
![]()
而隨著生成式 AI 爆發式發展,越來越多研究者也開始重新關注那篇《隨機鸚鵡的危險》:因為他們發現,當年論文中被視為過度擔憂的問題,如今已成為行業每天都在討論的現實。
![]()
或許,她只是比其他人更早看到了問題
六年過去,關于 Timnit Gebru 與谷歌之間的是非爭議,外界或許永遠無法獲得一個所有人都認同的答案。
谷歌認為,那是一場正常的學術審查與離職事件;Gebru則認為,自己因為堅持發表研究成果而遭到打壓。但有一點已經越來越難以否認:
那篇導致她離開谷歌的論文,并沒有隨著爭議結束而失去意義。
恰恰相反,它討論的幻覺、偏見、數據污染、環境成本、模型崩潰和權力集中等問題,如今已經成為整個 AI 產業無法回避的話題。
有時,歷史會以一種出人意料的方式給出評價。
2020 年,很多人覺得 Timnit Gebru 太悲觀了;
2026 年,人們開始意識到,她或許只是比其他人更早看到了問題。
參考鏈接:https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from
開發者“神裝”補給站|CSDN 6 月寵粉福利
不論你是想跑通最新的本地 LLM,還是想實測一套 Agent 自動化工作流,算力與補給,我們都為你備齊了!
立領三重進階大禮:
200 小時云端算力券免費領(只限 6 月領取)
瑞幸咖啡/肯德基早餐/下午茶任選其一
掃碼即刻領取,今日額度有限,手慢無!
領取地址:https://s.csdn.cn/4nPsOp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.