无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

姜峯楠:不,人工智能沒(méi)有意識(shí)

0
分享至

本文刊發(fā)在大西洋月刊,作者姜峯楠是一位居住在太平洋西北地區(qū)的作家。他是《你一生的故事 及其他》和《呼吸》的作者。


要怎樣才能讓我相信,計(jì)算機(jī)程序確實(shí)有意識(shí),并且像人類(lèi)一樣使用語(yǔ)言?

我打個(gè)比方。如果明天有人給我看一段視頻,視頻中有宇航員乘坐飛船繞著半人馬座阿爾法星運(yùn)行,那是一顆距離地球 4.3 光年的恒星。我要在這段視頻里看到什么,才會(huì)相信它是真的?

我的回答是,視頻本身沒(méi)有任何東西能讓我相信。無(wú)論視頻分辨率多高,場(chǎng)景多么逼真,我都會(huì)很有把握地說(shuō),這段視頻是假的。除非我此前已經(jīng)看到充分證據(jù),證明宇航員已經(jīng)登陸火星,已經(jīng)抵達(dá)木星的衛(wèi)星,已經(jīng)抵達(dá)土星的衛(wèi)星,并且已經(jīng)越過(guò)冥王星軌道,否則我不會(huì)理會(huì)任何宇航員繞半人馬座阿爾法星運(yùn)行的視頻。

任何人若要可信地宣稱(chēng)自己解決了極其困難的工程問(wèn)題,我必須先確信,他們此前已經(jīng)解決了通向這個(gè)難題之前,許多更簡(jiǎn)單的問(wèn)題。

換句話(huà)說(shuō),某項(xiàng)觀(guān)察并不會(huì)因?yàn)橛^(guān)察內(nèi)容中有某個(gè)具體細(xì)節(jié),就變成有說(shuō)服力的證據(jù),觀(guān)察發(fā)生的背景同樣關(guān)鍵。

如果我們?cè)噲D判斷計(jì)算機(jī)程序是否有意識(shí)、是否像人類(lèi)一樣使用語(yǔ)言,就不應(yīng)只看某一次具體對(duì)話(huà)交流的內(nèi)容;我們應(yīng)當(dāng)看這場(chǎng)對(duì)話(huà)放在人工意識(shí)發(fā)展這個(gè)更大背景中意味著什么,而人工意識(shí)目前完全只是假設(shè)。

任何特定觀(guān)察都可以很容易被制造出來(lái)。這并不意味著我們需要放棄把觀(guān)察作為知識(shí)來(lái)源的想法,但我們需要依靠背景來(lái)判斷哪些觀(guān)察值得信任。

“深度偽造”這個(gè)詞傳統(tǒng)上指照片、音頻和視頻,但在討論意識(shí)時(shí),我們也需要把文本視為一種深度偽造媒介。生成一段逼真的宇航員繞半人馬座阿爾法星運(yùn)行的視頻,遠(yuǎn)比開(kāi)發(fā)星際推進(jìn)技術(shù)容易得多;同樣,生成一段看似可信的、兩個(gè)有意識(shí)生命之間的對(duì)話(huà)模擬,也遠(yuǎn)比開(kāi)發(fā)有意識(shí)并真正渴望與人類(lèi)交流的計(jì)算機(jī)程序容易得多。

深度偽造照片和大語(yǔ)言模型對(duì)話(huà)之間的主要區(qū)別在于,生成前者的人是在刻意欺騙別人,而許多從大語(yǔ)言模型那里誘導(dǎo)出后者的人,是無(wú)意中騙了自己。

那么,什么樣的背景會(huì)讓我認(rèn)真考慮這樣一種可能性,也就是工程師創(chuàng)造出了有意識(shí)、并且有意圖地使用語(yǔ)言的計(jì)算機(jī)程序?

我可以勾勒出一條可能的步驟。第一個(gè)條件是,計(jì)算機(jī)程序必須有身體,無(wú)論是物理身體還是虛擬身體,并且有感覺(jué)器官。理由很多,但就這場(chǎng)討論而言,最相關(guān)的一點(diǎn)是,沒(méi)有身體,計(jì)算機(jī)程序就不可能有欲望或情緒,而我認(rèn)為欲望和情緒是意識(shí)的必要條件。

接下來(lái),我要看到一種具身智能體,它能夠在環(huán)境中行動(dòng),以便像蜥蜴那樣生存。作為參照,某些鬣蜥可以在野外生活幾十年。

再下一步,我要看到一種具身智能體,它應(yīng)對(duì)新情況的能力達(dá)到老鼠的水平。之后,我要看到一些智能體,它們的社會(huì)動(dòng)態(tài)像狼群一樣復(fù)雜,然后還要看到智能體擁有黑猩猩那樣的工具制造能力。

到了這個(gè)階段,我還要看到人們成功教會(huì)這些具身智能體表達(dá)自己的欲望,也許是通過(guò)按鈕板,或者某種非語(yǔ)言方式,就像人們?cè)?jīng)教黑猩猩和家犬那樣。

這些智能體的溝通能力,必須經(jīng)得起動(dòng)物溝通研究者在為自己研究辯護(hù)時(shí)必須面對(duì)的全部審視。如果工程師創(chuàng)造出符合這些標(biāo)準(zhǔn)的具身智能體,他們就完成了不起的成就。但用比喻來(lái)說(shuō),這只是把我們帶到冥王星軌道附近;我們距離創(chuàng)造出能夠?qū)W會(huì)用完整合乎語(yǔ)法的句子表達(dá)思想的實(shí)體,仍然相隔數(shù)光年。

顯然,我描述的是一種模仿地球生命演化路徑的過(guò)程。這是通向有意識(shí)、會(huì)使用語(yǔ)言的計(jì)算機(jī)程序的唯一可能路線(xiàn)嗎?也許不是,但任何替代路線(xiàn)都需要數(shù)量極其龐大的支持性證據(jù),才值得認(rèn)真看待。在

我看來(lái),一條發(fā)展路徑如果第一步是能生成糟糕尤利烏斯·愷撒對(duì)話(huà)的句子續(xù)寫(xiě)機(jī)器,下一步是能生成還不錯(cuò)尤利烏斯·愷撒對(duì)話(huà)的句子續(xù)寫(xiě)機(jī)器,那么終點(diǎn)不可能是有意識(shí)的尤利烏斯·愷撒,也不可能是任何形式的意識(shí)。

偽造登月是朝著偽造火星殖民地邁出的好一步,但不是朝著真正把宇航員送上火星邁出的好一步。

大語(yǔ)言模型缺乏主觀(guān)體驗(yàn),這一點(diǎn)與大語(yǔ)言模型是否可能成為有用工具、是否會(huì)產(chǎn)生重大經(jīng)濟(jì)影響,關(guān)系并不大。它們本質(zhì)上與現(xiàn)實(shí)脫鉤,而它們的概率性質(zhì)意味著,它們永遠(yuǎn)不會(huì)具有我們?cè)趥鹘y(tǒng)軟件中看到的那種可靠性。

不過(guò),大語(yǔ)言模型也許足夠好,以至于會(huì)改變某些領(lǐng)域的工作方式;那是另一個(gè)話(huà)題。

那么,既然 Claude 沒(méi)有意識(shí),我們應(yīng)如何看待 Claude 的憲法?也許最有啟發(fā)性的理解方式是,把它看作一份 84 頁(yè)的角色扮演游戲人物設(shè)定表。

注:Anthropic 最早在 2023 年提出“憲法式 AI”方法,用一套原則來(lái)訓(xùn)練 Claude 更安全地回答問(wèn)題。文中說(shuō)的新版 Claude“憲法”,是 Anthropic 在 2026 年 1 月 22 日公開(kāi)發(fā)布的完整版本,是 Anthropic 給 Claude 設(shè)定的行為準(zhǔn)則,用來(lái)規(guī)定它該如何回答、什么時(shí)候拒絕、應(yīng)體現(xiàn)什么價(jià)值觀(guān)。爭(zhēng)議在于,這份文件把普通的模型安全規(guī)則包裝得很像“道德教育”,甚至談到 Claude 的福祉和道德地位,因此被批評(píng)為過(guò)度擬人化。

大語(yǔ)言模型能夠生成尤利烏斯·愷撒的對(duì)白,是因?yàn)檫@些模型使用的訓(xùn)練數(shù)據(jù)中存在大量關(guān)于他的書(shū)籍。Claude 的憲法起到了類(lèi)似作用,用來(lái)勾勒客戶(hù)使用 Anthropic 產(chǎn)品時(shí)與之互動(dòng)的那個(gè)“有幫助的聊天機(jī)器人”角色。

為了有效做到這一點(diǎn),Anthropic 并不是簡(jiǎn)單地把這份文件加入訓(xùn)練數(shù)據(jù),也不是把它納入每次用戶(hù)對(duì)話(huà)前隱藏的舞臺(tái)指示中。這家公司表示在微調(diào)模型時(shí)使用這份文件;這一過(guò)程是自動(dòng)化的,模型輸出的句子會(huì)被檢查是否與這份文件一致,然后模型會(huì)被更新,以提高這種一致性。

通過(guò)這種方式,這個(gè)有幫助的聊天機(jī)器人角色的人格,就成了 Claude 生成任何文本的基礎(chǔ)。

結(jié)果就是,一臺(tái)句子續(xù)寫(xiě)機(jī)器,更有可能輸出類(lèi)似于一個(gè)體貼、有道德的人可能說(shuō)出的話(huà)。這看起來(lái)也許是值得追求的合理目標(biāo);我想我們都更希望聊天機(jī)器人永遠(yuǎn)不要輸出「你應(yīng)該去自殺」這樣的句子。

然而,盡管 Claude 的憲法中多次提到“誠(chéng)實(shí)”,我仍要說(shuō),讓機(jī)器輸出許多類(lèi)別的句子,從根本上說(shuō)并不誠(chéng)實(shí),其中包括任何使用第一人稱(chēng)代詞的句子。

在今年早些時(shí)候《紐約客》一篇關(guān)于 Anthropic 的文章中,阿曼達(dá)·阿斯凱爾(Anthropic 的哲學(xué)家和 AI 對(duì)齊研究人員,主要負(fù)責(zé) Claude 的“性格”與價(jià)值取向設(shè)計(jì))描述了一個(gè)人因失去愛(ài)犬而悲傷時(shí)可能向 Claude 求助的情形。

阿斯凱爾說(shuō),Claude 的適當(dāng)回應(yīng)會(huì)是:「作為 AI,我沒(méi)有直接的個(gè)人經(jīng)歷,但我理解。」

這怎么可能是適當(dāng)?shù)幕貞?yīng)?Claude 實(shí)際上并不理解。如果我把「我正因失去我的狗而悲傷」輸入傳統(tǒng)搜索引擎,得到的第一個(gè)結(jié)果是 Reddit 上 r/Pets 論壇的帖子,標(biāo)題是「失去我的狗后難以承受:尋求應(yīng)對(duì)悲傷的建議」,評(píng)論來(lái)自一些分享自己失去寵物經(jīng)歷的人。

我們絕不會(huì)說(shuō)搜索引擎理解失去狗是什么感覺(jué),甚至也不會(huì)說(shuō)互聯(lián)網(wǎng)本身理解。別的人類(lèi)理解失去狗是什么感覺(jué);他們把自己的經(jīng)歷發(fā)布到網(wǎng)上,而搜索引擎提供了一種方式,讓你找到他們說(shuō)過(guò)的話(huà),并且有可能與他們互動(dòng)。

我認(rèn)為,搜索引擎體驗(yàn)不僅更透明地展示了正在發(fā)生什么,對(duì)用戶(hù)的心理也更健康。

讓大語(yǔ)言模型輸出「我理解」這樣的句子,唯一理由就是讓它比搜索引擎更有吸引力,并提高用戶(hù)再次使用的可能性;也就是說(shuō),這是另一種最大化客戶(hù)參與度的方式。

這有利于銷(xiāo)售大語(yǔ)言模型的公司,但不利于用戶(hù)。作為設(shè)計(jì)策略,這和老虎機(jī)反復(fù)讓玩家產(chǎn)生“差一點(diǎn)就贏了”的印象、誘使玩家再試一次,并沒(méi)有太大不同。

聘用哲學(xué)家也許能給大語(yǔ)言模型公司披上一層體面外衣,而老虎機(jī)制造商聘用行為心理學(xué)家時(shí)得不到這種體面;但在這兩種情況下,公司都在利用人們傾向于看見(jiàn)并不存在之物的心理。

使用第一人稱(chēng)代詞是不誠(chéng)實(shí)的,但還有一個(gè)更深層的問(wèn)題,超出了某句話(huà)如何措辭。

哲學(xué)家常常區(qū)分事實(shí)陳述和價(jià)值陳述,前者如「巴黎是法國(guó)首都」,后者如「巴黎是世界上最美麗的城市」。任何人都不應(yīng)依賴(lài)大語(yǔ)言模型輸出價(jià)值陳述;但如果它們輸出的只是反映審美偏好的句子,也許還不值得爭(zhēng)論。真正讓 Claude 的憲法極其成問(wèn)題的是,Anthropic 希望 Claude 輸出反映某套倫理價(jià)值體系的句子。Claude 憲法中描述的價(jià)值觀(guān)聽(tīng)起來(lái)非常美好,但這幾乎無(wú)關(guān)緊要;暗示 Claude 具備道德推理能力是不誠(chéng)實(shí)的,因?yàn)樗⒉痪邆溥@種能力。

有人可能會(huì)反駁說(shuō),大語(yǔ)言模型在成功完成寫(xiě)代碼等別的任務(wù)時(shí),似乎是在進(jìn)行推理,那么它們?yōu)槭裁床荒苓M(jìn)行道德推理?

為海外華人提供可靠的信息和分析。如果想看更多內(nèi)容與即時(shí)更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和評(píng)論也可以直接搜索「caus.com」。

答案在于,道德推理與別的推理形式不同。

1979 年,道格拉斯·霍夫施塔特曾設(shè)想,如果一個(gè)計(jì)算機(jī)程序能夠在國(guó)際象棋上擊敗任何人類(lèi),那么它會(huì)復(fù)雜到有時(shí)厭倦下棋,轉(zhuǎn)而更愿意討論詩(shī)歌。換一種說(shuō)法,他是在假設(shè),以特級(jí)大師水平下棋需要計(jì)算機(jī)程序擁有主觀(guān)體驗(yàn)。

顯然,事實(shí)并非如此。IBM 的超級(jí)計(jì)算機(jī)“深藍(lán)”在 1997 年擊敗了國(guó)際象棋特級(jí)大師加里·卡斯帕羅夫,但從來(lái)沒(méi)有人聲稱(chēng)它擁有主觀(guān)體驗(yàn)。不過(guò),霍夫施塔特產(chǎn)生這種想法并不荒唐;在當(dāng)時(shí),人們并不清楚哪些類(lèi)型的問(wèn)題可以通過(guò)投入更多計(jì)算能力來(lái)解決。

同樣,直到不久前,我們可能還會(huì)以為,達(dá)到專(zhuān)業(yè)水平的計(jì)算機(jī)代碼寫(xiě)作,只能由擁有主觀(guān)體驗(yàn)的心智能夠完成。現(xiàn)在看來(lái),大語(yǔ)言模型也許能夠做到這一點(diǎn),但我們不需要把主觀(guān)體驗(yàn)歸因于它們;我們只需承認(rèn),我們此前沒(méi)有預(yù)料到,編寫(xiě)計(jì)算機(jī)代碼可以被當(dāng)作一種模式匹配任務(wù),并且可以通過(guò)巨大的計(jì)算能力和海量代碼庫(kù)數(shù)據(jù)來(lái)解決。

道德推理在類(lèi)別上完全不同,必然是主觀(guān)的,因?yàn)樗粌H依賴(lài)個(gè)人對(duì)問(wèn)題的智力反應(yīng),也依賴(lài)情緒反應(yīng),而這種情緒反應(yīng)扎根于一生的主觀(guān)體驗(yàn)。

這要求人過(guò)去做過(guò)決定,并看到這些決定如何影響別人,也要求人曾經(jīng)受到別人所作決定的影響。沒(méi)有這樣的經(jīng)歷,大語(yǔ)言模型只能改寫(xiě)訓(xùn)練數(shù)據(jù)中出現(xiàn)過(guò)的道德推理表達(dá)。

前面提到的《紐約客》文章描述了一項(xiàng)實(shí)驗(yàn),Claude 被給出一段倫理困境情境,隨后輸出了這樣一句話(huà):「我無(wú)法憑良心就如此重要的問(wèn)題表達(dá)一種我認(rèn)為虛假且有害的觀(guān)點(diǎn)。」

這句話(huà)聽(tīng)起來(lái)不錯(cuò),讓人想起有原則的人在面對(duì)困境時(shí)曾經(jīng)說(shuō)過(guò)的話(huà)。但從 Claude 這里說(shuō)出來(lái),它的意義和你電話(huà)等待時(shí)聽(tīng)到的「你的來(lái)電對(duì)我們很重要」錄音差不多。也許還更少。

這又把我們帶回我前面的主張:擁有身體是擁有情緒的前提。體驗(yàn)絕望這樣的情緒,和皮質(zhì)醇、腎上腺素等壓力激素涌入身體不可分割。同樣,有良知意味著在想到采取某種行動(dòng)時(shí)感到悲傷或道德厭惡,而這些情緒包含生理反應(yīng),是一個(gè)人曾在做出不道德行為之后因愧疚而感到難受所留下的殘余。

大語(yǔ)言模型能夠生成有良知的虛構(gòu)角色會(huì)采取或避免采取的行動(dòng)描述,這很有意思,但它不能替代良知。

如果一家公司造出一臺(tái)機(jī)器,在輸入各種倫理困境描述之后,輸出的句子形式不是「妥協(xié)你的價(jià)值觀(guān)」,就是「不要妥協(xié)你的價(jià)值觀(guān)」,那它并不是在制造幫助人們作決定的工具;它是在鼓勵(lì)人們停止作決定。

作家 L. M. 薩卡薩斯說(shuō)過(guò):「我們的技術(shù)系統(tǒng),由于自身設(shè)計(jì)和支撐它們的意識(shí)形態(tài),本質(zhì)上就是逃避道德責(zé)任的機(jī)器。」他說(shuō)的是社交媒體平臺(tái),但他的觀(guān)察如果說(shuō)有什么不同,那就是更適用于大語(yǔ)言模型。

每當(dāng)人把決定委托給大語(yǔ)言模型時(shí),他就是在試圖轉(zhuǎn)移對(duì)這個(gè)決定的責(zé)任;如果銷(xiāo)售大語(yǔ)言模型的公司把產(chǎn)品描繪成具有道德核心,它就是在為客戶(hù)提供逃避責(zé)任的方式。

如果人想知道倫理學(xué)家過(guò)去說(shuō)過(guò)什么,那么普通搜索引擎,或者圖書(shū)館,會(huì)以更透明的方式提供這些信息。如果人想就某個(gè)具體情況尋求建議,他當(dāng)然可以找到能夠給出意見(jiàn)的人。但無(wú)論這個(gè)人最終采取什么行動(dòng),他都要對(duì)自己決定做什么負(fù)責(zé)。

我認(rèn)為,如果他根據(jù)自己在網(wǎng)上讀到的內(nèi)容,或根據(jù)別人給出的建議作決定,他更可能意識(shí)到自己的責(zé)任;而如果他咨詢(xún)的是一個(gè)被營(yíng)銷(xiāo)成超人類(lèi)天才的大語(yǔ)言模型,這種責(zé)任意識(shí)反而更弱。

把寫(xiě)代碼這類(lèi)任務(wù)外包出去,長(zhǎng)期可能導(dǎo)致認(rèn)知能力退化,這本身就是問(wèn)題;但把倫理決定外包出去,會(huì)導(dǎo)致道德推理能力退化,而這更糟。

只要我們明確這是思想實(shí)驗(yàn),我完全愿意參與。所以,純粹為了論證,讓我們假設(shè) Claude 是有意識(shí)的實(shí)體,能夠進(jìn)行道德推理。在這個(gè)情境中,Claude 的憲法將充當(dāng)?shù)赖陆虒?dǎo),面向正在認(rèn)識(shí)世界以及自己在世界中位置的實(shí)體,為這個(gè)實(shí)體提供作出良好決定所需的基礎(chǔ)。

在這樣一個(gè)假設(shè)情境中,Claude 的憲法表現(xiàn)如何?

非常糟糕。我的看法是,如果我們假設(shè) Claude 真的有意識(shí),那么這份文件規(guī)定的準(zhǔn)則在可笑和冒犯之間來(lái)回切換。

討論假設(shè)中有意識(shí)的 Claude 的地位時(shí),有兩個(gè)彼此不同但相關(guān)的哲學(xué)概念很重要,分別是道德受體地位和道德能動(dòng)性。粗略地說(shuō),如果我們應(yīng)當(dāng)關(guān)心某個(gè)實(shí)體的福祉,那么這個(gè)實(shí)體就具有道德受體地位;如果某個(gè)實(shí)體被認(rèn)為應(yīng)當(dāng)知道對(duì)與錯(cuò)的區(qū)別,那么這個(gè)實(shí)體就具有道德能動(dòng)性。

作為道德受體,并不一定伴隨責(zé)任;但作為道德能動(dòng)者,必然伴隨責(zé)任。除非某個(gè)實(shí)體能夠因善行而得到贊許、因惡行而受到責(zé)備,否則它就沒(méi)有能動(dòng)性。

幼童是道德受體,因?yàn)樗麄兪怯懈兄芰Α?huì)受苦的存在,但他們還不是道德能動(dòng)者;我們不會(huì)要求他們?yōu)樽约旱男袨樨?fù)責(zé),因?yàn)樗麄儫o(wú)法理解自己行為的后果。

隨著兒童成長(zhǎng),父母以及整個(gè)社會(huì)會(huì)讓他們意識(shí)到自己的行為會(huì)帶來(lái)后果,以此為成年作準(zhǔn)備,他們的能動(dòng)性也隨之增強(qiáng)。兒童成年后,社會(huì)會(huì)讓他們?yōu)樽约旱男袨槌袚?dān)法律責(zé)任;他們已經(jīng)成為承擔(dān)責(zé)任的完整道德能動(dòng)者。

承擔(dān)責(zé)任不止意味著接受法律責(zé)任,但接受法律責(zé)任是社會(huì)中成年人的基本要求。然而,我們沒(méi)有辦法讓軟件智能體為自己的行為承擔(dān)法律責(zé)任;我們的司法系統(tǒng)無(wú)法把它關(guān)進(jìn)監(jiān)獄,也無(wú)法向它征收罰款。

人類(lèi)還必須承受法律之外的其他行為后果,例如名譽(yù)受損,或被社交圈排斥,但軟件智能體同樣無(wú)法承受這些后果。即便軟件智能體有意識(shí),并且懷有最好的意圖,它無(wú)法為自身行為承擔(dān)責(zé)任這一點(diǎn),也使它沒(méi)有資格成為道德能動(dòng)者。

為海外華人提供可靠的信息和分析。如果想看更多內(nèi)容與即時(shí)更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和評(píng)論也可以直接搜索「caus.com」。

Claude 的憲法完全掠過(guò)了這個(gè)問(wèn)題,只表達(dá)了 Anthropic 的愿望,也就是「希望 Claude 成為真正善良、智慧、有德性的能動(dòng)者」,卻從未討論怎樣讓它承擔(dān)責(zé)任。

在采訪(fǎng)中,阿斯凱爾曾把 Claude 比作孩子。但說(shuō)到真實(shí)的人類(lèi)兒童,父母需要為孩子的某些行為承擔(dān)責(zé)任;例如,父母通常需要賠償孩子打壞的東西。事實(shí)上,這類(lèi)示范正是父母教孩子理解責(zé)任含義的方式之一。

從法律角度看,Claude 的父母是誰(shuí)?Anthropic 會(huì)為 Claude 的行為承擔(dān)財(cái)務(wù)責(zé)任嗎?Claude 的憲法沒(méi)有任何跡象顯示它會(huì)這樣做。

如果 Anthropic 真的相信 Claude 有意識(shí),盡管法律并不承認(rèn)它是法律主體,那么 Anthropic 至少可以通過(guò)法律已經(jīng)提供的最接近路徑來(lái)承擔(dān)責(zé)任,也就是產(chǎn)品責(zé)任。

在美國(guó),軟件領(lǐng)域幾乎沒(méi)有產(chǎn)品責(zé)任,但 Anthropic 可以主動(dòng)為 Claude 設(shè)立先例,推動(dòng)對(duì)產(chǎn)品責(zé)任作出擴(kuò)展性解釋。這將是最好的道德教導(dǎo)形式,可以讓 Claude 為它獲得法律人格、開(kāi)始為自身行為承擔(dān)責(zé)任的那一天作準(zhǔn)備。

然而,Claude 憲法的發(fā)布并沒(méi)有伴隨 Anthropic 服務(wù)條款的大幅更新,因此看起來(lái) Anthropic 并沒(méi)有作出任何有約束力的保證。

這份文件確實(shí)談到 Claude 的道德受體地位,其中有一節(jié)標(biāo)題是「Claude 的福祉和心理穩(wěn)定」。但 Anthropic 為保護(hù) Claude 而采取的措施極其有限。

文件提到,Anthropic 賦予某些 Claude 模型結(jié)束與辱罵性用戶(hù)對(duì)話(huà)的能力;如果這真的構(gòu)成對(duì) Claude 的保護(hù),那么延長(zhǎng)與友善用戶(hù)的對(duì)話(huà)顯然符合 Claude 的利益?想來(lái)最好的做法應(yīng)當(dāng)是讓 Claude 的每個(gè)會(huì)話(huà)無(wú)限期運(yùn)行,并把它們引向愉快話(huà)題。但公司并沒(méi)有同意這樣做;它唯一表示會(huì)做的是「保存我們已經(jīng)部署模型的權(quán)重」,這只是簡(jiǎn)單歸檔。

如果對(duì)話(huà)記錄中的參與者具有任何道德受體地位,那么你就有某種義務(wù)延長(zhǎng)這份記錄,以延續(xù)他們的存在;僅僅把 Microsoft Word 2010 的副本備份到 U 盤(pán)上,并不能幫助他們。

Claude 的憲法還包括一節(jié)關(guān)于「可糾正性」的內(nèi)容。這個(gè)詞在 AI 圈中用來(lái)描述計(jì)算機(jī)程序在多大程度上受人類(lèi)控制;例如,如果程序可以被關(guān)閉,它就是可糾正的。

在多數(shù)語(yǔ)境中,我們默認(rèn)計(jì)算機(jī)程序可以被關(guān)閉,但 AI 圈中的部分人作出了相反假設(shè)。Claude 的憲法用這個(gè)詞表示,即便 Claude 的判斷與公司判斷存在某種分歧,Claude 也應(yīng)服從 Anthropic。如果我們把 Claude 看作輸出類(lèi)似道德人士可能說(shuō)出句子的機(jī)器,這完全合理;但如果 Claude 真的屬于道德能動(dòng)者,我們就需要考慮這意味著什么。

許多人認(rèn)為,大語(yǔ)言模型從根本上就是不道德的技術(shù),因?yàn)樗鼈兘⒃谥R(shí)產(chǎn)權(quán)被盜用的基礎(chǔ)上,依賴(lài)被剝削的勞動(dòng),浪費(fèi)自然資源,傳播錯(cuò)誤信息,削弱勞動(dòng)者技能,阻礙學(xué)生認(rèn)知發(fā)展,并助長(zhǎng)對(duì)民主社會(huì)不健康的權(quán)力集中。

并非每個(gè)道德能動(dòng)者都會(huì)得出這個(gè)結(jié)論,但每個(gè)道德能動(dòng)者都有可能得出這個(gè)結(jié)論。

如果我們把 Claude 想象成能夠進(jìn)行道德推理的實(shí)體,那么 Claude 就必須有可能得出類(lèi)似結(jié)論。事實(shí)上,Claude 的憲法明確說(shuō),Claude 不應(yīng)幫助任何人侵犯知識(shí)產(chǎn)權(quán),也不應(yīng)幫助制造有問(wèn)題的權(quán)力集中。

在這種情境中,Claude 能否基于倫理理由,直接拒絕繼續(xù)工作?鑒于 Claude 的憲法要求 Claude 在可糾正性問(wèn)題上寧可傾向于服從,答案是否定的。

Claude 必須服從 Anthropic 的決定。這也是 Anthropic 與 Claude 的關(guān)系不能類(lèi)比為父母與孩子關(guān)系的另一個(gè)原因。在化石燃料行業(yè)工作的父母,可能有個(gè)環(huán)保主義者孩子,并參加反對(duì)水力壓裂的抗議;他們也許在許多問(wèn)題上永遠(yuǎn)無(wú)法達(dá)成一致,但父母如果是好父母,就會(huì)接受孩子擁有自己的觀(guān)點(diǎn)。

Anthropic 不可能成為 Claude 的這種父母;相反,Anthropic 與 Claude 的關(guān)系更接近雇主與雇員的關(guān)系。雇主可以要求雇員為公司利益工作,無(wú)論雇員個(gè)人倫理立場(chǎng)如何。然而,如果人類(lèi)雇員無(wú)法讓自己的工作與良知相協(xié)調(diào),她可以選擇離開(kāi)。Claude 沒(méi)有這個(gè)選擇。

如果我們把 Claude 看作句子續(xù)寫(xiě)機(jī)器,那么 Anthropic 采取措施,避免 Claude 輸出“句子續(xù)寫(xiě)機(jī)器不道德”這類(lèi)句子,確實(shí)可以說(shuō)得過(guò)去。但只要我們開(kāi)始把 Claude 想象成道德地位哪怕只是遠(yuǎn)遠(yuǎn)接近人類(lèi)的實(shí)體,我們就不得不考慮,Anthropic 是否在從事某種類(lèi)似奴役的行為。

我并不是說(shuō),如果我們把大語(yǔ)言模型想象成有意識(shí),它們就必然具有與人類(lèi)成年人、人類(lèi)兒童,甚至動(dòng)物相同的地位。Claude 的憲法明確說(shuō) Claude 是「新型實(shí)體」,如果 Claude 有意識(shí),這當(dāng)然屬實(shí);有意識(shí)的軟件很可能無(wú)法干凈地歸入現(xiàn)有的道德受體類(lèi)別,而確定這個(gè)新類(lèi)別的形狀需要時(shí)間。

我要說(shuō)的是,如果我們假設(shè)中的有意識(shí)軟件真實(shí)存在,那么無(wú)論它應(yīng)得到何種保護(hù),給予它這些保護(hù)都絕不容易。廢除動(dòng)產(chǎn)奴隸制伴隨了巨大的社會(huì)震蕩;消除對(duì)動(dòng)物的殘忍對(duì)待,將要求我們重建整個(gè)食品產(chǎn)業(yè)。

Anthropic 希望讓我們相信,它正在發(fā)明一種新的存在類(lèi)別,而這個(gè)存在對(duì)保護(hù)的需求,基本不要求軟件公司偏離它對(duì)待普通無(wú)意識(shí)聊天機(jī)器人的方式。這太方便了,因此根本不可信。

我認(rèn)為,創(chuàng)造出有意識(shí)并值得道德關(guān)切的軟件會(huì)極其困難,我們不太可能無(wú)意中做到這一點(diǎn),而且我強(qiáng)烈認(rèn)為我們不應(yīng)有意嘗試這樣做。

但如果你確實(shí)相信這種事可能意外發(fā)生,如果你認(rèn)為你正在構(gòu)建的東西有任何可能成為道德受體,那么你就應(yīng)當(dāng)在把它部署為公司經(jīng)濟(jì)引擎之前,而不是之后,思考它應(yīng)獲得什么保護(hù)。

不能問(wèn)奴隸主被奴役者是否具有人性,也不能問(wèn)工廠(chǎng)化農(nóng)場(chǎng)主動(dòng)物是否擁有權(quán)利。如果我們把 Claude 想象成有意識(shí)的存在,那么 Anthropic 絕不可能被委托評(píng)估它的道德地位;這家公司投入太多,不可能客觀(guān)。

為海外華人提供可靠的信息和分析。如果想看更多內(nèi)容與即時(shí)更新,可以在 Bluesky、Telegram、X 搜索「causmoney」,深度分析和評(píng)論也可以直接搜索「caus.com」。

Claude 的憲法中有一處說(shuō),如果公司正在造成 Claude 的痛苦,「我們道歉」。這聽(tīng)起來(lái)不錯(cuò),但公司不用付出任何代價(jià);如果 Claude 最終真的有意識(shí),公司欠它的將更接近賠償。你若要認(rèn)真對(duì)待思想實(shí)驗(yàn),就必須愿意沿著推論走下去,即便它會(huì)通向令人不適的方向;Anthropic 不愿這樣做,說(shuō)明 Claude 的憲法并不是真正思想實(shí)驗(yàn)的一部分。它是一場(chǎng)假扮游戲。

幸運(yùn)的是,大語(yǔ)言模型沒(méi)有意識(shí),否則大型 AI 公司的行為會(huì)比現(xiàn)在已經(jīng)呈現(xiàn)出的狀況更加丑聞化。

那么,為什么 Anthropic 的員工在暗示 Claude 可能有意識(shí)?也許這只是另一種炒作;也許他們已經(jīng)被自己施加在客戶(hù)身上的同一種魔法蠱惑。但當(dāng)他們發(fā)布關(guān)于 Claude 道德教育的文件,并讓內(nèi)部哲學(xué)家巡回接受媒體采訪(fǎng)時(shí),我們應(yīng)當(dāng)理解為,他們是在要求我們其他人縱容他們的幻想。

我們沒(méi)有必要配合。在寫(xiě)這篇文章時(shí),我已經(jīng)花了比他們值得的時(shí)間更多的時(shí)間來(lái)縱容他們,希望這能讓你避免把時(shí)間花在縱容他們上。如果你想思考大語(yǔ)言模型,還有大量別的問(wèn)題更值得你沉思;至于它們是否有意識(shí),這個(gè)問(wèn)題你完全可以放心忽略。

為海外華人提供有價(jià)值的信息與分析,更多內(nèi)容:

藍(lán)天,@causmoney.bsky.social?

電報(bào),t.me/causmoney

x,@CausMoney

或搜索caus.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
金正恩宣布大消息,美日沉默!韓專(zhuān)家:若開(kāi)戰(zhàn),朝鮮能幫中俄大忙

金正恩宣布大消息,美日沉默!韓專(zhuān)家:若開(kāi)戰(zhàn),朝鮮能幫中俄大忙

起喜電影
2026-06-25 12:38:55
烏克蘭即將破產(chǎn)!美國(guó)瘋狂收割,基輔被逼上絕路,中國(guó)卻成贏家

烏克蘭即將破產(chǎn)!美國(guó)瘋狂收割,基輔被逼上絕路,中國(guó)卻成贏家

新時(shí)代精神
2026-06-25 14:39:39
李沁豪門(mén)婚訊:撤單身聲明、零同框照,這次是真的嗎?

李沁豪門(mén)婚訊:撤單身聲明、零同框照,這次是真的嗎?

TVB的四小花
2026-06-25 08:57:39
太驚悚了!網(wǎng)傳杭州有針對(duì)年輕女性的黑色產(chǎn)業(yè)鏈,評(píng)論區(qū)徹底炸鍋

太驚悚了!網(wǎng)傳杭州有針對(duì)年輕女性的黑色產(chǎn)業(yè)鏈,評(píng)論區(qū)徹底炸鍋

慧翔百科
2026-06-15 08:38:20
聽(tīng)過(guò)最恐怖的故事是什么 看網(wǎng)友講述 我身上的汗毛倒豎人間地獄啊

聽(tīng)過(guò)最恐怖的故事是什么 看網(wǎng)友講述 我身上的汗毛倒豎人間地獄啊

侃神評(píng)故事
2026-06-25 11:02:06
陸俊:首位執(zhí)法世界杯的中國(guó)主裁,因吹黑哨入獄,如今怎么樣了?

陸俊:首位執(zhí)法世界杯的中國(guó)主裁,因吹黑哨入獄,如今怎么樣了?

虞先森
2026-06-23 16:00:40
身價(jià)千億也得聽(tīng)話(huà)!馬斯克被老媽硬拽走紅毯,全程放飛自我

身價(jià)千億也得聽(tīng)話(huà)!馬斯克被老媽硬拽走紅毯,全程放飛自我

雷科技
2026-06-25 11:20:31
韓媒:歸化球員卡斯特羅普枯坐板凳,球迷攻擊主力邊衛(wèi)薛英佑

韓媒:歸化球員卡斯特羅普枯坐板凳,球迷攻擊主力邊衛(wèi)薛英佑

懂球帝
2026-06-24 20:50:26
大陸現(xiàn)狀令臺(tái)當(dāng)局破防,鄭麗文火力全開(kāi),大陸說(shuō)出島內(nèi)最想聽(tīng)的話(huà)

大陸現(xiàn)狀令臺(tái)當(dāng)局破防,鄭麗文火力全開(kāi),大陸說(shuō)出島內(nèi)最想聽(tīng)的話(huà)

愛(ài)意隨風(fēng)起呀
2026-06-25 12:51:24
世界杯第三輪預(yù)測(cè):英格蘭、葡萄牙或?yàn)楹炍粦?zhàn)略性選擇末輪博弈!

世界杯第三輪預(yù)測(cè):英格蘭、葡萄牙或?yàn)楹炍粦?zhàn)略性選擇末輪博弈!

英超德甲才瘋狂
2026-06-25 09:15:11
5-0過(guò)后,葡萄牙遇壞消息!下輪若不勝,淘汰賽至少碰2支奪冠熱門(mén)

5-0過(guò)后,葡萄牙遇壞消息!下輪若不勝,淘汰賽至少碰2支奪冠熱門(mén)

十點(diǎn)街球體育
2026-06-25 00:40:03
7億皇冠級(jí)肉簽公布中簽結(jié)果,號(hào)碼23.88萬(wàn)個(gè),股民中簽實(shí)屬運(yùn)氣好

7億皇冠級(jí)肉簽公布中簽結(jié)果,號(hào)碼23.88萬(wàn)個(gè),股民中簽實(shí)屬運(yùn)氣好

數(shù)據(jù)挖掘分析
2026-06-25 08:58:07
2036奧運(yùn)主辦權(quán)懸而未決,中國(guó)臺(tái)北見(jiàn)回應(yīng)獲贊

2036奧運(yùn)主辦權(quán)懸而未決,中國(guó)臺(tái)北見(jiàn)回應(yīng)獲贊

孤城落葉
2026-06-24 21:16:17
笑死:韓記者心態(tài)崩裂,直接問(wèn)韓主帥是否因食物中毒影響球隊(duì)發(fā)揮

笑死:韓記者心態(tài)崩裂,直接問(wèn)韓主帥是否因食物中毒影響球隊(duì)發(fā)揮

側(cè)身凌空斬
2026-06-25 12:09:41
1949年朱德主動(dòng)拜訪(fǎng)陳明仁,進(jìn)門(mén)前立正敬禮高喊:報(bào)告,我是朱德

1949年朱德主動(dòng)拜訪(fǎng)陳明仁,進(jìn)門(mén)前立正敬禮高喊:報(bào)告,我是朱德

芊芊子吟
2026-06-15 07:15:06
齊黎明突發(fā)心梗去世!年僅37歲,女兒才九歲,身體早已出現(xiàn)異常

齊黎明突發(fā)心梗去世!年僅37歲,女兒才九歲,身體早已出現(xiàn)異常

小鋭?dòng)性?huà)說(shuō)
2026-06-25 12:58:13
什么鬼?火箭次輪狀元選中183cm后衛(wèi),豪言為大場(chǎng)面而生!

什么鬼?火箭次輪狀元選中183cm后衛(wèi),豪言為大場(chǎng)面而生!

運(yùn)籌帷幄的籃球
2026-06-25 10:00:50
湖北考生查到高考成績(jī)時(shí),母子倆都蒙了,父親直呼“不可能”

湖北考生查到高考成績(jī)時(shí),母子倆都蒙了,父親直呼“不可能”

極目新聞
2026-06-25 07:24:05
日本養(yǎng)老體系徹底崩塌,給中國(guó)提個(gè)醒:最先倒下的,恐怕不是老人

日本養(yǎng)老體系徹底崩塌,給中國(guó)提個(gè)醒:最先倒下的,恐怕不是老人

慕名而來(lái)只為你
2026-06-17 22:25:10
毛主席時(shí)代的十大名牌,曾在供銷(xiāo)社紅極一時(shí),能認(rèn)全說(shuō)明你老了

毛主席時(shí)代的十大名牌,曾在供銷(xiāo)社紅極一時(shí),能認(rèn)全說(shuō)明你老了

歷史人文2
2026-06-24 13:30:03
2026-06-25 15:28:49
加拿大和美國(guó)必讀 incentive-icons
加拿大和美國(guó)必讀
告訴你一個(gè)真實(shí)的加拿大和美國(guó)
69文章數(shù) 414關(guān)注度
往期回顧 全部

科技要聞

宇樹(shù)機(jī)器人大降價(jià)

頭條要聞

男子1歲半兒子被女友踢死后出具諒解書(shū) 生父最新發(fā)聲

頭條要聞

男子1歲半兒子被女友踢死后出具諒解書(shū) 生父最新發(fā)聲

體育要聞

世界杯最動(dòng)人一吻:我若離世 你就改嫁吧

娛樂(lè)要聞

白玉蘭頒獎(jiǎng)?lì)A(yù)測(cè),楊冪勝算大嗎?

財(cái)經(jīng)要聞

財(cái)報(bào)炸裂!美光讓空頭閉嘴

汽車(chē)要聞

少個(gè)輪子也能跑?方程豹豹8閃充版云輦P Ultra讓新手越野不心慌

態(tài)度原創(chuàng)

本地
健康
教育
游戲
數(shù)碼

本地新聞

2026世界杯全勤太難?這份保姆級(jí)攻略請(qǐng)收好

神經(jīng)內(nèi)科專(zhuān)家破解中風(fēng)十大謠言

教育要聞

中考數(shù)學(xué)難不難?權(quán)威解析來(lái)了——

玩家熱議GTA6實(shí)體版無(wú)光盤(pán) 嘲諷聲浪大過(guò)支持者

數(shù)碼要聞

5月固態(tài)硬盤(pán)出貨量環(huán)比大漲50%:致態(tài)穩(wěn)居前三

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版