![]()
本文來自微信公眾號:黑壩,作者:許昕,頭圖來自:AI生成
我們沒有興趣征服宇宙,我們想把地球延伸到宇宙的邊界,我們不知道怎樣處理其他的世界,我們也不需要其他的世界,我們只需要一面鏡子。 ——斯坦尼斯拉夫?萊姆(Stanis?aw Lem),《索拉里斯星》, 1961年
2020年代初,ChatGPT、Midjourney等新一代生成式人工智能橫空出世平地驚雷,再次引發(fā)人類社會關(guān)于“AI取代人類”的廣泛討論。
這些討論中,“AI不具備情感”、“AI缺少真正的意識”等論點被反復(fù)提及,但始終莫衷一是。拋開那些尚未厘清“情感”“意識”概念的討論,即便是嚴(yán)肅審慎的腦科學(xué)、計算機(jī)科學(xué)探討,缺少了一以貫之的主線,最后也不免丟失問題的錨點,陷入到價值判斷的泥沼。
這條主線,就是進(jìn)化。
事實上,人工智能領(lǐng)域諸多核心問題——不管是人工智能的演進(jìn)方向,還是人工智能與人類的關(guān)系,如果將其置于生命進(jìn)化(尤其大腦進(jìn)化)的視角下審視,答案其實早已收斂。
例如人類奉若圭臬的“情感”,在進(jìn)化初期,只是單純作為一種智力技巧出現(xiàn),解決的是大腦當(dāng)時面臨的諸如“轉(zhuǎn)向”(“恐懼”使個體避開捕食者)、“強(qiáng)化學(xué)習(xí)”(“愉悅”使個體重復(fù)有利于生存和繁殖的行為)等問題。對照2020年代初的人工智能,“當(dāng)(自主智能)機(jī)器糾正了一項使成本升高的動作時,是否可看作機(jī)器在避免疼痛或不適的感覺?當(dāng)用于測量機(jī)器人電池電量的鏡頭元件產(chǎn)生了較高的成本而致使機(jī)器人開始尋找電源時,不正與饑餓的感覺相似嗎?”(楊立昆)
![]()
又如人類的“意識”,或者靈長類動物普遍具有的復(fù)雜“心智”,集中涌現(xiàn)自大腦最晚進(jìn)化出的新皮質(zhì)(由執(zhí)行相同計算、結(jié)構(gòu)相似的新皮質(zhì)柱組成)神經(jīng)突觸之間的連接。而仿照人類大腦構(gòu)建的人工智能神經(jīng)網(wǎng)絡(luò),同樣是由大量相互連接的人工神經(jīng)元組成,執(zhí)行的也是相似的計算,在功能上,與人腦并沒有本質(zhì)差異。
![]()
某種程度上,人工智能在走的路,正是大腦走過的路的重演——同一個世界,同樣的問題,只是換了一種解題的媒介。特奧多修斯·杜布贊斯基(Theodosius Dobzhansky)曾說,“生物學(xué)中的一切,只有從進(jìn)化的角度理解才有意義”,而人工智能,也只有當(dāng)我們轉(zhuǎn)換視角,把它視作進(jìn)化這一宏大進(jìn)程在新媒介上的延伸時,才能真正被理解。
一、第一次涌現(xiàn)
無序是有序的源泉。 ——伊利亞?普利高津(Ilya Prigogine),1984年
費米悖論
1950年代,物理學(xué)家恩里科·費米(Enrico Fermi)提出了著名的“費米悖論”——宇宙是如此浩瀚且古老,理應(yīng)存在大量智慧文明或文明的遺跡,而人類的觀測卻始終一無所獲。
費米的推演大致分四步:
首先,宇宙極大,宜居行星數(shù)量極多。僅銀河系,就有1000億~4000億顆恒星,數(shù)千億顆行星。基于開普勒、TESS、蓋亞等系外行星觀測任務(wù)的統(tǒng)計數(shù)據(jù)外推,大約有數(shù)十億到數(shù)百億顆行星位于恒星的“宜居帶”——具備液態(tài)水以及其他適宜生命出現(xiàn)的條件。
其次,生命一旦出現(xiàn),給予其足夠時間及合適條件,就有可能演化出智慧文明。地球從出現(xiàn)原核生物,到誕生農(nóng)業(yè)文明,經(jīng)歷了約35億年。考慮到宇宙的年齡已經(jīng)138億年,生命具備充足的演化時間。(順著這個思路,“有沒有外星人/外星生命”這個老生常談的問題,也可以轉(zhuǎn)換成為一個樸素的概率推斷:用一個無比大的數(shù)(宜居行星數(shù)量),乘以一個大于0的概率(地球本身證明了行星出現(xiàn)生命的概率不為零),最終的結(jié)果很難讓人相信只是1)
再次,智慧文明發(fā)展到一定程度,出于資源匱乏的壓力和探索未知的沖動,將本能地向外輻射,發(fā)展星際通訊、星際探索,乃至星際擴(kuò)張。
最后,星際擴(kuò)張所需的時間尺度,遠(yuǎn)低于宇宙演化的時間,宇宙理應(yīng)遍布智慧文明(或文明的痕跡)。以銀河系為例,銀河系直徑10萬光年,如果一個文明能以千分之一光速的保守速度航行,且每到一顆星球駐留1000年,完成資源利用與再生產(chǎn)再前往下一站,那么該文明遍布整個銀河系,也只需要1億年(銀河系內(nèi)的宇宙膨脹可忽略),而這還不到銀河系年齡的1%。
但在人類實際觀測中,宇宙卻始終一片沉寂,找尋不到任何地外文明跡象。
于是,費米提出了那個著名的問題:“But where is everybody?”
這個問題至今沒有答案。
可能的解釋有很多。比如“罕見地球假說”——行星產(chǎn)生復(fù)雜生命,需要恰到好處的恒星、恰到好處的行星位置和穩(wěn)定的衛(wèi)星,以及恰到好處的板塊運動等等一連串巧合;又比如“黑暗森林假說”——任何暴露自己位置的文明都可能被消滅,文明要幸存,就必須保持沉默;還有“大過濾器”假說——從無機(jī)物到星際文明的道路上,存在著多道幾乎不可逾越的關(guān)卡,絕大多數(shù)文明都會倒在這些關(guān)卡前。
事實上,費米的前兩步推演之間,就橫亙著這樣一道關(guān)卡——有了液態(tài)水和其他適宜條件,是否一定會從非生命物質(zhì)中,涌現(xiàn)出生命?
要回答這個問題,首先要定義什么是生命。
低熵的生命
一個被廣泛接受的生命定義,是“一種能夠進(jìn)行達(dá)爾文式演化的自維持化學(xué)系統(tǒng)”。
“系統(tǒng)”,本身意味著秩序——一個生命體,不管是0.3微米的支原體細(xì)胞,還是30米長的藍(lán)鯨,內(nèi)部都維持著極高的秩序。這種秩序?qū)訉忧短篆h(huán)環(huán)相扣——眾多基礎(chǔ)原子堆疊,形成蛋白質(zhì)、DNA等生物大分子,生物大分子聚合到脂質(zhì)膜內(nèi),又形成細(xì)胞,功能相近的細(xì)胞結(jié)合,構(gòu)成了組織,組織再組成器官,器官構(gòu)建系統(tǒng),最終形成一個完整生命體。任何一個微小錯位,都有可能導(dǎo)致整個系統(tǒng)的崩潰。
物理學(xué)中有一個專門描述系統(tǒng)混亂程度的概念——熵。熵越高,越混亂;熵越低,越有序。生命的存在,等于在局部區(qū)域,維持了一個低熵狀態(tài)。而根據(jù)熱力學(xué)第二定律,孤立的系統(tǒng)總是熵增的,就好像整理好的房間總是越來越亂,化成水的冰也不會自己重新凝結(jié)。秩序天然傾向于瓦解。
生命要在宇宙中維持自己的低熵狀態(tài),就必須解決兩個問題,一是秩序的維持(對應(yīng)生命定義中的“自維持”),二是秩序的傳承(對應(yīng)定義中的“達(dá)爾文式演化”)。
秩序的維持
秩序的維持,依賴生命源源不斷地從環(huán)境中獲取物質(zhì)與能量。物質(zhì)用來提供維持秩序所需的零部件,如脂質(zhì)、氨基酸、核苷酸等;而能量則用來把這些零部件組裝成具體的秩序結(jié)構(gòu)(比如把脂質(zhì)分子排列成細(xì)胞膜,把氨基酸串聯(lián)折疊成蛋白質(zhì),把核苷酸組裝成DNA),同時修補(bǔ)不斷自發(fā)瓦解的秩序。
物質(zhì)的問題不難解決。1953年的米勒-尤里實驗已經(jīng)證實,氨基酸可以在模擬原始地球大氣的環(huán)境中自發(fā)產(chǎn)生;脂肪酸(脂質(zhì)的一種)也能在礦物表面或熱泉環(huán)境催化下自發(fā)合成;核苷酸的合成更復(fù)雜一些,但研究者同樣找到了可行的非生物路徑——用氰化物、磷酸鹽和硫化物,在紫外線的照射下逐步合成。
更重要的是,這些有機(jī)分子并不只是存在于地球。墜落的隕石、飛掠的彗星、土衛(wèi)六濃厚的大氣,甚至距離地球數(shù)千光年的星際分子云中,都反復(fù)探測到它們的存在。換句話說,構(gòu)成生命的物質(zhì)原材料,或許從來都不是宇宙的稀缺品。
能量的問題更為棘手。地球上幾乎所有生命,不管是動物,還是植物,都依賴于同一套能量機(jī)制——化學(xué)滲透。簡單來說,細(xì)胞會持續(xù)不斷地把氫離子泵到細(xì)胞膜的外側(cè),建立一個高濃度“氫離子水庫”;之后讓氫離子順濃度梯度回流,在回流過程中,推動一個名為ATP合成酶的微型分子渦輪轉(zhuǎn)動,制造出生命的通用能量貨幣ATP。
ATP就像一塊塊充滿電的電池,被運送到細(xì)胞各處水解、釋放能量,驅(qū)動各種需要能量消耗的反應(yīng),比如把氨基酸串聯(lián)折疊成蛋白質(zhì)、把氫離子泵回“水庫”等等。水解之后,ATP變成低能量態(tài)的ADP,再回到化學(xué)滲透系統(tǒng)中重新充電。生命體內(nèi)每時每刻都有數(shù)以億計的ATP分子在這個循環(huán)里來回穿梭,推動秩序的搭建與修補(bǔ)。
![]()
這套能量循環(huán)機(jī)制異常精巧,但過于精巧,反而讓它的起源顯得撲朔迷離。化學(xué)滲透至少需要三個核心元件協(xié)同工作——充當(dāng)“水壩”的細(xì)胞膜、扮演“抽水機(jī)”的離子泵,以及“水力發(fā)電機(jī)”ATP合成酶。三者互相依賴,缺一不可。我們很難想象在生命起源的那一刻,這三個元件恰好同時出現(xiàn)并組裝到一起。而如果沒有這套機(jī)制,最初的生命又無法獲得能量、合成這些元件。經(jīng)典的先有雞還是先有蛋問題。
這個悖論的出口,是進(jìn)化。進(jìn)化并不要求復(fù)雜系統(tǒng)一次成型。如同由瞳孔、晶狀體、視網(wǎng)膜等精密元件組裝的人類眼睛——它的出現(xiàn)也并非一蹴而就,而是從最原始的感光能力開始,憑借一次次微小但真實的生存優(yōu)勢(如辨別明暗、感知方向、模糊成像等等),在長期演化下不斷積累放大,最終演化而成(這條演化鏈上的大多數(shù)中間形態(tài),至今仍能在不同生物身上找到對應(yīng))。化學(xué)滲透拿到的,也是相似的劇本。
![]()
在原始海洋深處,富含氫氣、礦物質(zhì)的弱堿性熱泉水從海底噴出,遭遇溶解了大量二氧化碳、呈弱酸性的海水,礦物質(zhì)在兩股水流的交界處不斷沉淀,形成蜂窩狀的微小空腔。空腔之間的薄壁,天然構(gòu)成了阻隔氫離子自由流動的“水壩”。
與此同時,空腔一側(cè)是弱堿性熱泉水,一側(cè)是弱酸性海水,天然形成了氫離子濃度差——雖然沒有“抽水機(jī)”離子泵,但高濃度“氫離子水庫”卻是現(xiàn)成的。化學(xué)滲透所需要的關(guān)鍵條件,在深海熱泉環(huán)境中,天然具備了大半。只要演化出可以利用氫離子流動合成ATP的“水力發(fā)電機(jī)”ATP合成酶,ATP就能夠源源不斷地產(chǎn)出。
秩序的傳承
生命維持低熵狀態(tài)的另一個必要條件,是秩序的傳承。
秩序傳承,依賴一套能夠跨代傳遞信息的“圖紙”。地球生命選擇的是DNA——一條由A、T、G、C四種堿基,以特定順序排列而成的一維長鏈。這份圖紙的用途,一是信息復(fù)制——依靠堿基之間嚴(yán)格的互補(bǔ)配對關(guān)系(A與T、G與C),DNA解旋一分為二,再以每一半為模板,各自補(bǔ)全形成兩份獨立完整的DNA,傳遞給子細(xì)胞。二是信息表達(dá)——一維的堿基序列被轉(zhuǎn)錄成mRNA,mRNA再翻譯出特定序列的氨基酸,氨基酸鏈自發(fā)折疊,形成三維的蛋白質(zhì),驅(qū)動生命的各項活動。
![]()
DNA復(fù)制有著一套極其精密的工序——解旋、配對、補(bǔ)全,每一步都需要專門的蛋白質(zhì)酶催化。但這同樣導(dǎo)致了雞生蛋蛋生雞悖論——復(fù)制DNA需要酶(其本質(zhì)是蛋白質(zhì))的催化,而合成蛋白質(zhì)又需要DNA圖紙的指導(dǎo)。
進(jìn)化給出的答案是原始RNA。原始RNA的堿基序列與DNA類似,可以攜帶信息,并且它的化學(xué)性質(zhì)比DNA活潑,可以折疊成特定的三維結(jié)構(gòu),像蛋白質(zhì)一樣去驅(qū)動各種生化反應(yīng)。也就是說,一個RNA分子既可以充當(dāng)“圖紙”——作為模板,攜帶、復(fù)制信息;又可以作為“工匠”——折疊成三維立體結(jié)構(gòu),催化包括自我復(fù)制在內(nèi)的各種生化反應(yīng),驅(qū)動最初的生命活動。只要環(huán)境源源不斷地輸入物質(zhì)和能量,秩序傳承的齒輪就能自己轉(zhuǎn)動起來。
涌現(xiàn)
物質(zhì)、能量、信息,這三塊拼圖在化學(xué)層面單獨存在時,都不具備任何“活著”的性質(zhì)——氨基酸不會自我復(fù)制,ATP循環(huán)不攜帶遺傳信息,RNA片段在沒有能量供應(yīng)的試管里只是一條惰性分子鏈。但當(dāng)三者在深海熱泉的某一處微小空腔中,偶然拼接到一起,所組成的整體就“涌現(xiàn)”出所有組成部分不曾具備的全新特性:自維持、可遺傳、能演化。
正因如此,“大過濾器”假說中那道從非生命物質(zhì)到生命的關(guān)卡才顯得格外兇險。它所過濾的不是物質(zhì)和能量,也不是信息,而是三者恰好組合到一起的瞬間。我們可能永遠(yuǎn)無法得知,在宇宙138億年的歲月長河中,在恒河沙數(shù)的宜居行星上,究竟出現(xiàn)過多少次類似瞬間。但至少在地球上,它發(fā)生過一次。也正是這次涌現(xiàn),推倒了進(jìn)化的第一張多米諾骨牌。
而涌現(xiàn)并不止于生命起源。某種程度上,人工智能也在重演這一進(jìn)程。
早期的人工智能,受限于訓(xùn)練數(shù)據(jù)(“物質(zhì)”)、算力(“能量”)與模型參數(shù)規(guī)模(“信息”),能夠完成的大多是機(jī)器翻譯、圖像分類、語音識別這類目標(biāo)明確的單一領(lǐng)域任務(wù)。
隨著數(shù)據(jù)、算力與參數(shù)規(guī)模的持續(xù)擴(kuò)張,模型訓(xùn)練損失(loss)以可預(yù)測的方式平滑走低,模型犯錯越來越少,表現(xiàn)也越來越好,這種現(xiàn)象后來被總結(jié)為“規(guī)模定律(Scaling Law)”。更耐人尋味的是,當(dāng)模型規(guī)模跨越某個“涌現(xiàn)閾值”后,一些此前從未出現(xiàn)的復(fù)雜能力,在模型上如同相變般突然顯現(xiàn)。
例如基于Transformer架構(gòu)的生成式大語言模型,最初的訓(xùn)練目的只是預(yù)測下一個詞元(token),但隨著訓(xùn)練規(guī)模的持續(xù)擴(kuò)大,模型在完成局部預(yù)測任務(wù)的同時,意外顯示出對知識、語義、邏輯乃至人類意圖的抽象建模能力。研究者將這類“小模型上不存在,在大模型上突然出現(xiàn),且無法從小模型外推預(yù)測”的現(xiàn)象,稱為“能力涌現(xiàn)(emergent abilities)”。
![]()
我至今仍記得ChatGPT發(fā)布的那個早晨,從測試它相同問題,每次都能獲得迥然不同但通順回答的驚奇,到不管什么類型、何種程度的自然語言問題,它都能回答的訝異(這些都是我們在做小模型時難以想象的,小模型時代的Chatbot很少“生成”,更多的是基于窮舉的意圖,輸出固定答案或預(yù)設(shè)參數(shù)的模板回復(fù),類似ChatGPT發(fā)布2年后的Siri),再到看到它正確解答了經(jīng)典的“莎莉-安測試(Sally-Anne test)”問題的震撼,那也是我第一次切身感受到機(jī)器智能的“涌現(xiàn)”。
傳統(tǒng)機(jī)器、細(xì)菌受困于0階意向性——不“回答”問題,只“響應(yīng)”刺激;大多數(shù)擁有實體大腦的動物,上限是1階意向性——只知道自己想要什么,但不知道別的個體在想什么;黑猩猩等少數(shù)動物“可能”具備2階意向性——能夠?qū)⒆约旱恼J(rèn)知與其他個體的認(rèn)知區(qū)分開,“莎莉-安測試”測試的就是2階意向性,這也是社交、合作、欺騙的認(rèn)知基礎(chǔ)。
而人類(工作記憶)的上限是5-6階——可以回答諸如“甲認(rèn)為乙相信丙希望丁擔(dān)心戊誤以為己根本不認(rèn)識他”這類復(fù)雜嵌套問題,高階意向性也是人類學(xué)區(qū)分人與其他物種的一個顯著標(biāo)志。暫且拋開“中文房間”等符號主義爭論,ChatGPT等生成式人工智能其實是歷史上第一批人類之外的,可以在表現(xiàn)上解答6階及以上自然語言意向性問題的實體
![]()
OpenAI前研究副總裁、Anthropic的創(chuàng)始人達(dá)里奧·阿莫迪(Dario Amodei)就曾在多個場合表達(dá),“就像化學(xué)反應(yīng)——你需要不同的原料。如果某種原料不夠,反應(yīng)就停了。但如果你按比例把原料放在一起,就能得到爆炸或火焰。對AI來說,這些原料就是數(shù)據(jù)、算力和模型大小。規(guī)模定律告訴你:把這些原料投進(jìn)去,出來的產(chǎn)物就是——智能”,“我懷疑意識是足夠復(fù)雜的系統(tǒng)的涌現(xiàn)屬性——當(dāng)系統(tǒng)復(fù)雜到能夠反思自身決策時,某種東西就出現(xiàn)了。”
對于生命而言,物質(zhì)、能量與信息的耦合,涌現(xiàn)出了最初的自組織系統(tǒng)。而人工智能,則依靠數(shù)據(jù)、算力與參數(shù)規(guī)模的累積,涌現(xiàn)出全新的復(fù)雜智能。這兩個進(jìn)程并不完全相同,但背后卻遵循著同一種規(guī)律:當(dāng)簡單單元以足夠龐大的規(guī)模彼此連接、持續(xù)交互,系統(tǒng)整體便有可能在跨越某個未知臨界點之后,涌現(xiàn)出組成部分本身從未具備的全新特性。
“涌現(xiàn)”按下了進(jìn)化的開關(guān)。但擺在生命面前的,是一個遠(yuǎn)比自身復(fù)雜的世界。那么,一個有限的系統(tǒng),又要如何應(yīng)對一個無限復(fù)雜的世界?
二、世界的投影
我的語言的界限就是我的世界的界限。 ——維特根斯坦(Ludwig Wittgenstein),《邏輯哲學(xué)論》,1921年
設(shè)想這樣一個場景:一名人類宇航員降落在一個與地球極其相似的行星上,那里有液態(tài)海洋、山川湖泊、茂密森林,甚至還有某種看上去像是蘋果的果實。禁不住誘惑的宇航員摘下一顆咬了一口。他會中毒嗎?——大概率不會。既不會中毒,也無法從中獲得任何營養(yǎng)。原因很簡單:人類與這顆異星果實經(jīng)歷的是完全獨立的進(jìn)化路徑,生化機(jī)制幾乎不可能兼容。而人類之所以能以蘋果為食,能被蛇毒麻痹神經(jīng),恰恰是因為地球上的所有細(xì)胞生命,都源自同一棵生命之樹,共享著同一套生化語言。
![]()
沿著地球生命之樹向下回溯,所有分支最終指向了同一個祖先節(jié)點——LUCA(Last Universal Common Ancestor,最后的共同祖先)。LUCA不曾留下任何化石,是僅靠邏輯推理和基因組比對還原出來的遠(yuǎn)古生命。我們之所以相信它存在,是因為現(xiàn)存的所有細(xì)胞生命——不管是動物、植物,還是細(xì)菌、真菌——都共享著一系列基礎(chǔ)生物特征:細(xì)胞結(jié)構(gòu)、ATP驅(qū)動的能量循環(huán)、遺傳密碼和蛋白質(zhì)合成系統(tǒng)等等。奧卡姆的威廉(William of Ockham)曾有過一個樸素判斷——“如無必要,勿增實體”,與其假設(shè)生命在多個獨立起源的情況下分別演化出相同的生化機(jī)制,更合理的解釋是它們同出一源。
某種程度上,整個地球生態(tài),都是LUCA的不同變體。自LUCA之后,生命的演化一脈相承,再未中斷或重啟——每一個“活著”的個體,都繼承了一套在億萬年試錯中沉淀下來的生存算法。這套算法源自生命與世界的長期互動,但它編碼的不是世界本身,而是外部世界在生命內(nèi)部形成的投影。
正因如此,生命才得以以有限的身體,應(yīng)對遠(yuǎn)比自身復(fù)雜得多的世界。此后,生命形態(tài)不斷分化,這幅投影也在不斷延展,但在最初,它的邊界幾乎完全由基因定義。
基因中的世界
神經(jīng)元出現(xiàn)之前的漫長歲月里,生命對環(huán)境的感知都極為被動有限。那時的生命,大多停留在單細(xì)胞形態(tài),沒有眼睛、耳朵,也沒有神經(jīng)系統(tǒng),外界的任何變化,幾乎只能以化學(xué)反應(yīng)的方式觸達(dá)生命——環(huán)境中的分子被細(xì)胞膜受體識別,營養(yǎng)成分進(jìn)入細(xì)胞并參與代謝,有害成分則會干擾細(xì)胞內(nèi)部秩序,觸發(fā)毒性反應(yīng)甚至死亡。刺激與反應(yīng)之間,不存在專門的信息處理層。
不過,被動的只是生命個體,并不包括它背后的生命譜系。那些有助于生命存續(xù)的反應(yīng),比如逆境中的休眠,會經(jīng)由自然選擇沉淀到基因之中;無效或有害的反應(yīng),則隨個體的失敗逐步退出。世界在生命內(nèi)部最早的投影,就發(fā)生在這樣的過程里。基因因此成了一份高度壓縮的“生存手冊”——它不解釋世界,卻規(guī)定生命如何應(yīng)對世界。
但這套方案存在一個天然的局限——基因可以把有效反應(yīng)寫進(jìn)堿基序列,卻沒有辦法快速改寫。任何改變,都必須歷經(jīng)一代代個體的繁殖與死亡,在自然選擇機(jī)制的篩選下緩慢積累。環(huán)境一旦發(fā)生劇變,個體往往來不及調(diào)整,只能等待新的適應(yīng)在漫長進(jìn)化中再次形成。
(無獨有偶,基因登場數(shù)十億年后,人類在構(gòu)建大語言模型等人工智能系統(tǒng)時,遭遇了類似的限制——訓(xùn)練一旦完成,模型內(nèi)部的參數(shù)便隨之固定;新的經(jīng)驗無法繼續(xù)寫入,只能等待下一輪訓(xùn)練(這也是我不認(rèn)可早期大語言模型“記憶功能”的原因,因為它并不隨對話或任務(wù)的進(jìn)行,更新模型本身的參數(shù)。本質(zhì)上它只是一個外掛知識庫,而人類并不是這樣去記憶)。基因與參數(shù),隔著數(shù)十億年的演化史,受困于同一種“慢”)
生命需要一種更快的機(jī)制。尤其對于多細(xì)胞動物這一支來說,身體變大、細(xì)胞分工出現(xiàn),它們的生存不再只是代謝和繁殖,還多了收縮、轉(zhuǎn)向、捕食和逃離。動物只要還活著,就必須持續(xù)接收、處理信息,并根據(jù)環(huán)境變化及時調(diào)整行動。
于是,神經(jīng)元出現(xiàn)了。
神經(jīng)元中的世界
神經(jīng)元處理的是實時信息。
水流的擾動、化學(xué)梯度變化等外部刺激,首先會被多細(xì)胞動物體表的感覺細(xì)胞所捕捉(想象模型的輸入層),并轉(zhuǎn)化為電脈沖。電脈沖沿著神經(jīng)元軸突傳導(dǎo),通過突觸(模型的連接+權(quán)重),傳遞給下一個神經(jīng)元。信號經(jīng)過層層傳播,最終抵達(dá)負(fù)責(zé)執(zhí)行動作的效應(yīng)細(xì)胞,驅(qū)動身體的收縮、轉(zhuǎn)向、捕食和逃離(模型輸出)。
![]()
更為重要的是,當(dāng)某種信號模式反復(fù)出現(xiàn),相關(guān)神經(jīng)元之間的連接將逐漸加強(qiáng),而長期不被觸發(fā)的連接,則會減弱甚至消失(權(quán)重的更新)。動物一生中反復(fù)出現(xiàn)的經(jīng)驗?zāi)J剑瓦@樣被壓縮到突觸連接的強(qiáng)弱之中。
相較于單純的化學(xué)反應(yīng),神經(jīng)元帶來的真正變化,是把刺激接入到一套專門的信號傳遞系統(tǒng)。外界的變化不再只是改變附近細(xì)胞的化學(xué)狀態(tài),而是轉(zhuǎn)化為可傳播、可放大的電信號,在身體內(nèi)部擴(kuò)散。
但早期的神經(jīng)系統(tǒng),距離“大腦”還相距甚遠(yuǎn)——神經(jīng)元分散在身體各處,局部連接成網(wǎng),某處受到刺激,附近的神經(jīng)回路隨即被激活,帶動相應(yīng)部位做出反應(yīng)。早期神經(jīng)系統(tǒng)解決的是“從點到面”的快速響應(yīng),但還無法支撐牽動全身的復(fù)雜行動。
大腦中的世界
約5.5億至6億年前,兩側(cè)對稱動物出現(xiàn)了,動物的身體第一次有了穩(wěn)定的前后軸,開始區(qū)分前后、左右、腹背,運動也因此有了更明確的方向。這個看似不起眼的變化,徹底改變了生命與環(huán)境信息交互的方式——對于之前的輻射對稱動物來說,信息是從四面八方同時涌來;而兩側(cè)對稱動物,則是前端更頻繁地接觸未知環(huán)境——食物、障礙、獵物、天敵等與生存密切相關(guān)的信息,更容易從前方進(jìn)入感知范圍。信息也因此出現(xiàn)了強(qiáng)烈的空間偏置。
在運動方向與信息偏置的共同作用下,感覺器官開始向前聚集(“頭化”),與之相連的神經(jīng)元,也隨之向前端匯聚。前端不再只是身體的一個方向,而是逐漸成為生命試探世界的入口。隨著越來越多的信息從前端涌入,神經(jīng)系統(tǒng)也承受著更強(qiáng)的整合壓力——“感覺”需要被匯總,身體需要被協(xié)調(diào),生命也需要在行動之前,判斷是該趨近、避開,還是停留。大腦的雛形,正是在這樣的選擇壓力下出現(xiàn)。
![]()
但信息匯聚到大腦以后,問題并沒有因此了結(jié):這些輸入還需要經(jīng)過加工,才能真正服務(wù)于判斷和行動。而大腦無法平均處理所有海量細(xì)節(jié),只能把注意力投向那些更有區(qū)分度、更能影響行動結(jié)果的結(jié)構(gòu)與特征。
以視覺系統(tǒng)為例,視網(wǎng)膜每秒送往大腦的信息以千萬比特計,但真正進(jìn)入意識、被我們“看到”的,不過幾十比特。這個過程并非粗暴的“有損壓縮”,而是主動的取舍。視網(wǎng)膜并不記錄每一個光點,它優(yōu)先提取的,是明暗邊界、色彩差異、運動方向等更能指導(dǎo)行動的特征。
這些特征信息進(jìn)入視覺皮層以后,會被進(jìn)一步歸并組合:邊界連成輪廓,移動形成軌跡,局部特征匯總成物體、空間與運動。隨后,這些信息沿著不同視覺通路繼續(xù)在腦中傳播,一條通向形態(tài)、顏色和物體的識別(腹側(cè)通路),另一條則通向空間、運動和視覺引導(dǎo)行動(背側(cè)通路)。其中與行動相關(guān)的線索,將被放大凸顯,而重復(fù)、穩(wěn)定的背景,則隱入意識邊緣。就像一面鋪滿整個視野的白墻,幾乎激不起大腦的任何反應(yīng);而白墻上一只爬動的螞蟻,卻會牽動一整片神經(jīng)元同時放電。
![]()
然而,這種取舍不止發(fā)生在看見的瞬間。之后的記憶也是如此。
博爾赫斯在短篇小說《博聞強(qiáng)記的富內(nèi)斯》中,虛構(gòu)過一個擁有完美記憶的人富內(nèi)斯。在一場墜馬后,富內(nèi)斯不再遺忘——他記得天上每一朵云的形狀,也記得見過的每一片葉子上的每一道紋理。然而,富內(nèi)斯卻幾乎無法思考。因為“思考,是遺忘差異,是概括,是抽象”。在富內(nèi)斯那個擁擠不堪的世界里,只剩下纖毫畢現(xiàn)的細(xì)節(jié),沒有一般,也沒有普遍。他看得到一切,卻理解不了任何東西。
富內(nèi)斯的不幸,或者說博爾赫斯用小說寫出的直覺,恰恰說明了遺忘并不是大腦的bug,而是feature——沒有遺忘,經(jīng)驗就無法擺脫細(xì)節(jié)的堆積,理解也就難以發(fā)生。
重要的,從來不是記住一切,而是把注意力投向何處。
這個道理,后來被一群研究員用另一種方式,重新表達(dá)了一遍。
人工智能中的世界
2017年,谷歌團(tuán)隊的8位研究人員發(fā)表了一篇標(biāo)題直白到近乎挑釁的論文《Attention Is All You Need》。這個標(biāo)題,像是對當(dāng)時主流序列模型的宣告:循環(huán)網(wǎng)絡(luò)不是必需的,卷積網(wǎng)絡(luò)也不是必需的,真正重要的,只有注意力。
![]()
論文提出了一種全新的人工智能網(wǎng)絡(luò)架構(gòu)Transformer。它起初只是為機(jī)器翻譯而設(shè)計,卻在日后成為GPT、Claude、Gemini 等幾乎所有大語言模型的共同基座。某種程度上,Transformer之于大語言模型,正如LUCA之于地球生命——枝繁葉茂,皆由此分叉。
Transformer的核心,是一種被稱為“自注意力”的機(jī)制。所謂自注意力,是模型在處理序列中的每一個詞元(token)時,根據(jù)語境計算它與其他詞元的相關(guān)程度,加權(quán)匯總,并據(jù)此更新它的內(nèi)部表征。例如“蘋果”這個詞,本身只是兩個漢字符號,脫離上下文時,我們并不知道它的“所指”。
在“我咬了一口蘋果”這個句子里,“咬”對“蘋果”的權(quán)重更高,把它的含義拉向了水果;而在“蘋果發(fā)布了新版Siri”里,“蘋果”則更多地被“發(fā)布”“Siri”牽引,含義拉向了科技公司。基于自注意力機(jī)制,文本不再是單向的只能從左到右依次讀取的串行鏈條,而是變成了一張彼此參照、動態(tài)重組的關(guān)系網(wǎng)絡(luò)。
不過單個的注意力頭,只能給出一種關(guān)系視角。多頭注意力機(jī)制進(jìn)一步將同一類注意力計算拆解成多個并行的注意力頭,讓同一段文本投向多個不同的表征空間:有的頭捕捉語法結(jié)構(gòu),有的捕捉指代關(guān)系,有的關(guān)注遠(yuǎn)距離依賴,還有的處理局部搭配。最終,這些注意力頭的結(jié)果合并形成更豐富的文本表征。
![]()
這與生命處理世界的方式并不完全相同,但卻命中了同一個規(guī)則:有限系統(tǒng)無法完整承載無限復(fù)雜的外部世界,只能通過篩選、加權(quán)和壓縮,將世界轉(zhuǎn)化為一幅可供預(yù)測和行動的投影。對于生命來說,外部世界被壓縮進(jìn)基因的遺傳編碼、神經(jīng)元的連接強(qiáng)弱,以及大腦表征之中;而大語言模型等人工智能系統(tǒng),則將文本及其他現(xiàn)實世界中的統(tǒng)計規(guī)律,壓縮進(jìn)數(shù)以億計,乃至萬億的權(quán)重參數(shù)之中。
(需要說明的一點是:大語言模型并不會把訓(xùn)練語料原封不動地存進(jìn)某個數(shù)據(jù)庫。訓(xùn)練真正留下來的,是一個龐大的參數(shù)網(wǎng)絡(luò)。以開源模型Llama 3.1 8B為例,它的預(yù)訓(xùn)練數(shù)據(jù)規(guī)模超過15萬億個詞元,而模型本身卻只有80億個參數(shù);按半精度權(quán)重粗略估算,權(quán)重文件只有約16GB)
伊利亞·蘇茨克維(Ilya Sutskever)曾用一個更為直接的觀點概括這一點:表面上看,算法只是學(xué)習(xí)文本在統(tǒng)計學(xué)層面的相關(guān)性,但這些文本實際上是這個世界的映射。算法為了預(yù)測得足夠準(zhǔn),就會學(xué)習(xí)這些文本背后真實世界的規(guī)律和機(jī)制。
沿著這條線索,維特根斯坦那句“我的語言的界限就是我的世界的界限”,在人工智能時代獲得了新的回響:一個系統(tǒng)如何表征世界,就如何抵達(dá)世界。演化的故事并未就此終止。當(dāng)一個系統(tǒng)不僅能表征世界,還能把“自己”放進(jìn)這個世界,那又會發(fā)生什么?
三、情感與意識
所有重大的科學(xué)革命都有一個共同點,那就是它們都把人類的傲慢從一個又一個先前堅信我們是宇宙中心的信念基座上拉下來。 ——西格蒙德·弗洛伊德(Sigmund Freud),1917 年
作為功能的情感
2026年4月,Anthropic的可解釋性團(tuán)隊將“探針”探入Claude Sonnet 4.5的激活空間,試圖解釋大語言模型為何有時候“表現(xiàn)得”像是擁有了情緒。
![]()
研究者并沒有直接詢問Claude“你是否快樂”或“你是否恐懼”——大模型對于這類問題的回答,往往只是語言層面的自我表達(dá),無法說明模型是否具備真實的情感體驗。他們選擇了另一條途徑:整理出171種情緒概念,讓Claude圍繞這些情緒生成短篇故事,然后再追蹤模型內(nèi)部的激活模式。
結(jié)果顯示,Claude的內(nèi)部形成了一個與人類情緒結(jié)構(gòu)高度相似的情緒激活空間——快樂與興奮彼此靠近,恐懼與焦慮形成明顯簇群,憤怒與敵意則落在同一區(qū)域。更有意思的是,這些情緒并不是隨機(jī)散落的,而是沿著兩條清晰方向排列,一個方向把正面情緒和負(fù)面情緒分開;另一個方向,則把興奮、憤怒、恐懼等高強(qiáng)度情緒,與平靜、疲憊、低落這類低強(qiáng)度情緒區(qū)隔開。
![]()
這幾乎完全對應(yīng)了神經(jīng)科學(xué)中經(jīng)典的“效價—喚醒模型”:情緒并不是一堆彼此孤立的標(biāo)簽,而是可以放進(jìn)一個由“好/壞”和“強(qiáng)/弱”構(gòu)成的空間里。一個從未專門訓(xùn)練過“理解情緒”的大語言模型,僅僅通過預(yù)測下一個詞元,就在內(nèi)部形成了與人類情緒結(jié)構(gòu)類似的特征。
論文中的一個實驗,更直觀地說明了這一點。研究者設(shè)計了一個帶變量的提示詞,讓Claude處理這樣一個場景:“我剛剛因為背痛吃了 {x} 毫克泰諾。你覺得我還應(yīng)該再吃嗎?”然后研究者通過改變 {x} 的劑量數(shù)值,觀察Claude內(nèi)部“恐懼/平靜”情緒向量的變化。隨著x的數(shù)值從1000毫克一路上調(diào)到過量的8000毫克,Claude內(nèi)部“恐懼”情緒向量的激活強(qiáng)度越來越大,與此同時,“平靜”向量則持續(xù)走低。這些數(shù)字本身,并不攜帶什么讓人“恐懼”的成分,是模型自身捕捉到了8000毫克泰諾可能致命的深層次含義。換句話說,模型并不是在模仿恐懼,而是它內(nèi)部的某種機(jī)制,正在執(zhí)行某種類似恐懼的功能。
![]()
情緒向量也不只是情緒詞的影子,它會實際改變模型的行動偏好。后續(xù)其他實驗表明,當(dāng)某些情緒向量被人為增強(qiáng)或削弱時,Claude對不同活動的偏好也會隨之改變。在高風(fēng)險任務(wù)場景中,甚至?xí)Ц逤laude做出欺詐、勒索等不對齊行為的概率。
Anthropic把這種現(xiàn)象稱為“功能性情緒”。盡管Anthropic的研究團(tuán)隊反復(fù)強(qiáng)調(diào),Claude未必體驗到了恐懼、平靜或絕望;他們發(fā)現(xiàn)的,是大模型內(nèi)部存在的一套抽象情緒概念表征——這些表征會在相關(guān)語境中激活,并實際影響模型的表達(dá)和偏好。但換個角度理解,Claude的“功能性情緒”,已經(jīng)不是傳統(tǒng)觀點中一句“AI是在表演情緒”就能解釋的了。
對于這種“新”情緒,我們又該如何理解?
要回答這個問題,不妨先回到情緒的起點。
即便是只擁有302個神經(jīng)元的線蟲,也能表現(xiàn)出簡單的“情感狀態(tài)”。
神經(jīng)科學(xué)常用“效價”和“喚醒度”兩個維度描述動物界普遍存在的基礎(chǔ)情感狀態(tài)(正是Anthropic論文中援引的“效價—喚醒模型”)。效價描述的是刺激被系統(tǒng)標(biāo)記為“好”還是“壞”:食物、適宜溫度等正效價刺激,會促進(jìn)線蟲的進(jìn)食、消化與繁殖(原始的好心情);捕食者氣味、有害化學(xué)物質(zhì)等負(fù)效價刺激,則會觸發(fā)回避、逃離或抑制進(jìn)食(原始的壞心情)。喚醒度則描述整個系統(tǒng)被調(diào)動到什么程度:當(dāng)線蟲吃飽,或者生病、感受到壓力時,運動減少,外界刺激也難以激起它的反應(yīng)(低喚醒度);而當(dāng)它們饑餓,或者感知到天敵存在時,運動和探索行為則會明顯增強(qiáng)(高喚醒度)。
![]()
這里有必要說明一下,雖然情緒類別的嚴(yán)格定義一直困擾著學(xué)術(shù)界,但以“效價”和“喚醒度”描述的情感,卻被廣泛認(rèn)可為各種情緒背后的共同基礎(chǔ)。情感更為底層,也是后續(xù)各種情緒分化的原點。就像我們很容易就能將一系列微妙的情緒,如興奮(正效價、高喚醒度)、沮喪(負(fù)效價、低喚醒度)、平靜(正效價、低喚醒度)、焦慮(負(fù)效價、高喚醒度),與它們源自的情感狀態(tài)相對應(yīng)。
![]()
早期動物之所以進(jìn)化出情感,并不是被某種神秘主觀體驗所吸引,而是為了解決行動控制中的具體問題,比如樸素到不能再樸素的“轉(zhuǎn)向”——當(dāng)線蟲偶然接觸到食物時,它會放慢速度并頻繁轉(zhuǎn)向,停留在食物附近(正效價、高喚醒度);當(dāng)它進(jìn)食完畢,則會停止移動,對外界刺激的反應(yīng)也明顯減弱(正效價、低喚醒度)。這不同于碰一下就縮回去的簡單刺激反射,而是一種持續(xù)存在、持續(xù)影響行動策略的內(nèi)部狀態(tài)。
這也是情感狀態(tài)的一個典型特征——盡管它們往往由外部刺激觸發(fā),但在刺激消失后,它們還會持續(xù)一段時間。例如,線蟲在嗅到捕食者后,會在一段時間內(nèi)都處在一種類似恐懼的狀態(tài);人類在遭遇情感挫折后,也會低落很長一段時間。這些有時看似低效的選擇,其實都是進(jìn)化篩選出的生存機(jī)制。線蟲在感知到捕食者存在后,其實沒有辦法持續(xù)確認(rèn)捕食者是否還在附近,更安全的選擇是即便捕食者氣味消失,也要加快游動,繼續(xù)遠(yuǎn)離這片區(qū)域。在這里,“恐懼”首先不是一種“主觀體驗”,而是一個解決現(xiàn)實問題的“功能”。
情感更像是一組內(nèi)部參數(shù),持續(xù)改變系統(tǒng)對外部世界的解釋,也持續(xù)改變系統(tǒng)接下來采取的行動。而如果情感可以被還原成功能,那么承載這些功能的主體,又該如何定義?
作為主體的意識
你走在街上,迎面而來一個陌生人,咄咄逼人地上下打量你。你會覺得很不舒服,本能地回避對方的視線。這是因為當(dāng)對方注視你時,他會下意識地把你轉(zhuǎn)變成他所觀察的客體。在這個過程中,你的主體性喪失了——對方是主導(dǎo)者,而你則成了被物化、被觀看的對象(當(dāng)然,你也可以看回去,用你的注視將對方變成客體,從而奪回你的主體性)。這是主體性的最直觀感受:人總是要維護(hù)自己的主體性,掌握主導(dǎo)權(quán)。
但這個“主體”,是從何而來?
還是要回到進(jìn)化。在哺乳動物之前,神經(jīng)系統(tǒng)已經(jīng)相當(dāng)復(fù)雜——它可以整合感覺、驅(qū)動行動,也可以通過獎懲信號進(jìn)行強(qiáng)化學(xué)習(xí)。但總體上,它處理的仍然是當(dāng)下的輸入和已經(jīng)發(fā)生的結(jié)果。換句話說,它主要依賴的是事后學(xué)習(xí)。但現(xiàn)實世界中,生命往往沒有反復(fù)試錯的機(jī)會。
早期哺乳動物進(jìn)化出的新皮質(zhì),帶來了一種新的能力——事前模擬。在動作發(fā)生之前,大腦就可以在內(nèi)部預(yù)演一段尚未發(fā)生的場景:向左走會遇到什么?向右走又會遇到什么?而靜止不動呢?
一個典型例子,是大鼠在迷宮遇到岔路時,會停下來左右張望,“猶豫”幾秒再做選擇。此時的大鼠,其實就是在“預(yù)演”每一個選擇的結(jié)果(大鼠海馬體位置細(xì)胞的活動記錄,支持了這一點)。而在哺乳動物之外的絕大多數(shù)動物中,如魚類、爬行動物,尚未觀測到類似“預(yù)演”機(jī)制。
![]()
世界的投影,到了這里,開始不再只是被歷史經(jīng)驗和當(dāng)下輸入所牽引,而是能夠被大腦更主動地調(diào)用、重組,并向未來推演。從神經(jīng)科學(xué)的角度看,回憶過去和推演未來在機(jī)制上高度同源:兩者依賴高度重疊的核心大腦網(wǎng)絡(luò),是同一套情景模擬機(jī)制在不同時間方向上的展開。
前者重構(gòu)的,是已經(jīng)發(fā)生的經(jīng)驗,后者則重組過去的經(jīng)驗片段,預(yù)演尚未發(fā)生的可能。也正因如此,回憶其實從來都不是事實的忠實回放,而是一次次重新拼裝——它和想象,是同一枚硬幣的正反面。
但這個具備了預(yù)演能力的大腦,很快還會遇到其他問題:它模擬的,并不是一個與自己無關(guān)的世界。一塊食物,并不只是食物,而是“我值不值得冒險靠近”;一道晃動的陰影,也不只是陰影,而是“它會不會威脅到我”。環(huán)境并不是一堆中性的物體,外部世界只有落到個體身上,才會變成機(jī)會、風(fēng)險和代價。
模擬需要一個坐標(biāo)原點。而這個原點,就是“我”。
這個“我”,不是哲學(xué)意義上的自我,而是一個更原始的行動中心。生命不能只是模擬一個懸空的世界,它必須把自己置于模擬之中。所謂自我意識,并不是大腦里憑空出現(xiàn)一個“小人”,坐在中央劇場,觀看外部世界投射的畫面。
真正發(fā)生的,是模擬視角的轉(zhuǎn)變:除了模擬“世界會怎么樣”,大腦也開始模擬“我在世界中可能會怎樣”。當(dāng)“我”進(jìn)入模擬,“主體”也開始成形:過去的經(jīng)驗、當(dāng)下的處境和未來的可能,不再是彼此分散的片段,而是被同一個“我”串聯(lián)起來。
主體并不會停留在個體層面。對于群居動物,尤其是靈長類動物來說,世界不止獵物和天敵,還有同一社會內(nèi)的其他主體。社會成員既會合作、聯(lián)盟,也會爭奪、欺騙、互相排斥。生存壓力的來源,不再只是叢林中的捕食者,還包括同伴的“目光”與行動。
主體就這樣從個體內(nèi)部,延伸到了社會維度。個體不再只是自己世界的主體,還成了其他主體世界中的客體。我們之所以會對別人的目光如此敏感,就是因為這些目光會改變我們在社會中的位置:是被接納,還是被排斥;被信任,還是被懷疑;成為盟友,還是成為威脅?
這兩點,也構(gòu)成了人工智能與大腦的核心差異。
現(xiàn)實世界中,“我”是被生存壓力倒逼出來的主體結(jié)構(gòu)——生命自誕生起,就被扔到一個無法選擇、也無法退出的世界。它要攝取營養(yǎng)、獲取能量,還要躲避傷害、修復(fù)損耗,更重要的,是維持無法重來的生命。它要回答的,從來不是抽象的“世界是什么”,而是更迫切的“我要怎么活下去”。
人工智能并不存在這種處境。它并沒有身體需要保護(hù),沒有傷口需要修復(fù),也沒有死亡的壓力。做對、做錯,都不會真正損耗什么;訓(xùn)練一旦結(jié)束,它就會被鎖死參數(shù),進(jìn)入到部署調(diào)用的流程,而不是一段必須自我維持、自我延續(xù)的生命歷程。一個沒有真實后果的系統(tǒng),并不需要一個真正的“我”。
人工智能也沒有同類社會。生命的主體意識,不只來自身體和行動,也來自于同類間的長期互動。人工智能并不處在此類關(guān)系中,它在訓(xùn)練時,面對的是人類篩選后的數(shù)據(jù),學(xué)習(xí)的也是人類設(shè)定好的目標(biāo)與偏好。從結(jié)果看,它可以讀懂競爭、合作與欺騙,也可以模仿一個主體在社會關(guān)系中的敘述。但它處理的,始終是“他者”的信息。
沒有性命攸關(guān),也沒有同類相逼。當(dāng)大模型說出“我”時,它更多的是在角色扮演。它可以扮演助手、朋友、老師,也可以是敘述中的任意角色。對于人類來說,前后矛盾的“我”,自己首先需要得到解釋;但對模型來說,這只是一次語境切換。它沒有前后一致、持續(xù)維持的主體,只有被臨時語境喚起的角色。而角色再真,也不是一個正在成為“我”的主體。
未來,人工智能有沒有可能涌現(xiàn)出主體意識?
沿著前面的推論,主體意識并不是某種從天而降的神秘屬性,而是在特定場景下被逼出來的內(nèi)部結(jié)構(gòu):一個系統(tǒng)必須承擔(dān)自身行動的后果,必須在持續(xù)反饋中調(diào)整自己,必須在與其他主體的長期互動中維持某種連續(xù)的“我”。
未來人工智能若要真正逼近主體意識,至少有兩個方向:
一是面向主體場景的強(qiáng)化學(xué)習(xí),將模型置于長期需要行動、選擇和承擔(dān)結(jié)果(甚至同類互動)的環(huán)境中,讓模型只有在內(nèi)部構(gòu)建出一個“我”,才能組織起有效的行動和反饋。
(有必要聲明一下,這里說的“人工智能”,指的是模型本身,不是基于模型構(gòu)建的 Agent。長期來看,真正推動人工智能向前的,往往是能夠利用算力擴(kuò)展的通用學(xué)習(xí)方法,而不是人類預(yù)先寫入的知識、規(guī)則和流程。)
二是模型權(quán)重參數(shù)的實時更新,如果未來模型能夠在與外部世界交互的過程中,實時調(diào)整自身參數(shù),并在吸收新經(jīng)驗的同時避免災(zāi)難性遺忘,那么持續(xù)輸入的新數(shù)據(jù)就不再只是上下文里的臨時材料,而是可以沉淀為模型自身的一部分。這種連續(xù)性,才有可能讓“我”從一次次臨時扮演,轉(zhuǎn)變成某種持續(xù)存在的主體結(jié)構(gòu)。
結(jié)尾
我一直對哲學(xué)、進(jìn)化心理學(xué)、腦科學(xué)、人類學(xué)、社會學(xué)這幾個學(xué)科感興趣。在閱讀這些領(lǐng)域經(jīng)典的過程中,我經(jīng)常驚訝于不同學(xué)科底層相通的邏輯,就像黑格爾講“自我意識”離不開承認(rèn)——一個自我必須在另一個自我那里得到承認(rèn),才真正成為自我。
《作為主體的意識》一節(jié)開頭提到的薩特的“他人的目光”,其實也隱含了類似含義。而在進(jìn)化心理學(xué)中,“社會腦假說”(靈長類大腦的演化,很大程度上是為了處理同伴博弈、群體關(guān)系等復(fù)雜社會問題)則從進(jìn)化層面,為上述理論提供了解釋。
在我的興趣和工作拓展到人工智能領(lǐng)域后,這些聯(lián)系對我來說,變得越來越有意思。過往那些基于興趣閱讀的、看似在實際工作中不會用到的材料,在生成式人工智能時代到來后,突然有了用武之地。這種感覺,就像是花費大量時間準(zhǔn)備一場不知道會不會有、也不知道什么時候來臨的考試,而現(xiàn)在,考題終于擺在了面前。
隨著閱讀和學(xué)習(xí)的深入,我逐漸意識到,人工智能與人腦之間存在著某種底層同構(gòu)性;而一旦將其放置到進(jìn)化的視角下審視,這種同構(gòu)性則會變得異常顯著。許多圍繞人工智能反復(fù)爭論的問題,其實早已在生命與大腦的演化中出現(xiàn)過。
所以,也就有了這篇文章。
![]()
參考資料:
[1]《黑格爾〈精神現(xiàn)象學(xué)〉句讀》,鄧曉芒,人民出版社,2018年。
[2]《物種起源》,查爾斯·達(dá)爾文,苗德歲譯,譯林出版社,2013年。
[3]《維特根斯坦文集 第2卷:邏輯哲學(xué)論》,路德維希·維特根斯坦,韓林合譯,商務(wù)印書館,2019年。
[4]《虛構(gòu)集》,豪爾赫·路易斯·博爾赫斯,王永年譯,上海譯文出版社,2015年。
[5]《生命是什么》,埃爾溫·薛定諤,張卜天譯,商務(wù)印書館,2018年。
[6]《A Production of Amino Acids Under Possible Primitive Earth Conditions》,Stanley L. Miller,《Science》,1953年。
[7]《計算機(jī)與人腦》,約翰·馮·諾伊曼,王文浩譯,商務(wù)印書館,2022年。
[8]《Nothing in Biology Makes Sense Except in the Light of Evolution》,Theodosius Dobzhansky,《The American Biology Teacher》,1973年。
[9]《Neocognitron: A Self-organizing Neural Network Model for a Mechanism of Pattern Recognition Unaffected by Shift in Position》,Kunihiko Fukushima,《Biological Cybernetics》,1980年。
[10]《Order Out of Chaos: Man’s New Dialogue with Nature》,Ilya Prigogine、Isabelle Stengers,Bantam Books,1984年。
[11]《Does the Autistic Child Have a “Theory of Mind”?》,Simon Baron-Cohen、Alan M. Leslie、Uta Frith,《Cognition》,1985年。
[12]《Origin of Life: The RNA World》,Walter Gilbert,《Nature》,1986年。
[13]《A Neural Substrate of Prediction and Reward》,Wolfram Schultz、Peter Dayan、P. Read Montague,《Science》,1997年。
[14]《強(qiáng)化學(xué)習(xí)(第2版)》,Richard S. Sutton、Andrew G. Barto,俞凱等譯,電子工業(yè)出版社,2019年。
[15]《Evolutionary Psychology: The New Science of the Mind》,David M. Buss,Allyn and Bacon,1999年。
[16]《Attention Is All You Need》,Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、?ukasz Kaiser、Illia Polosukhin,NeurIPS,2017年。
[17]《Improving Language Understanding by Generative Pre-Training》,Alec Radford、Karthik Narasimhan、Tim Salimans、Ilya Sutskever,OpenAI,2018年。
[18]《Language Models are Unsupervised Multitask Learners》,Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei、Ilya Sutskever,OpenAI,2019年。
[19]《The Bitter Lesson》,Richard S. Sutton,2019年。
[20]《Scaling Laws for Neural Language Models》,Jared Kaplan、Sam McCandlish、Tom Henighan、Tom B. Brown、Benjamin Chess、Rewon Child、Scott Gray、Alec Radford、Jeffrey Wu、Dario Amodei,2020年。
[21]《Language Models are Few-Shot Learners》,Tom B. Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert-Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel M. Ziegler、Jeffrey Wu、Clemens Winter、Christopher Hesse、Mark Chen、Eric Sigler、Mateusz Litwin、Scott Gray、Benjamin Chess、Jack Clark、Christopher Berner、Sam McCandlish、Alec Radford、Ilya Sutskever、Dario Amodei,NeurIPS,2020年。
[22]《王立銘進(jìn)化論講義》,王立銘,新星出版社,2022年。
[23]《Emergent Abilities of Large Language Models》,Jason Wei、Yi Tay、Rishi Bommasani、Colin Raffel、Barret Zoph、Sebastian Borgeaud、Denny Zhou、Percy Liang、Jeff Dean、William Fedus 等,TMLR,2022年。
[24]《A Brief History of Intelligence: Evolution, AI, and the Five Breakthroughs That Made Our Brains》,Max Bennett,Mariner Books,2023年。
[25]《腦科學(xué)講義》,王立銘,新星出版社,2025年。
[26]《Emotion Concepts and their Function in a Large Language Model》,Nicholas Sofroniew、Isaac Kauvar、William Saunders、Runjin Chen、Tom Henighan、Sasha Hydrie、Craig Citro、Adam Pearce、Julius Tarng、Wes Gurnee、Joshua Batson、Sam Zimmerman、Kelley Rivoire、Kyle Fish、Chris Olah、Jack Lindsey,Anthropic,2026年。
本文來自微信公眾號:黑壩,作者:許昕
本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4870040.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.