A Dual-Model Architecture for Cognition
認知雙模型架構
https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
![]()
![]()
摘要
本文提出了 Ze,一個基于兩種不同的環(huán)境生成模型并行運作的新型認知架構理論框架:因果(前向)模型 M_A 和反事實(逆向)模型 M_B。Ze 的核心動力學源于兩個獨立的變分自由能 F_A 和 F_B 的最小化,以及兩者之間沖突的管理,即 ΔF = |F_A - F_B|。這一沖突調節(jié)著兩種相之間的轉換:干涉態(tài)(在此狀態(tài)下模型輸出被建設性地融合)和局域態(tài)(通過離散投影解決沖突)。我們在形式上建立了 Ze 與量子測量(特別是雙縫實驗)之間的深層結構同構性,而無需在底層引入量子物理。Ze 被構建為一個完整的、可證偽的理論,它將認知中的“坍縮”重新解釋為由優(yōu)化驅動的相變,生成新的可實驗驗證的預測,并將感知、行動與表征學習整合到一個統(tǒng)一的架構中。本預印本提供了該框架的完整數(shù)學闡述。
關鍵詞:認知架構;變分推斷;模型沖突;主動推斷;量子認知;相變
1. 引言
尋求一種形式化的、基于計算理論的認知與意識理論,仍然是神經科學與人工智能領域的核心挑戰(zhàn)。主流范式,如預測處理與自由能原理,認為大腦的功能是一個分層的生成模型,以最小化驚訝或變分自由能(Friston, 2010)。盡管這些框架功能強大,但它們通常描述的是單一的、統(tǒng)一的感知模型。Ze形式體系提出了一個根本性的擴展:智能系統(tǒng)需要維護同一個環(huán)境的兩個不同的、非對稱的生成模型。
這種二元性的動機,源于不僅需要解釋被動感知,還需要解釋反事實推理、敘事理解以及信念的突然重組。我們引入一個因果(前向)模型 M_A,它基于時間動態(tài)預測感官數(shù)據(jù);以及一個反事實(逆向)模型 M_B,它推斷解釋、目標和潛在原因。它們的獨立運作以及隨后的相互作用構成了Ze架構的核心。
該理論嚴格建立在已確立的變分力學基礎上,不對大腦的量子過程做任何假設。然而,它揭示了一個與量子測量之間的深刻形式類比。這一類比不僅僅是隱喻性的,而且表明,支配不確定性解決方式的數(shù)學原理可能在不同的物理和計算基底中是普遍的。Ze為經典的認知現(xiàn)象——知覺雙穩(wěn)態(tài)、頓悟問題解決以及睡眠-覺醒周期——提供了新的視角,并產生了具體的、可檢驗的預測,從而將其與標準模型區(qū)分開來。
2. 數(shù)學形式體系
2.1. 核心變量與基本結構
考慮一個接收觀察流 o_{1:T} 的智能體。Ze假設存在兩個獨立的生成模型:
![]()
2.2. 兩個變分自由能
每個模型最小化其自身的變分自由能泛函,這是驚訝的上界(Friston, 2010):
![]()
2.3. 模型沖突:核心量
Ze 中的核心動態(tài)變量是模型沖突或解釋分歧:
![]()
2.4. 干涉作為后驗兼容性
干涉被形式化為模型后驗的建設性融合。我們使用 Jensen-Shannon 散度(JSD)來衡量它們的兼容性,這是一種對稱且有界的度量:
![]()
![]()
![]()
![]()
![]()
3. 與量子力學的形式對應
Ze的數(shù)學結構展現(xiàn)出與量子雙縫實驗嚴格同構的關系。
![]()
![]()
這種對應關系表明,疊加、干涉、測量和擦除等原理并非量子物理學所獨有,而是描述了那些在競爭性內部模型之間管理不確定性的系統(tǒng)的一般動力學(Busemeyer & Bruza, 2012)。在Ze中,“坍縮”不是一個假設,而是一種涌現(xiàn)的、由優(yōu)化驅動的相變。
4. 實驗預測與可證偽性
Ze是一個嚴格的理論,而非隱喻,因為它建立在標準變分演算之上,不提出任何量子物理層面的主張,提出了一個新的架構性假設,并產生了可證偽的預測。
4.1. 關鍵可檢驗預測
![]()
![]()
![]()
5. 討論與結論
Ze 形式體系將感知、行動和學習整合到一個統(tǒng)一的、數(shù)學精確的架構中。其核心創(chuàng)新在于生成模型的強制性二元性,這些模型之間的沖突與和解動力學支配著認知。
5.1. 對認知科學的啟示
Ze 為知覺雙穩(wěn)態(tài)(自發(fā)的局域化)、頓悟(突然的沖突解決)以及睡眠的功能(周期性的擦除與整合)等現(xiàn)象提供了有原則的解釋。它將認知構建為因果性的“是什么”模型與反事實性的“可能是什么”模型之間的持續(xù)協(xié)商。
5.2. 根本性轉變
該理論重新解釋了認知“坍縮”的難題——明確的感知如何從模糊的數(shù)據(jù)中涌現(xiàn)——將其視為一種基于優(yōu)化的軟性相變。這為這一過程去神秘化,并使其與更廣泛的自組織物理原則對齊(Tschacher & Haken,2007)。
5.3. 未來方向
未來的工作必須聚焦于 Ze 智能體的形式化計算實現(xiàn),以及設計第 2 表中概述的關鍵實驗。此外,與量子力學的同構性 invites 跨學科對話,表明量子信息理論可能為建模高層認知過程提供強大的工具,而無需假設一個量子大腦。
結論
總之,Ze 被提出作為一個完整的、可證偽的框架,通過在雙模型動力學的治理下統(tǒng)一變分推斷、主動學習和結構性模型修正,推進了我們對智能系統(tǒng)的形式化理解。
圖 1. Ze 架構示意圖。一個框圖,展示了兩個生成模型 M_A 和 M_B,它們接收觀察 o_t 并維護后驗分布 q_A 和 q_B。該圖說明了 F_A、F_B、ΔF 的計算,以及沖突信號的反饋如何調節(jié)干涉/局域化開關和策略選擇(π_A, π_B)。擦除算子 ? 和路徑固定參數(shù) λ 也被顯示為調節(jié)性輸入。
圖 2. 動力學狀態(tài)與相變。一個分岔圖,繪制了系統(tǒng)穩(wěn)定性度量隨模型沖突 ΔF 的變化。圖中顯示,當 ΔF < θ 時存在一個穩(wěn)定的“干涉”吸引子,該吸引子在閾值 θ 處失去穩(wěn)定性。當 ΔF > θ 時,出現(xiàn)兩個穩(wěn)定的“局域化”吸引子,對應于偏向 M_A 或 M_B 的兩種解決方式。箭頭指示了在局域化事件期間系統(tǒng)的軌跡。
原文鏈接:https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.