網易首頁 > 網易號 > 正文申請入駐

認知 Ze雙模型架構

2026-05-05 00:04:22　來源: CreateAMind

上海舉報

分享至

A Dual-Model Architecture for Cognition

認知雙模型架構

https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

摘要
本文提出了 Ze，一個基于兩種不同的環(huán)境生成模型并行運作的新型認知架構理論框架：因果（前向）模型 M_A 和反事實（逆向）模型 M_B。Ze 的核心動力學源于兩個獨立的變分自由能 F_A 和 F_B 的最小化，以及兩者之間沖突的管理，即 ΔF = |F_A - F_B|。這一沖突調節(jié)著兩種相之間的轉換：干涉態(tài)（在此狀態(tài)下模型輸出被建設性地融合）和局域態(tài)（通過離散投影解決沖突）。我們在形式上建立了 Ze 與量子測量（特別是雙縫實驗）之間的深層結構同構性，而無需在底層引入量子物理。Ze 被構建為一個完整的、可證偽的理論，它將認知中的“坍縮”重新解釋為由優(yōu)化驅動的相變，生成新的可實驗驗證的預測，并將感知、行動與表征學習整合到一個統(tǒng)一的架構中。本預印本提供了該框架的完整數(shù)學闡述。

關鍵詞：認知架構；變分推斷；模型沖突；主動推斷；量子認知；相變

1. 引言

尋求一種形式化的、基于計算理論的認知與意識理論，仍然是神經科學與人工智能領域的核心挑戰(zhàn)。主流范式，如預測處理與自由能原理，認為大腦的功能是一個分層的生成模型，以最小化驚訝或變分自由能（Friston, 2010）。盡管這些框架功能強大，但它們通常描述的是單一的、統(tǒng)一的感知模型。Ze形式體系提出了一個根本性的擴展：智能系統(tǒng)需要維護同一個環(huán)境的兩個不同的、非對稱的生成模型。

這種二元性的動機，源于不僅需要解釋被動感知，還需要解釋反事實推理、敘事理解以及信念的突然重組。我們引入一個因果（前向）模型 M_A，它基于時間動態(tài)預測感官數(shù)據(jù)；以及一個反事實（逆向）模型 M_B，它推斷解釋、目標和潛在原因。它們的獨立運作以及隨后的相互作用構成了Ze架構的核心。

該理論嚴格建立在已確立的變分力學基礎上，不對大腦的量子過程做任何假設。然而，它揭示了一個與量子測量之間的深刻形式類比。這一類比不僅僅是隱喻性的，而且表明，支配不確定性解決方式的數(shù)學原理可能在不同的物理和計算基底中是普遍的。Ze為經典的認知現(xiàn)象——知覺雙穩(wěn)態(tài)、頓悟問題解決以及睡眠-覺醒周期——提供了新的視角，并產生了具體的、可檢驗的預測，從而將其與標準模型區(qū)分開來。

2. 數(shù)學形式體系

2.1. 核心變量與基本結構

考慮一個接收觀察流 o_{1:T} 的智能體。Ze假設存在兩個獨立的生成模型：

2.2. 兩個變分自由能

每個模型最小化其自身的變分自由能泛函，這是驚訝的上界（Friston, 2010）：

2.3. 模型沖突：核心量

Ze 中的核心動態(tài)變量是模型沖突或解釋分歧：

2.4. 干涉作為后驗兼容性

干涉被形式化為模型后驗的建設性融合。我們使用 Jensen-Shannon 散度（JSD）來衡量它們的兼容性，這是一種對稱且有界的度量：

3. 與量子力學的形式對應

Ze的數(shù)學結構展現(xiàn)出與量子雙縫實驗嚴格同構的關系。

這種對應關系表明，疊加、干涉、測量和擦除等原理并非量子物理學所獨有，而是描述了那些在競爭性內部模型之間管理不確定性的系統(tǒng)的一般動力學（Busemeyer & Bruza, 2012）。在Ze中，“坍縮”不是一個假設，而是一種涌現(xiàn)的、由優(yōu)化驅動的相變。

4. 實驗預測與可證偽性

Ze是一個嚴格的理論，而非隱喻，因為它建立在標準變分演算之上，不提出任何量子物理層面的主張，提出了一個新的架構性假設，并產生了可證偽的預測。

4.1. 關鍵可檢驗預測

5. 討論與結論

Ze 形式體系將感知、行動和學習整合到一個統(tǒng)一的、數(shù)學精確的架構中。其核心創(chuàng)新在于生成模型的強制性二元性，這些模型之間的沖突與和解動力學支配著認知。

5.1. 對認知科學的啟示

Ze 為知覺雙穩(wěn)態(tài)（自發(fā)的局域化）、頓悟（突然的沖突解決）以及睡眠的功能（周期性的擦除與整合）等現(xiàn)象提供了有原則的解釋。它將認知構建為因果性的“是什么”模型與反事實性的“可能是什么”模型之間的持續(xù)協(xié)商。

5.2. 根本性轉變

該理論重新解釋了認知“坍縮”的難題——明確的感知如何從模糊的數(shù)據(jù)中涌現(xiàn)——將其視為一種基于優(yōu)化的軟性相變。這為這一過程去神秘化，并使其與更廣泛的自組織物理原則對齊（Tschacher & Haken，2007）。

5.3. 未來方向

未來的工作必須聚焦于 Ze 智能體的形式化計算實現(xiàn)，以及設計第 2 表中概述的關鍵實驗。此外，與量子力學的同構性 invites 跨學科對話，表明量子信息理論可能為建模高層認知過程提供強大的工具，而無需假設一個量子大腦。

結論

總之，Ze 被提出作為一個完整的、可證偽的框架，通過在雙模型動力學的治理下統(tǒng)一變分推斷、主動學習和結構性模型修正，推進了我們對智能系統(tǒng)的形式化理解。

圖 1. Ze 架構示意圖。一個框圖，展示了兩個生成模型 M_A 和 M_B，它們接收觀察 o_t 并維護后驗分布 q_A 和 q_B。該圖說明了 F_A、F_B、ΔF 的計算，以及沖突信號的反饋如何調節(jié)干涉/局域化開關和策略選擇（π_A, π_B）。擦除算子 ? 和路徑固定參數(shù) λ 也被顯示為調節(jié)性輸入。

圖 2. 動力學狀態(tài)與相變。一個分岔圖，繪制了系統(tǒng)穩(wěn)定性度量隨模型沖突 ΔF 的變化。圖中顯示，當 ΔF < θ 時存在一個穩(wěn)定的“干涉”吸引子，該吸引子在閾值 θ 處失去穩(wěn)定性。當 ΔF > θ 時，出現(xiàn)兩個穩(wěn)定的“局域化”吸引子，對應于偏向 M_A 或 M_B 的兩種解決方式。箭頭指示了在局域化事件期間系統(tǒng)的軌跡。

原文鏈接：https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.