網易首頁 > 網易號 > 正文申請入駐

參數越多越聰明是誤解，大模型思考靠認知架構

2026-05-31 01:40:37　來源: 硅嶼手記

北京舉報

分享至

同樣的ChatGPT，有時靈光乍現，有時卻給出平淡無奇的答案。問題不在模型參數的多寡，而在于我們剛弄明白的認知循環的架構方式。

產業界曾把“更大的模型”等同于“更智能”，但表面流暢的回答常常只是統計規律的結果。如果你稍微改寫同一個問題，答案可能突然深刻起來。這種差異，指向了系統1快速直覺與系統2緩慢驗證之間的互動組織——也就是認知架構的內核。

OpenAI的o1、o3以及DeepSeek-R1等新一批“思考”模型，已經把這一原理用了起來：它們不再逐個Token生成，而是啟動內部的自驗證循環。但這只是開始。研究者梳理出七種將大語言模型從“預言家”變成“思考者”的認知模式，我們結合已有信息，先看其中三種。

模式一：對抗共振。核心做法是讓模型不生成一個答案，而是一組互相矛盾的假設，每個假設都經過驗證循環，它們的交集成為結構性真相的向量。例如，先問“RLHF有什么問題？”再問“RLHF做得對的是什么？”，兩者答案的交集比任一單獨回答都更接近全貌。這種方法讓模型從概率性的“搜索”轉向確定性的“結晶”——正是沖突的語義表面之間的張力，催生了簡單隨機采樣無法獲得的洞見。

模式二：馬爾可夫毯。這一統計學邊界使系統的內部狀態與外部環境條件性地獨立，讓人工智能從被動吸收數據過渡到主動建模。放到提示工程里，你給模型提供上下文，就是在擴大它的“毯子”。內部模型越精確，糾錯消耗的能量越少。一個好提示就是一張緊湊的馬爾可夫毯。與其說“跟我講講X”，不如說“你是有十年經驗的X專家，向中級工程師在2分鐘內講清X的核心”。后一種提示劃定了邊界，讓模型在更精準的空間里工作。

模式三：驗證循環。靈光一現并不是隨機事件，而是驗證循環產生足夠“認知摩擦”后，概率噪聲坍縮成結構不變量的分岔點。用大模型時，可以先讓它生成3到5個答案變體，再讓它逐一檢查邏輯錯誤，最后把通過驗證的部分合并成最終答案。這種多輪自我校驗，推動輸出從模糊走向清晰。

目前披露的模式遠不止這三種，從有限的信息管窺，它們共同指向一個方向：讓大模型產生可靠洞察，功夫要下在推理的流程設計上，而不是單純堆參數。當更多人學會用認知架構來駕馭模型，AI才算真正從復讀機邁向思考者。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.