同樣的ChatGPT,有時靈光乍現,有時卻給出平淡無奇的答案。問題不在模型參數的多寡,而在于我們剛弄明白的認知循環的架構方式。
產業界曾把“更大的模型”等同于“更智能”,但表面流暢的回答常常只是統計規律的結果。如果你稍微改寫同一個問題,答案可能突然深刻起來。這種差異,指向了系統1快速直覺與系統2緩慢驗證之間的互動組織——也就是認知架構的內核。
OpenAI的o1、o3以及DeepSeek-R1等新一批“思考”模型,已經把這一原理用了起來:它們不再逐個Token生成,而是啟動內部的自驗證循環。但這只是開始。研究者梳理出七種將大語言模型從“預言家”變成“思考者”的認知模式,我們結合已有信息,先看其中三種。
模式一:對抗共振。核心做法是讓模型不生成一個答案,而是一組互相矛盾的假設,每個假設都經過驗證循環,它們的交集成為結構性真相的向量。例如,先問“RLHF有什么問題?”再問“RLHF做得對的是什么?”,兩者答案的交集比任一單獨回答都更接近全貌。這種方法讓模型從概率性的“搜索”轉向確定性的“結晶”——正是沖突的語義表面之間的張力,催生了簡單隨機采樣無法獲得的洞見。
模式二:馬爾可夫毯。這一統計學邊界使系統的內部狀態與外部環境條件性地獨立,讓人工智能從被動吸收數據過渡到主動建模。放到提示工程里,你給模型提供上下文,就是在擴大它的“毯子”。內部模型越精確,糾錯消耗的能量越少。一個好提示就是一張緊湊的馬爾可夫毯。與其說“跟我講講X”,不如說“你是有十年經驗的X專家,向中級工程師在2分鐘內講清X的核心”。后一種提示劃定了邊界,讓模型在更精準的空間里工作。
模式三:驗證循環。靈光一現并不是隨機事件,而是驗證循環產生足夠“認知摩擦”后,概率噪聲坍縮成結構不變量的分岔點。用大模型時,可以先讓它生成3到5個答案變體,再讓它逐一檢查邏輯錯誤,最后把通過驗證的部分合并成最終答案。這種多輪自我校驗,推動輸出從模糊走向清晰。
目前披露的模式遠不止這三種,從有限的信息管窺,它們共同指向一個方向:讓大模型產生可靠洞察,功夫要下在推理的流程設計上,而不是單純堆參數。當更多人學會用認知架構來駕馭模型,AI才算真正從復讀機邁向思考者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.