網易首頁 > 網易號 > 正文申請入駐

大模型在想什么？因果學習與模型可解釋性入門丨面向復雜系統的人工智能第十一講

2026-05-24 14:33:14　來源: 集智俱樂部

北京舉報

分享至

導語

集智俱樂部、集智學園創始人，北京師范大學張江教授開設了，致力于打破學科壁壘，將復雜系統與人工智能深度融合。從神經網絡到因果推斷，從世界模型到多尺度建模，甚至包含最前沿的“氛圍編程（Vibe Coding）”實戰，帶你親手落地AI項目。

作為系列課程的第十一講，張江教授將以「因果學習與模型可解釋性」為題，在因果學習部分，教你用算法從數據中自動還原因果圖，并從高維觀測中提取因果變量；在可解釋性部分，解剖大模型，追蹤內部信息流，甚至可以用數學方法植入或抹除它的某個特定想法。正式分享將于5月25日（周一）13:30-16:15騰訊會議線上直播，北師大海淀區線下授課（助教可協助入校）。

課程簡介

Anthropic 分析 Claude 內部推理時使用的電路追蹤框架，可以溯源到本節課程講解的內容：因果學習與模型可解釋性。

課程分兩部分推進。第一部分建立因果機器學習理論基礎：從Pearl因果層級（關聯→干預→反事實）與結構因果模型（SCM）出發，引入獨立因果機制原則和稀疏機制偏移假設，推導PC算法從條件獨立性測試中恢復因果圖的完整流程；進而講解因果表征學習，涵蓋線性ICA可辨識性理論、時間對比學習（TCL）對非線性ICA的突破、以及iVAE將可辨識性引入變分自編碼器；最后以不變因果預測（ICP）與穩定學習作為落地應用。第二部分聚焦大語言模型可解釋性：從Transformer電路框架出發，介紹電路追蹤與歸因圖；再到表示工程；最后覆蓋SelfIE與Patchscopes等自解釋框架。

學完本節內容，你可以獨立運行PC算法、理解ICA類因果表征方法的可辨識性條件，并掌握用LAT干預語言模型內部狀態的實操路徑。

課程大綱

Causal Learning
1. Causal Machine Learning: Background and Principles
2. Causal Discovery
3. Causal Representation Learning
Model Interpretability

關鍵術語

結構因果模型（SCM）：將數據生成過程形式化為帶外生噪聲的方程組，支持干預與反事實推理
d-分離：DAG中判斷兩變量在給定條件集下條件獨立的圖形化準則
Markov等價類：產生相同條件獨立關系的一組DAG，PC算法僅能恢復到此級別
獨立因果機制（ICM）原則：不同因果變量的生成機制相互獨立，局部干預不影響其余機制
時間對比學習（TCL）：利用時間分段信息解決非線性ICA可辨識性問題的方法
iVAE：通過輔助觀測變量（如時間或領域標簽）使VAE潛變量滿足可辨識性條件
殘差流：Transformer中信息在各層間傳遞的主干，所有組件以并行加法讀寫同一向量
表示工程（RepE）：通過讀取和控制模型內部表示空間來干預模型行為，無需修改權重
線性人工層析成像（LAT）：對比正負刺激激活差異提取概念方向向量，用于行為監控與控制

課程信息

課程主題：因果學習與模型可解釋性

課程時間：2026年5月25日（周一） 13:30-16:15

課程形式：騰訊會議（會議信息見群內通知）/北師大海淀區線下授課（助教可協助入校）；集智學園網站錄播（3個工作日內上線）

課程主講人

張江，北京師范大學系統科學學院教授，集智俱樂部、集智學園創始人，集智科學研究中心理事長，曾任騰訊研究院、華為戰略研究院等特聘顧問。主要研究領域包括因果涌現、復雜系統分析與建模、規模理論等。

個人主頁：https://jake.swarma.org/

課程適用對象

理工科背景高年級本科生
理工科背景碩士、博士研究生

報名須知

1. 課程形式：

參與方式：付費學員可參與騰訊會議直播/北師大海淀區線下授課（助教可協助入校）
授課形式：

平時：課堂討論與內容共創
結課：項目匯報

2. 課程周期：2026年3月2日-2026年6月22日，每周一 13:30-16:15進行。

3. 課程定價：399元

課程鏈接：https://campus.swarma.org/v3/course/5684?from=wechat

付費流程：

課程頁面添加學員登記表，添加助教微信入群；
課程可開發票。

課程共創任務：課程字幕

為鼓勵學員深度參與、積極探索，我們致力于形成系列化知識傳播成果，并構建課程知識共建社群。為此，我們特別設立激勵機制，讓您的學習之旅滿載收獲與成就感。

課程以老師講授為主，每期結束后，助教會于課程群內發布字幕共創任務。學員通過參與這些任務，不僅能加深對內容的理解，還可獲得積分獎勵。積分可兌換其他讀書會課程或實物獎品，助力您的持續成長。

推薦課程

參考課程

吳恩達：Build with Andrew https://www.deeplearning.ai/courses/build-with-andrew/
Jure Leskovec: Machine Learning with Graphs, StanfordCS224W.https://www.youtube.com/playlist?list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn
Steve Brunton: Data Driven Science and Engineering, University of Washingtonhttps://www.youtube.com/playlist?list=PLMrJAkhIeNNRpsRhXTMt8uJdIGz9-X_1-
Karthik Duraisamy: DATA-DRIVEN ANALYSIS AND MODELING OF COMPLEX SYSTEMS, Michigen institute for computational discovery and engineering, Michigen University.https://micde.umich.edu/academic-programs-old/data-driven-course/
Sergey Levine: Deep Reinforcement Learning, CS 285 at UC Berkeley.http://rail.eecs.berkeley.edu/deeprlcourse/

【集智學園網站資源】

對復雜系統連續變化自動建模——Neural Ordinary Differential Equations解讀https://campus.swarma.org/course/2046
復雜網絡自動建模在大氣污染中的應用https://campus.swarma.org/course/1998
兩套因果框架深度剖析：潛在結果模型與結構因果模型https://campus.swarma.org/course/2526
穩定學習：發掘因果推理和機器學習的共同基礎https://campus.swarma.org/course/2323
因果強化學習https://campus.swarma.org/course/2156
張江：因果與機器學習能夠破解涌現之謎嗎https://campus.swarma.org/course/4540
因果涌現理論提出者：Erik Hoel主題報告https://campus.swarma.org/course/4317
如何從數據中發現因果涌現——神經信息壓縮器https://campus.swarma.org/course/4874
標準化流技術簡介https://campus.swarma.org/course/1999
帶隱狀態的強化學習世界模型https://campus.swarma.org/course/4848

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.