網易首頁 > 網易號 > 正文 申請入駐

寫Verilog、調CUDA,總翻車?工業代碼大模型開始學會先想后寫了

0
分享至



代碼大模型會寫代碼,這件事已經不新鮮了。

真正新的問題是:它會不會在寫之前先想清楚,這段代碼一旦進入真實系統,會發生什么?

這個問題在工業場景里尤其關鍵。因為工業代碼和普通編程不一樣,它不是 “語法通順、功能差不多” 就算過關,而是要面對真實硬件、真實工具鏈和真實約束。一個 Verilog 模塊可能語法沒問題,卻在仿真或綜合階段直接失敗;一個 CUDA kernel 可能邏輯上說得通,卻在 grid 配置、索引映射或顯存約束上出錯;?個嵌入式程序也可能因為寄存器順序或中斷邏輯不對,根本跑不起來。

所以,工業代碼大模型真正缺的,往往不是 “寫” 的能力,而是 “想” 的能力。

最近,北航聯合多家單位提出的InCoder-32B Thinking,瞄準的正是這個問題。它不是簡單把代碼模型再做大,也不是只給模型加?層通用的長鏈推理,而是試圖讓模型學會:在工業環境里,代碼為什么會錯,錯了之后環境會給出什么反饋,下?步又該怎么改。

一、它不是普通的 thinking model

而是面向工業代碼的 thinking model



這幾年,thinking model 很火。大家已經習慣了讓模型 “先想?想,再回答”。

但工業代碼場景有個特殊問題:很多時候,單靠語言層面的思考并不夠。因為工業任務的難點,不只是邏輯推理,還包括對工具鏈行為、硬件約束和執行反饋的理解。你可以在紙面上分析很多步,但如果根本不知道 GPU 的 shared memory 限制,不知道 Verilog 綜合器如何報錯,不知道幾何建模中的非法結構意味著什么,再長的 reasoning 也可能是空轉。

InCoder-32B Thinking 的不同之處,就在于它不是把 “思考” 當作純文本技巧,而是直接建立在工業環境之上。它試圖讓模型的 reasoning,天然綁定真實執行反饋,而不是脫離系統的 “自洽解釋”。

換句話說,它不是?個 “更會說” 的模型,而是?個 “更接近工程實際” 的 thinking model。

二、真正的新意

是讓模型從 “報錯 — 修復” 里學會思考



InCoder-32B Thinking 的核心設計之一,是Error-driven Chain-of-Thought(ECoT)。

它的關鍵點在于:模型的 thinking,不是人為寫出來的,而是從一輪輪 “生成 — 執行 — 報錯 — 修復” 的過程中提煉出來的。模型學習的,不只是最終答案,而是工程師如何一步步定位問題、修復錯誤、再驗證結果。

這在工業代碼中尤為重要。因為很多問題并不是 “不會寫”,而是 “哪?寫錯了”。比如 GPU kernel 越界,本質可能是 shape 和索引映射不一致;RTL 編譯失敗,可能是端口聲明或位寬不規范。

ECoT 做的事情,就是把這些真實失敗和修復過程中的 reasoning 保留下來,讓模型學會從錯誤中思考,而不是只記住正確答案。

三、讓模型先 “預判結果”

再去寫代碼



如果說 ECoT 讓模型學會 “如何改錯”,那么另?個關鍵設計 Industrial Code World Model(ICWM),則讓模型學會 “提前預判”。

可以把 ICWM 理解為?個工業代碼的 “世界模擬器”:給定任務環境和候選代碼,它會預測這段代碼在真實工具鏈中的結果 —— 是通過、編譯失敗、運行報錯,還是性能不達標,并生成相應的診斷信息。

這帶來的變化很關鍵:模型不再只是寫代碼,而是開始預估代碼進入真實系統后的后果。

論文顯示,ICWM 在多個工業場景中的結果預測準確率達到 96.7%,多輪軌跡?致性達到 94.4%。這意味著,它已經能夠在相當程度上替代真實執行環境,用于大規模數據生成和推理訓練。

更重要的是,這也改變了訓練數據的來源。

InCoder-32B Thinking 的 reasoning 數據,不是人工構造的解釋,而是通過真實執行流程 “跑出來的”:任務生成 → 代碼執行 → 收集報錯 → 多輪修復 → 記錄完整軌跡。

GPU、芯片、嵌?式、3D 建模等任務,都在對應的真實工具鏈中驗證。

最終保留下來的,不只是正確答案,而是完整的錯誤 — 修復路徑。這種數據天然包含工業系統最關鍵的信息:代碼在真實環境中的行為反饋。

四、工業代碼不是統?模板能解決的

它需要 “自適應思考深度”



論文還有一個很有意思的發現:不同任務的思考深度差異極大。

GPU kernel 優化的中位 thinking 長度達到19015 個字符,而 agentic coding 單步只有91 個字符,差距超過200 倍。

這說明,工業代碼并不存在一個統一的 “思考模板”。有些問題需要長鏈路推理(比如性能優化、硬件約束),有些則適合短決策(比如多輪 agent 操作)。

InCoder-32B Thinking 學到的,不是固定長度的 CoT,而是根據任務復雜度和環境反饋,動態調整思考深度 —— 復雜問題深推理,簡單問題快速決策。

這種能力,更接近真實工程師,而不是模板化的語言模型。

五、結果說明:工業代碼模型的競爭

已經開始從 “會寫” 轉向 “會驗證”



從結果來看,這條路線是有效的。

InCoder-32B Thinking 在14 個通用代碼 benchmark和9 個工業代碼 benchmark上進行了評測。在通用任務上保持競爭力,在工業場景中則取得顯著提升,包括CAD Coder 84.0%、KernelBench L2 38.0%等指標。

更關鍵的是,這些提升是跨領域的 —— 芯片設計、GPU 優化、嵌入式、編譯器、3D 建模都受益。

這說明它學到的,不是某個領域技巧,而是?種更底層的能力:

理解執行反饋 → 組織推理 → 完成修復

如果說過去大家比的是誰 “寫得更像人”,那么現在,工業代碼模型開始比的是誰 “更像工程師”。

開源信息

模型與代碼現已開源。

Hugging Face:https://huggingface.co/Multilingual-Multimodal-NLP/IndustrialCoder



GitHub:https://github.com/CSJianYang/Industrial-Coder

當代碼大模型開始不只生成代碼,而是開始預測代碼進入真實工業環境后的后果,工業代碼智能的門檻,也就從 “會寫程序” 抬高到了 “會理解系統”。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
假空姐大鬧亞航后續:真容曝光,真實身份被扒,私信乘客只求出名

假空姐大鬧亞航后續:真容曝光,真實身份被扒,私信乘客只求出名

愛寫的櫻桃
2026-04-25 21:34:02
90%訂單消失,中東旺季沒了

90%訂單消失,中東旺季沒了

中國新聞周刊
2026-04-25 07:28:04
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
13歲拿奶奶身份證開播,千萬粉絲網紅主播涼了

13歲拿奶奶身份證開播,千萬粉絲網紅主播涼了

鳳凰網財經
2026-04-24 19:40:21
曼城進足總杯決賽!四人被批評,一人獲盛贊:他讓防守球員崩潰!

曼城進足總杯決賽!四人被批評,一人獲盛贊:他讓防守球員崩潰!

聽我說球
2026-04-26 07:17:50
美國被曝考慮“懲罰”西班牙 桑切斯:支持盟友須遵守國際法

美國被曝考慮“懲罰”西班牙 桑切斯:支持盟友須遵守國際法

環球網資訊
2026-04-25 14:06:16
河北一女子稱用輪椅推患病親人到銀行取錢被拒:急需入院治療,人都快沒氣了;銀行致歉

河北一女子稱用輪椅推患病親人到銀行取錢被拒:急需入院治療,人都快沒氣了;銀行致歉

大象新聞
2026-04-25 21:45:03
女星陶昕然發長文回應被《乘風2026》淘汰,稱“想翻紅沒錯”:紅意味著選擇權,可我也知道這個世界不缺紅的方式,我會愛惜羽毛

女星陶昕然發長文回應被《乘風2026》淘汰,稱“想翻紅沒錯”:紅意味著選擇權,可我也知道這個世界不缺紅的方式,我會愛惜羽毛

魯中晨報
2026-04-25 16:08:13
特朗普、穆杰塔巴、佩澤希齊揚,同日表態

特朗普、穆杰塔巴、佩澤希齊揚,同日表態

極目新聞
2026-04-26 07:59:00
震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

火山詩話
2026-04-24 16:29:11
為什么你的電量焦慮出國就消失?

為什么你的電量焦慮出國就消失?

晚風也遺憾
2026-04-24 09:04:51
5月1日起車窗貼紙全作廢!不辦電子標罰200扣1分,車主必看的指南

5月1日起車窗貼紙全作廢!不辦電子標罰200扣1分,車主必看的指南

侃故事的阿慶
2026-04-25 07:58:23
別再尬演白月光!頂著大刀雙眼皮一臉疲態,這能讓男人念念不忘?

別再尬演白月光!頂著大刀雙眼皮一臉疲態,這能讓男人念念不忘?

攬星河的筆記
2026-04-25 15:08:35
中國西電、特變電工、東方電氣、上海電氣,最新年報含金量誰高?

中國西電、特變電工、東方電氣、上海電氣,最新年報含金量誰高?

長風價值掘金
2026-04-25 22:29:38
發現一個現象:根據歷史規律,中國可能成地球上最后一個超級大國

發現一個現象:根據歷史規律,中國可能成地球上最后一個超級大國

鶴羽說個事
2026-04-23 22:45:59
這條無恥新聞,引起公憤了!

這條無恥新聞,引起公憤了!

胖胖說他不胖
2026-04-25 14:07:02
列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

抽象派大師
2026-04-25 18:39:46
四川省第一大鎮,沒有爭議

四川省第一大鎮,沒有爭議

石辰搞笑日常
2026-04-24 13:27:13
鄭欽文VS萊巴金娜前瞻:觀賽時間不友好,戰勁敵能否更進一步?

鄭欽文VS萊巴金娜前瞻:觀賽時間不友好,戰勁敵能否更進一步?

全景體育V
2026-04-26 06:51:35
46歲馬寧領取亞足聯獎牌 霸氣閃耀亞冠決賽 罰下主隊球員:你出去

46歲馬寧領取亞足聯獎牌 霸氣閃耀亞冠決賽 罰下主隊球員:你出去

風過鄉
2026-04-26 06:28:50
2026-04-26 08:19:02
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12852文章數 142636關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

小伙被困隧道給母親留遺言:我救了個人可能出不去了

頭條要聞

小伙被困隧道給母親留遺言:我救了個人可能出不去了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

教育
時尚
親子
數碼
旅游

教育要聞

90后科學老師用塑料桶手搓4米高水火箭!

這些穿搭適合春天!外套彩色內搭白色、褲子穿基礎款,舒適大方

親子要聞

總感覺她們兩是上輩子的情人!

數碼要聞

OPPO手表6月推送新功能:身心狀態提醒、日照時長監測一應俱全

旅游要聞

安徽黃山:呈坎古村嬉魚燈

無障礙瀏覽 進入關懷版