網易首頁 > 網易號 > 正文 申請入駐

連按Tab完成重構:螞蟻CodeFuse團隊提出無指令代碼編輯框架NES

0
分享至



在 AI coding 工具快速演進的今天,“讓模型寫代碼” 正在從補全、問答走向Agent 端到端編程:從需求拆解、跨文件修改到測試修復,一次任務動輒涉及多輪規劃與執行。

但在真實開發里,最頻繁、最消耗注意力的往往不是 “大任務”,而是無處不在的小編輯:一次重命名、一次參數補全、一次跨文件 refactor 的連鎖修改…… 這些動作密集、節奏快,任何額外的提示詞輸入、等待模型響應或頻繁切換上下文,都會打斷開發者的 “心流”。

螞蟻集團的 CodeFuse 算法團隊長期從事大模型代碼生成 / 編輯、AI IDE 智能輔助與工程化落地研究。此次在 FSE 2026 的 Industry Track 提出了NES(Next Edit Suggestion):一個無指令(instruction-free)、低延遲(<250ms)的 “下一步編輯建議” 框架。NES 不要求開發者先用自然語言描述意圖,而是從歷史編輯軌跡(historical editing trajectories)里學習開發者的目標與習慣,直接給出 “下一處該改哪里、該怎么改” 的建議,并把交互簡化為連續的 Tab → Tab → Tab。

FSE(ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering)是全球軟件工程領域的頂級學術會議(CCF-A 類)其中的 Industry track 專門面向卓越應用研究,重點考察工作的顯著性 (Significance)、穩健性 (Soundness) 以及對當前工業實踐的改進程度。



  • 論文:NES: An Instruction-Free, Low-Latency Next Edit Suggestion Framework Powered by Learned Historical Editing Trajectories(FSE 2026)
  • arxiv:https://arxiv.org/html/2508.02473v3

一、大模型會寫,但 “編輯協作” 仍不夠順滑

近兩年,代碼大模型工具顯著提升了代碼生成與編輯效率,但在代碼編輯(code editing)這類高頻任務中,現有范式仍有兩類關鍵痛點:

1. 過度依賴顯式指令,打斷心流

很多研究與產品的編輯能力建立在 “用戶先用自然語言描述修改意圖 → 模型再生成 patch” 的鏈路上。現實中,開發者并不總能(也不愿意)把 “下一步要改什么” 先說清楚:尤其在重構、維護、跨文件依賴調整中,編輯意圖往往是邊讀邊改、逐步推進的。

2. 編輯任務強時效,延遲直接影響可用性

代碼編輯與補全一樣是 “即時交互” 場景。論文指出用戶通常期望 1 秒內反饋,而很多方法還依賴較重的理解、檢索或推理流程,導致延遲上升,進一步放大 “打斷感”。

更重要的是:編輯并非一次性動作。一個 “看似簡單” 的需求(例如把一個組件新增屬性)往往會觸發連鎖修改:改接口、改實現、改調用點、補參數…… 如果每一步都要重新描述、重新等待,就很難形成真正的協作體驗。

二、NES 從歷史編輯軌跡去判斷 “下一步如何改”

NES 的出發點來自一個樸素但被低估的事實:

開發者的目標與習慣,往往沉淀在他們的歷史編輯模式里。

例如重復的重構動作、跨文件依賴的修改路徑、某類 API 的調用順序、團隊內的代碼風格等,都能從 “編輯軌跡” 中體現出來。NES 選擇把這些軌跡當作 “隱式意圖信號”,從而繞開顯式自然語言指令。



為此,NES 設計了一個雙模型架構:

  • NES-Location:預測 “下一處最可能的編輯位置”(跨文件 / 跨模塊的導航建議)。
  • NES-Edit:在到達位置后生成 “應該如何改” 的具體代碼修改。

三、從 “軌跡采集 → 數據構建 → 兩階段訓練 → 推理加速” 閉環落地

NES 的實現可以拆成三個關鍵環節。

3.1 軌跡采集:用增量 diff 捕獲真實編輯操作

要讓模型學到 “編輯習慣”,首先要能穩定捕獲編輯軌跡。NES 在 IDE 插件側實現了實時、增量的差異檢測(incremental difference detection),把計算范圍從 “全文件 diff” 收縮到 “當前被修改的局部片段”,以降低開銷并提升實時性。

同時,論文提出了自定義的NES diff 格式:不僅標注新增 / 刪除 / 保留行,還給每一行加上絕對行號,提升信息密度并減少位置歧義。這一點對 “預測編輯位置”“生成可直接應用的 patch” 都很關鍵。

3.2 兩階段訓練:SFT 學模式,DAPO 對齊人類偏好

NES 對兩個模型都采用了兩階段后訓練流程:

  • Stage 1:SFT(監督微調):讓模型先學會基本的編輯模式與軌跡 - 意圖映射。
  • Stage 2:DAPO(強化學習對齊):在高質量偏好數據上進一步優化行為,使輸出更貼近真實開發者的 “有用建議”。





通過兩階段的模型訓練,NES 在核心指標上達到 SOTA:

  • 編輯位置預測準確率 75.6%(NES-Location)
  • 編輯內容 Exact Match Rate 27.7%(NES-Edit)

3.3 推理優化:把 “可落地性” 拉到 250ms 以內

在 IDE 內聯建議場景里,推理延遲幾乎決定生死。NES 在系統側引入了Prefix Caching與Speculative Decoding等優化,并針對工業環境進行工程調優,使端到端建議響應達到 平均 <250ms 的量級。

工業部署上,論文給出了選擇小模型(Qwen3-4B)并結合高質量后訓練數據的理由:

  • 8B 等更大模型成本與延遲更高,不適合 “低延遲” 體驗目標。
  • 通過 SFT+DAPO,小模型也能達到很強的任務效果,具備更優的成本性能。

四、效果與價值:交互鏈路被重構

4.1 效果展示:

邏輯類的修改,當用戶把 Point2D 改為 Point3D 時,模型能夠理解代碼邏輯的變化,首先增加 z 參數,接著預測需要跳轉到第 18 行進行修改,用戶采納修改后,緊接著預測用戶到第 19 行進行修改



格式統一,當把 Monday 修改為星期一時,首先 edit 模型會對 7-9 行進行同樣的命名風格修改,用戶采納后,next-tab 模型幫助用戶導航到第 10 行進行同樣的修改,整個過程用戶只需要按 tab 鍵即可完成



4.2 開發者與代碼的交互鏈路被改寫

很多工具的編輯能力建立在 “先描述 → 模型再改” 的范式上,評估也常圍繞單次編輯是否正確。NES 的價值在于它把協作粒度切到 “下一步”,把編輯變成一個連續循環:

  • Location讓跨文件修改的 “導航成本” 顯著下降;
  • Edit讓到位后的改動可以直接一鍵接受;
  • 二者組合形成鏈式推進,尤其適合 refactor 這類連鎖任務。

這類體驗的提升,對開發者心流非常重要。

五、NES 在 Agent 時代的不可替代生態位

寫代碼從來不是一次性的創作,而是無數次 "發現問題→定位→修改→再定位" 的循環。那些打斷心流的瞬間,往往不是來自一個復雜的 Bug,而是一次又一次的 "下一處該改哪"。

在 Code Agent 快速發展的今天,編輯級的精準響應反而成為更難被繞過的基礎能力 —— 它直接關乎開發者能否真正保持心流、信任 AI 的建議并持續采納。NES 給出的答案是:從軌跡里學意圖,把延遲壓到感知閾值以內,讓 "下一步" 變成一次 Tab。當模型開始比你更早知道該改哪里,人與 AI 的協作邊界,正在被悄悄重構。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
鯰魚須之后,“水母頭”又在小學生中流行,顏值低的剪了很尷尬

鯰魚須之后,“水母頭”又在小學生中流行,顏值低的剪了很尷尬

蝴蝶花雨話教育
2026-04-19 00:50:03
你是怎么發現老婆出軌的?網友匿名分享真實經歷,一個比一個扎心

你是怎么發現老婆出軌的?網友匿名分享真實經歷,一個比一個扎心

大熊歡樂坊
2026-04-20 02:29:01
杜蘭特傷情更新!G2出戰狀態最新消息

杜蘭特傷情更新!G2出戰狀態最新消息

行舟問茶
2026-04-20 13:21:07
他是毛主席的好干部,1979年判刑13年,2004年去世十萬人沿街磕頭

他是毛主席的好干部,1979年判刑13年,2004年去世十萬人沿街磕頭

阿器談史
2026-04-20 16:26:53
激烈交鋒,解放軍接到消息,日本恐重蹈二戰覆轍,岸田文雄已扛旗

激烈交鋒,解放軍接到消息,日本恐重蹈二戰覆轍,岸田文雄已扛旗

阿校談史
2026-04-20 15:44:39
絕不談判!永久關閉豁免窗口!中國打響光刻機反擊戰

絕不談判!永久關閉豁免窗口!中國打響光刻機反擊戰

阿七說史
2026-04-20 15:10:26
美伊復談美先遣團隊抵達伊斯蘭堡

美伊復談美先遣團隊抵達伊斯蘭堡

界面新聞
2026-04-19 20:41:03
鹿晗生日關曉彤刪慶生動態,男方曾被曝出軌,女方上春晚哭腫雙眼

鹿晗生日關曉彤刪慶生動態,男方曾被曝出軌,女方上春晚哭腫雙眼

冷紫葉
2026-04-20 17:08:43
男子收到陌生賬號轉賬8萬余元,3天后一奢侈品牌商家找來:員工誤將其收款碼給交易客戶;男子稱巨款或給賬戶造成金融安全風險

男子收到陌生賬號轉賬8萬余元,3天后一奢侈品牌商家找來:員工誤將其收款碼給交易客戶;男子稱巨款或給賬戶造成金融安全風險

大象新聞
2026-04-19 23:47:08
外交部談霍爾木茲海峽局勢:對美方強制截停有關船只表示關切

外交部談霍爾木茲海峽局勢:對美方強制截停有關船只表示關切

新京報
2026-04-20 15:47:06
72歲王健林健康引擔憂,眼神癡呆嘴歪到認不出,疑患癌后消耗暴瘦

72歲王健林健康引擔憂,眼神癡呆嘴歪到認不出,疑患癌后消耗暴瘦

往史過眼云煙
2026-03-15 17:12:00
小學生拒絕“借”車遭毆打還被搜家,8人未滿14歲不處罰、1人被處行拘免執行,家長稱看施暴視頻氣得吃救心丸

小學生拒絕“借”車遭毆打還被搜家,8人未滿14歲不處罰、1人被處行拘免執行,家長稱看施暴視頻氣得吃救心丸

極目新聞
2026-04-19 22:39:27
16分鐘被定位2639次!國家安全部緊急提醒:手機軌跡恐成泄密地

16分鐘被定位2639次!國家安全部緊急提醒:手機軌跡恐成泄密地

有范又有料
2026-04-18 16:35:23
美國首次動武扣伊朗船只,特朗普稱不做“好好先生”,談判還有戲嗎?

美國首次動武扣伊朗船只,特朗普稱不做“好好先生”,談判還有戲嗎?

上觀新聞
2026-04-20 15:38:03
美國死盯伊朗,金正恩突然亮出核武牌,短短數小時連出兩記重拳

美國死盯伊朗,金正恩突然亮出核武牌,短短數小時連出兩記重拳

黑鷹觀軍事
2026-04-20 14:42:19
柳葉刀子刊:過量吃豬牛羊肉、吸煙和高血糖,是全球乳腺癌激增的「隱形推手」

柳葉刀子刊:過量吃豬牛羊肉、吸煙和高血糖,是全球乳腺癌激增的「隱形推手」

醫諾維
2026-04-20 16:58:33
文章面館開業4天后,終于有藝人到場!網友:這對比太心酸了

文章面館開業4天后,終于有藝人到場!網友:這對比太心酸了

娛小余
2026-04-19 23:21:33
失敗了!送出全明星首發+1億美金,換了31歲黑洞,真不如去馬刺啊

失敗了!送出全明星首發+1億美金,換了31歲黑洞,真不如去馬刺啊

籃球信息社
2026-04-19 20:46:27
一季度被外國人買走50億元的保溫杯,有8成出自這個浙江小縣城

一季度被外國人買走50億元的保溫杯,有8成出自這個浙江小縣城

金卡讀城
2026-04-20 17:21:33
巴黎FC主帥:我們隊里的意大利人都比尤文和米蘭的意大利人多

巴黎FC主帥:我們隊里的意大利人都比尤文和米蘭的意大利人多

懂球帝
2026-04-20 09:47:26
2026-04-20 18:03:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12811文章數 142632關注度
往期回顧 全部

科技要聞

華為Pura90逆周期定價,4699元起,未漲價

頭條要聞

小伙入職僅一天公司40多部手機集體"失靈" 警方提醒

頭條要聞

小伙入職僅一天公司40多部手機集體"失靈" 警方提醒

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

本地
旅游
親子
數碼
公開課

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

旅游要聞

英國倫敦:維多利亞與阿爾伯特博物館東館即將開放

親子要聞

孕兩月胎教日記:欣賞摩羯男張凌赫

數碼要聞

華為MateBook 14鴻蒙版筆記本官宣搭載麒麟X90處理器

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版