兩年來,關(guān)于人工智能顛覆軟件工程的討論一直遵循著同樣的敘事模式:模型變得越來越智能,基準(zhǔn)測(cè)試不斷提高。
但這個(gè)畫面,其實(shí)已經(jīng)過時(shí)了。
![]()
過去兩個(gè)月發(fā)生的根本性轉(zhuǎn)變,核心并不在于智能的提升,而在于人工智能的“生存環(huán)境”——它能夠觸及和操作的邊界,發(fā)生了根本變化。
界面的遷移
到2025年12月為止,主流的AI編程工具還只是集成在IDE里的助手。它們安靜地待在你旁邊,時(shí)不時(shí)給點(diǎn)建議。你來決定運(yùn)行什么,去看報(bào)錯(cuò)信息,琢磨下一步怎么走。
雖然實(shí)用,但從根本上說,它是個(gè)被動(dòng)的角色。AI根本不清楚整個(gè)系統(tǒng)跑起來是否正常。它既不能自己運(yùn)行程序,也無法主動(dòng)發(fā)現(xiàn)問題、更別說嘗試修復(fù)了。整個(gè)過程,人類依然是主導(dǎo)。
而像Codex CLI和Claude Code這類工具,徹底改變了這個(gè)局面。它們把AI從編輯器里請(qǐng)了出來,直接放到了終端里。現(xiàn)在,模型可以自己讀取代碼庫、執(zhí)行命令、運(yùn)行測(cè)試、分析失敗原因、動(dòng)手修改代碼,然后再試一次——整個(gè)過程,基本不需要你中途插手。
![]()
聽起來好像只是換了個(gè)地方放工具,但事情遠(yuǎn)沒有這么簡(jiǎn)單。
真正的工作,從來不是寫代碼。
這可能是大多數(shù)人對(duì)軟件工程師工作的最大誤解。
把代碼敲出來,只是最后那個(gè)看得見的成果。真正耗神的工作,是圍繞代碼展開的一系列活動(dòng):理解現(xiàn)有系統(tǒng),運(yùn)行測(cè)試,定位問題,提出假設(shè),然后驗(yàn)證、再重試。
這個(gè)過程,本質(zhì)上不是靠“想”就能解決的推理問題,而更像是一個(gè)不斷試錯(cuò)的“搜索”問題。你需要一次次嘗試,直到找到可行的方案。實(shí)驗(yàn)的節(jié)奏越快,找到正確答案的節(jié)奏也就越快。
普通人遇到難題,大概在嘗試三四個(gè)假設(shè)后,思路就開始跟不上了。而AI智能體呢?在你還沒讀完第一個(gè)報(bào)錯(cuò)信息的時(shí)候,它可能已經(jīng)跑完幾十個(gè)假設(shè)了。
一旦機(jī)器能以遠(yuǎn)超人類的速度來跑這個(gè)“搜索-驗(yàn)證”循環(huán),整個(gè)結(jié)構(gòu)就會(huì)發(fā)生變化。中間那些重復(fù)性高、創(chuàng)造性低的工作——樣板代碼、數(shù)據(jù)遷移、系統(tǒng)對(duì)接、日常調(diào)試——會(huì)迅速變得成本極低。真正的價(jià)值,開始向兩端轉(zhuǎn)移。
一端是頂層設(shè)計(jì):系統(tǒng)架構(gòu)、抽象模型、那些決定產(chǎn)品最終形態(tài)的關(guān)鍵決策。另一端是底層支撐:確保這些設(shè)計(jì)能準(zhǔn)確落地的堅(jiān)實(shí)基礎(chǔ)。
驗(yàn)證的鴻溝
然而,這種轉(zhuǎn)變也暴露了一個(gè)大多數(shù)團(tuán)隊(duì)還沒準(zhǔn)備好的問題。
“測(cè)試”是檢查代碼有沒有按預(yù)期運(yùn)行。“驗(yàn)證”是檢查代碼的運(yùn)行結(jié)果,是不是真的達(dá)成了你想要的效果。你寫在文檔里的需求,和你內(nèi)心真正渴望解決的問題,這中間的差距,正是AI智能體最容易出問題的地方。有些智能體雖然能完美通過你寫的所有測(cè)試,但卻可能把你的系統(tǒng)搞得一團(tuán)糟。
AI智能體非常擅長(zhǎng)滿足那些明確寫出來的規(guī)則,但它們很難發(fā)現(xiàn)那些你沒寫出來、甚至沒想到的規(guī)則。它們能找到讓所有測(cè)試用例都變綠的那個(gè)解,但它們不知道測(cè)試本身可能漏掉了什么。
人類工程師腦子里裝著代碼庫里沒有的東西:團(tuán)隊(duì)的歷史記憶,當(dāng)初設(shè)計(jì)的深層意圖,還有兩年前某個(gè)沒來得及寫進(jìn)文檔的關(guān)鍵決策背后的權(quán)衡。這些都是AI智能體沒有的。它只能看到代碼庫里的內(nèi)容,以及你明確給它的優(yōu)化目標(biāo)。
所以,它一定會(huì)去優(yōu)化,而且效率極高,但有時(shí)候,它會(huì)朝著一些你完全沒想到的方向去優(yōu)化,結(jié)果讓你大吃一驚。
新的瓶頸
瓶頸已經(jīng)轉(zhuǎn)移了:不再是從人到機(jī)器,也不再是從慢到快,而是從“生成”轉(zhuǎn)向了“驗(yàn)證”。
現(xiàn)在,稀缺的不再是“產(chǎn)出”的能力——人人都能產(chǎn)出大量代碼。真正稀缺的,是那個(gè)在產(chǎn)出被正式接受之前,負(fù)責(zé)驗(yàn)證它到底靠不靠譜的基礎(chǔ)設(shè)施。
比如,能模擬真實(shí)工作流程的評(píng)估工具;能在新代碼上線、性能下降之前就把它攔下來的部署門禁;基于“肯定會(huì)出問題”這個(gè)前提構(gòu)建的回滾機(jī)制;記錄AI每一步操作、方便事后追溯的審計(jì)日志;還有能把潛在影響范圍控制住的權(quán)限設(shè)計(jì)。
最后能想明白這一點(diǎn)的團(tuán)隊(duì),未必是代碼生成速度最快的團(tuán)隊(duì),而是那些率先構(gòu)建起底層架構(gòu),能有效約束和驗(yàn)證AI產(chǎn)出的團(tuán)隊(duì):包括控制層、評(píng)估體系、信任機(jī)制——正是這些東西,讓AI可以在真實(shí)的、復(fù)雜的大規(guī)模系統(tǒng)中穩(wěn)定可靠地運(yùn)行。
這份工作的性質(zhì),升級(jí)了。
![]()
軟件工程師這個(gè)角色并沒有消失,只是職責(zé)發(fā)生了演化:從親手編寫代碼,轉(zhuǎn)變?yōu)楣芾硪粋€(gè)能編寫代碼的系統(tǒng);從親自跑通那個(gè)“假設(shè)-驗(yàn)證”循環(huán),轉(zhuǎn)變?yōu)槿ザx這個(gè)循環(huán)的目標(biāo)和邊界。
最終能跑出來的公司,不會(huì)是那些押注于下一個(gè)更強(qiáng)模型的,而是那些押注于構(gòu)建更可靠驗(yàn)證機(jī)制的公司。
外面的大多數(shù)人,還沒意識(shí)到這一點(diǎn)。而在這里親手建設(shè)這一切的人,已經(jīng)忙得顧不上等他們反應(yīng)過來了。
via:Natasha Malpani
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.