Claude Code上線一年,多數(shù)人還在用它寫單行代碼。有個開發(fā)者做了件反直覺的事:關(guān)掉所有高級功能,裸機測試。
結(jié)果Plan Mode(規(guī)劃模式)的表現(xiàn),和網(wǎng)上傳的完全不一樣。
裸機測試:一個極簡CLI的誕生
測試者選了Typer框架,目標(biāo)很簡單——做一個帶3個命令的Python CLI工具。沒有CLAUDE.md文檔,沒有MCP(模型上下文協(xié)議)擴展,沒有自定義鉤子。
這種"裸奔"配置,恰恰是理解Claude Code出廠能力的唯一方式。
Typer被選中的理由很產(chǎn)品經(jīng)理:用終端命令造終端工具,有種遞歸的爽感。測試者原話:「There’s something inherently satisfying about using a terminal-based command to build more terminal tools」——翻譯過來就是,用命令行寫命令行,套娃快樂。
Plan Mode的隱藏邏輯
裸機狀態(tài)下,Claude Code的Plan Mode暴露了一個設(shè)計細(xì)節(jié):它會在執(zhí)行前生成結(jié)構(gòu)化步驟,而非直接蹦代碼。
這和AutoGPT時代的"想一步做一步"有本質(zhì)區(qū)別。Plan Mode先把需求拆成可驗證的子任務(wù),每個子任務(wù)帶明確的完成標(biāo)準(zhǔn)。測試者發(fā)現(xiàn),這種預(yù)規(guī)劃讓3命令CLI的代碼生成零返工。
零返工的前提是:需求邊界足夠清晰。
當(dāng)測試者嘗試模糊描述時,Plan Mode會主動追問——不是猜,是確認(rèn)。這種"保守型交互"在AI工具里很少見,多數(shù)產(chǎn)品選擇先給答案再讓用戶擦屁股。
為什么裸機測試有意義
開發(fā)者社區(qū)有個慣性:拿到新工具先堆配置。CLAUDE.md寫500行,MCP接7個服務(wù),鉤子調(diào)得飛起。
測試者的反套路在于:先測下限,再堆上限。裸機表現(xiàn)決定了工具的容錯空間——當(dāng)網(wǎng)絡(luò)斷了、MCP掛了、文檔丟了,Claude Code還能不能干活?
答案是能,但有個條件。Plan Mode依賴的上下文窗口(context window)必須夠大,才能把完整規(guī)劃塞進一次對話。測試者沒提具體數(shù)字,但暗示了"長規(guī)劃"和"短執(zhí)行"的拆分策略。
這種策略的代價是:用戶得習(xí)慣"先等它想,再看它做"。急性子的人可能會直接切回普通模式。
下一步的懸念
測試者預(yù)告了續(xù)篇:同一項目,疊滿CLAUDE.md + MCP + 自定義技能后的對比。
裸機已經(jīng)能零返工,加完配置會飛成什么樣?或者反過來——當(dāng)高級功能互相打架時,裸機的穩(wěn)定性會不會反而更香?
你平時用AI寫代碼,是先堆配置還是先裸機試錯?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.