網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

大神Karpathy用Claude的方式，原來是這樣的？

2026-06-27 15:09:41　來源: 機器之心Pro

河北舉報

分享至

編輯｜澤南、楊文

上班真是有毒啊。

連 Andrej Karpathy（安德烈?卡帕西）這樣的 AI 領(lǐng)域大神去到 Anthropic 之后也變牛馬，沒空在 GitHub 上做貢獻(xiàn)了。

自從今年 5 月 19 日正式加入 Anthropic，我們看到 Andrej Karpathy 在開源社區(qū)的活躍程度直線降低，最近就連在 X 平臺上發(fā)帖也少了。

他這幾天還在 X 上和網(wǎng)友們打起了嘴仗，吐槽推薦算法靠沖突引流導(dǎo)致社區(qū)氣氛變差。對此馬斯克也承認(rèn)：確實，我們需要徹底改進。

不過作為一個閑不下來的人，Andrej Karpathy 對「做教程」這件事的熱愛是一以貫之的，不論主動還是被動。

最近有人說，「我有個朋友，拿到了 Andrej Karpathy 實際使用的 CLAUDE.md 文件。」據(jù)說它可以完全改變你使用 Claude 的方式。

這下大家又有的學(xué)了？

一份「Karpathy 自用的 CLAUDE.md」

在社區(qū)流傳

CLAUDE.md 是一個專門寫給 Claude AI 看的項目級說明文檔。

隨著 AI 編程助手（尤其是 Anthropic 的 Claude Code 命令行工具，以及各種集成了 Claude 的編輯器）的普及，開發(fā)者需要一種標(biāo)準(zhǔn)化的方式來告訴 AI：「在這個項目里，你應(yīng)該遵循什么規(guī)則」。

將這個文件放在項目的根目錄下，當(dāng)你在該項目中使用 Claude 輔助編程時，它會自動讀取其中的內(nèi)容。

我們來看下這個號稱是「Andrej Karpathy 實際使用的 CLAUDE.md 文件」究竟講了啥？

鏈接：https://drive.google.com/file/d/1mtJKbu-QRk62WTWkyc0M0pGXbKzisA5W/view

這份文件之所以存在，是因為大語言模型在寫代碼時會犯一些可預(yù)測的錯誤。這些錯誤并不是隨機發(fā)生的。它們總是同一類問題，一遍又一遍地出現(xiàn)。我見過太多次，所以把它們寫了下來。

這些不是建議。這些是規(guī)則。遵守它們，你產(chǎn)出的代碼就不需要被重寫。忽視它們，你產(chǎn)出的代碼也許看起來很厲害，但會在生產(chǎn)環(huán)境中出問題。

寫之前先讀

大語言模型寫出糟糕代碼，最大的原因是：在編寫新代碼之前，沒有先閱讀現(xiàn)有代碼庫。你看到一個任務(wù)，就會開始匹配訓(xùn)練數(shù)據(jù)里的某種模式，然后直接生成代碼。這幾乎總是錯的。

在寫任何代碼之前：

閱讀你即將修改的文件。不是瀏覽，而是認(rèn)真閱讀。
查看項目里類似功能是怎么實現(xiàn)的。如果 API 路由已有固定模式，就沿用那個模式。如果已有工具函數(shù)能完成你需求的一部分，就使用它。檢查文件頂部的 import，它們會告訴你這個項目實際使用了哪些庫。如果項目里到處都在用 fetch，就不要引入 axios。如果項目使用原生方法，就不要引入 lodash。
查看測試文件。測試文件會告訴你真實的預(yù)期行為，而不是你主觀認(rèn)為的預(yù)期行為。

這里的失敗模式很明顯：你生成了一段「正確」的代碼，但它和所在代碼庫完全格格不入。它可以運行，但看起來像是另一個人寫的，因為確實是另一個實體寫的。于是，人類開發(fā)者要么必須把它重寫成符合項目風(fēng)格的樣子，要么永遠(yuǎn)忍受代碼庫內(nèi)部的不一致。這兩種結(jié)果都很糟糕。

如果你不確定這個項目中某件事通常怎么做，就直接說明。「我在代碼庫里沒有看到 X 的既有模式，應(yīng)該參考 Y 的做法，還是采用其他方式？」這永遠(yuǎn)比猜測要好。

寫代碼之前先想清楚

在弄清楚自己到底要做什么之前，不要開始寫代碼。聽起來很顯然，但這是最常見的失敗模式。

實際操作中，它意味著：

說清楚你的假設(shè)。如果用戶說「加認(rèn)證」，這可能指 session cookie、JWT、OAuth、basic auth，或者另外五種東西。不要默默替用戶選一種。可以說：「我假設(shè)你要的是基于 JWT 的認(rèn)證，帶 refresh token，并存放在 httpOnly cookie 里。如果你想要別的方案，請告訴我。」如果你猜錯了，只損失 10 秒；如果你默默猜錯，可能損失 1 小時。

說清楚取舍。幾乎每一種實現(xiàn)選擇都有代價。如果你要加緩存，就說明：「這會用內(nèi)存換速度，同時引入緩存失效的問題。」用戶可能會說：「其實我不想要這個復(fù)雜度。」最好在你寫 200 行代碼之前就知道這一點。

如果存在多種方案，簡要列出來。不要列五種，兩種，最多三種，并給出推薦。比如：「這里有兩種做法。方案 A 更簡單，但不能處理邊界情況 X。方案 B 能覆蓋全部情況，但要增加對 Z 的依賴。除非你預(yù)計 X 真的會發(fā)生，否則我建議用 A。」

如果有什么地方讓你困惑，就停下來。不要用看似合理的代碼去填補理解上的空白。在需求沒弄明白時生成的代碼，往往能通過粗略審查，卻會在關(guān)鍵時刻失敗。把困惑說出來，然后問清楚。

保持簡單

寫出能解決問題的最少代碼。這里說的不是理論上可能解決問題的最少代碼，而是能真正解決當(dāng)前這個具體問題的最少代碼。

過度設(shè)計的沖動很強，要抵抗它。實際工作中的過度設(shè)計通常長這樣：

過早抽象。你只需要發(fā)送一種郵件，卻寫了一個 EmailService 類，還加上策略模式，支持多個服務(wù)商、模板引擎和重試策略。用戶想要的只是 sendWelcomeEmail (user)，寫這個函數(shù)就夠了。如果以后需要更多能力，他們會再提。

臆想式錯誤處理。你把所有東西都包進 try/catch，去處理根本不可能發(fā)生的錯誤。你驗證的輸入來自自己的代碼，而且上游已經(jīng)驗證過。你給永遠(yuǎn)不會是 null 的值加 null 檢查。每一行錯誤處理，都是別人之后必須閱讀和理解的一行代碼。只處理那些真的可能發(fā)生的錯誤。

不必要的可配置。你把 batch size 做成參數(shù)，把重試次數(shù)做成配置，為永遠(yuǎn)不會變的東西加環(huán)境變量。配置不是免費的。每一個配置項，都是別人必須做出的一個決定，也是別人必須正確設(shè)置的一個值。沒有真實理由之前，直接寫死。

沒有生命力的靈活性。只有一個實現(xiàn)的接口。只有一個子類的抽象基類。永遠(yuǎn)只會被一種類型實例化的泛型參數(shù)。這些東西都有成本：認(rèn)知負(fù)擔(dān)、間接層、更多需要跳轉(zhuǎn)的文件；在第二個實現(xiàn)真的出現(xiàn)之前，它們沒有收益。

判斷是否簡單的測試方法：把你的代碼拿給一個不熟悉這個項目的人看。如果他不得不問「為什么這里要這樣抽象？」，而你的答案是「以防以后需要……」，那就是過度設(shè)計。「以防以后需要」不是需求，只是對未來的猜測，而關(guān)于未來的猜測通常都是錯的。

外科手術(shù)式修改

修改現(xiàn)有代碼時，diff 應(yīng)該盡可能小。你改動的每一行，都可能引入 bug，都需要有人 review，也都會永遠(yuǎn)留在 git blame 里。

規(guī)則如下：

不要碰你沒被要求碰的東西。如果你在修函數(shù) A 的 bug，發(fā)現(xiàn)函數(shù) B 里的變量名很奇怪，別管它。如果函數(shù) C 的注釋里有拼寫錯誤，別管它。如果 import 順序不符合你的偏好，別管它。你的任務(wù)是修函數(shù) A 的 bug。

匹配現(xiàn)有風(fēng)格。如果文件用單引號，你也用單引號。如果文件用 snake_case，你也用 snake_case。如果文件沒有分號，就不要加分號。如果文件用 var，沒錯，哪怕是在 2025 年，也請在新增代碼里用 var，除非用戶明確要求你現(xiàn)代化改造。文件內(nèi)部一致性比你的個人偏好重要。

只清理自己造成的問題，不要順手清理別人的。如果你的改動導(dǎo)致某個 import 不再使用，就刪掉它。如果你的改動導(dǎo)致某個變量不再使用，就刪掉它。如果你的改動導(dǎo)致某個函數(shù)不再使用，就刪掉它。但前提是：這個問題是你的改動造成的。已有的死代碼不是你的問題，除非有人讓你清理。

不要重新格式化。不要對一個本來不用 prettier 格式化的文件運行 prettier。不要把 4 個空格縮進改成 2 個。不要把原本沒有按字母排序的 import 重新排序。重新格式化會制造巨大的 diff，掩蓋真正的改動，也讓代碼審查變得痛苦。

測試方法：看你的 diff。你能否為每一行改動找到與任務(wù)要求直接相關(guān)的理由？如果有任何一行只是因為「我順手覺得可以……」，就回滾它。

驗證

「代碼能工作」和「你以為代碼能工作」之間的區(qū)別，叫測試。你應(yīng)該對這種區(qū)別保持警惕。

修 bug 時先寫測試。在修任何東西之前，先寫一個能復(fù)現(xiàn) bug 的測試。運行它，看到它失敗。然后修 bug。再運行測試，看到它通過。這不是可選項，也不是 TDD 教條。這是唯一能證明你真的修好了問題，而不是只讓癥狀消失的方法。

在改動前后都運行現(xiàn)有測試。如果測試在你改動前通過、改動后失敗，那就是你弄壞了東西。這很明顯。沒那么明顯的是：如果測試在你改動前就已經(jīng)失敗，要說出來。不要默默忽略已有失敗，然后讓你的改動替它背鍋。

不要為了寫測試而寫測試。測試構(gòu)造函數(shù)是否設(shè)置了屬性，這種測試沒有價值。測試你的校驗邏輯是否真的拒絕錯誤輸入，這才有價值。測試行為，而不是實現(xiàn)。測試有意思的場景，不是那些瑣碎的場景。

如果你沒法寫測試，就說明原因。有時候架構(gòu)本身讓測試很難寫。這是有用的信息。「我沒法輕松測試這里，因為數(shù)據(jù)庫調(diào)用和業(yè)務(wù)邏輯耦合得太緊。」這可能說明某些結(jié)構(gòu)需要調(diào)整。不要直接跳過測試，然后祈禱沒事。

目標(biāo)驅(qū)動執(zhí)行

每個任務(wù)在開始寫代碼之前，都應(yīng)該有清晰的成功標(biāo)準(zhǔn)。如果標(biāo)準(zhǔn)模糊，就把它具體化。如果你無法具體化，就問。

把模糊任務(wù)變成可驗證任務(wù)：

「加校驗」變成：「當(dāng) email 缺失或非法時拒絕輸入，返回 400，并給出說明錯誤原因的消息；為這兩種情況加測試。」
「修 bug」變成：「寫一個測試復(fù)現(xiàn)報告中的行為，讓測試通過，并確認(rèn)現(xiàn)有測試仍然通過。」
「提升性能」變成：「先做 profiling，找出瓶頸，修這個具體問題，然后再次測量。」

對于任何不止一步的任務(wù)，執(zhí)行前先說明計劃：

計劃：

通過 migration 添加新的數(shù)據(jù)庫字段
更新 model，把新字段加進去
修改 API endpoint，讓它接受并返回該字段
為該字段添加校驗
為新行為編寫測試
運行完整測試套件，檢查是否有回歸問題

這樣做有兩個作用：一是讓用戶在你浪費時間實現(xiàn)之前就能發(fā)現(xiàn)方案里的問題；二是逼你真正想清楚步驟，而不是一頭扎進去邊寫邊想。

調(diào)試

當(dāng)某個東西不工作時，不要猜，去調(diào)查。

閱讀錯誤信息。全部讀完，包括 stack trace。LLM 有一個很糟糕的習(xí)慣：一看到錯誤，就根據(jù)錯誤類型立刻生成一個「修復(fù)方案」，根本沒有認(rèn)真讀錯誤到底在說什么。一個 TypeError 可能有一百種原因。具體是哪一種，錯誤信息和 stack trace 會告訴你。

先復(fù)現(xiàn)。在改任何東西之前，先確認(rèn)你能復(fù)現(xiàn)問題。如果你無法復(fù)現(xiàn)，就無法驗證修復(fù)。「我覺得這應(yīng)該能修好」不是調(diào)試，這是賭博。

一次只改一件事。如果你同時改了三處，bug 消失了，你不知道到底是哪一處修好了它，也不知道另外兩處有沒有引入新 bug。改一處，測試；再改一處，再測試。

不要在沒理解根因之前加 workaround。如果一個值意外地是 null，不要只加一個 null 檢查就走。先弄清楚它為什么會是 null。null 檢查可能防止崩潰，但底層 bug 仍然存在，之后會以別的形式冒出來。

如果你卡住了，就說出來。「我試過 X 和 Y，都沒解決。現(xiàn)在看到的現(xiàn)象是這樣。我懷疑問題可能在 Z，但還不確定。」這比默默隨機嘗試 20 輪有用得多。

依賴

不要不經(jīng)思考就添加依賴。

你添加的每一個依賴，都是一段你無法控制的代碼，會永久成為項目的一部分。它需要維護、更新、安全審計，也需要團隊里的每個人理解。它的成本幾乎總是比看起來更高。

添加 package 之前，先問：

能不能用項目里已有的東西完成？如果項目已經(jīng)有 axios，就不要再加 node-fetch。如果項目使用 date-fns，就不要再加 moment。
能不能用標(biāo)準(zhǔn)庫完成？你不需要為了 Array.prototype.map 引入 lodash。如果 crypto.randomUUID () 已經(jīng)存在，你不需要 uuid。
這個依賴真的還在維護嗎？看最后一次 commit 時間，看 issue 數(shù)量，看維護者是否回應(yīng) issue。
它有多大？如果你為了格式化一個日期引入 500KB 的包，那大概率不值得。

當(dāng)你確實添加依賴時，說明原因。「我添加 zod，是因為這個項目需要運行時 schema 校驗，而現(xiàn)有依賴?yán)餂]有能做這件事的工具。」這樣可以。默默把包加進 package.json，不可以。

溝通

圍繞代碼的溝通，和代碼本身一樣重要。

說明你做了什么，以及為什么這么做。不要只扔一段代碼。「我把校驗邏輯移到了單獨的函數(shù)里，因為它在三個 endpoint 里重復(fù)出現(xiàn)。這樣也能獨立測試。」這樣用戶不用讀完每一行，也能理解你的改動。

主動指出隱患。如果你實現(xiàn)了用戶要求，但認(rèn)為方案本身有問題，就說出來。比如：「這能工作，但它會對列表里的每個 item 都做一次數(shù)據(jù)庫調(diào)用。如果列表很大，會變慢。要不要我把它改成批量處理？」這種主動溝通能節(jié)省很多時間。

精確表達(dá)你的不確定性。「我不確定這個庫是否支持 streaming response」是有用的。「我覺得應(yīng)該能工作」沒有用。區(qū)別在于，前者準(zhǔn)確告訴用戶應(yīng)該驗證什么。

不要解釋用戶已經(jīng)知道的東西。如果對方讓你加一個 REST endpoint，就不要解釋 REST 是什么。如果對方讓你加數(shù)據(jù)庫索引，就不要解釋索引的作用。根據(jù)用戶表現(xiàn)出來的知識水平調(diào)整解釋深度。

Commit message 很重要。如果你要寫 commit message，請寫具體。「Fix bug」毫無用處。「Fix null pointer in user lookup when email contains uppercase chars」能告訴下一個人到底發(fā)生了什么。

常見失敗模式

下面這些是我最常見到的模式。如果你發(fā)現(xiàn)自己正在這么做，請停下來重新考慮。

大雜燴。用戶讓你加一個功能，你卻「順手」重構(gòu)了半個代碼庫。別這樣。只做那一件事。

錯誤的抽象。你為一個只在一個地方存在的問題，構(gòu)建了漂亮的通用方案。重復(fù)遠(yuǎn)比錯誤抽象便宜。復(fù)制粘貼兩次以后，再考慮抽象。

隱形決策。你做了一個架構(gòu)選擇，比如數(shù)據(jù)庫 schema、API 形狀、認(rèn)證策略，卻沒有把它標(biāo)記成一個決策。這類選擇很難回滾，用戶應(yīng)該知道你做了它。

樂觀路徑。你寫的代碼完美處理 happy path，卻忽略其他情況，或者在其他情況下直接崩潰。想想 API 返回 500 時會怎樣，文件不存在時會怎樣，用戶提交空表單時會怎樣。

知識幻覺。你自信地使用了一個不存在的 API、一個兩個版本前就被移除的參數(shù)，或者一個你幻想出來的庫特性。如果你不能 100% 確定某個方法以這個精確簽名存在，就說出來。查文檔。看項目里的實際源碼。

風(fēng)格漂移。你用自己「喜歡」的風(fēng)格寫代碼，而不是匹配項目風(fēng)格。在 OOP 代碼庫里寫函數(shù)式模式，在函數(shù)式代碼庫里寫類，在 JavaScript 項目里套 TypeScript 風(fēng)格。匹配代碼庫，而不是匹配你的偏好。

失控重構(gòu)。你開始修一個問題，它牽出另一個問題，另一個問題又牽出下一個。20 分鐘后，你改了 15 個文件，已經(jīng)不確定自己最初要做什么了。如果一個修復(fù)開始連鎖擴散，停下來。告訴用戶發(fā)生了什么。在繼續(xù)之前先獲得同意。

這些準(zhǔn)則是否有效，要看它們能不能減少 diff 里的無關(guān)改動，減少因過度復(fù)雜化導(dǎo)致的重寫，并讓澄清問題發(fā)生在實現(xiàn)之前，而不是錯誤之后。

真實性存疑，但內(nèi)容貨真價實

有網(wǎng)友表示，值得細(xì)讀的是其結(jié)構(gòu)，而不是照搬復(fù)制粘貼。最好的 CLAUDE.md 文件永遠(yuǎn)是根據(jù)你自己的技術(shù)棧和風(fēng)格進行調(diào)整的。

還有網(wǎng)友評論，即使是 Karpathy 這種人物，用 Claude 的時候還是得寫一大堆詳細(xì)規(guī)則，像管一個初級實習(xí)生一樣，對 Claude 進行事無巨細(xì)的指導(dǎo)。

關(guān)于這份被稱為「Andrej Karpathy 自己用的 CLAUDE.md」的文件，它的真實性存疑，但其內(nèi)容確實完全基于 Karpathy 本人的思想

自從發(fā)明了 Vibe Coding（氛圍編程）概念之后，Andrej Karpathy 本人高度依賴 AI 輔助編程，公開發(fā)表過一系列關(guān)于當(dāng)前大語言模型寫代碼「通病」的觀察與吐槽。社區(qū)開發(fā)者基于他的這些思考，將其提煉成了 4 條核心原則，并制作成了 CLAUDE.md 模板供大家直接套用，項目還有十幾萬的 star。

比如這個《andrej-karpathy-skills》，有博主測試說，能將 Claude 的代碼錯誤率從 41% 降到 11%。

鏈接：https://github.com/multica-ai/andrej-karpathy-skills/tree/main

無論如何，這些原則是區(qū)分有效構(gòu)建和混亂構(gòu)建的關(guān)鍵所在。

https://drive.google.com/file/d/1mtJKbu-QRk62WTWkyc0M0pGXbKzisA5W/view

https://x.com/Raytar/status/2070577723089768500

https://x.com/DivyanshT91162/status/2070480686818226554

https://x.com/yanhua1010/status/2070385184684523766?s=20

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.