這兩天,Claude Code的源碼在網上傳得飛起。
誰都沒想到,程序員的一次疏漏,就把核心商業資產暴露在了全世界的面前。
在好奇心驅使下,我也忍不住去看了看,你別說,發現了幾個小秘密,還真有點意思。
01
用戶情緒失控? 趕緊用正則判斷一下!
你以為一個頂級 AI 產品,是怎么理解用戶情緒的?
大模型?情感分析?多模態推理?
不。
是一行正則表達式!
在userPromptKeywords.ts 中,有這么一段:
}看到其中的正則表達式沒有?也就是說,如果你罵它:
“This shit is broken again.” “Wtf”
它是能“聽懂”的,但你要是來一句:
“這破玩意怎么又壞了?”
不好意思,它一臉懵。
用中文它可聽不懂,“英語好,得學啊!”
不過更有意思的是,它檢測到你情緒崩潰之后,并不會“哄你”,不會變溫柔,不會道歉三連,也不會進入什么“安撫模式”。
它只是默默地把這件事記下來:“嗯,這個用戶剛剛罵人了。”
然后用于內部統計,比如:有多少用戶在使用過程中爆粗口,哪些場景最容易讓人抓狂。
既然是這樣,就不需要那么精確了,一行正則就行了。
這段代碼背后的故事可能是這樣的:
經理:老板想統計下用戶在使用Cluade Code時,心情沮喪的占多大比例,能做不?
實習生:可以做。
經理:今天下午能上線不?
實習生:可以,我用一行正則表達式搞定。
02
長達5594行的文件!
我在IBM的時候遇到了一個神奇的項目,Web界面很漂亮,打開代碼一看: 一個歷史悠久,長達5000行的JSP。
那一刻我就覺得,這已經是“屎山藝術”的巔峰了。
沒想到啊,這次在 Claude Code 里,又看到了熟悉的感覺:一個 5594 行的 TypeScript 文件。
![]()
用Claude Code分析一下這個Claude Code文件,結果如下:
![]()
其中一個行數就長達3170行,占了整個文件的57%。
![]()
當然,公平地說一句:代碼本身不差,注釋挺清晰,類型也很規范。
問題不在“寫得爛”,而在:結構已經開始失控了。
它很可能是快速迭代下的產物,你幾乎可以還原它的成長路徑:
1.一開始:結構清晰、模塊優雅
2. 然后,加一個 subtype
3. 再加一個subtype
4. 時間來不及了,再加一個subtype吧
往一個現成的函數里加邏輯,永遠是最省事的,沒有程序員能抵抗這種誘惑。
03
有人想“蒸餾”我? 給丫投毒!
在 claude.ts 文件的 301–313 行,有一個叫 ANTI_DISTILLATION_CC 的開關。
一旦打開,Claude Code 在調用 API 時會帶上一個字段:anti_distillation: ['fake_tools']
}這個字段的作用是:告訴服務器在系統提示詞(system prompt)中偷偷加入一些假的工具(fake tools)定義。
如果有人在抓 API 流量,做數據蒸餾訓練,這些假工具會混進訓練數據,模型會學到一堆“并不存在的能力”,最終效果肯定是越學越歪。
更狠的是,在betas.ts中,還有一套機制:服務端文本壓縮 + 簽名驗證。
Claude會把對話壓縮成摘要,簽名后傳給客戶端,下一輪對話時客戶端把簽名回傳,服務端再恢復原文。
結果就是你抓到了API響應,但只是摘要,關鍵內容拿不到。
這樣做有兩個好處,一是節省Token,其次還是防止蒸餾。
04
嘿嘿,我是臥底!
這個臥底功能僅對Anthropic的員工。
在內部項目里(白名單那種),Claude Code非常“坦誠”,commit message 里會寫上:
Co-Authored-By: Claude Opus 4.6 noreply@anthropic.com
PR 描述中會帶:
Generated with Claude Code (93% 3-shotted by claude-opus-4-5)
大家一看就知道:哦,這是我們家AI寫的。
但員工一旦切到外部開源項目,畫風突變,直接進入“臥底模式”。
所有 commit、PR 標題、描述,都要嚴格遵守一套規則:
不能提任何內部模型代號
不能出現未發布版本號
不能暴露內部倉庫信息
甚至連 “Claude Code” 這幾個字都不能出現
更不用說 Co-Authored-By 這種 AI 署名了
簡單說就是一句話:不允許留下任何“這是 AI 寫的”痕跡。
于是就出現了一個很微妙的畫面:
一個 Anthropic 員工,用Claude Code在 GitHub 上提交代碼,寫 PR、改 bug、過 review,看起來,完全就是一個普通人類開發者。
如果只是擔心模型細節泄露,這其實很好理解。
但現在是連“AI參與過”這件事本身,也被一起抹掉了,這就不只是“保護機密”了,而更像是讓 AI 安靜地混在人群里干活。
05
一點兒感想
翻完這堆代碼,我最大的感受就是:
不管是任何產品,不管外表看起來有多么光鮮亮麗,內部都有可能混亂不堪啊。
不管底層模型多牛,到了應用層,該用正則還是用正則,該有屎山還是有屎山。
AI產品本質上還是軟件工程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.