vllm剛剛發了一個推:
![]()
vLLM官方還把這個專門鉆空子的培訓機構的小紅書拉出來做了英文翻譯
![]()
全世界面前丟人現眼了
我也湊熱鬧去看了小紅書,發現好幾個和我一樣看樂子的兄弟留言了
![]()
看之前的評論區,更多的是——這是一門生意
投機取巧,丟人顯眼那種
![]()
我順著 PR 鏈接進去仔細扒了一遍,從標題到 commit,從描述到測試方案,越看越離譜
PR 看起來「專業到不行」
先說 PR 標題:
? fix(eagle3): read norm_before_fc from eagle_config for NVIDIA checkpoint
修一個 Eagle3 投機解碼在加載 NVIDIA 官方 GPT-OSS 系列 checkpoint 時,norm_before_fc 這個字段被藏在嵌套字典 eagle_config 里讀不到的問題,導致 RMSNorm 被靜默跳過、接受率下降
光看標題就讓人覺得:這哥們兒對 vLLM v1 worker 里的 speculative decoding 模塊門兒清,還順手幫 NVIDIA 兜底,妥妥的核心貢獻者氣質
正文 Purpose 寫得頭頭是道:
明確指出問題:NVIDIA 的 Eagle3 checkpoint 把
norm_before_fc塞在嵌套的eagle_config字典里,vLLM 只讀了頂層字段修復方案:先從
eagle_config讀,讀不到再 fallback 到頂層 attr給了對照:「Same pattern already used for
use_aux_hidden_statein the same block」——還知道仿照已有同模式,專業感拉滿
PR 的 Test Plan 直接貼了三段 Python 腳本,分別做:
正確性測試 :貪心解碼對比 baseline 和 eagle3 輸出是否一致
性能測試 :單 request 512 tokens 解碼,對比 baseline 和 eagle3 的 tok/s,輸出 speedup
單元測試 :手動構造 mock config,驗證兩個分支都能正確讀取
norm_before_fc
結尾還來一句:「Tested with Qwen3-32B + Qwen3-32B_eagle3 on 1x H200」
H200!H200 啊老鐵們,整套下來300萬的機器
測試結果也寫得明明白白:
Correctness: 4/4 greedy 輸出一致
性能:baseline xx tok/s → eagle3 xx tok/s
正常 reviewer 看到這個 PR,心里想的是:「問題清晰、修復點小、測試齊全、還在大模型上跑過——閉眼合」
事實上,PR 最后真的就被合了,63 項 CI 全綠,benchislett 直接打了 ready 標簽 merge 進 main
為啥 vLLM 又把人 ban 了
PR 都合了,結果社區有人舉報:這個 PR 解決的根本是個不存在的問題
什么意思呢?
NVIDIA 那批 Eagle3 checkpoint 實際跑的時候根本沒有這個 bug——norm_before_fc 該讀到的地方都讀到了。所謂「RMSNorm 被靜默跳過、接受率下降」是這哥們兒憑空想象出來的,目的就是制造一個看起來很專業、很硬核、但其實改了等于沒改的 PR
為啥要這么做?答案就藏在 vLLM 公告里那六個字——「PR training」workflow for resume building
簡歷注水流水線
套路拆解
我順手翻了下作者的 GitHub 個人頁,自稱是 ZTE(中興通訊)的工程師,做國產 NPU 推理引擎,從編譯到運行時全棧
但是真要去給 vLLM、PyTorch、SGLang 這種頂級開源項目修真問題,門檻極高:
得讀懂幾十萬行 C++/CUDA/Python 代碼
得復現真實 bug,給出最小可復現樣例
得跑得起多卡集群驗證
這門檻對絕大多數人都不友好,但「把簡歷寫上『vLLM core contributor,merged PR 』」這件事,對找工作(尤其是出海大模型崗)極具誘惑
于是這門生意就來了:
培訓機構教你怎么扒 vLLM 的代碼模式
找一處不痛不癢的邏輯分支,偽裝成 bug
用 AI 寫一段看起來很專業的 Purpose + Test Plan
聲稱在 H200 / 8×A100 上跑過 (反正 reviewer 沒法驗證)
等合并,截圖發朋友圈,寫進簡歷
低成本、低風險、高回報——直到撞上 vLLM 這種頂級項目的人肉舉報
這件事的離譜之處
vLLM 這次發飆的真正原因,不是「合了一個錯 PR」(畢竟 PR 真錯了 revert 就行),而是:
? AI coding agents 讓大批量低質量 PR 的生成成本無限趨近于 0,維護者卻要花真金白銀的時間去 review
一個 PR review 哪怕只花 maintainer 半小時,幾百個這種「PR training 學員」一起沖,整個核心團隊就被廢了
更狠的一個數據:vLLM 現在每個月收到的 PR 已經過千,社區還在以指數增長
所以這次 vLLM 不僅把人 ban 了,還順手掛出小紅書的英文翻譯——等于把整個產業鏈曝光給全世界看
給同行提個醒
這事兒對國內開發者的殺傷其實挺大的:
簡歷上寫過開源 contribution 的,未來招聘方會按圖索驥去驗證
頂級項目對中文社區貢獻者的信任度,被這幫人拉低了一檔
真有心做開源的同學,提 PR 反而會被懷疑「是不是又來注水的」
我自己也用 AI coding agent 干活,Claude Code、Codex、Cursor 切著用,效率確實是過去的幾倍
但 AI 是放大器,放大你的真實能力,也放大你的水貨含量
把 AI 當工具,去解決你真正遇到的問題,那是生產力革命
把 AI 當 PR 生成器,去騙簡歷騙 offer,那是把整個開源生態的信任資產燒給你自己取暖
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.