網易首頁 > 網易號 > 正文申請入駐

離大譜，向 vLLM 提交虛假PR，給簡歷注水，被拉出在全世界面前示眾

2026-05-24 13:06:39　來源: Ai學習的老章

北京舉報

分享至

vllm剛剛發了一個推：

vLLM官方還把這個專門鉆空子的培訓機構的小紅書拉出來做了英文翻譯

全世界面前丟人現眼了

我也湊熱鬧去看了小紅書，發現好幾個和我一樣看樂子的兄弟留言了

看之前的評論區，更多的是——這是一門生意

投機取巧，丟人顯眼那種

我順著 PR 鏈接進去仔細扒了一遍，從標題到 commit，從描述到測試方案，越看越離譜

PR 看起來「專業到不行」

先說 PR 標題：

? fix(eagle3): read norm_before_fc from eagle_config for NVIDIA checkpoint

修一個 Eagle3 投機解碼在加載 NVIDIA 官方 GPT-OSS 系列 checkpoint 時，norm_before_fc 這個字段被藏在嵌套字典 eagle_config 里讀不到的問題，導致 RMSNorm 被靜默跳過、接受率下降

光看標題就讓人覺得：這哥們兒對 vLLM v1 worker 里的 speculative decoding 模塊門兒清，還順手幫 NVIDIA 兜底，妥妥的核心貢獻者氣質

正文 Purpose 寫得頭頭是道：

明確指出問題：NVIDIA 的 Eagle3 checkpoint 把 norm_before_fc 塞在嵌套的 eagle_config 字典里，vLLM 只讀了頂層字段
修復方案：先從 eagle_config 讀，讀不到再 fallback 到頂層 attr
給了對照：「Same pattern already used for use_aux_hidden_state in the same block」——還知道仿照已有同模式，專業感拉滿

Test Plan 才是「靈魂注水」

PR 的 Test Plan 直接貼了三段 Python 腳本，分別做：

正確性測試 ：貪心解碼對比 baseline 和 eagle3 輸出是否一致
性能測試 ：單 request 512 tokens 解碼，對比 baseline 和 eagle3 的 tok/s，輸出 speedup
單元測試 ：手動構造 mock config，驗證兩個分支都能正確讀取 norm_before_fc

結尾還來一句：「Tested with Qwen3-32B + Qwen3-32B_eagle3 on 1x H200」

H200！H200 啊老鐵們，整套下來300萬的機器

測試結果也寫得明明白白：

Correctness: 4/4 greedy 輸出一致
性能：baseline xx tok/s → eagle3 xx tok/s

正常 reviewer 看到這個 PR，心里想的是：「問題清晰、修復點小、測試齊全、還在大模型上跑過——閉眼合」

事實上，PR 最后真的就被合了，63 項 CI 全綠，benchislett 直接打了 ready 標簽 merge 進 main

為啥 vLLM 又把人 ban 了

PR 都合了，結果社區有人舉報：這個 PR 解決的根本是個不存在的問題

什么意思呢？

NVIDIA 那批 Eagle3 checkpoint 實際跑的時候根本沒有這個 bug——norm_before_fc 該讀到的地方都讀到了。所謂「RMSNorm 被靜默跳過、接受率下降」是這哥們兒憑空想象出來的，目的就是制造一個看起來很專業、很硬核、但其實改了等于沒改的 PR

為啥要這么做？答案就藏在 vLLM 公告里那六個字——「PR training」workflow for resume building

簡歷注水流水線

套路拆解

我順手翻了下作者的 GitHub 個人頁，自稱是 ZTE（中興通訊）的工程師，做國產 NPU 推理引擎，從編譯到運行時全棧

但是真要去給 vLLM、PyTorch、SGLang 這種頂級開源項目修真問題，門檻極高：

得讀懂幾十萬行 C++/CUDA/Python 代碼
得復現真實 bug，給出最小可復現樣例
得跑得起多卡集群驗證

這門檻對絕大多數人都不友好，但「把簡歷寫上『vLLM core contributor，merged PR 』」這件事，對找工作（尤其是出海大模型崗）極具誘惑

于是這門生意就來了：

培訓機構教你怎么扒 vLLM 的代碼模式
找一處不痛不癢的邏輯分支，偽裝成 bug
用 AI 寫一段看起來很專業的 Purpose + Test Plan
聲稱在 H200 / 8×A100 上跑過 （反正 reviewer 沒法驗證）
等合并，截圖發朋友圈，寫進簡歷

低成本、低風險、高回報——直到撞上 vLLM 這種頂級項目的人肉舉報

這件事的離譜之處

vLLM 這次發飆的真正原因，不是「合了一個錯 PR」（畢竟 PR 真錯了 revert 就行），而是：

? AI coding agents 讓大批量低質量 PR 的生成成本無限趨近于 0，維護者卻要花真金白銀的時間去 review

一個 PR review 哪怕只花 maintainer 半小時，幾百個這種「PR training 學員」一起沖，整個核心團隊就被廢了

更狠的一個數據：vLLM 現在每個月收到的 PR 已經過千，社區還在以指數增長

所以這次 vLLM 不僅把人 ban 了，還順手掛出小紅書的英文翻譯——等于把整個產業鏈曝光給全世界看

給同行提個醒

這事兒對國內開發者的殺傷其實挺大的：

簡歷上寫過開源 contribution 的，未來招聘方會按圖索驥去驗證
頂級項目對中文社區貢獻者的信任度，被這幫人拉低了一檔
真有心做開源的同學，提 PR 反而會被懷疑「是不是又來注水的」

幾句心里話

我自己也用 AI coding agent 干活，Claude Code、Codex、Cursor 切著用，效率確實是過去的幾倍

但 AI 是放大器，放大你的真實能力，也放大你的水貨含量

把 AI 當工具，去解決你真正遇到的問題，那是生產力革命

把 AI 當 PR 生成器，去騙簡歷騙 offer，那是把整個開源生態的信任資產燒給你自己取暖

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.