代碼面開(kāi) AI,不是開(kāi)卷考
今天鴨鴨刷到一條挺有意思的招聘新聞。
外媒 Business Insider 報(bào)道稱,谷歌內(nèi)部文件顯示,從今年下半年起,計(jì)劃在軟件工程師招聘的“代碼理解”面試環(huán)節(jié),允許候選人使用谷歌官方認(rèn)證的 AI 助手;試點(diǎn)階段將統(tǒng)一使用自研模型 Gemini。谷歌發(fā)言人向媒體證實(shí)了這一安排。
![]()
報(bào)道里寫(xiě)得很具體:候選人要在現(xiàn)有代碼庫(kù)里做閱讀、排錯(cuò)和優(yōu)化;面試官會(huì)重點(diǎn)看“AI 應(yīng)用熟練度”,包括提示詞工程、對(duì) AI 輸出結(jié)果的核驗(yàn),以及調(diào)試能力。谷歌把整套新流程定調(diào)為“人為主導(dǎo)、AI 輔助”,說(shuō)是想更貼近生成式 AI 時(shí)代工程師的真實(shí)工作狀態(tài)。
試點(diǎn)會(huì)先落在美國(guó)部分團(tuán)隊(duì),面向初、中級(jí)崗位,谷歌云以及平臺(tái)與設(shè)備等業(yè)務(wù)線會(huì)先試。如果跑得順,再擴(kuò)到更多業(yè)務(wù)和地區(qū)。
嗯,讀到這兒很多人第一反應(yīng)可能是:那不就是開(kāi)卷嗎。
但鴨鴨想先把話說(shuō)在前面:
允許帶 Gemini 進(jìn)考場(chǎng),不等于題目變簡(jiǎn)單。它更像把考場(chǎng)從“默寫(xiě)語(yǔ)法”挪到“帶一個(gè)會(huì)瞎編的實(shí)習(xí)生一起干活”。你不會(huì)驗(yàn),他寫(xiě)得越快,你死得越快。
為啥鴨鴨會(huì)這么看?
第一,代碼理解本來(lái)就不是比誰(shuí)敲得快。陌生倉(cāng)庫(kù)里找 bug、理調(diào)用鏈、判斷一次改動(dòng)會(huì)不會(huì)牽一發(fā)而動(dòng)全身,這些活以前靠手寫(xiě)思路;現(xiàn)在多了一條:你得判斷 AI 給你的“捷徑”是不是在抄近道抄進(jìn)溝里。
第二,報(bào)道里提到的考核點(diǎn),其實(shí)是在把工程師拆成兩半。一半是“會(huì)不會(huì)指揮 AI”,提示詞怎么寫(xiě)、上下文怎么給、約束怎么說(shuō)清楚;另一半是“敢不敢簽字”,AI 改完你敢不敢說(shuō)這版能合、能發(fā)、能背鍋。缺一半,面試?yán)锒紩?huì)露餡。
第三,這事不是谷歌一家自嗨。報(bào)道里還提到,澳大利亞公司 Canva 早在 2025 年 6 月就要求相關(guān)崗位候選人在技術(shù)面試?yán)锉仨氂?Copilot、Cursor 或 Claude 這類工具。美國(guó) AI 編程公司 Cognition 也對(duì) Business Insider 表示,已經(jīng)把 AI 使用納入面試流程,還把“面試禁用 AI”比作“讓孩子不帶計(jì)算器參加數(shù)學(xué)考試”。行業(yè)方向很直白:以后默認(rèn)工作流里就有 AI,面試還在假裝沒(méi)有 AI,反而失真。
第四,皮查伊在 2026 年 4 月 22 日谷歌 Cloud Next 活動(dòng)上說(shuō)過(guò),谷歌內(nèi)部約 75% 的新代碼由 AI 生成。這個(gè)數(shù)字不是用來(lái)嚇唬人的,是用來(lái)解釋公司為什么要改面試題。公司真正想問(wèn)的是:當(dāng) AI 能吐出海量代碼時(shí),你還剩下什么不可替代的判斷力。
那這事兒對(duì)正在準(zhǔn)備面試的人意味著啥?
鴨鴨說(shuō)幾句實(shí)在話。
別把“會(huì)用 AI”理解成“會(huì)點(diǎn)生成”:面試?yán)锔靛X的是你怎么拆問(wèn)題、怎么限定 AI 的發(fā)揮范圍、怎么對(duì)輸出做對(duì)照驗(yàn)證。會(huì)點(diǎn)生成的人一抓一把,敢驗(yàn)收的人不多。
刻意練“讀陌生代碼 + 小步驗(yàn)證”:給自己找一段不熟悉的開(kāi)源模塊,先用 AI 生成三種改法,再逐條對(duì)照測(cè)試用例、邊界條件和性能影響。練的是肌肉記憶,不是 prompt 玄學(xué)。
準(zhǔn)備一兩個(gè)“AI 翻過(guò)車”的真實(shí)例子:面試?yán)锬苤v清楚你怎么發(fā)現(xiàn) AI 給的建議不靠譜、你怎么糾偏,比背八股更像高級(jí)工程師。
心態(tài)上把它當(dāng)成開(kāi)卷里的閉卷:卷子是開(kāi)的,評(píng)分標(biāo)準(zhǔn)沒(méi)開(kāi)。公司要的是你能不能把 AI 的產(chǎn)出變成可上線的結(jié)果。
大家怎么看?如果國(guó)內(nèi)大廠跟進(jìn)“代碼理解環(huán)節(jié)允許官方 AI”,你覺(jué)得公平嗎,還是更卷了?歡迎評(píng)論區(qū)聊聊~
今天鴨鴨和大家分享一道 AI大模型面試題。
【什么是大模型微調(diào)?與預(yù)訓(xùn)練的核心區(qū)別是什么?】
回答重點(diǎn)
大模型微調(diào)就是在預(yù)訓(xùn)練模型的基礎(chǔ)上,用特定任務(wù)的數(shù)據(jù)對(duì)模型做二次訓(xùn)練,讓它從"通才"變成某個(gè)領(lǐng)域的"專家"。
跟預(yù)訓(xùn)練的核心區(qū)別有三點(diǎn):
1)目標(biāo)不同。預(yù)訓(xùn)練是讓模型學(xué)通用的語(yǔ)言理解能力,在幾百 GB 甚至幾 TB 的通用語(yǔ)料上訓(xùn)練,比如維基百科、書(shū)籍、網(wǎng)頁(yè)。微調(diào)是讓模型適應(yīng)特定任務(wù),比如情感分析、代碼生成、醫(yī)療問(wèn)答,用的是跟任務(wù)相關(guān)的小規(guī)模標(biāo)注數(shù)據(jù)
2)數(shù)據(jù)規(guī)模差異大。預(yù)訓(xùn)練動(dòng)輒用幾萬(wàn)億 token 的數(shù)據(jù),訓(xùn)練成本是幾百萬(wàn)甚至上千萬(wàn)美元。微調(diào)可能只需要幾千到幾十萬(wàn)條標(biāo)注樣本,幾張 A100 跑幾個(gè)小時(shí)就能搞定
3)學(xué)習(xí)方式不同。預(yù)訓(xùn)練主要是自監(jiān)督學(xué)習(xí),讓模型預(yù)測(cè)下一個(gè) token 或者還原被遮蓋的詞,不需要人工標(biāo)注。微調(diào)通常是監(jiān)督學(xué)習(xí),需要輸入輸出配對(duì)的標(biāo)注數(shù)據(jù)
![]()
擴(kuò)展知識(shí)為什么需要微調(diào)
預(yù)訓(xùn)練模型雖然能力強(qiáng),但它學(xué)的是通用知識(shí),面對(duì)特定場(chǎng)景還是差點(diǎn)意思。比如用 GPT 直接做法律合同審查,它可能連行業(yè)術(shù)語(yǔ)都理解不準(zhǔn);用它做客服問(wèn)答,回復(fù)風(fēng)格可能跟公司調(diào)性對(duì)不上。
![]()
微調(diào)就是一個(gè)性價(jià)比極高的中間方案,不用從零開(kāi)始訓(xùn)練,也不用忍受通用模型在特定場(chǎng)景的平庸表現(xiàn)。
主流微調(diào)策略
1)全參數(shù)微調(diào),把模型所有參數(shù)都拿出來(lái)重新訓(xùn)練。效果最好,但成本也最高。一個(gè) 70B 參數(shù)的模型,光加載到 GPU 就需要 140GB 顯存,還得額外留空間存梯度和優(yōu)化器狀態(tài),沒(méi)有幾十張頂級(jí)顯卡根本跑不動(dòng)
2)部分參數(shù)微調(diào),凍結(jié)大部分層,只訓(xùn)練最后幾層或者特定模塊。減少了計(jì)算量,但效果往往不如全參數(shù)微調(diào)
3)參數(shù)高效微調(diào) PEFT,這是現(xiàn)在的主流做法。核心思路是往原模型里插入少量可訓(xùn)練參數(shù),原模型參數(shù)全部?jī)鼋Y(jié)。LoRA是最流行的一種,它在 attention 層的權(quán)重矩陣旁邊加兩個(gè)低秩矩陣,訓(xùn)練時(shí)只更新這兩個(gè)小矩陣。一個(gè) 7B 的模型用 LoRA 微調(diào),可訓(xùn)練參數(shù)可能只有幾百萬(wàn),顯存占用直接降一個(gè)數(shù)量級(jí)
LoRA 的原理
LoRA 基于一個(gè)假設(shè):微調(diào)時(shí)權(quán)重的變化量是低秩的,不需要更新整個(gè)大矩陣。
原本要更新的權(quán)重矩陣 W 是 d×d 的,比如 4096×4096,有 1600 多萬(wàn)參數(shù)。LoRA 把變化量分解成兩個(gè)小矩陣 A 和 B 的乘積,A 是 d×r,B 是 r×d,r 一般取 8 或 16。這樣可訓(xùn)練參數(shù)從 d2 降到 2dr,壓縮了幾百倍。
推理時(shí)把 LoRA 矩陣合并回原權(quán)重,不增加任何推理延遲。而且可以給同一個(gè)基座模型掛不同的 LoRA 權(quán)重,實(shí)現(xiàn)多任務(wù)切換。
微調(diào)數(shù)據(jù)的質(zhì)量比數(shù)量重要
搞微調(diào)最容易踩的坑就是迷信數(shù)據(jù)量。其實(shí)幾千條高質(zhì)量數(shù)據(jù)的效果往往比幾萬(wàn)條噪聲數(shù)據(jù)好。Alpaca 當(dāng)年只用了 52000 條數(shù)據(jù)就把 LLaMA 調(diào)成了能聊天的模型。
高質(zhì)量數(shù)據(jù)的標(biāo)準(zhǔn):指令清晰、回答準(zhǔn)確、覆蓋多樣場(chǎng)景、格式一致。與其花時(shí)間爬更多數(shù)據(jù),不如花時(shí)間清洗和篩選已有數(shù)據(jù)。
篇幅有限,完整答案可以點(diǎn)擊下方小程序進(jìn)行查閱:
我們精選了近兩年的高頻面試真題,已經(jīng)有 10000 多道面試題目啦,由大廠資深面試官手寫(xiě)答案,押題命中率超高!
不僅有傳統(tǒng)八股文,場(chǎng)景題、項(xiàng)目題、系統(tǒng)設(shè)計(jì)題等等應(yīng)有盡有,還在不斷更新中!
目前優(yōu)惠最低特價(jià) 129 元即永久(限時(shí)上架)暢看所有面試題和答案,正式運(yùn)營(yíng)價(jià)格為 399+,不要錯(cuò)過(guò)這次優(yōu)惠哈!
且,現(xiàn)在邀請(qǐng)好友注冊(cè)并成為會(huì)員,還可獲得 10% 的分傭!詳情見(jiàn)面試?guó)喞卵?qǐng)有賞規(guī)則(網(wǎng)頁(yè)版面試?guó)嘃c(diǎn)擊頭像查看)
![]()
網(wǎng)頁(yè)端網(wǎng)址:www.mianshiya.com
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.