DoNews4月15日消息,據(jù)Z Finance報道,剛剛,DeepSeek 的核心研究員、R1 與 V3 系列模型的主要作者之一郭達(dá)雅或已正式入職字節(jié)跳動。
據(jù)公開信息,郭達(dá)雅本科與博士均就讀于中山大學(xué),師從人工智能學(xué)院印鑒教授,并由前微軟亞洲研究院(MSRA)副院長周明博士聯(lián)合培養(yǎng)。這位曾在騰訊廣告算法大賽蟬聯(lián)冠軍、被調(diào)侃“還沒畢業(yè)就賺夠百萬獎金”的天才,在 DeepSeek 期間填補(bǔ)了最核心的兩塊技術(shù)版圖:
代碼智能(Code Intelligence): 他主導(dǎo)了 DeepSeek-Coder 系列的演進(jìn),通過極致的數(shù)據(jù)清洗與結(jié)構(gòu)化訓(xùn)練,讓模型在代碼生成與補(bǔ)全上達(dá)到了行業(yè)頂尖。
純強(qiáng)化學(xué)習(xí)(RL)的拓荒:作為 R1 推理模型的核心作者,他參與探索了如何在不依賴大規(guī)模人工標(biāo)注(SFT)的情況下,通過大規(guī)模強(qiáng)化學(xué)習(xí)讓模型自主演化出“自我反思”與“思維鏈(CoT)”。正是這一突破,讓中國大模型在 2025 年實現(xiàn)了對硅谷的“邏輯奇襲”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.