![]()
大模型 RL 老兵Flood Sung 切入機(jī)器人賽道。
作者丨張 賢
編輯丨馬曉寧
AI科技評論獨(dú)家消息,前月之暗面后訓(xùn)練與強(qiáng)化學(xué)習(xí)負(fù)責(zé)人宋鴻涌(Flood Sung)已于 2025 年 12 月離職,創(chuàng)立機(jī)器人公司「北京十六號機(jī)器人科技有限公司」(XVI Robotics),公司業(yè)務(wù)方向聚焦通用人形機(jī)器人基座模型。(本文作者長期關(guān)注機(jī)器人&具身智能賽道,歡迎添加微信交流:zhangxian2021)
企查查信息顯示,北京十六號機(jī)器人科技有限公司成立于 2025 年 12 月。據(jù)公開信息顯示,XVI Robotics 定位于構(gòu)建大規(guī)模基座模型,使人形機(jī)器人能夠理解、推理并在物理世界中行動(dòng)。
宋鴻涌英文名 Flood Sung,在學(xué)術(shù)圈和 AI 社區(qū)知名度較高,是國內(nèi)強(qiáng)化學(xué)習(xí)領(lǐng)域較早的系統(tǒng)性研究者之一,職業(yè)軌跡橫跨游戲 AI、大模型后訓(xùn)練與機(jī)器人三個(gè)方向,構(gòu)成了他入局具身智能的獨(dú)特邏輯。
學(xué)術(shù)上,他在少樣本學(xué)習(xí)(Few-Shot Learning)領(lǐng)域有奠基性貢獻(xiàn)——2018 年于 CVPR 發(fā)表的《Learning to Compare: Relation Network for Few-Shot Learning》被引次數(shù)超過 6,000 次,是該領(lǐng)域的里程碑工作。他在 GitHub 上維護(hù)的深度學(xué)習(xí)論文路線圖項(xiàng)目「Deep-Learning-Papers-Reading-Roadmap」,積累了超過 3.9 萬顆星,是國內(nèi) AI 社區(qū)影響力最廣的開源科普項(xiàng)目之一。
工程上,宋鴻涌從 2020 年到 2022 年在字節(jié)跳動(dòng) AI Lab 擔(dān)任研究科學(xué)家,深度參與游戲 AI 中的多智能體強(qiáng)化學(xué)習(xí)研究,領(lǐng)導(dǎo)過 3D-MOBA 游戲項(xiàng)目中多智能體 AI 機(jī)器人的算法研究與落地;2023 年至 2025 年加入月之暗面(Kimi),擔(dān)任后訓(xùn)練與強(qiáng)化學(xué)習(xí) Lead,主導(dǎo)了 Kimi K1.5、K2、K2.5 等核心模型的 RL 訓(xùn)練體系搭建,是 Kimi 系列大模型 post-training 能力的核心推手。
宋鴻涌的創(chuàng)業(yè)方向,是目前具身智能領(lǐng)域中技術(shù)門檻最高、競爭最激烈、資本最看重的一個(gè)切入點(diǎn)。
所謂「通用人形機(jī)器人基座模型」,本質(zhì)上是將大語言模型在數(shù)字世界的通用推理能力,遷移到物理世界的機(jī)器人控制任務(wù)中——讓人形機(jī)器人能夠在陌生場景中理解指令、感知環(huán)境、規(guī)劃動(dòng)作,不依賴場景特定的訓(xùn)練數(shù)據(jù)。這一路徑的核心挑戰(zhàn),正好與宋鴻涌在 Kimi 積累的 RL post-training 技術(shù)高度吻合:如何讓模型在稀疏反饋的環(huán)境中自我迭代、泛化到新任務(wù)。
據(jù)AI 科技評論了解,XVI Robotics 團(tuán)隊(duì)仍處于早期組建階段,公司已獲得知名機(jī)構(gòu)的種子輪融資。公司相關(guān)的產(chǎn)品形態(tài)和商業(yè)化路徑尚未公開披露,AI 科技評論將持續(xù)關(guān)注。
![]()
未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號轉(zhuǎn)載請先在「AI科技評論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.