機器之心發布
過去幾年,大模型競爭主要發生在 AI 公司之間。但隨著 AI 開始從數字世界進入真實設備與物理世界,競爭邏輯正在發生變化。
最近,機器之心注意到,一個長期相對低調、但擁有全球最大消費電子生態之一的科技巨頭,正在快速進入大模型核心戰場 ——三星 Samsung。
而且,它走的路線,和大多數互聯網公司并不相同。
最近一段時間,三星連續發布多篇大模型相關工作,覆蓋模型架構、強化學習、Physical AI 等多個方向。這些工作的背后,都在釋放一個非常明確的信號:
三星正在全面構建自己的 Foundation Model 體系。
與此同時,據此前媒體報道,三星已經采購數萬張 GPU,用于 AI 基礎設施建設。隨著 HBM 等高帶寬存儲需求在 AI 訓練中持續爆發,三星在 AI 基礎設施領域的優勢,也開始被重新認識。
相比多數互聯網公司,三星還有一個更特殊的優勢:它不僅擁有模型能力,還擁有全球最完整軟硬的生態之一。
從手機、智能家居到機器人設備,三星幾乎覆蓋了用戶生活中的全部核心場景。而當 AI 開始從「聊天助手」進入「真實世界交互」階段,這種生態能力的重要性,也正在迅速提升。
三星最近一項備受關注的工作,是其提出的Memory-Based 大模型新架構 Meki,嘗試在資源受限條件下重新定義模型 Scaling 的方式。
![]()
- 論文地址:https://arxiv.org/pdf/2602.03359
- 項目鏈接:https://github.com/ningding-o/MeKi
過去幾年,大模型的發展邏輯非常直接:更大的參數規模、更大的訓練數據,以及更強的算力。
但當 AI 開始進入真實設備與物理世界后,這條路徑開始逐漸遇到限制。因為無論是移動設備、智能家居,還是機器人系統,端側設備的 RAM、帶寬與功耗都十分有限,而傳統 Transformer 通常要求大量參數常駐內存運行,這使得模型規模很難持續擴大。
但另一方面,這些設備往往擁有遠大于 RAM 的存儲空間(ROM)。于是,三星提出了一個新的方向:能否利用 ROM,進一步擴展模型能力?
Meki 提出了一種 Memory-Based Architecture,通過參數化 Memory Bank 的方式,將大量知識存儲在 ROM 中,并在推理過程中動態讀取。簡單來說,RAM 負責實時計算,ROM 負責知識存儲,而模型則進一步突破端側容量限制。
相比傳統 Transformer,這種架構更加適合長期運行的端側 AI 與 Physical AI 場景。尤其是在機器人等 Physical AI 系統中,模型不僅面臨更嚴格的資源限制,同時還需要滿足低延遲、實時交互與長期在線運行等要求,因此,這類面向端側資源約束的架構創新,正在變得越來越重要。
除了模型架構外,三星近期提出的 M2RL,則進一步探索了 Multi-Domain RL 的訓練范式。
![]()
- 論文地址:https://arxiv.org/pdf/2602.12566
隨著 AI 開始進入真實設備與現實世界,僅靠靜態數據已經越來越不夠。模型需要與環境持續交互,需要感知設備狀態,需要學習長任務,也需要適應動態世界。下一代基礎模型,正在從「靜態語言模型」演化為「交互式智能系統」。
在這一背景下,三星提出的 M2RL,系統研究了不同領域強化學習能力之間如何協同演化,包括混合多任務 RL、模型融合、多階段后訓練等方向。相關工作發現,數學、代碼、科學推理等高密度推理任務之間,并不存在明顯沖突,反而能夠形成協同增強效應。這也意味著,強化學習正在推動基礎模型持續獲得更強的推理、規劃與復雜環境交互能力。
此外,三星也開始布局面向物理世界智能的評測體系。其提出的 LiveClawBench,正試圖解決一個行業越來越明顯的問題:當 AI 開始真正進入設備、機器人與 Physical AI 場景后,傳統 Benchmark 已經越來越難有效評測下一代模型能力。
![]()
- 論文地址:https://arxiv.org/abs/2604.13072
過去的大模型評測,大多基于靜態任務、固定環境與標準答案,但真實世界中的 AI 系統并不是這樣。現實環境中,設備狀態會變化,任務鏈路更長,環境也更加復雜,模型需要持續感知、規劃、執行與調整。對于真正運行在現實世界中的 AI 系統而言,僅靠「刷題式 Benchmark」已經遠遠不夠。
為此,三星在 LiveClawBench 中提出了一個「三維復雜度框架」,從 Environment Complexity(環境復雜度)、Cognitive Demand(認知復雜度)以及 Runtime Adaptability(運行時適應能力)三個維度,系統評測模型在真實復雜環境中的長期任務執行能力。
相比傳統 Agent Benchmark,LiveClawBench 更強調真實任務鏈路、多環境協同以及復雜長期任務。某種意義上,它正在探索的,其實是:當 AI 真正進入物理世界后,下一代智能系統應該如何被評測。
這些工作的背后,都來自三星一個新組建的核心技術攻堅組織:AI Model TF。
公開信息顯示,TF(Task Force)是三星面向公司級戰略任務設立的核心攻堅組織,通常承擔決定未來核心競爭力的關鍵技術方向。
而 AI Model TF,則是三星于 2025 年由集團 CTO 直接推動成立的大模型團隊,核心定位是面向三星全球業務體系,打造先進的 Foundation Model 能力,以此為根基向物理智能(Physical AI) 方向演進。
在業內看來,這也釋放出一個非常明確的信號:三星正在以前所未有的戰略力度,加速投入下一代 AI 能力建設,并將其提升至集團級核心戰略高度。
相比傳統互聯網公司,三星不僅擁有模型研發能力,還同時具備覆蓋手機、家居、機器人到底層芯片與 AI 基礎設施的全球最完整終端設備生態,這也使其天然具備將大模型落地到真實物理世界與用戶場景中的能力。
隨著大規模 GPU 集群與 AI 基礎設施持續投入,AI Model TF 正在快速聚集基礎模型、強化學習等方向的核心人才,被外界視為三星下一代 AI 戰略最關鍵的技術組織之一,也承載著三星在 Foundation Model、Physical AI 等未來智能體系上的核心突破任務。
而近期這些工作的通訊作者,均為AI Model TF 負責人、三星高級技術總監唐業輝。據了解,他目前主要負責三星大模型訓練與核心技術方向推進,長期深耕基礎模型與 Physical AI,在超大規模模型訓練、模型架構與系統優化等方向擁有深厚積累。其研究重點涵蓋高效模型、Agentic AI、World Model 等前沿領域,并擁有基于萬卡集群開展超大規模模型訓練的豐富經驗。
從三星近期在基礎模型、端側智能與 Physical AI 等方向持續取得的突破來看,這或與其快速搭建的高水平 AI 人才體系密切相關。
公開資料顯示,唐業輝博士畢業于北京大學,Google Scholar 引用超過 1.3 萬次,并長期擔任 NeurIPS、ICML 等國際頂級 AI 會議的領域主席。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.