![]()
智東西
作者 王涵
編輯 云鵬
智東西6月12日報道,今天,在智源大會2026上,智源研究院分享并發布了近一年以來的多項研究成果,包括基座大模型、智能體和基礎軟硬件生態三部分。
基座大模型方面,智源分享了原生多模態大模型悟界Emu3.5、AI藥物發現模型悟界·OpenComplex 2.5等的研究進展,并在會上發布了神經科學模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經科學領域數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。
![]()
智能體方面,智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0,發布了四款智能體產品,包括面向心臟疾病的輔助診斷智能體、面向科學發現的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎軟硬件生態方面,智源發布眾智FlagOS 2.1,該系統能夠適配18家芯片廠商的32款芯片。
在大會開幕演講中,美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出:當前依賴反饋控制的方法效果不佳,他主張形式化方法才是未來,即先明確形式化規范、再編寫程序、最后數學證明程序符合規范,他樂觀認為未來AI將成為完成這些證明的工具,大幅提升可靠性。演講尾聲,Diffie給出驚人預測:到2050年,機器智能將超越人類,成為世界運行的主宰。
![]()
圖靈獎得主、馬薩諸塞大學阿默斯特分校榮譽退休教授Andrew Barto,將強化學習歸結為“控制、搜索與聯想記憶”的三位一體,指出“機器學習最初就是強化學習”。他強調強化學習與神經網絡研究從一開始便緊密交織,深度強化學習結合大腦獎勵系統的最新成果將指引下一輪方向。最后他警示:獎勵信號設計可能帶來“反常實例化”風險。
![]()
在播客環節,中國工程院院士、阿里云創始人王堅與智源研究院理事長黃鐵軍展開對話,圍繞中國大模型的發展路徑展開,重點討論了從追趕驗證到路線選擇、體系構建與范式創新的轉型,如何突破互聯網文本數據的天花板和算力短缺的極限,以及如何從“跟隨國際主流范式”轉向“形成自身問題意識”、實現原創范式躍遷。
![]()
在智源研究院院長王仲遠主持的圓桌對話中,小米羅福莉、清華朱軍、清華劉知遠、南洋理工安波四位專家進行了近50分鐘的深度交流。
羅福莉認為引發熱議的Claude Fable 5本質仍是預訓練、數據與強化學習持續推進的自然結果;朱軍指出新版模型Token消耗下降是正確方向;劉知遠分析Anthropic的成功源于找準代碼這一專業領域,并強調智能革命在于用AI替代機械重復的腦力勞動;安波則提出AI自進化不能依賴封閉環境。
![]()
一、“悟界”登《Nature》,發布全球最大最全的神經科學數據集
智源研究院院長王仲遠分享了近一年來智源研究院的相關研究進展。
基座大模型方面,智源研發的原生多模態大模型悟界Emu3.5,在去年10月30日就已經正式發布并且開源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是國內多模態大模型方向的第一篇。
悟界·Emu3.5通過Next-Token Prediction這一實現方式,實現了文本、圖像、視頻的統一學習,實現了多模態理解任務和多模態生成任務的統一學習。
智源將Next-Token Prediction擴展到了神經科學領域,研發出了悟界·Brainμ1.0,該模型能夠將腦信號與其它模態互相轉化,可以將腦信號轉成文字、圖像、聲音,同時可以反過來轉換。
![]()
同時,智源發布了全球最大最全的AI-Ready神經科學領域數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。
![]()
此外,智源還發布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驅動藥物發現模型。通過單一的流程,該模型覆蓋了制藥的四大關鍵步驟,包括口袋識別、反向篩選、結構預測、形成力預測。OpenComplex 2.5在多個benchmark上的核心指標,超過了傳統的物理方法和其他的AI模型。
![]()
二、提出世界模型四類技術路線,自研世界模型即將開源
世界模型方面,智源將當下世界模型的技術路線分為四類:
1、第一類是語言為中心的世界模型,包括VIMA等。
2、第二類是以像素為中心的視覺模型,如Sora。
3、第三類是以三維結構為中心的視覺模型,代表是李飛飛團隊成果。
4、第四類是以視覺表征為中心的世界模型,像是楊立昆團隊成果。
![]()
王仲遠分享稱,智源認為,以上四類技術路線距離真正的世界模型還存在一定差距。智源正在研發當中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力:物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模,能夠真正實現全模態的輸入,以及下一步物理狀態的預測。
該模型目前還在訓練中,將在未來幾個月開源。
![]()
三、發布具身大腦,推出四款智能體
具身智能方面,王仲遠透露,智源最新研發的具身大腦悟界·RoboBrain Orca v0,是以下一個物理狀態預測為核心的具身大腦。它通過融合大量的多模態交互數據,強化了世界模型在具身上的表征,提升下游少量樣本泛化能力,目前已與50余家企業進行了合作。
![]()
智能體方面,王仲遠在現場發布了四款智能體產品,包括:
1、面向心臟疾病的輔助診斷智能體:BAAI Cardiac Agent
該智能體是智源智源與安貞醫院共同研發的,能夠有效識別和處理心臟磁共振的多模態數據,提升醫生的診斷效率。其心臟疾病診斷的精確度,能夠達到安貞醫院頂尖心血管醫生的診斷水平。
![]()
2、面向科學發現的自主研究智能體:AREX
該智能體能夠覆蓋科學研究的幾個關鍵環節,包括信息調研、方案設計、實驗探究、報告撰寫。其背后所依賴的基座模型由智源自主研發。在權威的基準測試上,不僅能夠顯著超越同等參數的開源模型,更能夠比肩萬億參數級別的旗艦模型。
![]()
3、本屆智源大會專屬的聽會智能體:SoulAgent
該智能體可以幫助參會者實現智源大會一站式參會體驗,同時也能夠與先期入駐的智源大會的專家進行AI問答。
![]()
4、面向有害蛋白獲取的風險發現智能體
智源首次通過紅隊實驗的方法驗證:智能體能夠輔助篩查并獲取有害的蛋白,進而合成蛋白,將在近期公布相關的測試報告。
![]()
四、FlagOS更新至2.1版本,適配32款芯片
在基礎軟硬件生態方面,王仲遠介紹,智源研究院聯合開源社區打造的眾智FlagOS 現已更新至 2.1 版本。該系統適配18家芯片廠商的32款芯片,是目前全球適配芯片品類最多的計算系統。
FlagOS內置算子超600個且數量仍在持續擴充,不僅為18家芯片廠商提供統一AI編譯器、為12家廠商提供通用技術支持,還同時完成國際標準與國家標準立項。
目前該系統可支撐90%以上主流開源模型部署,近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。
![]()
結語:AI技術發展,已經迎來拐點
本屆智源大會釋放出多項行業動向。
首先,AI研究方向日趨多元,行業不再單純追逐模型參數規模,逐步向腦科學、藥物研發、心臟疾病診斷等實體應用領域深耕。其次,基礎軟硬件生態落地提速,眾智FlagOS已實現對32款芯片的適配,底層技術布局初見成效。
此外,兩位圖靈獎得主與國內專家在分享中形成共識:隨著AI技術持續演進,僅依靠算力與數據堆砌已難實現長遠發展,技術路線規劃、安全體系搭建以及人機協同關系等核心議題,亟待全行業深入探索與正視。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.