![]()
█ 腦科學動態
Nature:破解自閉癥核心癥狀的關鍵靶點
Nature:首次實現人工細胞的不對稱分裂
Cell:移植植物光合作用系統治療干眼癥
海馬漣漪與重放機制揭示大腦如何靈活重組知識以解決新問題
神經元過度活躍誘發嚴重自身免疫性腦病
嚴厲管教破壞幼兒壓力調節能力的發展
綠地接觸顯著改善弱勢兒童心理健康
█ AI行業動態
谷歌Gemini 3.2 Flash意外泄露:單次生成2200行代碼
AnySearch打通“暗網”數據,為AI Agent開啟真實世界之眼
馬耳他開全球先例:全民免費享用ChatGPT Plus一年
OpenAI深夜重組:Brockman正式掌權
█ AI驅動科學
Cell:AI模型Path2Space僅憑病理切片預測空間基因表達
LLM多智能體系統演進全景:從基礎能力到自主自我進化的閉環生命周期
突破超長上下文訓練瓶頸:Lighthouse Attention實現高效大模型預訓練
大語言模型如何推算時間?研究揭示Llama內部的通用幾何計算器
新型深度學習架構CCDNN利用典型相關性引導實現高效多源數據融合
腦科學動態
Nature:破解自閉癥核心癥狀的關鍵靶點:X染色體長鏈非編碼RNA PTCHD1-AS
Clarrisa A. Bradley、Sangyoon Y. Ko和Stephen W. Scherer(加拿大多倫多病童醫院)發現X染色體基因PTCHD1-AS缺失會引發自閉癥核心癥狀及腦紋狀體失調,明確了特定行為異常的遺傳基礎。
研究團隊對9349名自閉癥患者和8332名對照者進行全基因組測序,發現27名男性患者存在PTCHD1-AS微缺失,其患病風險增加2.56倍,且主要表現為社交障礙而較少伴隨認知缺陷。團隊據此構建了基因敲除小鼠模型,發現小鼠展現出社交減少、發聲溝通異常及過度理毛等刻板行為,但學習和記憶力保持正常。結合轉錄組學分析,該基因在小鼠背側紋狀體(dorsal striatum,負責行為控制和習慣形成的腦區)持續表達。基因敲除導致該腦區的少突膠質細胞、神經元及星形膠質細胞發生分子改變,引起常規蛋白激酶C(conventional protein kinase C,參與細胞內信號傳導的酶類)減少并擾亂了突觸可塑性。此外研究證實該基因的功能完全獨立于相鄰的蛋白質編碼基因。研究發表在 Nature 上。
#疾病與健康 #神經機制與腦功能解析 #長鏈非編碼RNA #自閉癥 #PTCHD1-AS
閱讀更多:
Bradley, Clarrisa A., et al. “An X-Linked Long Non-Coding RNA, PTCHD1-AS, and the Core Features of Autism.” Nature, May 2026, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-026-10515-6
Nature:首次實現人工細胞的不對稱分裂
天然細胞能通過不對稱分裂產生不同子代,而現有合成細胞缺乏復雜內部結構域邊界,難以復現該過程。為解決人工細胞受控分裂的難題,Yan Qiao、Shu Wang與Yiyang Lin等研究人員(中國科學院化學研究所與北京化工大學)構筑了層狀液晶液滴模型,首次在無外部操控下成功實現了人工細胞向兩種結構迥異子代的不對稱分裂。
該研究團隊利用脂質分子與核苷酸自組裝,構筑了分子密集的層狀液晶液滴人工細胞(artificial cell,一種模擬天然生命系統基本特征的合成微室模型)。加入堿性磷酸酶(alkaline phosphatase,一種催化大分子去磷酸化反應的酶)后,液滴表面產生局部凹陷,隨著反應進行,凹陷沿周向擴展并形成清晰的核殼界面。當凹陷張開至臨界角度時,液滴內部核心被完整擠出,被剝離的外殼閉合成具有內部水相的多層囊泡。
實驗證明靜電屏蔽作用是這種不對稱分裂(asymmetric division,母體細胞分裂為組成與形態不同子代的過程)的核心驅動力,多價金屬離子在無酶條件下也能引發相同現象。分裂結束后子代液滴保留了酶活性,而子代囊泡因結構疏松釋放出部分分子并降低了內部pH值。這說明不對稱分裂能為后續功能演化提供差異化的化學微環境。該研究展示了化學不均勻性與界面能梯度協同誘發形態改變的新機制,為組裝可增殖系統奠定基礎。研究發表在 Nature 上。
#其他 #其他 #人工細胞 #不對稱分裂 #生命起源
閱讀更多:
Meng, He, et al. “Asymmetric Splitting in Dividing Lipid-Nucleotide Multilamellar Droplets.” Nature, vol. 653, no. 8114, May 2026, pp. 418–24. www.nature.com, https://doi.org/10.1038/s41586-026-10489-5
Cell:移植植物光合作用系統治療干眼癥
針對干眼癥引發的眼表炎癥難題,David Tai Leong、葉娟、孫曉和丁顯光(新加坡國立大學、浙江大學醫學院附屬第二醫院、山東第一醫科大學、南京郵電大學)等研究人員將植物光合作用系統移植入哺乳動物眼部,成功利用可見光驅動細胞產生代謝物,有效緩解了干眼癥狀。
研究團隊提取了菠菜葉綠體中的類囊體基粒(Thylakoid grana,光合作用中進行光反應的膜結構堆疊體),去除消耗能量的暗反應酶系,并使用表面活性劑將其包裹成名為LEAF的納米系統。這些顆粒尺寸約400納米,保留了完整的光系統復合結構,能夠在環境可見光下自主高效地產生還原型煙酰胺腺嘌呤二核苷酸磷酸(NADPH,一種關鍵的抗氧化還原輔酶)。實驗表明,LEAF能夠被角膜上皮細胞和巨噬細胞快速吞噬。當小鼠內源性合成途徑被完全阻斷時,LEAF依然能獨立提供充足的NADPH,并使細胞內的活性氧水平降低一半。在干眼癥小鼠模型中滴注LEAF眼藥水并在正常環境光下照射,小鼠角膜的NADPH水平在30分鐘內即顯著上升。連續治療5天后,角膜熒光染色損傷評分大幅下降,淚液分泌顯著增加。它不僅能在細胞內部恢復自身抗氧化能力并促使促炎巨噬細胞轉變為抗炎型,還能在細胞外通過附帶的植物源抗氧化酶清除微環境中的致炎因子,整體療效優于常用的免疫抑制藥物環孢素A。研究發表在 Cell 上。
#疾病與健康 #跨學科整合 #干眼癥 #納米醫學 #光合作用
閱讀更多:
Xing, Kuoran, et al. “Transplanting Light-Dependent Reactions for Mammalian Eye Photosynthesis.” Cell, vol. 0, no. 0, May 2026. www.cell.com, https://doi.org/10.1016/j.cell.2026.04.034
海馬漣漪與重放機制揭示大腦如何靈活重組知識以解決新問題
面對新情況時,人類大腦如何將過去的知識重新組合以進行靈活的規劃?北京師范大學、中國醫學科學院和倫敦大學學院等機構的Li He、Xiongfei Wang等團隊通過記錄人腦電活動,揭示了海馬體和內側前額葉皮層在這一過程中協同工作的關鍵神經機制。
![]()
? 利用顱內記錄設計輪廓構建任務(研究 1)。Credit: Nature Neuroscience (2026).
為了探究這一過程,研究人員招募了28名因治療需要植入顱內電極的癲癇患者。參與者被要求完成兩項類似樂高拼搭的推理任務,需要在腦海里將熟悉的元素組合成全新的圖案。實驗期間,研究團隊使用高分辨率顱內腦電圖記錄了患者海馬體和皮層區域的腦電活動。數據分析顯示,海馬體會產生短暫的高頻神經活動爆發,即海馬漣漪,這種活動能夠促使內側前額葉皮層更新其活動模式,從而將新推斷出的解決方案編碼為組合結構。與此同時,大腦會快速觸發重放機制(replay,即對過往經驗或信息序列的快速重新激活),將熟悉的知識模塊重新組合成解決當前問題所需的候選序列。研究發現,重放活動在海馬漣漪期間最為強烈,它不僅與內側前額葉皮層的活動高度協同,還能有效預測參與者是否能做出高效的推理行為。這項研究證明了海馬漣漪和重放機制是大腦動態更新皮層表征、支持靈活規劃與推理的核心動力。研究發表在 Nature Neuroscience 上。
#神經科學 #神經機制與腦功能解析 #海馬體 #靈活規劃
閱讀更多:
He, Li, et al. “Human Hippocampal Ripples Coordinate Planning Sequences and Compositional Representations in Neocortex.” Nature Neuroscience, May 2026, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41593-026-02291-3
神經元過度活躍誘發嚴重自身免疫性腦病
針對免疫系統錯誤攻擊大腦細胞導致抗IgLON5疾病中Tau蛋白病理改變的具體分子機制問題,德國神經退行性疾病中心和柏林夏里特醫學院的Bilge Askin和Susanne Wegmann及其團隊證實異常抗體會引發神經元過度活躍,進而導致細胞內Tau蛋白的異常聚集與錯位,揭示了該罕見腦炎的致病基礎。
![]()
? 來自患者血漿的α-IgLON5 自身抗體可與神經元 IgLON5 結合。Credit: Science Advances (2026).
該團隊從患者血漿中分離出純化的IgLON5特異性自身抗體(α-IgLON5 AABs,一種針對特定神經元表面蛋白的異常免疫分子),并將其應用于體外培養的小鼠海馬神經元和成年野生型小鼠中。體外實驗顯示,異常抗體會導致IgLON5蛋白與細胞表面的其他受體和通道分子發生聚集,這種膜表面的受體簇集迅速誘發了神經元的異常過度活躍。過度活躍隨后觸發了致死性級聯反應,導致神經元內出現明顯的Tau蛋白錯位(Tau missorting,即原本應位于軸突的Tau蛋白異常轉移并積累在細胞體和樹突中)。實驗進一步證實,含有易聚集Tau突變的神經元在連續抗體處理下,顯著形成了類似神經原纖維纏結的結構。在體內測試階段,研究人員通過微量泵連續十四天將總計75微克的患者抗體注入野生型小鼠側腦室,結果成功在小鼠海馬體中誘導出Tau蛋白異常磷酸化及強烈的神經炎癥反應。該研究明確了異常免疫抗體與細胞內Tau病理學之間的因果關系,將神經元功能亢進確立為驅動該類神經退行性病變的核心因素。研究發表在 Science Advances 上。
#疾病與健康 #神經機制與腦功能解析 #自身免疫疾病 #Tau蛋白 #IgLON5腦炎
閱讀更多:
Askin, Bilge, et al. “IgLON5 Autoimmune Antibodies Activate Tau via Neuronal Hyperactivity.” Science Advances, vol. 12, no. 20, May 2026, p. eaec2042. science.org (Atypon), https://doi.org/10.1126/sciadv.aec2042
嚴厲管教破壞幼兒壓力調節能力的發展
嚴厲的教養方式會如何影響兒童處理壓力的能力?Jianing Sun與Erika Lunkenheimer團隊(賓夕法尼亞州立大學)研究發現,體罰或吼叫等嚴厲管教方式會破壞幼兒獨立調節壓力的發展軌跡,導致兒童在面臨壓力時更難以平復,且隨著年齡增長反而更加依賴母親的外部干預。
研究團隊對129對高危母子進行了兩階段追蹤,在兒童3歲和4歲時分別進行評估。母親通過問卷報告自身大聲呵斥或體罰等育兒行為。在兒童進行具有挑戰性的拼圖任務時,研究人員為母子佩戴監測設備,以30秒為間隔追蹤其呼吸竇性心律失常。數據表明,母親在一時間段內的生理狀態能預測孩子下一時段的狀態。在管教溫和的家庭中,母親對孩子的生理調節影響隨孩子長到4歲而減弱,顯示兒童正發展獨立的自我調節能力。但在管教嚴厲的家庭中,母親的外部調節影響隨孩子成長反而增強。受嚴厲管教的兒童還表現出更大的呼吸竇性心律失常慣性(RSA inertia,指受到壓力挑戰后升高的壓力水平需要更長時間才能恢復到基線水平),表明其壓力調節系統發育不良且更為僵化。研究發表在 Child Development 上。
#認知科學 #心理健康與精神疾病 #兒童發展 #壓力調節 #家庭教育
閱讀更多:
https://dx.doi.org/10.1093/chidev/aacag033
綠地接觸顯著改善弱勢兒童心理健康
自然綠地能否縮小弱勢兒童的心理健康差距?Keira I. Denker和Andrea Faber Taylor(伊利諾伊大學厄巴納-香檳分校)研究發現綠地具均衡生成效應,弱勢兒童從中獲得的心理益處顯著多于優勢同齡人。
研究團隊采用范圍界定綜述方法,檢索并篩選了123項關于自然環境對健康影響的實證研究。隨后他們深入分析了其中24項專門比較0至18歲不同社會背景兒童心理健康的文獻。數據表明123項研究中近百分之六十證實了均衡生成(equigenesis,即特定物理環境促進不同人群健康公平的現象)的存在。聚焦兒童的24項研究中,半數明確指出弱勢兒童從綠地中獲益更多,表現為焦慮水平降低、行為問題減少,且閱讀數學能力和親社會行為得到顯著改善。盡管優勢兒童也能獲益,但由于其已具備充足支持,往往表現出天花板效應。各項數據均未顯示綠地存在負面影響,這表明投資校園綠化是改善弱勢兒童心理健康的高回報手段。研究發表在 Frontiers in Psychology 上。
#疾病與健康 #心理健康與精神疾病 #兒童心理 #社會經濟因素 #自然干預
閱讀更多:
Denker, Keira I., and Andrea Faber Taylor. “Nature Is Nurture: A Scoping Review of Nature Exposure as an Equigenic Intervention on Children’s Psychological Health.” Frontiers in Psychology, vol. 17, Apr. 2026. Frontiers, https://doi.org/10.3389/fpsyg.2026.1731222
AI 行業動態
谷歌Gemini 3.2 Flash意外泄露:單次生成2200行代碼,手搓Windows 98引轟動
在年度I/O大會開幕前夕,谷歌悄然在網頁端上線了新一代模型Gemini 3.2 Flash,被全球開發者意外捕獲。該模型展現出驚人的編碼實力:過去模型單次生成難以突破四五百行代碼,而Gemini 3.2 Flash可輕松輸出超過1000行,甚至有人僅用一次提示就生成了2200行的Three.js項目代碼。更令人驚嘆的是,有開發者利用其Pro版本僅憑提示就“手搓”出一個功能完備、支持窗口拖拽和內置瀏覽器的Windows 98模擬界面。在物理模擬和SVG設計測試中,該模型同樣表現卓越,能生成帶有透明光影、水花粒子的3D場景和高度細節化的PS5主機藍圖,其創意編程能力甚至超越了自家的旗艦Pro版本。
這一突破得益于谷歌DeepMind采用的模型蒸餾與稀疏化技術,在保持核心性能的同時將推理成本降低15-20倍,延遲壓縮至200毫秒以內。業內傳言其代碼與推理能力已逼近GPT-5.5的92%水平。除了模型本身,Gemini應用正在全面打通第三方服務,目前已接入GitHub、Spotify、WhatsApp等,并預告將集成Canva(在線設計平臺)、Instacart(生鮮購物平臺)和OpenTable(餐廳預訂平臺),用戶可直接在對話中完成設計、購物和訂位,打造全能AI管家入口。隨著I/O大會臨近,更多產品如全天候智能體Gemini Spark、視頻生成工具Gemini Omni等也遭泄露。在OpenAI和Anthropic下一代模型蓄勢待發的背景下,這場泄露被視為谷歌在通往ASI競速中的關鍵翻盤局。
#Gemini3.2Flash #AI編碼 #模型蒸餾 #全能AI管家 #谷歌I/O
閱讀更多:
https://9to5google.com/2026/05/17/gemini-app-thinking-level/
AnySearch打通“暗網”數據,為AI Agent開啟真實世界之眼
在AI Agent自主執行任務的能力飛速提升之際,一個關鍵瓶頸——信息獲取的深度與廣度——正日益凸顯。傳統搜索引擎無法觸及互聯網上超過80%的專業數據,如企業股權結構、生產級代碼、法律裁決書和實時威脅情報等。近日,一款名為AnySearch的產品試圖解決這一痛點。它定位為AI時代的“搜索基礎設施”,為Agent提供一個統一的高質量搜索入口。通過智能意圖路由(Intent Classifier,一種自動判斷查詢目標并分配至最佳數據源的技術)和結果融合算法,AnySearch能將散落在代碼倉庫、金融數據庫、法律文書庫等專業源頭的結構化信息,整合為簡潔的Markdown格式輸出。上線僅一周,該產品便在GitHub、ClawHub等開發者社區引發熱潮,被多位技術專家評價為Agent開發中不可或缺的“天眼”。
AnySearch的能力在多個專業場景中得到驗證。產品經理用它完成競品調研時,它能自動聚合融資動態、應用商店評分和社區輿論,并標注信息置信度;開發者查詢生產級代碼實現時,它能直接從主流開源倉庫(如bb8、pgcat)中提取核心邏輯并橫向對比;投資人做公司盡調,它會誠實指出數據沖突與信息缺口,避免誤導;安全工程師排查可疑IP,它能提供基礎網絡信息并明確自身的判斷邊界。該產品提供REST API、MCP Server和Skill三種接入方式,并承諾不記錄、不追蹤用戶查詢,將隱私保護作為架構底線。AnySearch的嘗試,標志著搜索正經歷從“幫人找網頁”到“幫AI理解世界”的第四次范式轉移。
#AI搜索 #AIAgent #AnySearch #智能路由 #專業數據源
閱讀更多:
https://github.com/anysearch-ai
馬耳他開全球先例:全民免費享用ChatGPT Plus一年
OpenAI近日宣布與馬耳他政府達成一項國家級合作,向所有馬耳他公民免費提供為期一年的ChatGPT Plus訪問權限,相關費用由國家承擔。這是全球首個以國家為單位、覆蓋全體公民的人工智能工具普及計劃。不過,獲得這一福利有一個前置條件:公民需先完成由馬耳他大學開發的人工智能素養課程,內容涵蓋人工智能的基本原理、能力邊界以及在家庭和工作場景中的負責任使用方法。首批用戶預計在今年5月接入,由馬耳他數字創新管理局負責分發,后續還將覆蓋海外馬耳他公民。這種“先教育、后工具”的路徑,與多數國家停留在監管層面的政策形成鮮明對比。
對于OpenAI而言,這項合作的直接訂閱收入(馬耳他約57萬人口,全員開通年成本約1.3億美元)并非主要目標。其真正意圖在于三方面:一是通過政府渠道批量獲取用戶,搶占心智,將ChatGPT塑造為“全球公用事業”;二是獲得來自教師、漁民、公務員等多樣化真實世界的交互數據,反哺模型訓練,提升數據多樣性;三是打造“樣板間”,以吸引更多中等規模國家跟進合作。從財政可行性看,人口在500萬以下的國家(如愛沙尼亞、新加坡、盧森堡)較易復制此模式,而人口過千萬的大國則面臨較大預算壓力。這場實驗的核心檢驗命題是:人工智能普及的瓶頸究竟是工具可及性,還是使用能力。項目啟動6個月后的月活留存率,將成為判斷該模式是否可持續的關鍵指標。
#馬耳他 #ChatGPTPlus #全民AI #AI素養 #OpenAI
閱讀更多:
https://openai.com/index/malta-chatgpt-plus-partnership/
OpenAI深夜重組:Brockman正式掌權,三大王牌合并迎戰“SaaS末日”與Anthropic反超
人工智能領域的領軍企業OpenAI在IPO前夕進行了公司歷史上最大規模的組織重組。聯合創始人兼總裁Greg Brockman從“代管”正式轉正,全面接管所有產品戰略。此次調整的核心是將ChatGPT、編程智能體Codex以及開發者生態命脈API三大獨立產品線打碎合并,形成統一的產品與平臺團隊。原ChatGPT負責人Nick Turley被調離消費者業務,轉管企業方向,其職位由前Instagram副總裁Ashley Alexander接替。這一“三線合一”的戰略旨在以最大專注力向“智能體時代”(Agentic Future,指AI能自主完成復雜數字任務的階段)進軍,并秘密開發代號為“超級應用”的桌面端產品,該應用將融合ChatGPT、Codex和Atlas瀏覽器,目標是“自主代替用戶執行復雜的數字任務”。
此次堪稱“硅谷權游”的權力洗牌,被外界解讀為OpenAI在內外交困下的斷臂自救。內部層面,公司近期遭遇嚴重的高管空心化:AGI部署負責人Fidji Simo因病無限期休假,Sora負責人Bill Peebles等多位技術大牛接連離職。外部競爭則更為兇險:最大競爭對手Anthropic剛完成300億美元融資,估值飆升至9000億美元,在估值和編程領域實現對OpenAI的反超;同時,谷歌也計劃在下周I/O大會上發布一系列針對ChatGPT的AI產品。為在年內推進IPO并重塑資本市場信心,OpenAI必須通過重組講出一個“統一底層能力、統治桌面端”的清晰故事。Brockman這位技術靈魂親自掛帥產品,既是臨危受命,也是為守住9億周活躍用戶帝國而發起的背水一戰。
#OpenAI重組 #GregBrockman #超級應用 #Anthropic反超 #智能體時代
閱讀更多:
https://www.wired.com/story/openai-reorg-greg-brockman-product/
AI 驅動科學
Cell:AI模型Path2Space僅憑病理切片預測空間基因表達
空間轉錄組學能夠揭示腫瘤異質性,但高昂的成本限制了其大規模應用。Eldad D. Shulman和Eytan Ruppin等(美國國立癌癥研究所)開發了一款深度學習模型,直接從常規病理切片中精準預測空間基因表達,成功提取乳腺癌生物標志物,為腫瘤微環境分析與治療預測提供了低成本的新方案。
研究團隊利用空間轉錄組學的大規模數據與匹配的常規病理圖像,訓練了這款名為Path2Space的AI模型。該模型采用多層感知機預測每個微小捕獲區域的基因表達。結果表明,模型能穩健預測上萬個基因的空間分布,性能超越現有的21種計算方法,并在福爾馬林固定石蠟包埋(formalin-fixed paraffin-embedded,一種標準的臨床組織保存法)的切片上表現優異。研究人員將其應用于癌癥基因組圖譜的976個乳腺癌樣本,成功推斷出局部細胞類型豐度,并將患者劃分為三個具有不同生存結局的空間亞組。更值得注意的是,基于該模型構建的空間腫瘤微環境(tumor microenvironment,腫瘤細胞周圍由各類細胞和非細胞成分組成的復雜環境)景觀,比傳統批量測序更準確地預測了患者對化療和曲妥珠單抗的臨床響應。研究發表在 Cell 上。
#疾病與健康 #個性化醫療 #空間轉錄組學 #人工智能 #生物標志物
閱讀更多:
Shulman, Eldad D., et al. “AI-Predicted Spatial Transcriptomics Unlocks Breast Cancer Biomarkers from Pathology.” Cell, vol. 0, no. 0, May 2026. www.cell.com, https://doi.org/10.1016/j.cell.2026.04.023
LLM多智能體系統演進全景:從基礎能力到自主自我進化的閉環生命周期
大語言模型多智能體在復雜協作中面臨故障難診斷與無法自主改進的困境。Shihao Qi、Jie Ma等研究人員(西安交通大學等)提出涵蓋系統生命周期的全景綜述框架,揭示了從基礎協作到閉環自我進化的深層機制。
研究團隊提出了名為LIFE的四階遞進理論模型。該框架將系統演化路徑劃分為奠定能力基礎(Lay the capability foundation,指構建單智能體認知模塊)、通過協作整合(Integrate agents through collaboration,指確立組織架構與通信協議)、通過歸因尋找故障(Find faults through attribution,指識別復雜環境中的錯誤源頭)以及通過自主改進進化(Evolve through autonomous self-improvement,指基于診斷結果自發優化行為)四個階段。團隊系統評估了現有研究在組織拓撲及故障分析等層面的方法論,并嚴謹驗證了相鄰階段的雙向制約關系。結果表明,系統故障診斷與結構優化之間存在核心的閉環效應。精準的故障溯源不僅能剖析錯誤發生的深層根源,更能極大程度地收斂架構迭代的搜索空間。若缺乏可靠的診斷支撐,智能體生態的自我進化將失去方向;而缺乏進化演變機制,歸因結果也難以在實際應用中落地。該研究系統總結了邁向全自主閉環協作生態的跨期技術路線圖。
#大模型技術 #意圖與決策 #多智能體系統 #失敗歸因 #自我進化
閱讀更多:
https://arxiv.org/abs/2605.14892
突破超長上下文訓練瓶頸:Lighthouse Attention實現高效大模型預訓練
極長上下文大語言模型的訓練面臨注意力機制計算量呈平方級激增的嚴重瓶頸。為此,諾斯研究院(Nous Research)的Bowen Peng、Subho Ghosh和Jeffrey Quesnelle提出了Lighthouse Attention架構,不僅大幅提升了訓練速度,還完美保留了模型推理期的全注意力能力。
該研究提出了一種僅用于訓練階段的對稱選擇式分層注意力算法。研究人員首先對查詢(Queries,注意力機制中代表當前處理信息的向量)、鍵(Keys,代表被匹配信息的向量)和值(Values,包含實際內容信息的向量)進行多層級的對稱壓縮池化,并使用無需梯度的參數無關評分機制進行重要性評估。隨后,算法通過分塊雙調排序(chunked-bitonic top-K,一種用于圖形處理器上快速并行篩選最高分項的排序機制)選出關鍵特征,將其重組為密集的因果子序列,再送入閃存注意力(FlashAttention,一種精確的硬件感知注意力加速內核)中進行核心計算,最后通過反向散射操作將結果精準還原至原始序列位置。這種解耦設計將稀疏選擇邏輯完全移出核心計算流,極大提升了并行效率。在大語言模型預訓練實驗中,研究人員采用兩階段策略:主要時間使用新架構,最后階段短暫恢復為標準全注意力訓練。數據顯示,在512K上下文下,該方法前向傳播速度比基線快21倍,總運算速度提升17.3倍。最終模型的收斂損失不僅優于從頭訓練的全注意力基線,而且端到端總耗時大幅縮減。
#大模型技術 #計算模型與人工智能模擬 #長文本預訓練 #LighthouseAttention #稀疏注意力
閱讀更多:
https://arxiv.org/abs/2605.06554
大語言模型如何推算時間?研究揭示Llama內部的通用幾何計算器
大語言模型在處理月份等循環概念時,究竟是如何進行推理的?Sheridan Feucht和Ekdeep Singh Lubana團隊(Goodfire以及東北大學等機構)發現,Llama 3.1 8B 模型并未采用特定周期的模運算,而是在內部調用了一個通用的十進制幾何計算器來統一處理此類任務。
為了揭開大模型內部計算機制的面紗,研究團隊采用分布式對齊搜索(Distributed Alignment Search,一種通過追蹤網絡層級間信息流向來定位抽象因果變量的優化過程)和因果分析技術,對模型處理各類循環任務的神經活動進行了觀測。實驗中,研究人員將標準加法任務的神經激活狀態進行修補(patching,指在神經網絡特定層替換激活值以測試因果關系的干預方法)到循環任務中,成功改變了模型的預測結果。
研究揭示,當面對諸如八月之后的六個月是哪個月的提問時,模型并非像人類那樣依次推算,而是先將八月轉換為數字8,在第18層調用一個通用的十進制加法模塊算出6加8等于14,隨后在更深層的網絡中將14映射回二月。更令人驚嘆的是,模型使用傅里葉特征(Fourier features,即利用一組圓在激活空間中通過不同余數周期組合來表征數字的數學技術)并行處理這些加法子問題。研究團隊甚至在第18層精準定位了28個專門負責加法的多層感知機神經元,這些神經元形成不同的聚類,完美協同處理不同周期的加法運算。
#大模型技術 #計算模型與人工智能模擬 #因果分析 #幾何表征
閱讀更多:
Feucht, Sheridan, et al. “Arithmetic in the Wild: Llama Uses Base-10 Addition to Reason About Cyclic Concepts.” arXiv:2605.01148, arXiv, 1 May 2026. arXiv.org, https://doi.org/10.48550/arXiv.2605.01148
新型深度學習架構CCDNN利用典型相關性引導實現高效多源數據融合
在工業4.0時代,如何高效融合來自不同傳感器和系統的數據是提升自動化和智能化水平的關鍵。來自中南大學的陳志文(Zhiwen Chen)教授及其合作團隊提出了一種名為CCDNN的創新深度學習架構,通過將數據相關性作為一種“引導”而非最終目標,實現了更高效、更專注的多源數據融合。
![]()
? 該創新方法利用典型相關引導的深度神經網絡技術實現高效數據融合。實驗結果表明,該方法在基準測試任務中表現出優異的性能,凸顯了其在智能控制、自動化和數據驅動工程系統等領域的應用潛力。Credit: Professor Zhiwen Chen, Central South University, China
傳統的數據融合方法,如典型相關分析(CCA)及其深度學習版本,致力于最大化不同數據源之間的相關性,但這可能偏離了如故障診斷或性能預測等具體工程任務的核心。CCDNN架構則另辟蹊徑,它將“保持數據相關性”作為一個約束條件,讓深度神經網絡(DNNs)在優化過程中能夠更專注于手頭的任務。此外,該架構還集成了一個獨特的無參數冗余濾波器,以精簡信息。實驗結果驗證了其優越性:在標準的MNIST數據集上進行重構任務時,其誤差比主流的DCCA模型降低了40%以上;在模擬工業故障診斷和設備剩余壽命預測等復雜場景中,CCDNN的分類和預測準確性也顯著優于現有方法。這一靈活的架構能夠有效處理圖像、時間序列等異構數據,為開發下一代智能工程系統提供了強大的新工具。研究發表在 IEEE/CAA Journal of Automatica Sinica 上。
#AI驅動科學 #跨學科整合 #深度學習 #工業自動化
閱讀更多:
Chen, Zhiwen, et al. “CCDNN: A Novel Deep Learning Architecture for Multi-Source Data Fusion.” IEEE/CAA Journal of Automatica Sinica, vol. 13, no. 3, Mar. 2026, pp. 555–67. IEEE Xplore, https://doi.org/10.1109/JAS.2025.125411
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。您也可以在后臺提問,我們將基于追問知識庫為你做出智能回復哦~
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
研究院在華山醫院、上海市精神衛生中心分別設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工陳天橋雒芊芊神經科學研究院。
研究院還建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、科普視頻媒體「大圓鏡」等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.