![]()
█ 腦科學動態
Science:人類視覺感知與想象共享同一套神經密碼
我們如何在暗處看清事物?視網膜雙極細胞網絡的高度整合
一餐高脂飲食即可引發腸道關鍵免疫細胞迅速流失
全球夜間變暖威脅數十億人睡眠健康
從嗅覺感知到精準轉向:線蟲全腦鈣成像揭示導航底層機制
冥想僅需7分鐘即可使腦電波變化達到峰值
連結感提升7%,為什么我們更愿意為直播而不是錄播駐足?
寬恕可全面提升長期心理健康與親社會性格
腦機接口超越醫療范疇:Neuralink技術或開啟心理政治新紀元
█ AI行業動態
視頻生成模型HappyHorse-1.0登頂評測榜首
█ AI驅動科學
破解AI過度自信:受大腦啟發的噪聲訓練讓神經網絡找回“自知之明”
系統解析高通量篩選與AI技術,加速抗衰老藥物研發
40萬條帖子揭示減肥神藥GLP-1的隱藏副作用
CompreSSM技術打造更精簡、更快速的AI模型
PaperOrchestra問世,可將原始筆記自動撰寫為AI研究論文
腦科學動態
Science:人類視覺感知與想象共享同一套神經密碼
為什么我們在回憶曾見過的事物時它們會顯得如此真實?視覺感知與心理想象是否共享大腦的基礎架構?V. S. Wadia、Ueli Rutishauser和Doris Y. Tsao等研究人員(西達賽奈醫療中心和加州大學伯克利分校等)通過單神經元記錄發現,人類大腦在感知和想象物體時激活了相同的神經元,揭示了視覺想象背后的共享神經編碼機制。
該研究記錄了16名植入顱內電極的癲癇患者大腦腹側顳葉皮層中714個單神經元的電活動。研究人員首先讓患者觀看包含面部和動物等類別的圖像,隨后讓部分患者憑記憶想象這些相同的圖像。為了解析神經元信號,研究結合深度神經網絡和生成式人工智能工具,為物體創建了數值描述。結果顯示,在具有視覺反應的神經元中,約80%利用分布式軸編碼(axis code,一種將刺激特征投射到特定特征軸上并根據投射值作出神經反應的編碼方式)來表征物體。更關鍵的是,當患者想象這些物體時,約40%的軸調諧神經元被重新激活,并且精準重現了最初觀看圖像時的神經活動模式。這意味著心理意象的產生依賴于感知期間使用的相同感覺代碼。這一發現不僅證實了人類腹側顳葉皮層中存在生成模型,還可以通過神經元活動規律反向重建患者想象的畫面。研究發表在 Science 上。
#神經科學 #神經機制與腦功能解析 #認知科學 #生成式AI #心理意象
閱讀更多:
Wadia, V. S., et al. “A Shared Code for Perceiving and Imagining Objects in Human Ventral Temporal Cortex.” Science, vol. 392, no. 6794, Apr. 2026, pp. 207–15. science.org (Atypon), https://doi.org/10.1126/science.adt8343
我們如何在暗處看清事物?視網膜雙極細胞網絡的高度整合
視覺系統最初如何處理微弱光線下的信息?傳統的并行處理假說認為視網膜中的信息通道是獨立運作的。耶魯大學醫學院的Yao Xue、Seunghoon Lee和Z. Jimmy Zhou團隊發現,視網膜中的神經通道遠比想象中更加整合,一種層級化的網絡機制揭示了人類在弱光下視物的關鍵。
![]()
? Credit: Neuron (2026).
研究團隊摒棄了破壞突觸回路的傳統切片方法,在完整的鼠視網膜和人類視網膜中應用了雙膜片鉗技術與雙光子成像。他們刺激特定的雙極細胞(bipolar cells,負責接收感光細胞信號并向下游傳遞的中間神經元),并記錄受體細胞反應。結果顯示,雙極細胞的十幾個平行信息通道并非獨立存在,而是通過電突觸高度整合。刺激單個細胞會引發多個細胞釋放神經遞質,形成分散的云狀信號網絡。研究還發現BC6型雙極細胞在網絡中充當驅動節點,以層級方式向下游分配信號。這種串聯網絡使細胞能有效整合并處理微弱視覺信號,顯著提升了對低對比度及微小目標的檢測能力。研究發表在 Neuron 上。
#神經科學 #神經機制與腦功能解析 #視網膜 #視覺系統 #雙極細胞
閱讀更多:
Xue, Yao, et al. “A Hierarchical Electrical Synaptic Circuit Mechanism for Integrative Parallel Visual Processing in the Retina.” Neuron, vol. 0, no. 0, Feb. 2026. www.cell.com, https://doi.org/10.1016/j.neuron.2025.12.042
一餐高脂飲食即可引發腸道關鍵免疫細胞迅速流失
短期的油膩飲食究竟會如何快速重塑腸道微環境并影響免疫屏障?Eva C. Torrico和Selma Boulenouar等研究人員展開了詳細探索,結果發現僅僅數小時的高脂飲食就足以對腸道內的關鍵免疫細胞造成致命打擊,從而揭示了不良飲食習慣損害腸道健康的微觀起始機制。
研究團隊通過小鼠實驗發現,喂食高脂飲食的小鼠腸道內3型先天淋巴細胞(ILC3,一種維持腸道健康的黏膜免疫衛士)在24小時內迅速衰減,且該現象與總熱量攝入或體重增加無關。人類腸道樣本分析同樣顯示超重人群的ILC3數量顯著偏低。機制研究揭示,高脂飲食會帶來致命的雙重打擊:一方面它增加腸道通透性,激活單核吞噬細胞釋放炎癥因子;另一方面,ILC3自身會大量吸收脂肪酸,但炎癥信號抑制了過氧化物酶體增殖物激活受體α(PPARα,調節脂質代謝的核心轉錄因子),從而阻斷了脂肪酸氧化(FAO,細胞內燃燒脂肪獲取能量的代謝通路)。未能燃燒的脂質轉化為過氧化物,破壞線粒體結構并誘發細胞凋亡。實驗還表明,魚油因具抗炎特性不會引發此類毒性,且小鼠在及時恢復正常飲食后,腸道免疫系統可重回健康狀態。研究發表在 Immunity 上。
#疾病與健康 #疾病預防 #高脂飲食 #免疫細胞 #腸道微生態
閱讀更多:
Torrico, Eva C., et al. “High-Fat Diet Causes Rapid Loss of Intestinal Group 3 Innate Lymphoid Cells through Microbiota-Driven Inflammation and Mitochondrial Stress.” Immunity, Mar. 2026. ScienceDirect, https://doi.org/10.1016/j.immuni.2026.02.014
全球夜間變暖威脅數十億人睡眠健康
隨著全球變暖導致夜間升溫加劇,這一現象究竟如何影響全球人口的睡眠?Kelton Minor等(哥本哈根大學)通過對大量觀測數據的回顧性分析發現,夜間高溫正嚴重縮短全球數十億人的睡眠時間,并指出當前學術界對氣候脆弱地區人群的睡眠狀況存在嚴重認知空白。
研究團隊回顧了過去十多年來關于溫度與睡眠關系的受控實驗室實驗與大規模自然實驗,并結合可穿戴設備的數據,評估了環境熱量對全球人群睡眠的具體影響。研究結果顯示,人類睡眠對溫度的反應呈非線性,夜間氣溫即使適度升高,也會顯著縮短睡眠時間。例如當夜間氣溫達到約27°C時,每10萬暴露人群中就會新增約9300人睡眠不足6小時。此外,人類建造的建筑環境往往會滯留熱量,這使得炎熱天氣對睡眠的破壞不僅發生在當晚,更會持續數日,導致嚴重的睡眠剝奪累加。令人擔憂的是,現有研究嚴重忽視了非洲和東南亞等氣候脆弱且貧困的地區人群。研究警告稱,隨著全球進一步變暖,睡眠受損問題將加速惡化,僅靠空調等現有措施難以應對。團隊呼吁成立全球工作組,將睡眠健康納入城市規劃與氣候適應策略中。研究發表在 SLEEP 上。
#疾病與健康 #疾病預防 #氣候變暖 #睡眠健康 #公共衛生
閱讀更多:
Minor, Kelton, et al. “A Wake-up Call for a Global Climate and Sleep Task Force.” Sleep, Mar. 2026, p. zsag075. Silverchair, https://doi.org/10.1093/sleep/zsag075
從嗅覺感知到精準轉向:線蟲全腦鈣成像揭示導航底層機制
動物如何將感官信息轉化為具體的導航行動?Steven W. Flavell 和 Talya S. Kramer 及其團隊(麻省理工學院皮考爾學習與記憶研究所)通過研究秀麗隱桿線蟲在氣味環境中的運動,精確繪制了大腦從感知氣味到執行復雜轉向行為的完整神經元活動圖譜,揭示了感覺運動弧的底層機制。
該研究通過將線蟲放置在具有不同氣味梯度的環境中,利用定制顯微鏡和全腦鈣成像技術,實時追蹤了線蟲運動時其大腦中100多個神經元的活動模式。研究顯示,線蟲并非隨機游走,而是能執行精確的糾錯轉向。研究團隊發現了一個由約10個神經元組成的特定序列,它們控制線蟲完成前行、后退、轉向至再次前行的連續動作。其中,SAA神經元負責整合氣味信息并精準規劃轉向方向。此外,通過細胞特異性干擾技術,研究人員發現由RIM神經元釋放的神經調節劑酪胺在這一過程中發揮著類似車輛換擋的關鍵協調作用。當敲除酪胺后,線蟲的神經活動序列和導航行為會嚴重崩潰。這一發現展示了神經系統如何通過特定架構和神經調節機制將感覺線索轉化為動作。研究發表在 Nature Neuroscience 上。
#神經科學 #神經機制與腦功能解析 #秀麗隱桿線蟲 #導航行為 #神經調節劑
閱讀更多:
Kramer, Talya S., et al. “Neural Sequences Underlying Directed Turning in Caenorhabditis Elegans.” Nature Neuroscience, Apr. 2026, pp. 1–17. www.nature.com, https://doi.org/10.1038/s41593-026-02257-5
冥想僅需7分鐘即可使腦電波變化達到峰值
冥想究竟需要多長時間才能在神經層面上對大腦產生實質性的改變?印度國家精神衛生和神經科學研究所的Malipeddi Saketh和Bindu M Kutty等團隊通過實時追蹤腦電活動,發現只需兩到三分鐘,大腦就會開始發生顯著的腦電波轉變并在七分鐘時達到峰值,且經驗越豐富的人在峰值時的腦波強度越高。
![]()
? 冥想新手對照組的時間動態:本文展示了初次冥想者(冥想新手對照組,簡稱 CNT)在呼吸覺察冥想中的起效時間和時間動態。Credit: Mindfulness (2026).
在這項研究中,研究團隊招募了28名無冥想經驗者、33名新手和42名高級練習者,讓他們進行10分鐘的呼吸覺察冥想。受試者佩戴裝有128個傳感器的帽子進行腦電圖測試,以追蹤多個頻率頻段的時間動態變化。研究結果顯示,無論經驗多少,受試者大腦的電模式都在2到3分鐘內開始發生轉變:與平靜和專注相關的α波和θ波以及與警覺相關的β1波顯著上升;同時,與困倦相關的δ波和γ1波出現下降。這些變化在7到10分鐘時達到最強。有趣的是,高級練習者雖然不一定比新手更快達到峰值,但他們的腦波強度要強得多,且在冥想開始30秒時就已經能觀察到獨特的神經電生理特征。這一發現表明,即便生活忙碌,僅需7分鐘的簡短冥想練習也能迅速調節認知與情緒。研究發表在 Mindfulness 上。
#認知科學 #大腦信號解析 #腦波動力學 #冥想 #心理健康
閱讀更多:
Saketh, Malipeddi, et al. “Temporal EEG Signatures of Meditation Experience: Peak Brainwave Changes at 7 Minutes During Isha Yoga Breath Watching.” Mindfulness, Mar. 2026. Springer Link, https://doi.org/10.1007/s12671-026-02790-1
連結感提升7%,為什么我們更愿意為直播而不是錄播駐足?
數字化時代人們亟需在虛擬空間中尋找真實的社交連結。Nofar Duani(南加州大學)、Alixandra Barasch(科羅拉多大學博爾德分校)和 Adrian F. Ward(德克薩斯大學奧斯汀分校)探究了直播與錄播對觀眾心理的不同影響,發現僅僅確認視頻是實時發生的,就能顯著提升觀眾的連結感和參與度,證實了純粹現場效應的存在。
該研究團隊以業余音樂表演為實驗背景,招募了3500名參與者開展了五項行為學實驗。研究人員在不同平臺上讓參與者觀看真實直播或錄播視頻,甚至向其展示完全相同的視頻但改變了直播標簽。結果顯示,直播為觀眾帶來了顯著的現場感提升。具體而言,觀看直播的參與者對表演者的連結感提升了7個百分點,喜愛度提高了5個百分點。同時觀眾不僅觀看直播的時間更長,也更愿意關注和訂閱創作者的頻道。研究團隊分析指出,這種效應的核心機制是臨場感的大幅增強。值得注意的是,如果觀眾看不到表演者的面部輪廓,這種現場感就會被大幅削弱;而當觀眾認為自己是唯一的觀看者時,建立的連結感反而會變得更為強烈。研究發表在 Journal of Marketing 上。
#認知科學 #其他 #直播流媒體 #臨場感 #消費者行為
閱讀更多:
Duani, Nofar, et al. “EXPRESS: The Liveness Lift: Viewing Live Streams Creates Connection and Enhances Engagement in Amateur Music Performances.” Journal of Marketing, Jan. 2026, p. 00222429261421488. SAGE Journals, https://doi.org/10.1177/00222429261421488
寬恕可全面提升長期心理健康與親社會性格
今天選擇原諒他人,一年后會帶來更強的幸福感嗎?哈佛大學定量社會科學研究所的Richard G. Cowden和Everett L. Worthington Jr.等研究人員分析了全球逾20萬人的縱向數據,證實習慣性寬恕能顯著改善個體的長期心理健康并增強親社會性格。
這項研究基于全球繁榮研究(Global Flourishing Study,一項涵蓋23個國家代表性樣本的大型縱向項目)的兩次跨年度調查數據。研究人員評估了逾20萬名參與者的特質性寬恕,并在一年后考察了涵蓋心理、社會、身體等維度的56項幸福感指標。數據分析表明,經常性寬恕不僅減輕了抑郁和焦慮等心理困擾,還顯著促進了感恩和向善等意志層面的成長。其中,寬恕與心理健康及親社會行為的正向關聯最強,與身體健康的關聯相對較弱。此外,這種效應呈現出明顯的跨文化差異。以南非為例,盡管該國總體寬恕水平較高,但受高貧困率和犯罪率等現實環境制約,寬恕與幸福感的關聯被大幅削弱;在普遍期望寬恕的文化中,其帶來的心理益處也會相應降低。研究證實,寬恕是可經過刻意練習強化的心理干預手段,能在人群層面產生實質性的健康效益。研究發表在 npj Mental Health Research 上。
#疾病與健康 #心理健康與精神疾病 #特質性寬恕 #社會文化差異 #行為干預
閱讀更多:
Cowden, Richard G., et al. “Longitudinal Associations of Dispositional Forgivingness with Multidimensional Well-Being: A Two-Wave Outcome-Wide Analysis in the Global Flourishing Study.” Npj Mental Health Research, vol. 5, no. 1, Jan. 2026, p. 3. www.nature.com, https://doi.org/10.1038/s44184-026-00187-5
腦機接口超越醫療范疇:Neuralink技術或開啟心理政治新紀元
腦機接口技術直接讀取大腦數據的能力,引發了關于新型權力控制的深刻擔憂。Sergi Parellada、Ana Gálvez Mozo與Francisco Tirado Serrano(加泰羅尼亞開放大學與巴塞羅那自治大學)探討了相關社會影響,指出Neuralink不僅是醫療工具,更是將心理過程轉化為數據以調控人類行為的心理政治項目,對個人自主權構成潛在威脅。
該研究借用已有理論,利用內容分析軟件Atlas.ti(一種定性數據分析工具,用于處理文本與音頻等非結構化數據)將Neuralink作為案例進行深入分析。研究顯示,諸如社交媒體等日常應用已在使用心理政治原理,但Neuralink由于能直接讀取大腦數據,可以繞過意識層面,直接影響無意識的認知過程。
研究團隊明確指出了該技術帶來的四大風險。首先是個人自主性的喪失,系統將取代個人做出改善行為的決定。其次是心理過程的商品化,神經數據將變為新的經濟資源。第三是心理健康的外包,個人的心理福祉將被交由私營公司控制的設備管理。最后是讓個人生物學地適應系統,即將政治焦點從解決引發不滿的社會條件轉移到直接修改大腦機制以適應環境。研究認為,這是一種新的治理形式,它不再通過強制手段,而是利用算法預測和自動化來將思想轉化為生產資源。研究呼吁在面對神經技術時保持人類的反思能力,并促進技術透明度。研究發表在 Culture, Theory and Critique 上。
#意識與腦機接口 #腦機接口 #心理政治學 #神經數據商品化 #科技倫理
閱讀更多:
Guillamón, Sergi Parellada, et al. “Neuralink and the Rise of Psychopolitical Governmentality.” Culture, Theory and Critique, vol. 0, no. 0, Dec. 2025, pp. 1–18. Taylor and Francis+NEJM, https://doi.org/10.1080/14735784.2025.2582471
AI 行業動態
阿里ATH官方認領神秘「歡樂馬」:視頻生成模型HappyHorse-1.0登頂評測榜首
在知名AI評測分析平臺Artificial Analysis上,一個代號為「HappyHorse-1.0」的視頻生成模型突然空降榜首,引發社區廣泛猜測。如今,這只“歡樂馬”被正式認領:它來自阿里巴巴旗下AI核心事業群ATH(Alibaba Token Hub,阿里新成立的聚焦人工智能技術和產品的事業群)鄭波團隊。據官方介紹,HappyHorse目前處于內測階段,計劃于4月30日開放API,并作為ATH創新事業部探索AI時代全新交互方式的一部分。該模型在文本生成視頻和圖像生成視頻兩類任務中均支持生成原生音頻,并在所有評測排行榜上位居第一或第二,將字節跳動的Seedance 2.0等競品擠至身后。
此次認領也揭開了幕后團隊的面紗。鄭波現任阿里巴巴副總裁,擁有清華大學計算機博士學位,曾領導谷歌展示廣告算法與中國地圖團隊,2017年加入阿里后歷任淘寶搜推算法負責人、阿里媽媽CTO等職,研究方向涵蓋大模型與多模態。盡管模型表現出色,但官方尚未開放內測體驗。Artificial Analysis平臺確認,HappyHorse-1.0在“無音頻”榜單中穩居第一,“有音頻”榜單中Elo分數(競技水平評分)幾乎與字節的Dreamina Seedance 2.0持平。這一消息讓AI社區對阿里在視頻生成領域的布局充滿期待。
#歡樂馬 #HappyHorse #阿里ATH #視頻生成模型 #鄭波團隊
閱讀更多:
https://huggingface.co/happyhorse-lab/Happy-Horse-1.0-AI-Video-Generator
AI 驅動科學
破解AI過度自信:受大腦啟發的噪聲訓練讓神經網絡找回“自知之明”
深度學習模型在實際應用中常表現出過度自信,導致輸出不準確甚至產生幻覺,而傳統的初始化方法正是這一問題的根源。Jeonghwan Cheon和Se-Bum Paik引入了一種受神經發育啟發的隨機噪聲熱身策略,成功解決了模型的不確定性校準問題,讓網絡在面對未知數據時能夠保持客觀真實的置信度。
生物大腦在出生前會通過自發神經活動進行預學習,受此機制啟發,研究團隊提出了一種隨機噪聲熱身訓練方法。在該方法中,神經網絡在接觸真實維度的數據之前,首先接受由高斯分布生成的隨機噪聲和均勻分布的隨機標簽的短暫訓練。研究人員在多種不同復雜度的網絡架構中測試了這一方法。實驗結果顯示,傳統的深度學習隨機初始化方法會使網絡在初始階段對特定的輸出類別產生偏見并表現出過度自信。而通過隨機噪聲熱身訓練,網絡能夠將初始置信度調整至偶然水平,實現完美的初始預校準。在隨后的真實數據學習中,這種預校準使得網絡的預測置信度與實際準確率保持高度一致,且完全不會犧牲原有的測試性能。此外,經過該方法訓練的網絡在面對未見過的分布外樣本時,會表現出接近偶然水平的極低置信度,從而顯著提升了人工智能系統識別未知輸入的能力。研究發表在 Nature Machine Intelligence 上。
#大模型技術 #計算模型與人工智能模擬 #不確定性校準 #隨機噪聲 #認知科學
閱讀更多:
Cheon, Jeonghwan, and Se-Bum Paik. “Brain-Inspired Warm-up Training with Random Noise for Uncertainty Calibration.” Nature Machine Intelligence, Apr. 2026, pp. 1–12. www.nature.com, https://doi.org/10.1038/s42256-026-01215-x
系統解析高通量篩選與AI技術,加速抗衰老藥物研發
隨著全球老齡化,如何延長健康生活年限成為緊迫挑戰。傳統抗衰藥物研發緩慢且昂貴,南方科技大學的呂宇軒、電子科技大學的鮮波、澳門科技大學的朱健康等人聯合國內外多家機構,系統綜述并提出了一套整合了短壽命模型、自動化篩選與人工智能的抗衰老藥物發現新范式,旨在加速“長壽藥”從實驗室到臨床的轉化。
該研究團隊提出的新范式摒棄了傳統耗時過長的動物模型,轉而聚焦于秀麗隱桿線蟲、果蠅和非洲鳉魚這三種與人類衰老機制高度相似的短壽命生物。通過結合WormBot等自動化高通量篩選平臺,研究人員能夠對成千上萬個樣本進行全生命周期的自動化監控,將評估標準從單純的“壽命延長”轉向更具臨床意義的“健康改善”,如腸道完整性、認知功能等。人工智能技術則貫穿整個流程,不僅用于前期數億分子的虛擬篩選,還負責后續海量表型數據的深度分析與機制推斷。此外,文章還強調了“反向轉化”策略的潛力,即將在臨床上觀察到具有抗衰老效果的藥物(如二甲雙胍),利用該高效平臺迅速驗證其作用機制,從而加速老藥新用。研究發表在 Ageing Research Reviews 上。
#疾病與健康 #自動化科研 #AI驅動科學 #健康管理與壽命延長
閱讀更多:
Ji, Xingkun, et al. “High-Throughput Screening for Ageing and Age-Related Disease Drug Discovery: Advances and Challenges.” Ageing Research Reviews, Apr. 2026, p. 103124. ScienceDirect, https://doi.org/10.1016/j.arr.2026.103124
40萬條帖子揭示減肥神藥GLP-1的隱藏副作用
廣受歡迎的GLP-1類減肥和糖尿病藥物是否存在未被發現的副作用?賓夕法尼亞大學的Sharath Chandra Guntuku, Lyle Ungar, Neil K. R. Sehgal, Jena Shaw Tronieri等研究人員利用人工智能分析了超過40萬條社交媒體帖子,結果識別出了一些可能在臨床試驗中被忽視的患者報告癥狀,特別是月經不調和體溫異常。
![]()
? 研究人員分析 Reddit 帖子的過程特寫:左側是研究人員輸入人工智能分析系統的帖子類型示例,右側展示了部分分析結果。Credit: Sylvia Zhang
研究團隊開創性地使用大型語言模型,對近7萬名Reddit用戶在六年間發布的關于索瑪魯肽和替?帕肽的帖子進行“計算社會聆聽”(computational social listening)。該方法首先通過識別惡心、嘔吐等已知的胃腸道不適驗證了其準確性,這些是用戶最常報告的副作用。在此基礎上,AI模型進一步挖掘出了兩類值得關注的新信號:近4%報告副作用的用戶提到了生殖系統癥狀,包括月經周期不規律和異常出血;另一部分用戶則報告了發冷、潮熱等體溫調節問題。此外,疲勞是用戶中第二大常見主訴,其報告頻率遠高于臨床試驗。研究人員強調,這些發現是相關性的而非因果性的,但它們為藥物的真實世界安全狀況提供了寶貴線索,并提示臨床醫生應關注這些患者關心的問題。研究發表在 Nature Health 上。
#疾病與健康 #自動化科研 #藥物警戒 #社交媒體分析 #GLP-1藥物
閱讀更多:
Sehgal, Neil K. R., et al. “Self-Reported Side Effects of Semaglutide and Tirzepatide in Online Communities.” Nature Health, Apr. 2026, pp. 1–6. www.nature.com, https://doi.org/10.1038/s44360-026-00108-y
訓練與壓縮同步進行:CompreSSM技術打造更精簡、更快速的AI模型
傳統AI模型訓練面臨成本與性能的權衡困境。為解決此問題,來自麻省理工學院計算機科學與人工智能實驗室(CSAIL)、馬克斯·普朗克智能系統研究所等機構的Makram Chahine, Philipp Nazari, Daniela Rus, T. Konstantin Rusch等人,開發了一種名為CompreSSM的新技術。該技術能在訓練過程中動態壓縮模型,實現了在保持高性能的同時,顯著提升訓練速度和效率。
該團隊提出的CompreSSM方法,顛覆了先訓練后壓縮的傳統模式,將壓縮過程融入學習本身。該技術專門針對狀態空間模型,一類在語言處理和機器人等領域表現出色的AI架構。研究人員借鑒了控制理論中的數學工具——漢克爾奇異值(Hankel singular values),它能衡量模型內部各狀態對整體行為的貢獻度。研究發現,這些狀態的相對重要性在訓練開始約10%后就趨于穩定。據此,CompreSSM可以在訓練早期精準識別并“手術式”地移除冗余組件,讓剩余的訓練在更精簡、更高效的模型上完成。實驗結果十分顯著:在圖像分類基準測試中,壓縮后的模型在保持近乎同等準確率的同時,訓練速度提升了1.5倍。例如,在CIFAR-10數據集上,一個狀態維度被壓縮至約四分之一的模型,準確率達到85.7%,遠高于從頭訓練的同尺寸小模型(81.8%)。在流行的Mamba架構上,該方法更是實現了約4倍的訓練加速,將128維模型壓縮至12維,性能依舊具有競爭力。該方法在效率和最終性能上均優于知識蒸餾等現有技術。研究成果將在 International Conference on Learning Representations 上發表。
#大模型技術 #其他 #模型壓縮 #狀態空間模型
閱讀更多:
Chahine, Makram, et al. “The Curious Case of In-Training Compression of State Space Models.” arXiv:2510.02823, arXiv, 24 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2510.02823
AI智能體PaperOrchestra問世,可將原始筆記自動撰寫為AI研究論文
如何將零散的研究思路和實驗數據自動轉化為一篇完整的學術論文?谷歌研究員Yiwen Song, Yale Song, Tomas Pfister和Jinsung Yoon為此開發了PaperOrchestra,一個創新的多智能體框架。該系統不僅能自主撰寫論文,還在與同類工具的對比中展現出卓越的文獻綜述和稿件整合能力。
PaperOrchestra采用一個協同工作的多智能體框架,模擬人類的寫作流程。它首先由“大綱智能體”解析用戶提供的想法摘要和實驗日志,規劃文章結構、圖表設計和文獻檢索策略。隨后,“繪圖智能體”和“文獻綜述智能體”并行工作,分別負責生成概念圖、數據圖,以及檢索、篩選并整合相關文獻。最后,“章節寫作智能體”和“內容優化智能體”將所有材料整合成一篇完整的latex手稿,并模擬同行評審過程進行迭代修改,直至達到可提交標準。為客觀評估其性能,團隊還構建了首個AI論文寫作基準PaperWritingBench。在人類評估中,PaperOrchestra在文獻綜述質量上的勝率比基線高出50%-68%,整體稿件質量高出14%-38%,證明了其在自動化科研寫作領域的巨大潛力。
#AI驅動科學 #自動化科研 #大模型技術
閱讀更多:
Song, Yiwen, et al. “PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing.” arXiv:2604.05018, arXiv, 6 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.05018
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。您也可以在后臺提問,我們將基于追問知識庫為你做出智能回復哦~
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
研究院在華山醫院、上海市精神衛生中心分別設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工陳天橋雒芊芊神經科學研究院。
研究院還建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、科普視頻媒體「大圓鏡」等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.