亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網易首頁 > 網易號 > 正文 申請入駐

北大團隊改造DeepSeek注意力,速度快四倍還不丟精度

0
分享至

聽雨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

就在大家都急頭白臉地等待DeepSeek-V4的時候,冷不丁一篇新論文引起了網友們的注意——

提出新稀疏注意力機制HISA(分層索引稀疏注意力),突破64K上下文的索引瓶頸,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。



不僅做到了大幅提速,而且?guī)缀醪粊G精度、即插即用不用重新訓練



論文直接在DeepSeek-V3.2和GLM-5上替換索引器,無需微調。

并且在找關鍵信息、長文本理解等任務上,精度都和原方法幾乎持平。



兩步消除上下文索引瓶頸

這篇論文想解決的問題很明確:給大模型的稀疏注意力機制換個更高效的 “檢索器”。

現(xiàn)有主流的DSA等token級稀疏注意力,核心就是通過只計算關鍵token的注意力,降低了核心計算成本。

但這個設計有個致命隱藏問題:要挑出相關字符,得靠一個 “索引器”——它需要把每個待查字符,和前面所有字符挨個打分,再選分數(shù)最高的。

文本長度L越長,這個打分的工作量是L的平方級增長。比如長度翻倍,工作量就會翻4倍。

到超長文本時,這個索引器的平方級成本,反而成了拖慢速度的元兇,甚至反而比真正的注意力計算還耗時。

基于此,研究團隊開始思考一個問題:能否在不改變最終稀疏注意力結果的前提下,降低索引器的搜索成本?

于是,他們提出了HISA(分層索引稀疏注意力),核心思路也很簡單:

既然挨個打分太費時間,那就先按塊篩掉大部分無關內容,再在剩下的小塊里精細選。



在功能邏輯上實現(xiàn)對原有模塊的等價替換,無需修改后續(xù)注意力計算邏輯,相當于 “換了個更高效的篩子,篩出來的東西幾乎沒變”。

具體就兩步,全程復用原模型的打分規(guī)則,零學習成本:

塊級粗過濾

  • 把長文本切成固定大小的 “字符塊”(比如128個字符一塊),給每個塊算一個 “整體特征向量”(相當于給每塊貼個總標簽)
  • 用原索引器的打分方式,只給這些塊標簽打分
  • 挑出分數(shù)最高的m個塊(比如64個),直接扔掉剩下的所有塊——塊的數(shù)量遠少于字符數(shù)。

這一步能省掉絕大部分工作量。

塊內精挑字符

只在第一步選出來的m個塊里,用原索引器的規(guī)則給單個字符打分,再挑出最終需要的k個相關字符。

還加了個小優(yōu)化:文本的第一個塊和最后一個塊必選,保證開頭的背景信息、結尾的最新上下文不被誤篩,也能處理文本拼接的邊界問題。



HISA的關鍵優(yōu)勢在于:復雜度驟降,還能 “無縫替換”

HISA把原索引器每一層 O (L2) 的算力成本,降到了O(L2/B + L×m×B)(B 是塊大小、m 是選的塊數(shù))

文本越長、塊選得越精準,提速效果越明顯。

更重要的是它的工程友好性

輸出和原索引器完全一致,下游的注意力計算模塊不用改;

不用重新訓練模型、不用調整KV緩存結構,直接替換原索引器就行;

短文本時會自動 “退化” 成原方法,只有超長文本時才觸發(fā)分層篩選,全程自適應。

實測提速超猛,精度幾乎沒丟

論文在DeepSeek-V3.2、GLM-5兩大主流大模型上做了全面測試,結果很亮眼:

速度上,在64K長度的文本下,HISA 比原DSA索引器最高提速3.75倍,常規(guī)設置也能提速2倍多。



上下文長度越長,HISA的提速效果越顯著,完全契合超長上下文(128K/1M)的實際應用需求。

精度上,HISA也幾乎完全保留原DSA的精度,且顯著優(yōu)于純塊稀疏方法。

論文進行了“大海撈針”測試,該測試衡量在超長無關文本中,精準檢索指定位置關鍵信息的能力。

結果HISA和DSA幾乎一樣準,在所有長度和插入深度下,檢索精度均接近DSA的近乎滿分。



長文本理解(LongBench 基準)上,HISA的分數(shù)也和DSA基本持平。

甚至在部分場景,比如合成檢索、少樣本學習等對token篩選精度要求高的任務中,HISA做到了小幅反超。



而在超參數(shù)測試中,不同塊大小、選塊數(shù)量下,HISA表現(xiàn)都很穩(wěn)定,分數(shù)均與DSA高度接近,無顯著性能差異



這也說明HISA對超參數(shù)的選擇不敏感,魯棒性強,工程落地時無需精細調參。

不過目前HISA還有小瑕疵,作者也提出了后續(xù)改進思路:

第一,現(xiàn)在塊是固定大小的,若一個塊里混了無關和相關內容,塊的 “整體標簽” 會不準。

未來可以搞自適應塊、重疊塊,或換更好的塊特征計算方式。

第二,目前只是推理時直接用,未來可以把塊篩選和模型一起訓練,讓篩選更精準。

第三,現(xiàn)在只測了索引器的速度,未來整合到完整的大模型服務框架里,測端到端的吞吐量和延遲。

團隊背景

這篇論文出自北京大學的張牧涵團隊。

張牧涵,北京大學人工智能研究院的Tanure-track助理教授和博士生導師。

回國前曾在Facebook AI(現(xiàn)為 Meta AI)擔任研究員,從事大規(guī)模圖學習系統(tǒng)和問題的研究。



其Google Scholar總引用量超過13000次,其中兩篇一作文章引用量分別達到3100+和2400+次,連續(xù)多年入選Elsevier全球前2%頂尖科學家(生涯影響力榜單)

Yufei Xu(徐宇飛)和Fanxu Meng(孟繁續(xù))為論文的共同一作。


[1]https://arxiv.org/abs/2603.28458

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

全程眼突鼓腮,看了觀眾對孫儷的評價,才知張藝謀這句話的含金量

陳述影視
2026-04-04 17:53:34
71歲退休老人奉勸:不管誰請吃飯,去不去都得先問清這4件事

71歲退休老人奉勸:不管誰請吃飯,去不去都得先問清這4件事

風起見你
2026-04-14 17:31:50
中方接到消息,美軍已經動手,特朗普宣告戰(zhàn)果,伊朗海軍損失慘重

中方接到消息,美軍已經動手,特朗普宣告戰(zhàn)果,伊朗海軍損失慘重

南宗歷史
2026-04-16 04:07:26
硬剛歐美 !4月17日的荷蘭摩托賽,張雪53號必遭歐美技術陰招?

硬剛歐美 !4月17日的荷蘭摩托賽,張雪53號必遭歐美技術陰招?

籃球看比賽
2026-04-15 10:52:11
紅薯逆襲?科學研究:堅持吃紅薯,不出半年,或能收獲這5種好處

紅薯逆襲?科學研究:堅持吃紅薯,不出半年,或能收獲這5種好處

健康之光
2026-04-06 18:41:47
中央廣電總臺啟動1.34億元CDN服務采購 騰訊云、阿里云、網宿三家力拼!沒想到結果是這樣

中央廣電總臺啟動1.34億元CDN服務采購 騰訊云、阿里云、網宿三家力拼!沒想到結果是這樣

新浪財經
2026-04-15 18:38:30
成都老小區(qū)深夜開門收費1-2元 網友吐槽:以后加班都不敢了 怕回不起家

成都老小區(qū)深夜開門收費1-2元 網友吐槽:以后加班都不敢了 怕回不起家

閃電新聞
2026-04-15 23:25:35
歐爾班“硬漢”戲碼背后的荒誕結局

歐爾班“硬漢”戲碼背后的荒誕結局

小眼睛小世界
2026-04-15 06:23:20
最新數(shù)據(jù):美國從中國進口的智能手機比例從90%驟降至25%,組裝中心加速轉移

最新數(shù)據(jù):美國從中國進口的智能手機比例從90%驟降至25%,組裝中心加速轉移

風向觀察
2026-04-14 14:25:12
同曦輸遼寧發(fā)布會!王世龍被萊迪打服,但仍滿意球隊攻守發(fā)揮!

同曦輸遼寧發(fā)布會!王世龍被萊迪打服,但仍滿意球隊攻守發(fā)揮!

籃球資訊達人
2026-04-15 23:57:12
上海市中心這面墻涉嫌侵權!當事人氣笑,多方回應

上海市中心這面墻涉嫌侵權!當事人氣笑,多方回應

看看新聞Knews
2026-04-15 20:56:15
北海艦隊、南海艦隊、東海艦隊公告

北海艦隊、南海艦隊、東海艦隊公告

澎湃新聞
2026-04-15 21:59:16
自困愁城:伊朗將為封鎖霍爾木茲海峽付出最慘重代價

自困愁城:伊朗將為封鎖霍爾木茲海峽付出最慘重代價

民間胡扯老哥
2026-04-13 22:30:45
賴清德宣布過境非洲小國,不到24小時,就被狠狠打臉,不簡單

賴清德宣布過境非洲小國,不到24小時,就被狠狠打臉,不簡單

瓦倫西亞月亮
2026-04-15 23:40:35
艾滋病劇增!醫(yī)生緊急提醒:出門牢記六不碰,別讓無知毀了一生

艾滋病劇增!醫(yī)生緊急提醒:出門牢記六不碰,別讓無知毀了一生

垚垚分享健康
2026-04-15 14:18:21
馮導和19養(yǎng)女事情上熱搜,好奇查了一下,才發(fā)現(xiàn)徐朵實在是不簡單

馮導和19養(yǎng)女事情上熱搜,好奇查了一下,才發(fā)現(xiàn)徐朵實在是不簡單

小娛樂悠悠
2026-04-15 13:13:11
保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

歷史點行
2026-03-29 13:38:28
小鵬GX出手,傳統(tǒng)車企還怎么玩?

小鵬GX出手,傳統(tǒng)車企還怎么玩?

BigCarShow
2026-04-15 21:30:10
問界M6預售26.98萬起,中大型SUV,配896線激光雷達,4月22日上市

問界M6預售26.98萬起,中大型SUV,配896線激光雷達,4月22日上市

藍色海邊
2026-04-16 00:29:35
反轉!巴西部長強行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人!

反轉!巴西部長強行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人!

共工之錨
2026-04-15 00:31:36
2026-04-16 05:07:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12476文章數(shù) 176450關注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國全票通過 “將不義之財歸還中國”

頭條要聞

法國全票通過 “將不義之財歸還中國”

體育要聞

三球準絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經要聞

業(yè)績失速的Lululemon:"健康"人設崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

家居
房產
健康
手機
親子

家居要聞

簡而不減 暖居之道

房產要聞

重磅調規(guī)!341畝商改住+中小學用地!寶龍城這把穩(wěn)了?

干細胞抗衰4大誤區(qū),90%的人都中招

手機要聞

一加Ace6至尊版再次被確認:魔改天璣9500+165Hz屏,本月發(fā)布!

親子要聞

孕婦200買水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網友炸鍋

無障礙瀏覽 進入關懷版