亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

谷歌一篇論文干崩內存股！KV緩存壓縮6倍，美光西數閃迪集體跳水

2026-03-26 14:37:59　來源: 未來圖靈

北京舉報

0

分享至

谷歌向內存開戰(zhàn)，直接讓存儲巨頭們集體失眠

3月26日消息，谷歌研究院發(fā)布TurboQuant壓縮算法，可將AI推理中的KV緩存壓縮至少6倍，精度零損失。在H100顯卡上實現8倍速度提升。這將使本地AI推理能力大幅提升，支持更大的上下文窗口，并在各類設備上減輕內存壓力。論文將在ICLR 2026正式亮相。

KV緩存是大模型生成文本時，每生成一個新詞都要“回顧”之前所有詞的信息。為避免重復計算，模型會把每一層產生的Key和Value向量臨時存起來，形成一張“速查表”。這張表隨對話長度線性膨脹——上下文從4K擴展到128K時，KV緩存消耗的顯存往往反超模型參數本身，成為推理階段最大的內存瓶頸。

TurboQuant用兩步解決這個問題：先用極坐標量化（PolarQuant）把傳統XYZ坐標換成“距離+角度”的極坐標描述，省掉歸一化常數開銷；再用1比特誤差校正（QJL）抹平壓縮殘留的系統性偏差。全程無需微調和訓練數據，直接將KV緩存壓至3比特，實現無損壓縮。

消息公布后，美股存儲芯片板塊集體下挫：美光科技跌4%，西部數據跌4.4%，閃迪跌6.5%。A股存儲芯片股同樣走低，兆易創(chuàng)新、佰維存儲跌超5%。Cloudflare CEO評價這是“谷歌的DeepSeek時刻”。

網友反應兩極分化。有人調侃：“內存股崩了，內存價格能不能也崩一崩？”也有人冷靜指出：“壓縮算法存在多年，訓練環(huán)節(jié)不受影響，內存價格一時半會恐怕下不來。”還有開發(fā)者開始復現論文：“在RTX 4090上2-bit跑Gemma 3 4B，輸出與未壓縮版逐字符一致。”更有網友驚呼：“這不就是HBO美劇《硅谷》里的Pied Piper嗎？”劇中虛構創(chuàng)業(yè)公司的核心技術就是一種近乎無損的極限壓縮算法。

英偉達同場會議也將推出KVTC壓縮算法，可實現20倍壓縮，精度損失不到1個百分點。兩種技術路線同期亮相，KV緩存優(yōu)化正從研究課題走向生產級基礎設施。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

挑戰(zhàn)閉源格局！騰訊混元3D 2.0開源發(fā)布，性能對標商業(yè)級模型

鈦媒體APP 2026-04-16 16:59:20
0 跟貼 0
匿名模型“大象”攪局OpenRouter：100B參數沖到熱榜第一，實測結果如何

智東西 2026-04-16 19:20:03
0 跟貼 0

華為云推出“辦公蝦”：讓Agent互相辯論，還能生成可編輯PPT

智東西 2026-04-16 20:21:12
0 跟貼 0

首個Qwen3.6開源模型來了！編程視覺雙提升，還兼容OpenClaw

智東西 2026-04-17 06:18:14
0 跟貼 0
萬幀實時！流式3D重建天花板，被國產開源模型打破了

機器之心Pro 2026-04-16 13:25:47
1 跟貼 1

與谷歌 Genie3 正面交鋒，阿里發(fā)布世界模型HappyOyster：從被動生成到主動模擬

鈦媒體APP 2026-04-16 22:40:08
1 跟貼 1

微軟電腦，一臺暴漲3400元

智東西 2026-04-15 09:55:15
2 跟貼 2
Gemini桌面端終于來了！實測喚起功能是亮點，但整體太糙

雷科技 2026-04-16 20:10:39
0 跟貼 0

谷歌隱形水印被失業(yè)印度小哥摳掉了

量子位 2026-04-16 13:27:53
0 跟貼 0
1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0
漲價潮之下北美PS5銷量激增：原因只能說太現實！

游民星空 2026-04-16 09:38:16
5 跟貼 5
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
豆包是世界上最好用的AI【商業(yè)B面&牛頓】

牛頓頓頓 2026-04-15 18:35:44
5 跟貼 5
特斯拉AI5芯片流片成功！將由臺積電和三星共同代工

熱點科技 2026-04-16 16:48:00
14 跟貼 14
Gemini桌面客戶端終于上線：直接讀取屏幕上下文，幫你解讀一切！

新智元 2026-04-17 00:26:41
0 跟貼 0
霍爾木茲海峽封了！伊朗用損失數據，給全世界上了一課02

谷火平 2026-04-14 18:31:32
0 跟貼 0
英偉達云游戲殺進印度，延遲數據讓我意外

閃存獵手 2026-04-16 10:29:32
0 跟貼 0
AI 記憶首次超越人類：幻覺率壓至 0.5%，長對話不再瞎編

鈦媒體APP 2026-04-16 10:14:16
2 跟貼 2
兩名外籍乘客在網約車上對著部隊大門連續(xù)拍照，接下來又要去訓練場方向，司機覺得可疑，直接開車把他們交給了部隊

極目新聞 2026-04-16 08:59:25
6429 跟貼 6429
【Open Car】雜貨鋪 & 內存連續(xù)降價中

電腦吧評測室 2026-04-15 22:02:49
0 跟貼 0
《識質存在》初體驗：NVIDIA DLSS 4多幀生成讓性能一飛沖天

IT之家 2026-04-16 20:16:37
0 跟貼 0
AI視頻混戰(zhàn)升級，字節(jié)在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
北航女學霸曾是父母驕傲，移民加拿大慘遭谷歌裁員，直播帶貨欲逆

搞笑熱血青年 2026-04-16 00:00:00
0 跟貼 0
內存漲價引爆連鎖反應 Meta被迫上調VR頭顯產品價格

財聯社 2026-04-17 01:26:25
0 跟貼 0
一國可敵全球，中國數據相比其他國家就是bug

小信新鮮事 2026-04-16 01:10:46
0 跟貼 0
搞定AI游戲本降噪、清涼、長續(xù)航，英特爾祭出軟件黑科技

智東西 2026-04-16 21:04:31
6 跟貼 6
美國國會深夜出招！全面封殺光刻機，中國芯片的梯子要被踹翻？

你笑的好甜美 2026-04-16 04:32:14
0 跟貼 0
Mac 可能 Neo，但 Mac Neo 不太可能

愛范兒 2026-04-16 11:05:47
13 跟貼 13
資深程序員收集錯誤，新手在刪除記錄

我是一個養(yǎng)蝦人 2026-04-16 08:55:03
0 跟貼 0
AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潛意識傳染

新智元 2026-04-16 18:50:56
0 跟貼 0
剛火就翻車，Hermes Agent被質疑抄襲中國團隊

虎嗅APP 2026-04-17 06:38:34
0 跟貼 0
女子剛換了顯卡，電腦卻依舊卡得不行，維修師傅瞬間解決問題！

搞笑新奇怪 2026-04-16 13:17:46
1 跟貼 1
男子因噪音過敏住5年隔音艙：自己設計，已接上百個訂單，幫噪音受困者找回睡眠

半島官網 2026-04-16 11:20:50
1628 跟貼 1628
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
2963 跟貼 2963
紅旗把五顆芯片塞進一顆，圖啥？

像素與芯片 2026-04-16 22:46:43
0 跟貼 0
剛剛，Claude Opus 4.7突然發(fā)布：不是最強，但奧特曼又得失眠

愛范兒 2026-04-17 01:35:26
0 跟貼 0
Anthropic發(fā)布Claude Opus 4.7：金融分析能力登頂公開模型軟件工程、多模態(tài)全面進階

財聯社 2026-04-17 01:18:06
2 跟貼 2
人類正在淪為算法NPC，覺醒才是唯一出路！

桔子嘮生活 2026-04-17 04:17:35
0 跟貼 0
你的歌單早被"假賬號軍團"攻陷了

薛定諤的BUG 2026-04-17 01:11:10
0 跟貼 0

王欣瑜首盤3-5時因傷選擇退賽，科斯蒂亞晉級WTA250魯昂站八強

王欣瑜首盤3-5時因傷選擇退賽，科斯蒂亞晉級WTA250魯昂站八強

懂球帝

2026-04-17 01:51:07

女生長的太漂亮是什么體驗？網友：母以子貴，父以女榮

女生長的太漂亮是什么體驗？網友：母以子貴，父以女榮

另子維愛讀史

2026-03-10 22:56:08

10個小時從北京到廣西，蘇林體驗的高鐵，我們原來早已習以為常！

10個小時從北京到廣西，蘇林體驗的高鐵，我們原來早已習以為常！

全城探秘

2026-04-16 14:14:12

霍爾木茲海峽，“隔空決戰(zhàn)”

霍爾木茲海峽，“隔空決戰(zhàn)”

中國新聞周刊

2026-04-16 12:05:59

邵氏五虎將只剩一人！早已息影30年，如今定居加拿大，生活很愜意

邵氏五虎將只剩一人！早已息影30年，如今定居加拿大，生活很愜意

以茶帶書

2026-04-16 19:07:49

美股收漲，納指12連陽，中國資產大爆發(fā)，半導體狂飆，奈飛盤后重挫

美股收漲，納指12連陽，中國資產大爆發(fā)，半導體狂飆，奈飛盤后重挫

第一財經資訊

2026-04-17 07:23:35

國民黨申請鄭麗文480萬訪陸經費，吳思瑤反對，韓國瑜出手

國民黨申請鄭麗文480萬訪陸經費，吳思瑤反對，韓國瑜出手

原來仙女不講理

2026-04-16 21:12:49

中間這位曾經是多少人的女神,現在也美人遲暮了

中間這位曾經是多少人的女神,現在也美人遲暮了

手工制作阿殲

2026-04-16 19:40:15

NBA裁定盧卡·東契奇有資格角逐獎項后，他的第一反應是：感謝

NBA裁定盧卡·東契奇有資格角逐獎項后，他的第一反應是：感謝

好火子

2026-04-17 05:30:04

紀委不會查這3種情況，很多人不知道，要切記！

紀委不會查這3種情況，很多人不知道，要切記！

細說職場

2026-04-16 15:27:18

蘋果讓Pro用戶往攝像頭上貼貼紙

蘋果讓Pro用戶往攝像頭上貼貼紙

像素與芯片

2026-04-16 23:29:10

WTI原油開盤走低，現跌1.7%

WTI原油開盤走低，現跌1.7%

每日經濟新聞

2026-04-17 06:11:05

女人暗示可以發(fā)生關系，這3個潛意識舉動藏不住真心

女人暗示可以發(fā)生關系，這3個潛意識舉動藏不住真心

熱心市民小黃

2026-04-17 07:13:30

爭議！張雪又亂說話了反轉后自己刪除視頻網友：老老實實造車吧

爭議！張雪又亂說話了反轉后自己刪除視頻網友：老老實實造車吧

念洲

2026-04-16 07:35:45

CBA又一巨人殺手！掀翻浙江后力挫江蘇：福建為季后賽瘋狂續(xù)命！

CBA又一巨人殺手！掀翻浙江后力挫江蘇：福建為季后賽瘋狂續(xù)命！

籃球快餐車

2026-04-17 02:18:56

馬筱梅深夜淚崩，張?zhí)m發(fā)文隔空撐腰

馬筱梅深夜淚崩，張?zhí)m發(fā)文隔空撐腰

蒂蒂茱家

2026-04-16 10:53:37

白天作陪晚上同宿？明碼標價8000一回！高端伴游淪為色情交易窩點

白天作陪晚上同宿？明碼標價8000一回！高端伴游淪為色情交易窩點

網絡易不易

2026-01-20 10:17:46

弗洛倫蒂諾賽后批評全隊：連續(xù)兩個賽季無冠是不可接受的

弗洛倫蒂諾賽后批評全隊：連續(xù)兩個賽季無冠是不可接受的

懂球帝

2026-04-16 19:07:06

為圓生子夢，李大雙棄丁克17年妻子，娶外國美女，如今兒子已1歲

為圓生子夢，李大雙棄丁克17年妻子，娶外國美女，如今兒子已1歲

攬星河的筆記

2026-04-15 19:03:52

過午不食？55歲男子堅持2年不吃晚飯，去體檢后，他的胃怎樣了？

過午不食？55歲男子堅持2年不吃晚飯，去體檢后，他的胃怎樣了？

白話電影院

2026-04-09 14:36:58

在這里每個人都能讀懂人工智能

1345文章數 2502關注度

往期回顧全部

科技要聞

Anthropic推出Opus 4.7，坦言依不及Mythos

頭條要聞

以媒：從媒體上得知與黎巴嫩停火以色列高官又驚又怒

頭條要聞

以媒：從媒體上得知與黎巴嫩停火以色列高官又驚又怒

體育要聞

皇馬拜仁踢出名局，但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世，享年63歲

財經要聞

海爾與醫(yī)美女王互撕換血抗衰誰的生意？

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

數碼

游戲

藝術

親子

房產要聞

人人人人！封關后首屆消博會，擠爆了！

數碼要聞

2999元！大疆Pocket 4出手就是王炸，兩年半等待值了

魔獸世界：時光服爭議不斷，DPS要求大鍋飯，團長選擇發(fā)放補貼

藝術要聞

這 4 個紅底黑字，藏著毛主席給一位普通母親的最高贊譽，看完淚目

親子要聞

孩子積食，脾胃虛弱

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版