網易首頁 > 網易號 > 正文申請入駐

一篇論文引發存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

2026-03-26 12:28:34　來源: AppSo

廣東舉報

分享至

看過 HBO 神劇《硅谷》（Silicon Valley）的朋友，想必都對那個名為 Pied Piper（魔笛手）的虛構公司念念不忘。

在劇中，男主角 Richard Hendricks 發明了一種「中間壓縮算法」，能以極高的壓縮率無損處理文件，甚至因此改寫了整個互聯網的規則。

當時我們都以為這只是編劇的腦洞。直到 Google Research 正式發布了名為 TurboQuant 的 AI 壓縮算法。

這原本是一條枯燥的技術新聞，卻在社交網絡上引發了病毒式傳播，不到 24 小時，就收獲了 1280 萬次瀏覽。原因無他，這項技術的設定簡直就是 Pied Piper 的翻版：

在不損失模型性能的前提下，將 AI 的「工作記憶」壓縮至少 6 倍。

市場的反應也極為真實，美股存儲芯片板塊盤中遭遇拋售，美光科技、閃迪等頭部企業股價齊齊收跌。

這不禁讓人好奇，一項純軟件層面的算法創新，為什么會讓賣硬件的先慌了神，而Google 到底向當前的 AI 牌桌上扔了一張怎樣的底牌？

困在「記憶黑洞」里的大模型

拋開網絡熱梗，TurboQuant 的出現其實不僅是為了好玩，更是為了解決一個讓整個 AI 行業頭疼已久的真實瓶頸。

眾所周知，現在的 AI 模型越來越大，對顯存的胃口也像無底洞一樣。尤其是在推理階段（也就是你和 AI 聊天的時候），AI 需要記住上下文信息，這部分數據被稱為 KV Cache（鍵值緩存）。

每處理一個詞，模型都要把它轉成一個高維向量存進 GPU 顯存。對話越長，這份「數字備忘錄」膨脹越快，很快就把 GPU 顯存塞滿。這就是為什么你的 AI 助手聊久了會「變笨」或者直接報錯，腦容量不夠了。

更棘手的是，傳統的壓縮方法一直面臨一個兩難困境：壓縮數據時，需要額外存儲「量化常數」來告訴模型怎么解壓。這些元數據聽起來很小，加起來卻能把壓縮帶來的收益全部抵消掉。

Google 的 TurboQuant 的誕生正是基于此。

研究人員設計了一套兩階段的數學解法。第一階段叫 PolarQuant，把數據向量從傳統的直角坐標系轉換成極坐標系，拆分成「半徑」（表示大小）和「角度」（表示方向）。

這個幾何變換的妙處在于：轉換后角度的分布變得高度可預測，模型不再需要為每個數據塊單獨存儲昂貴的歸一化常數，直接映射到固定的圓形網格上就行了，開銷為零。

第二階段叫 QJL（Quantized Johnson-Lindenstrauss 變換），充當數學層面的糾錯器。它把壓縮后殘留的誤差投影到低維空間，再把每個誤差值壓縮成一個符號位（+1 或 -1）。

這個設計保證了 AI 在計算「注意力分數」時，壓縮版本的結果與高精度原版在統計意義上完全一致。所謂注意力分數，就是模型判斷上下文里哪些詞最重要的關鍵步驟。

如果說以前 AI 記筆記是「逐字逐句抄寫」，那么 TurboQuant 就像發明了一套「極簡速記符號」：該記的一個不漏，占的空間卻少了六倍。

這套方法還有一個對企業來說格外友好的特性：無需重新訓練模型。你現有的開源模型，或者自己微調過的模型，直接套上 TurboQuant 就能跑，不用額外的數據集，也不用重新跑一遍訓練流程。

光說不練假把式，在「大海撈針」基準測試里，讓 AI 從 10 萬個詞里找出一句藏好的話，TurboQuant 在 Llama-3.1-8B 和 Mistral-7B 上跑出了滿分召回率，同時把 KV Cache 的顯存占用壓縮了至少 6 倍。

在 LongBench 綜合評測套件（涵蓋問答、代碼生成、長文摘要）上，TurboQuant 全面追平甚至超過了此前的最強基線方法 KIVI。

最硬核的數字來自英偉達 H100 GPU 的實測：4 位精度的 TurboQuant 在計算注意力邏輯上的速度，比未壓縮的 32 位方案快了整整 8 倍。

Google 的「DeepSeek 時刻」？

論文發布后的 24 小時內，社區已經開始動手驗證。

Apple Silicon MLX 框架的知名開發者 @Prince_Canuma 把算法移植到了 Apple Silicon 的 MLX 框架，測試 Qwen3.5-35B 模型，上下文長度從 8500 到 64000 token 全覆蓋，每個量化等級都跑出了 100% 的精確匹配。

他還發現，2.5 位的 TurboQuant 能把 KV Cache 壓縮近 5 倍，準確率零損失。

對于 TurboQuant 的發布，Cloudflare CEO Matthew Prince 甚至將其稱為 Google 的「DeepSeek 時刻」。

把時間撥回一年前，DeepSeek 以極低的成本訓練出了性能驚人的模型，徹底打破了硅谷大廠對高成本才能訓練出高性能 AI 的迷信。那次沖擊也讓整個行業意識到：光有大模型不夠，還得跑得起、跑得快。

TurboQuant 也是這種背景下的產物。如果這項技術能從實驗室走向大規模應用，它將帶來肉眼可見的商業價值。

同樣一張 H100，推理成本理論上可以直接打折超過 50%；端側部署的門檻也會大幅降低，以前需要 32 位精度才能跑的大模型，放在 Mac Mini 或者本地服務器上也能運行，還不會有質量損耗。

市場的反應，已經很說明問題了。TurboQuant 發布當天，美股存儲芯片板塊盤中遭遇明顯拋售。閃迪、美光科技等頭部企業股價顯著收跌，存儲芯片與硬件供應鏈相關指數單日跌幅超過 2%。

究其原因，如果 AI 巨頭能用一套純軟件算法把顯存需求砍掉六分之五，那些押注 AI 會持續瘋狂消耗高帶寬顯存的多頭，就得重新盤算自己的倉位了。

而這種防御性反應背后，也表明，過去兩年支撐存儲股估值的核心邏輯之一，是 AI 對顯存的需求只會越來越大。TurboQuant 第一次在技術層面正式動搖了這個假設。

當然，雖然聽起來很美好，還是要潑一盆冷水。

一方面，歷史上每次效率提升，往往反而帶動了總需求增長，經濟學里叫「杰文斯悖論」。AI 跑得更便宜，可能意味著更多人更頻繁地用它，最終消耗的算力反而更多。所以這場「顯存危機」到底會不會因此化解，還真不好說。

另一方面，TurboQuant 目前仍處于實驗室階段，根據最新消息，Google 計劃在下個月的 ICLR 2026 大會上正式展示這項技術，屆時還將同步亮相另一場頂會 AISTATS 2026。

但從論文到大規模生產部署，中間隔著工程適配、不同架構的兼容性測試、真實場景的性能驗證，每一關都不輕松。

論文地址：https://arxiv.org/abs/2504.19874

有網友直接開炮，這篇論文的底層研究其實早在去年四月就已公開，根本談不上橫空出世，眼下的輿論熱潮，多少有點追著舊聞起哄的意思。

在他看來，如果存儲股因為一篇算法論文而大跌，恰恰暴露了市場里有多少人根本沒搞清楚這件事的邊界，并把這波反應比作「豐田出了新混動引擎，石油就該崩盤」。

更重要的是，TurboQuant 解決的只是推理（Inference）階段的顯存瓶頸，訓練階段的顯存消耗依然是另一座大山。想從頭訓練一個主流量級的大模型，需要的算力資源依然是天文數字。

在《硅谷》里，Pied Piper 的壓縮算法最終改變了整個互聯網。而在現實中，TurboQuant 的野心沒那么大，目標只是讓 AI 在有限的物理空間里記得更多、算得更快、跑得更便宜。

現實終究不是好萊塢劇本，不必徹底改變互聯網，能和 AI 聊得更長、不再半途報錯，已經是很多人想要的了。

附上 TurboQuant 官方技術博客：

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌創始人布林：當年發完Transformer論文，我們太不當回事了

機器之心Pro 2025-12-15 10:18:00
49 跟貼 49
早報｜特斯拉第三代人形機器人預計年中亮相/更省token，GPT-5.5正式發布/西山居游戲辟謠「解散」傳言：將依法追究惡意造謠

愛范兒 2026-04-24 08:28:21
0 跟貼 0

谷歌Cloud Next大會焦點：AI Agent邁入規模化，推理芯片成獨立增長曲線

華爾街見聞官方 2026-04-24 11:02:50
0 跟貼 0

剛剛，DeepSeek V4 雙版本正式上線！

機器之心Pro 2026-04-24 11:26:05
2 跟貼 2
第一時間,寒武紀原生適配DeepSeek-V4！兩大國產之光再次強強聯合

機器之心Pro 2026-04-24 13:00:09
0 跟貼 0

港大俞益洲團隊發布首篇「高效視頻世界模型」全面綜述

機器之心Pro 2026-04-24 11:40:34
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
Anthropic逼急谷歌！布林親自下令組突擊隊，Gemini編程要追上Claude

新智元 2026-04-21 13:30:39
0 跟貼 0

她穿著洞洞鞋登上國際頂級領獎臺，只為每28秒消失的那條命

林紙巾 2026-04-21 13:17:22
0 跟貼 0
英特爾盤后大漲20%！全市場同指數費率最低的科創芯片ETF（588290）早盤大幅高開

每日經濟新聞 2026-04-24 10:32:05
0 跟貼 0
Anthropic估值超過OpenAI，中國光伏出口猛翻一倍 | 財經日日評

吳曉波頻道 2026-04-24 08:33:03
0 跟貼 0
國際東！樊振東造訪谷歌總部，合影霸王龍+英偉達總裁

23號球魁 2026-04-21 21:46:34
1 跟貼 1
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
中方不再忍讓！取消荷蘭光刻機優待，450億芯片項目直接叫停

Hi秒懂科普 2026-04-22 15:24:22
0 跟貼 0
29歲樊振東曬與黃仁勛合影，參觀英偉達、谷歌等大廠

星視頻 2026-04-22 12:47:08
0 跟貼 0
地平線連放「三把火」，英偉達的好日子到頭了？

新浪財經 2026-04-24 12:52:08
0 跟貼 0
海光信息一季度營收同比增長68%，領跑高端芯片市場

每日經濟新聞 2026-04-24 11:16:21
0 跟貼 0
個人微信建了600多個工作群，離職時賬號歸誰

現代快報 2026-04-23 13:49:11
2309 跟貼 2309
3米數據線讓車機斷連：谷歌官方認證標準曝光

硅嶼手記 2026-04-24 10:10:37
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
古馳也要做智能眼鏡？2027年上市，價格不敢想

賽博蘭博 2026-04-24 10:29:02
0 跟貼 0
中船特氣一季度營收增長36%，這塊“十五五”提及的短板，要迎來轉機了？｜ETF風向標

每日經濟新聞 2026-04-24 12:07:08
0 跟貼 0
刷屏！DeepSeek V4成本暴降73%，梁文鋒聯手華為寒武紀，源神歸位全體起立

智東西 2026-04-24 13:08:45
0 跟貼 0
狗子乖乖躺著讓雞治病

瀟湘晨報 2026-04-23 17:38:12
97 跟貼 97
Google給Java開發者發了個"智能體工具箱"

薛定諤的BUG 2026-04-24 10:05:02
0 跟貼 0
黃仁勛為何炮轟美對華芯片禁令？

劉興亮 2026-04-22 19:58:10
6 跟貼 6
馬斯克：全球最大晶圓工廠定了！將采用Intel 14A工藝制造芯片

快科技 2026-04-24 01:05:15
0 跟貼 0
80萬級旗艦芯片加持？樂道L90首搭自研神璣9031，完全體已成？

VDGER唯界 2026-04-22 00:41:43
0 跟貼 0
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
高通驍龍重回三星代工模式，再續前緣

快科技 2026-04-22 21:20:53
0 跟貼 0
SK海力士員工今年平均獎金47.7萬美元！明年再翻一倍

快科技 2026-04-21 17:36:33
0 跟貼 0
中介稱"杭州600萬房子355萬急出" 有人看房被"丟路邊"

錢江晚報 2026-04-23 14:45:39
1510 跟貼 1510
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
星空 Starry 6P 發布：艙駕融合芯片如何定義下一代智能車

AutoVideo 2026-04-22 21:13:30
1 跟貼 1
一芯統艙駕，這家公司想重做汽車大腦

擎動 2026-04-23 12:18:42
1 跟貼 1
地平線發布三大重磅技術，開啟整車智能體新時代

Geek新動力 2026-04-23 14:03:40
1 跟貼 1
廣東：開發高能效人工智能芯片和異構計算架構

界面新聞 2026-04-22 17:27:42
0 跟貼 0
缸中之腦現代版：20萬人腦神經元一周學會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
游戲開發圈心照不宣的事被谷歌給捅破了：九成游戲全靠AI代工！

快科技 2026-04-24 11:34:42
0 跟貼 0
深圳水官高速4月26日起停止收費

新快報新聞 2026-04-24 08:16:04
60 跟貼 60

AppSo

讓智能手機更好用的秘密

6307文章數 26828關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

家居

旅游

數碼

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

一篇論文引發存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

剛剛，DeepSeek-V4 預覽版發布 百萬上下文

特朗普：不會對伊朗動用核武器 已從軍事上拿下了伊朗

特朗普：不會對伊朗動用核武器 已從軍事上拿下了伊朗

里程碑之戰拖后腿，哈登18分8失誤

王思聰被綠！戀愛期間女友被金主包養

19家企業要"鋁代銅"，格力偏不

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

云游中國｜逛世界風箏都 留學生探秘中國傳統文化

自然肌理 溫潤美學

專訪巴可王紅波：顯示行業競爭下半場，深耕八大垂直行業與構建共贏生態

剛剛，DeepSeek-V4 預覽版發布百萬上下文

特朗普：不會對伊朗動用核武器已從軍事上拿下了伊朗

特朗普：不會對伊朗動用核武器已從軍事上拿下了伊朗

云游中國｜逛世界風箏都留學生探秘中國傳統文化

自然肌理溫潤美學