无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

還在糾結(jié)「本地 or 云端」?Perplexity 的「任務(wù)路由」徹底解決 AI 難題

0
分享至


不是問題的問題。


作者|樺林舞王

編輯|靖宇

當(dāng)?shù)貢r(shí)間 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主題演講上,做了一個(gè)很多人沒太在意、但可能改變整個(gè) AI 應(yīng)用行業(yè)走向的演示。

不是新模型,不是更快的搜索,而是一套「任務(wù)路由」系統(tǒng)。

簡(jiǎn)單來說,就是 AI 自己決定哪些事在你的電腦上做,哪些事扔給云端——而不是讓用戶去選。

CEO Aravind Srinivas 和 Intel CEO Lip-Bu Tan 站在臺(tái)上,在一臺(tái)跑著 Intel Core Ultra Series 3 芯片的設(shè)備上演示了全程。本地模型負(fù)責(zé)判斷,云端模型負(fù)責(zé)執(zhí)行復(fù)雜任務(wù),兩者之間的調(diào)度對(duì)用戶完全透明。

這件事聽起來像是一個(gè)工程細(xì)節(jié),但背后藏著一個(gè)更大的問題:AI 應(yīng)用的架構(gòu)之戰(zhàn),已經(jīng)從「誰的模型更強(qiáng)」,悄悄轉(zhuǎn)向了「誰能把資源調(diào)度得更聰明」

01

本地 VS 云端

過去兩年,AI 行業(yè)走了一條很直接的路:算力不夠?加算力。模型不夠大?加參數(shù)。隱私有顧慮?那就……先擱置。

但企業(yè)用戶不會(huì)永遠(yuǎn)擱置隱私問題。

一個(gè)典型的場(chǎng)景是:你讓 AI 助手幫你整理會(huì)議記錄,里面可能有未公開的財(cái)務(wù)數(shù)據(jù)、客戶信息、合同條款。這些東西傳到云端,法務(wù)部門就會(huì)來敲門。但如果只用本地模型處理,算力撐不住,效果又打折扣。


Perplexity 在跑任務(wù)時(shí)關(guān)注到了數(shù)據(jù)隱私問題|圖片來源:Perplexity

這就是 Perplexity 混合推理(Hybrid Agentic Inference)試圖解開的死結(jié)。

它的核心邏輯不復(fù)雜——讓本地模型先做「?jìng)刹靻T」,判斷每一個(gè)子任務(wù)的敏感程度和復(fù)雜度,然后決定是留在本地處理,還是打包發(fā)給云端的前沿模型。用戶不需要做任何選擇,系統(tǒng)自動(dòng)完成路由。

據(jù)技術(shù)分析,任務(wù)分類發(fā)生在 API 層。「這是 5 個(gè) token 的問答,還是 500 個(gè) token 的代碼生成請(qǐng)求?」——本地模型用 4 位量化處理前者,內(nèi)存占用減少約 75%;云端模型接管后者,但在傳輸前會(huì)做確定性哈希處理,防止原始數(shù)據(jù)泄漏。

理論上,邊緣設(shè)備的往返延遲可以因此降低 60%

當(dāng)然,「理論上」這三個(gè)字很重要。

02

從「AI 搜索」到任務(wù)路由

如果只看今天的演示,容易誤以為這是 Perplexity 的一次突然發(fā)力。但把時(shí)間線拉長(zhǎng),會(huì)發(fā)現(xiàn)這家公司在過去半年里做的每一步,都在為這個(gè)方向鋪路。

今年 3 月,Perplexity 與 CoreWeave 達(dá)成戰(zhàn)略合作,用專屬的 NVIDIA GB200 NVL72 集群跑推理工作負(fù)載,把云端算力基礎(chǔ)設(shè)施夯實(shí)。5 月中旬,它推出了 Mac 應(yīng)用,把 Personal Computer 功能開放給 Pro 和 Enterprise 用戶——之前只有 Max 用戶才能用。這一步很關(guān)鍵,相當(dāng)于在正式推出混合推理之前,先把用戶教育做了一遍,讓大家習(xí)慣「AI 在本地跑」這件事。

Perplexity 任務(wù)路由的演示視頻|圖片來源:Perlexity

到今天的 Computex 演示,混合推理功能還沒有正式上線,官方說會(huì)在 7 月推出。但選在這個(gè)時(shí)間點(diǎn)、這個(gè)舞臺(tái)亮相,用意很清楚——英特爾需要一個(gè)真實(shí)的 AI PC 用例,Perplexity 需要一個(gè)比自家官網(wǎng)更大的曝光窗口,雙方一拍即合。

與此同時(shí),Perplexity 的商業(yè)版圖也在加速擴(kuò)張。從 18 億美元估值融資 1 億美元,到兩個(gè)月后以 200 億美元估值完成 2 億美元融資,自成立三年來累計(jì)融資已達(dá) 15 億美元。錢還在持續(xù)進(jìn)來,說明投資人押注的不只是搜索,而是整個(gè) AI 代理基礎(chǔ)設(shè)施的敘事。

03

聰明的不是模型,是調(diào)度器

VentureBeat 的分析抓到了這件事的本質(zhì)。它指出,Perplexity 這套系統(tǒng)的關(guān)鍵主張,不是「本地可以跑模型」——這件事已經(jīng)有幾十種工具能做到了。真正的差異化在于,Perplexity 的系統(tǒng)自己做路由決策,逐個(gè)任務(wù),不需要用戶提前配置

這是一個(gè)視角的根本轉(zhuǎn)變。

以前,「本地 vs 云端」是一個(gè)用戶層面的選擇題。你要么信任云端,要么忍受本地模型的能力上限。Perplexity 想把這道選擇題從用戶面前拿走,變成系統(tǒng)內(nèi)部的一個(gè)工程問題。

但這恰恰是挑戰(zhàn)最大的地方。

要讓編排器在生產(chǎn)環(huán)境中可靠運(yùn)行,它需要同時(shí)做對(duì)幾件事:準(zhǔn)確評(píng)估每個(gè)子任務(wù)的復(fù)雜程度,理解涉及數(shù)據(jù)的敏感級(jí)別,了解用戶本地硬件的實(shí)時(shí)性能狀態(tài),還要管理跨設(shè)備-云端的任務(wù)狀態(tài)同步。任何一個(gè)環(huán)節(jié)判斷失誤,輕則輸出質(zhì)量下降,重則把不該上云的數(shù)據(jù)送出去了。

MacRumors 社區(qū)里有用戶的擔(dān)憂更直接——「這是讓 AI 出現(xiàn)幻覺然后刪文件的好辦法。」這話聽起來像段子,但觸到了一個(gè)真實(shí)的焦慮:當(dāng) AI 代理獲得了更多系統(tǒng)權(quán)限,并且還要自主做路由決策的時(shí)候,「可解釋性」和「可審計(jì)性」變得比任何時(shí)候都更重要。


Perplexity 任務(wù)完成提示頁(yè)面|圖片來源:Perplexity

企業(yè)安全專家也提出了另一層風(fēng)險(xiǎn)——如果云端模型的調(diào)用鏈沒有經(jīng)過 SOC 2 等級(jí)的驗(yàn)證,混合架構(gòu)本身可能反而引入新的供應(yīng)鏈安全漏洞。隱私問題還沒解決,安全問題已經(jīng)跟上來了。

值得一提的是,Perplexity 還在另一個(gè)戰(zhàn)場(chǎng)上承受壓力。

截至今年 5 月底,已有包括 CNN、紐約時(shí)報(bào)、News Corp 在內(nèi)的九家媒體機(jī)構(gòu)對(duì)其提起有效訴訟,指控版權(quán)和商標(biāo)侵權(quán)。這是一個(gè)懸在頭頂、遲遲沒有定論的法律風(fēng)險(xiǎn)。混合推理是產(chǎn)品層的創(chuàng)新,但版權(quán)糾紛是商業(yè)模式層的隱患,兩者并行,并不互相抵消。

一家公司可以在技術(shù)架構(gòu)上做出令人印象深刻的判斷,同時(shí)在商業(yè)合規(guī)上依然面臨真實(shí)的挑戰(zhàn)。這兩件事不矛盾,但放在一起,會(huì)讓「Perplexity 的未來」這個(gè)命題變得更復(fù)雜一些。

說白了,混合推理是 Perplexity 押注的方向,但押注能不能兌現(xiàn),取決于執(zhí)行層面的每一個(gè)細(xì)節(jié),以及它能否在法律壓力下保持足夠的專注度。

AI 應(yīng)用正在經(jīng)歷一次安靜的架構(gòu)革命。不是哪個(gè)模型又刷新了 benchmark,而是「算力在哪里跑、數(shù)據(jù)往哪里走」這個(gè)底層問題,開始被認(rèn)真對(duì)待。

Perplexity 今天在 Computex 臺(tái)上演示的那幾分鐘,可能比任何一次模型發(fā)布都更值得被記住——因?yàn)樗谥v的,是 AI 應(yīng)用該怎么被構(gòu)建,而不只是 AI 能做什么。

至于 7 月上線之后,這套系統(tǒng)在真實(shí)用戶手里能交出什么成績(jī)單,那才是這個(gè)故事真正開始的地方。

*頭圖來源:Perplexity

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

具身智能融資熱度持續(xù)爆表,一個(gè)月估值漲 10 倍、大牛出來就是幾十億天使、三輪融資同時(shí)開……這波熱潮理性嗎?國(guó)內(nèi)外路線有何差異?技術(shù)真實(shí)進(jìn)展到哪了?

今晚 20:00,極客公園視頻號(hào)直播間,我們請(qǐng)來了藍(lán)馳創(chuàng)投合伙人曹巍、具身智能投資人筆盒、諾亦騰機(jī)器人 創(chuàng)始人/首席執(zhí)行官戴若犁,和極客公園副主編鄭玄、作者 Li Yuan,一起聊聊這個(gè)行業(yè)的真相與泡沫。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
退休前最后三個(gè)月,社保局永遠(yuǎn)不會(huì)提醒你的4件事!不辦虧大幾萬

退休前最后三個(gè)月,社保局永遠(yuǎn)不會(huì)提醒你的4件事!不辦虧大幾萬

娛樂圈的筆娛君
2026-06-09 14:05:20
不到一天,菲律賓對(duì)華上演變臉,馬科斯想通了:不能學(xué)高市早苗

不到一天,菲律賓對(duì)華上演變臉,馬科斯想通了:不能學(xué)高市早苗

懵面女漢
2026-06-10 13:10:46
為什么去過朝鮮回來就沉默的人,不是隱瞞,是真的說不出

為什么去過朝鮮回來就沉默的人,不是隱瞞,是真的說不出

老特有話說
2026-05-12 15:41:08
世體:隨著穆帥回歸執(zhí)教,皇馬將再次利用門德斯的資源引入球星

世體:隨著穆帥回歸執(zhí)教,皇馬將再次利用門德斯的資源引入球星

懂球帝
2026-06-10 10:57:16
14名足球小將們回國(guó)了!沒想到歡迎儀式會(huì)是這樣

14名足球小將們回國(guó)了!沒想到歡迎儀式會(huì)是這樣

哄動(dòng)一時(shí)啊
2026-06-09 10:08:54
SemiAnalysis報(bào)告稱兩大關(guān)鍵技術(shù)延遲,引發(fā)“光電”大跌,網(wǎng)友激辯CPO

SemiAnalysis報(bào)告稱兩大關(guān)鍵技術(shù)延遲,引發(fā)“光電”大跌,網(wǎng)友激辯CPO

華爾街見聞官方
2026-06-10 09:49:47
離譜!5人在路中間擺桌吃飯!常州警方通報(bào)!

離譜!5人在路中間擺桌吃飯!常州警方通報(bào)!

常州大喇叭
2026-06-10 10:32:27
豐田全新發(fā)動(dòng)機(jī)量產(chǎn)裝車,熱效率44.5%,一箱油跑1200公里

豐田全新發(fā)動(dòng)機(jī)量產(chǎn)裝車,熱效率44.5%,一箱油跑1200公里

沙雕小琳琳
2026-06-09 00:39:53
離婚真相曝光僅6個(gè)月,前妻高調(diào)曝光追求者,撕碎猴哥僅剩體面

離婚真相曝光僅6個(gè)月,前妻高調(diào)曝光追求者,撕碎猴哥僅剩體面

掛肚逍遙心
2026-06-08 08:17:28
伊朗開始反擊了!

伊朗開始反擊了!

葉葉夜
2026-06-10 11:29:56
為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風(fēng)卻銷量火爆?

為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風(fēng)卻銷量火爆?

基斯默默
2026-05-28 11:06:03
男學(xué)霸高考后爬泰山跳崖,遺言催人淚下:若有來生,不再相見

男學(xué)霸高考后爬泰山跳崖,遺言催人淚下:若有來生,不再相見

星宇共鳴
2025-08-28 16:45:12
炸鍋了!全進(jìn)華真的太松弛,帶著張家齊出門吃飯,依然是一雙拖鞋

炸鍋了!全進(jìn)華真的太松弛,帶著張家齊出門吃飯,依然是一雙拖鞋

火山詩(shī)話
2026-06-09 16:53:05
“孩子很遺憾,媽媽只能這樣維護(hù)你的體面”頭七:楊女士一躍而下

“孩子很遺憾,媽媽只能這樣維護(hù)你的體面”頭七:楊女士一躍而下

深夜探案館
2026-06-09 01:40:50
1966年,陶鑄當(dāng)選正國(guó)級(jí)干部,事后給毛主席寫信:我感到十分愧疚

1966年,陶鑄當(dāng)選正國(guó)級(jí)干部,事后給毛主席寫信:我感到十分愧疚

歷史龍?jiān)w
2026-06-08 15:10:19
網(wǎng)傳王健林暗中幫助黃一鳴母女,助力孫女閃閃獲得時(shí)尚資源與走秀

網(wǎng)傳王健林暗中幫助黃一鳴母女,助力孫女閃閃獲得時(shí)尚資源與走秀

娛樂嗑學(xué)家.
2026-06-10 11:13:30
高考現(xiàn)實(shí)扎心:本科錄取率僅36%,多數(shù)人讀專科

高考現(xiàn)實(shí)扎心:本科錄取率僅36%,多數(shù)人讀專科

戶外阿毽
2026-06-10 13:25:03
2萬億巨頭股價(jià)創(chuàng)歷史新高

2萬億巨頭股價(jià)創(chuàng)歷史新高

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-10 11:08:38
今夏“貴婦褲”又又又火了!比闊腿褲、小腳褲百搭,還顯高不拖沓

今夏“貴婦褲”又又又火了!比闊腿褲、小腳褲百搭,還顯高不拖沓

小陳聊搭配
2026-06-10 11:46:46
高考信號(hào)屏蔽波及汽車智駕!鴻蒙智行:途經(jīng)務(wù)必手動(dòng)接管

高考信號(hào)屏蔽波及汽車智駕!鴻蒙智行:途經(jīng)務(wù)必手動(dòng)接管

快科技
2026-06-07 19:28:05
2026-06-10 14:44:49
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
12144文章數(shù) 78907關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級(jí)模型向你開放

頭條要聞

湖北15名大學(xué)生靠"手搓"饅頭創(chuàng)業(yè) 已拿到1000萬元投資

頭條要聞

湖北15名大學(xué)生靠"手搓"饅頭創(chuàng)業(yè) 已拿到1000萬元投資

體育要聞

2026世界杯,我們看什么?

娛樂要聞

850萬請(qǐng)跑男,公款追星肥了誰的口袋

財(cái)經(jīng)要聞

大盤股IPO終結(jié)行情盛宴?背后真相來了

汽車要聞

賽豆科技發(fā)布AIVA品牌 首款概念車亮相/量產(chǎn)版新車今年內(nèi)發(fā)布

態(tài)度原創(chuàng)

本地
手機(jī)
教育
藝術(shù)
公開課

本地新聞

用楊柳青年畫的方式,打開天津

手機(jī)要聞

小米澎湃OS 4引入蘋果同款液態(tài)玻璃:博主稱細(xì)節(jié)審美提升100倍

教育要聞

80歲學(xué)希臘語(yǔ)被嘲笑?這句話背后的故事把我看哭了

藝術(shù)要聞

2026年中國(guó)美術(shù)學(xué)院,研究生畢業(yè)油畫作品選(四)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版