![]()
不是問題的問題。
作者|樺林舞王
編輯|靖宇
當(dāng)?shù)貢r(shí)間 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主題演講上,做了一個(gè)很多人沒太在意、但可能改變整個(gè) AI 應(yīng)用行業(yè)走向的演示。
不是新模型,不是更快的搜索,而是一套「任務(wù)路由」系統(tǒng)。
簡(jiǎn)單來說,就是 AI 自己決定哪些事在你的電腦上做,哪些事扔給云端——而不是讓用戶去選。
CEO Aravind Srinivas 和 Intel CEO Lip-Bu Tan 站在臺(tái)上,在一臺(tái)跑著 Intel Core Ultra Series 3 芯片的設(shè)備上演示了全程。本地模型負(fù)責(zé)判斷,云端模型負(fù)責(zé)執(zhí)行復(fù)雜任務(wù),兩者之間的調(diào)度對(duì)用戶完全透明。
這件事聽起來像是一個(gè)工程細(xì)節(jié),但背后藏著一個(gè)更大的問題:AI 應(yīng)用的架構(gòu)之戰(zhàn),已經(jīng)從「誰的模型更強(qiáng)」,悄悄轉(zhuǎn)向了「誰能把資源調(diào)度得更聰明」。
01
本地 VS 云端
過去兩年,AI 行業(yè)走了一條很直接的路:算力不夠?加算力。模型不夠大?加參數(shù)。隱私有顧慮?那就……先擱置。
但企業(yè)用戶不會(huì)永遠(yuǎn)擱置隱私問題。
一個(gè)典型的場(chǎng)景是:你讓 AI 助手幫你整理會(huì)議記錄,里面可能有未公開的財(cái)務(wù)數(shù)據(jù)、客戶信息、合同條款。這些東西傳到云端,法務(wù)部門就會(huì)來敲門。但如果只用本地模型處理,算力撐不住,效果又打折扣。
![]()
Perplexity 在跑任務(wù)時(shí)關(guān)注到了數(shù)據(jù)隱私問題|圖片來源:Perplexity
這就是 Perplexity 混合推理(Hybrid Agentic Inference)試圖解開的死結(jié)。
它的核心邏輯不復(fù)雜——讓本地模型先做「?jìng)刹靻T」,判斷每一個(gè)子任務(wù)的敏感程度和復(fù)雜度,然后決定是留在本地處理,還是打包發(fā)給云端的前沿模型。用戶不需要做任何選擇,系統(tǒng)自動(dòng)完成路由。
據(jù)技術(shù)分析,任務(wù)分類發(fā)生在 API 層。「這是 5 個(gè) token 的問答,還是 500 個(gè) token 的代碼生成請(qǐng)求?」——本地模型用 4 位量化處理前者,內(nèi)存占用減少約 75%;云端模型接管后者,但在傳輸前會(huì)做確定性哈希處理,防止原始數(shù)據(jù)泄漏。
理論上,邊緣設(shè)備的往返延遲可以因此降低 60%。
當(dāng)然,「理論上」這三個(gè)字很重要。
02
從「AI 搜索」到任務(wù)路由
如果只看今天的演示,容易誤以為這是 Perplexity 的一次突然發(fā)力。但把時(shí)間線拉長(zhǎng),會(huì)發(fā)現(xiàn)這家公司在過去半年里做的每一步,都在為這個(gè)方向鋪路。
今年 3 月,Perplexity 與 CoreWeave 達(dá)成戰(zhàn)略合作,用專屬的 NVIDIA GB200 NVL72 集群跑推理工作負(fù)載,把云端算力基礎(chǔ)設(shè)施夯實(shí)。5 月中旬,它推出了 Mac 應(yīng)用,把 Personal Computer 功能開放給 Pro 和 Enterprise 用戶——之前只有 Max 用戶才能用。這一步很關(guān)鍵,相當(dāng)于在正式推出混合推理之前,先把用戶教育做了一遍,讓大家習(xí)慣「AI 在本地跑」這件事。
Perplexity 任務(wù)路由的演示視頻|圖片來源:Perlexity
到今天的 Computex 演示,混合推理功能還沒有正式上線,官方說會(huì)在 7 月推出。但選在這個(gè)時(shí)間點(diǎn)、這個(gè)舞臺(tái)亮相,用意很清楚——英特爾需要一個(gè)真實(shí)的 AI PC 用例,Perplexity 需要一個(gè)比自家官網(wǎng)更大的曝光窗口,雙方一拍即合。
與此同時(shí),Perplexity 的商業(yè)版圖也在加速擴(kuò)張。從 18 億美元估值融資 1 億美元,到兩個(gè)月后以 200 億美元估值完成 2 億美元融資,自成立三年來累計(jì)融資已達(dá) 15 億美元。錢還在持續(xù)進(jìn)來,說明投資人押注的不只是搜索,而是整個(gè) AI 代理基礎(chǔ)設(shè)施的敘事。
03
聰明的不是模型,是調(diào)度器
VentureBeat 的分析抓到了這件事的本質(zhì)。它指出,Perplexity 這套系統(tǒng)的關(guān)鍵主張,不是「本地可以跑模型」——這件事已經(jīng)有幾十種工具能做到了。真正的差異化在于,Perplexity 的系統(tǒng)自己做路由決策,逐個(gè)任務(wù),不需要用戶提前配置。
這是一個(gè)視角的根本轉(zhuǎn)變。
以前,「本地 vs 云端」是一個(gè)用戶層面的選擇題。你要么信任云端,要么忍受本地模型的能力上限。Perplexity 想把這道選擇題從用戶面前拿走,變成系統(tǒng)內(nèi)部的一個(gè)工程問題。
但這恰恰是挑戰(zhàn)最大的地方。
要讓編排器在生產(chǎn)環(huán)境中可靠運(yùn)行,它需要同時(shí)做對(duì)幾件事:準(zhǔn)確評(píng)估每個(gè)子任務(wù)的復(fù)雜程度,理解涉及數(shù)據(jù)的敏感級(jí)別,了解用戶本地硬件的實(shí)時(shí)性能狀態(tài),還要管理跨設(shè)備-云端的任務(wù)狀態(tài)同步。任何一個(gè)環(huán)節(jié)判斷失誤,輕則輸出質(zhì)量下降,重則把不該上云的數(shù)據(jù)送出去了。
MacRumors 社區(qū)里有用戶的擔(dān)憂更直接——「這是讓 AI 出現(xiàn)幻覺然后刪文件的好辦法。」這話聽起來像段子,但觸到了一個(gè)真實(shí)的焦慮:當(dāng) AI 代理獲得了更多系統(tǒng)權(quán)限,并且還要自主做路由決策的時(shí)候,「可解釋性」和「可審計(jì)性」變得比任何時(shí)候都更重要。
![]()
Perplexity 任務(wù)完成提示頁(yè)面|圖片來源:Perplexity
企業(yè)安全專家也提出了另一層風(fēng)險(xiǎn)——如果云端模型的調(diào)用鏈沒有經(jīng)過 SOC 2 等級(jí)的驗(yàn)證,混合架構(gòu)本身可能反而引入新的供應(yīng)鏈安全漏洞。隱私問題還沒解決,安全問題已經(jīng)跟上來了。
值得一提的是,Perplexity 還在另一個(gè)戰(zhàn)場(chǎng)上承受壓力。
截至今年 5 月底,已有包括 CNN、紐約時(shí)報(bào)、News Corp 在內(nèi)的九家媒體機(jī)構(gòu)對(duì)其提起有效訴訟,指控版權(quán)和商標(biāo)侵權(quán)。這是一個(gè)懸在頭頂、遲遲沒有定論的法律風(fēng)險(xiǎn)。混合推理是產(chǎn)品層的創(chuàng)新,但版權(quán)糾紛是商業(yè)模式層的隱患,兩者并行,并不互相抵消。
一家公司可以在技術(shù)架構(gòu)上做出令人印象深刻的判斷,同時(shí)在商業(yè)合規(guī)上依然面臨真實(shí)的挑戰(zhàn)。這兩件事不矛盾,但放在一起,會(huì)讓「Perplexity 的未來」這個(gè)命題變得更復(fù)雜一些。
說白了,混合推理是 Perplexity 押注的方向,但押注能不能兌現(xiàn),取決于執(zhí)行層面的每一個(gè)細(xì)節(jié),以及它能否在法律壓力下保持足夠的專注度。
AI 應(yīng)用正在經(jīng)歷一次安靜的架構(gòu)革命。不是哪個(gè)模型又刷新了 benchmark,而是「算力在哪里跑、數(shù)據(jù)往哪里走」這個(gè)底層問題,開始被認(rèn)真對(duì)待。
Perplexity 今天在 Computex 臺(tái)上演示的那幾分鐘,可能比任何一次模型發(fā)布都更值得被記住——因?yàn)樗谥v的,是 AI 應(yīng)用該怎么被構(gòu)建,而不只是 AI 能做什么。
至于 7 月上線之后,這套系統(tǒng)在真實(shí)用戶手里能交出什么成績(jī)單,那才是這個(gè)故事真正開始的地方。
*頭圖來源:Perplexity
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO
具身智能融資熱度持續(xù)爆表,一個(gè)月估值漲 10 倍、大牛出來就是幾十億天使、三輪融資同時(shí)開……這波熱潮理性嗎?國(guó)內(nèi)外路線有何差異?技術(shù)真實(shí)進(jìn)展到哪了?
今晚 20:00,極客公園視頻號(hào)直播間,我們請(qǐng)來了藍(lán)馳創(chuàng)投合伙人曹巍、具身智能投資人筆盒、諾亦騰機(jī)器人 創(chuàng)始人/首席執(zhí)行官戴若犁,和極客公園副主編鄭玄、作者 Li Yuan,一起聊聊這個(gè)行業(yè)的真相與泡沫。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.