智東西
作者 畢偉豪
編輯 漠影一、1000倍算力缺口,AI主機的硬門檻為什么在CPU二、三大場景開箱即用,千元級主機讓Agent走進生活三、超長上下文硬扛金融場景,一顆芯片給Agent兜底四、端側低成本推理,Token不再花錢如流水,Agent常駐后臺五、家庭共享零門檻,藍牙配網、無需鍵鼠結語:為Agent推理而生的芯片,正在重寫AI硬件的規則
![]()
智東西6月12日報道,這兩年,隨著Claude Code、Codex越來越能打,龍蝦(OpenClaw)、愛馬仕(Hermes)這類開源AI助手接連爆火,“智能體”熱度飆升,Agent時代就此到來。
![]()
現在,越來越多的人從聊天機器人轉到Agent,開始使用各種工具來完成日常生活中的任務,相比于簡單對話,Agent的Token的消耗量是巨大的。
因為現在的Agent可以真正幫人干活,比如寫軟件、盯股市、做PPT、剪視頻等等,以前聊天機器人回答問題,通常僅需一兩步推理,而現在一個金融Agent,要同時跑行情分析、財報解讀、交易決策等多項任務,一項任務就需要幾十步甚至上百步連續推理,算力需求根本不在一個量級。
![]()
不久前,英偉達CEO黃仁勛在訪談中做出了這樣的判斷:Agent時代,算力需求將暴漲到生成式AI的1000倍,整個行業會被推著進入全新的競爭階段。
![]()
算力需求指數級的增長帶來了兩個問題:第一是普通人該如何部署Agent、配置和使用前沿AI工具,第二則是黃仁勛所說的1000倍的算力缺口由誰來填補。
前沿Agent安裝部署難度高、配置復雜,而云端模型調用的延遲、Token消耗量、數據隱私安全等問題,正在推高端側推理需求,人們需要一臺真正能降低Agent使用門檻、并且可以在端側執行更多、更復雜任務的主機。
黃仁勛所說的1000倍算力缺口不可能全由云端填補,AIPC走進市場,將推理更多轉移到端側,正是重要的解法。但以前的AIPC只是把機器當成了能跑大模型的PC,而不是為Agent推理專門設計的計算機。
一臺從內到外均為Agent推理而生的AIPC,在這個時代的優勢逐漸凸顯,能在本地使用Agent執行任務,也可以憑借軟硬件優化提高計算效率,節省Token開支。
而一款好的主機,核心在于芯片,對于芯片而言,不論是端側、邊緣還是云端,CPU的重要性都不言而喻。AMD CEO蘇姿豐曾在采訪中直言,每個Agent運行過程里都在持續調度CPU,GPU只在調用模型那一步起作用,其余分配任務、搬運數據、調工具都走CPU。
![]()
因此,未來Agent執行的任務越復雜,CPU的分量就越重,只有為Agent專門設計的芯片,才能更好滿足Agent爆發帶來的需求。
此芯P1就是這樣一顆芯片,在架構層面,它為Agent推理做了定向優化:12核Arm v9.2 CPU,主頻可達3.2GHz,集成10核Arm Immortalis-G720 GPU以及專用NPU,異構總算力達45TOPS,可以為大模型的本地化部署提供開箱即用的算力支撐。
作為專為Agent而生的AI主機,聯想AI主機mini搭載此芯P1,這也是此芯和聯想在共同定義“Agentic Compute”新標準過程中的產品,要讓更多人享受到Agent時代的前沿成果。
這臺千元級別的主機,體積只有Mac mini的一半,平均功耗僅15W,運行噪音低于30分貝,卻能釋放此芯P1的45TOPS綜合算力,在多個Agent使用場景中表現穩定。
這臺搭載此芯P1的聯想AI主機mini,預裝了天禧Claw,開箱即用,支持多成員共享,數據隔離、記憶獨立,一個僅有巴掌大小的千元級主機,將使用Agent的門檻直接砍到了底。
![]()
Agent確實好用,但部署Agent、接模型API,配置以及使用那些前沿工具,本身就存在門檻,對大多數人來說,“開箱即用”才是接觸Agent最現實的路徑。如何讓Agent走進每個人、每個家庭的生活,是無數廠商思考的問題。
![]()
聯想AI主機mini依靠天禧Claw,可以實現7×24小時無人值守,全天候服務,并且無需部署和配置,真正實現了Agent開箱即用,門檻接近于零,同時設備支持手機、平板等多端互聯以及多成員獨立使用,隨時隨地都能調用Agent完成任務。
![]()
在炒股、自媒體創作、家庭共享這些需要Agent需要持續運行、多步推理、同時處理海量信息的場景中,這臺搭載此芯P1的主機表現很穩。
金融場景中,數據源又雜又多,實時行情流和靜態財報混在一起,還不能丟失信息,這讓Agent的工作負載壓力變得非常大。
比如一個散戶通過配置,讓Agent同時盯著股市、財經媒體、大公司官網和社交平臺,說一句“盯著新能源板塊,有變動立刻彈窗發給我”,Agent就得同時消化好幾種不同格式的信息,做深度推理。
![]()
如果上下文窗口不夠長,Agent在處理半路上很可能自動丟掉前面的關鍵數據,給出建立在殘缺信息上的判斷,這在金融場景中,是相當致命的。
搭載此芯P1的聯想AI主機mini,最高支持200K超長上下文,對需要Agent持續盯盤的用戶來說,上下文長度直接等于安全底線,這種超長的上下文窗口,讓聯想AI主機mini在金融場景中非常能打。
能滿足金融場景的使用需求,對其他需要長上下文推理的日常場景自然如魚得水。
很多自媒體創作者已然成為Agent的重度用戶,搜熱點、列大綱、寫文案、配圖排版等等,每一步背后都有Agent的身影。
聊天機器人一次對話通常僅有一到兩輪推理,而Agent完成一個創作任務可能是十幾輪甚至幾十輪連續推理,全程走云端大模型API的話,一天Token費輕松超過一頓外賣,一個月的賬單可能會非常驚人,放在端側推理支出就更加可控。
聯想AI主機mini就是這個思路,盡可能把工作搬到本地,從而大幅度降低Token的消耗。
![]()
搭載此芯P1的聯想AI主機mini支持運行本地輕量模型,可穩定承載13B–35B生產級Agent部署,外加拓展卡可支持7B-122B模型運行,遠超主流7B離線部署邊界,簡單任務可以在本地實現閉環。
同時,此芯P1針對Agent場景做了定向優化,首發搭載Ubuntu 26.04和Linux 7.0 kernel,P1的異構算力驅動、NPU調度、內存管理都在這些系統上做了深度適配。
其12核Armv9.2 CPU設計可以實現Agent執行任務時的精細化調度,在多任務并行時具有優秀的能效表現,NPU設計也能提高模型的計算效率。
在實際測試中,搭載此芯P1的聯想AI主機mini將執行復雜任務的Token消耗量降低了60%,速度提升50%-70%。
低成本推理是Agent普及的經濟前提,當推理成本降下來,Agent才可能從偶爾用一下變成日常跑在后臺。
AI硬件翻車最多的地方不是跑分低,是買回家只有一個人會用,空有強大算力,卻不能共享。傳統mini主機的開箱流程是:翻鍵鼠、找網線、插顯示器、進BIOS調試,這種操作過程本身就是一堵墻。
而聯想AI主機mini繞開了這堵墻:手機藍牙靠近自動配網,微信小程序掃碼綁定,不用接鍵鼠,不用插網線,并且可以實現多設備連接與多人共享。
![]()
老人查菜譜、小孩問作業,一臺主機放在電視柜上,全家人各用各的Agent,對著手機說話就行。
![]()
這個體驗能立住,靠芯片在底層撐起三條線:多用戶、多任務并行處理靠12核CPU的設計;一個人折騰崩了系統,獨立Recovery分區配合一鍵恢復,全家不受影響;64GB LPDDR5內存低功耗運行,帶寬高達100GB/s,能夠實現24小時待機,兼顧功耗與性能平衡。
面向家庭和中小團隊的AI主機,安全信任是另一個硬需求。此芯P1在芯片層充分利用了Arm v9.2的安全特性,包括PACBTI指針認證、MTE內存標簽擴展和Secure EL2硬件虛擬化,多人共用一臺機器跑各自的Agent,數據不串區,保證安全性。
P1還過了Arm SystemReady L6認證,這是數據中心級的硬件合規標準,主流Linux發行版可以開箱直裝。而OTA在線升級,可以讓芯片算力釋放能力隨系統迭代持續提升,買回家的硬件能夠越用越好用。
AI主機這個概念喊了兩年,但真正能讓Agent從聊天框里走出來的硬件,不是塞個大模型進機箱,也不是給PC換個殼貼個AI標簽。
芯片得在底層回答這些問題:Agent推理能不能一次處理足夠長的上下文,端側推理能否執行更多更復雜的任務,多任務并發時系統能不能穩住。
此芯P1選了Agentic Compute這條路,從芯片架構的第一行代碼開始,就為Agent推理做定向設計,通過“端云協同,端側常駐”的模式,打造為Agent而生的計算能力。
未來,評判一臺AI主機優劣的標準,將從跑分多高,逐漸變成Agent跑得省不省、穩不穩,Agentic Compute時代,AI主機的規則正在重寫。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.