網易首頁 > 網易號 > 正文申請入駐

Agent時代的終端競賽，贏在CPU！

2026-06-12 18:35:00　來源: 智東西

北京舉報

分享至

智東西
作者畢偉豪
編輯漠影一、1000倍算力缺口，AI主機的硬門檻為什么在CPU二、三大場景開箱即用，千元級主機讓Agent走進生活三、超長上下文硬扛金融場景，一顆芯片給Agent兜底四、端側低成本推理，Token不再花錢如流水，Agent常駐后臺五、家庭共享零門檻，藍牙配網、無需鍵鼠結語：為Agent推理而生的芯片，正在重寫AI硬件的規則

智東西6月12日報道，這兩年，隨著Claude Code、Codex越來越能打，龍蝦（OpenClaw）、愛馬仕（Hermes）這類開源AI助手接連爆火，“智能體”熱度飆升，Agent時代就此到來。

現在，越來越多的人從聊天機器人轉到Agent，開始使用各種工具來完成日常生活中的任務，相比于簡單對話，Agent的Token的消耗量是巨大的。

因為現在的Agent可以真正幫人干活，比如寫軟件、盯股市、做PPT、剪視頻等等，以前聊天機器人回答問題，通常僅需一兩步推理，而現在一個金融Agent，要同時跑行情分析、財報解讀、交易決策等多項任務，一項任務就需要幾十步甚至上百步連續推理，算力需求根本不在一個量級。

不久前，英偉達CEO黃仁勛在訪談中做出了這樣的判斷：Agent時代，算力需求將暴漲到生成式AI的1000倍，整個行業會被推著進入全新的競爭階段。

算力需求指數級的增長帶來了兩個問題：第一是普通人該如何部署Agent、配置和使用前沿AI工具，第二則是黃仁勛所說的1000倍的算力缺口由誰來填補。

前沿Agent安裝部署難度高、配置復雜，而云端模型調用的延遲、Token消耗量、數據隱私安全等問題，正在推高端側推理需求，人們需要一臺真正能降低Agent使用門檻、并且可以在端側執行更多、更復雜任務的主機。

黃仁勛所說的1000倍算力缺口不可能全由云端填補，AIPC走進市場，將推理更多轉移到端側，正是重要的解法。但以前的AIPC只是把機器當成了能跑大模型的PC，而不是為Agent推理專門設計的計算機。

一臺從內到外均為Agent推理而生的AIPC，在這個時代的優勢逐漸凸顯，能在本地使用Agent執行任務，也可以憑借軟硬件優化提高計算效率，節省Token開支。

而一款好的主機，核心在于芯片，對于芯片而言，不論是端側、邊緣還是云端，CPU的重要性都不言而喻。AMD CEO蘇姿豐曾在采訪中直言，每個Agent運行過程里都在持續調度CPU，GPU只在調用模型那一步起作用，其余分配任務、搬運數據、調工具都走CPU。

因此，未來Agent執行的任務越復雜，CPU的分量就越重，只有為Agent專門設計的芯片，才能更好滿足Agent爆發帶來的需求。

此芯P1就是這樣一顆芯片，在架構層面，它為Agent推理做了定向優化：12核Arm v9.2 CPU，主頻可達3.2GHz，集成10核Arm Immortalis-G720 GPU以及專用NPU，異構總算力達45TOPS，可以為大模型的本地化部署提供開箱即用的算力支撐。

作為專為Agent而生的AI主機，聯想AI主機mini搭載此芯P1，這也是此芯和聯想在共同定義“Agentic Compute”新標準過程中的產品，要讓更多人享受到Agent時代的前沿成果。

這臺千元級別的主機，體積只有Mac mini的一半，平均功耗僅15W，運行噪音低于30分貝，卻能釋放此芯P1的45TOPS綜合算力，在多個Agent使用場景中表現穩定。

這臺搭載此芯P1的聯想AI主機mini，預裝了天禧Claw，開箱即用，支持多成員共享，數據隔離、記憶獨立，一個僅有巴掌大小的千元級主機，將使用Agent的門檻直接砍到了底。

Agent確實好用，但部署Agent、接模型API，配置以及使用那些前沿工具，本身就存在門檻，對大多數人來說，“開箱即用”才是接觸Agent最現實的路徑。如何讓Agent走進每個人、每個家庭的生活，是無數廠商思考的問題。

聯想AI主機mini依靠天禧Claw，可以實現7×24小時無人值守，全天候服務，并且無需部署和配置，真正實現了Agent開箱即用，門檻接近于零，同時設備支持手機、平板等多端互聯以及多成員獨立使用，隨時隨地都能調用Agent完成任務。

在炒股、自媒體創作、家庭共享這些需要Agent需要持續運行、多步推理、同時處理海量信息的場景中，這臺搭載此芯P1的主機表現很穩。

金融場景中，數據源又雜又多，實時行情流和靜態財報混在一起，還不能丟失信息，這讓Agent的工作負載壓力變得非常大。

比如一個散戶通過配置，讓Agent同時盯著股市、財經媒體、大公司官網和社交平臺，說一句“盯著新能源板塊，有變動立刻彈窗發給我”，Agent就得同時消化好幾種不同格式的信息，做深度推理。

如果上下文窗口不夠長，Agent在處理半路上很可能自動丟掉前面的關鍵數據，給出建立在殘缺信息上的判斷，這在金融場景中，是相當致命的。

搭載此芯P1的聯想AI主機mini，最高支持200K超長上下文，對需要Agent持續盯盤的用戶來說，上下文長度直接等于安全底線，這種超長的上下文窗口，讓聯想AI主機mini在金融場景中非常能打。

能滿足金融場景的使用需求，對其他需要長上下文推理的日常場景自然如魚得水。

很多自媒體創作者已然成為Agent的重度用戶，搜熱點、列大綱、寫文案、配圖排版等等，每一步背后都有Agent的身影。

聊天機器人一次對話通常僅有一到兩輪推理，而Agent完成一個創作任務可能是十幾輪甚至幾十輪連續推理，全程走云端大模型API的話，一天Token費輕松超過一頓外賣，一個月的賬單可能會非常驚人，放在端側推理支出就更加可控。

聯想AI主機mini就是這個思路，盡可能把工作搬到本地，從而大幅度降低Token的消耗。

搭載此芯P1的聯想AI主機mini支持運行本地輕量模型，可穩定承載13B–35B生產級Agent部署，外加拓展卡可支持7B-122B模型運行，遠超主流7B離線部署邊界，簡單任務可以在本地實現閉環。

同時，此芯P1針對Agent場景做了定向優化，首發搭載Ubuntu 26.04和Linux 7.0 kernel，P1的異構算力驅動、NPU調度、內存管理都在這些系統上做了深度適配。

其12核Armv9.2 CPU設計可以實現Agent執行任務時的精細化調度，在多任務并行時具有優秀的能效表現，NPU設計也能提高模型的計算效率。

在實際測試中，搭載此芯P1的聯想AI主機mini將執行復雜任務的Token消耗量降低了60%，速度提升50%-70%。

低成本推理是Agent普及的經濟前提，當推理成本降下來，Agent才可能從偶爾用一下變成日常跑在后臺。

AI硬件翻車最多的地方不是跑分低，是買回家只有一個人會用，空有強大算力，卻不能共享。傳統mini主機的開箱流程是：翻鍵鼠、找網線、插顯示器、進BIOS調試，這種操作過程本身就是一堵墻。

而聯想AI主機mini繞開了這堵墻：手機藍牙靠近自動配網，微信小程序掃碼綁定，不用接鍵鼠，不用插網線，并且可以實現多設備連接與多人共享。

老人查菜譜、小孩問作業，一臺主機放在電視柜上，全家人各用各的Agent，對著手機說話就行。

這個體驗能立住，靠芯片在底層撐起三條線：多用戶、多任務并行處理靠12核CPU的設計；一個人折騰崩了系統，獨立Recovery分區配合一鍵恢復，全家不受影響；64GB LPDDR5內存低功耗運行，帶寬高達100GB/s，能夠實現24小時待機，兼顧功耗與性能平衡。

面向家庭和中小團隊的AI主機，安全信任是另一個硬需求。此芯P1在芯片層充分利用了Arm v9.2的安全特性，包括PACBTI指針認證、MTE內存標簽擴展和Secure EL2硬件虛擬化，多人共用一臺機器跑各自的Agent，數據不串區，保證安全性。

P1還過了Arm SystemReady L6認證，這是數據中心級的硬件合規標準，主流Linux發行版可以開箱直裝。而OTA在線升級，可以讓芯片算力釋放能力隨系統迭代持續提升，買回家的硬件能夠越用越好用。

AI主機這個概念喊了兩年，但真正能讓Agent從聊天框里走出來的硬件，不是塞個大模型進機箱，也不是給PC換個殼貼個AI標簽。

芯片得在底層回答這些問題：Agent推理能不能一次處理足夠長的上下文，端側推理能否執行更多更復雜的任務，多任務并發時系統能不能穩住。

此芯P1選了Agentic Compute這條路，從芯片架構的第一行代碼開始，就為Agent推理做定向設計，通過“端云協同，端側常駐”的模式，打造為Agent而生的計算能力。

未來，評判一臺AI主機優劣的標準，將從跑分多高，逐漸變成Agent跑得省不省、穩不穩，Agentic Compute時代，AI主機的規則正在重寫。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.