无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Agent還沒來,昇騰已經把從硬件到軟件的路鋪好了

0
分享至



文 | 智能相對論

作者 | 陳泊丞

從去年開始,中國大模型能力已經追到了全球第一梯隊。MiniMax M2.5、Kimi K2.5的Token消耗量在OpenRouter上長期位居前列,DeepSeek V4也常被拿來與GPT-5對標。但很多人忽略了,這些模型之所以“能跑”,是因為現有算力底座“夠用”。

那什么時候“夠用”會不夠用呢?答案是Agent時代。而且,在這個階段,“能跑”和“跑得舒服”,又是兩碼事。

在今年的鯤鵬昇騰開發(fā)者大會2026——昇騰AI開發(fā)者峰會2026上,昇騰給出了一個更底層的量化洞察:過去一年,模型調用頻次暴漲50到100倍,序列長度從Chatbot時代的4K飆升至接近1M,相當于250倍的跨度。MoE推理對時延的要求也越來越苛刻,正從10毫秒向1毫秒級別逼近。



這不是“模型變大了”的量變問題,而是整個算力底座的底層邏輯需要被重寫的質變信號。所以,真正的問題不是“現有算力夠不夠”,而是當Agent的胃口以指數增長,不僅消耗得更多,而且創(chuàng)造的需求在井噴,那么現有算力架構的“夠用”還能撐多久?

基于這個視角,我們會發(fā)現,昇騰今年在峰會上講的三件事,即超節(jié)點架構創(chuàng)新、軟件全面開源開放、開發(fā)者體驗升級,背后的本質上都是在回答同一個問題:算力底座如何從“能跑模型”進化到“天然親和Agent”?

這不是三個獨立的議題,而是從硬件到軟件到開發(fā)者的一整條技術鏈,必須在Agent前夜完成的一次系統(tǒng)性重構。

超節(jié)點,讓幾千上百個NPU之間擰出一股更強大的力量

Chatbot時代,序列長度約4K,KVCache命中一次就夠,NPU之間的通信壓力不大,也是可控的。

但進入Agent時代,推理鏈路拉長到接近1M tokens,KVCache需要跨NPU頻繁跳躍。這時候,問題就不僅是“帶寬夠不夠”,而是一個架構級命題——NPU和NPU之間怎么通信,直接決定了系統(tǒng)能不能跑得更好。

傳統(tǒng)方案下,每個NPU掛載獨立內存,跨NPU訪問要走消息語義,也就是send/recv那一套,單次通信在微秒級。

昇騰超節(jié)點天然親和Agent負載。而判斷超節(jié)點的核心標準其實只有一個,即“是否實現了全域內存統(tǒng)一編址”。在這里,昇騰950芯片的架構創(chuàng)新,實現了SIMT與SIMD雙編程模式的一體化融合,在三件事上同時做到了這一點。

一是內存語義的革命。基于靈衢互聯協議和總線控制器,AIC/AIV通過MTE指令直接訪存遠端內存,無需拷貝。對比傳統(tǒng)以太網,在基于靈衢互聯的超節(jié)點架構下,MTE指令一個操作就能完成。其中差的不是量的優(yōu)化,而是質的重構。

二是全域內存統(tǒng)一編址。全局單一虛擬地址空間下,NPU和CPU直接用虛擬地址訪問任意位置,無需改代碼、無需路由、無需拷貝。KV Cache實現全局共享,超長上下文無縫擴展。

三是內存池化帶來的效率躍遷。通過片上內存和DDR的分層池化能力,以查代算,KV Cache查詢命中率大幅提高。在LLM、推薦、Engram等典型場景,查詢時延降低3到4倍,訓練和推理吞吐相比傳統(tǒng)集群提升3到4倍。

三層疊加,通信RTT時延壓縮到了3微秒,帶寬更是達到TB級。這才是超節(jié)點的真正價值——并非“堆更多的NPU”,而是讓每一個Token都更高效、更經濟。

所以,這次峰會給出的核心判斷很直接:互聯能力決定超節(jié)點能力,系統(tǒng)綜合性能取決于超節(jié)點規(guī)模與單芯片性能規(guī)格的乘積。那么,當互聯帶寬達到T級,超節(jié)點要做的就不是“堆更多的NPU”,而是重新定義芯片之間怎么通信。

但物理上限只是入場券。真正決定算力生態(tài)命運的,是硬件造出來之后的又一核心問題:軟件的門檻有多高?開發(fā)者真的愿意來嗎?

昇騰要走自己的路

吸引開發(fā)者的關鍵是開源,但開源這件事的底層邏輯已經變了。

過去很多硬件的所謂“開源”,是在圍墻外開一扇窗——你能看到代碼,但不能改核心層,更不能參與路線決策。

這是“開放姿態(tài)”,不是“開源生態(tài)”。為什么要計較這個區(qū)別?因為開源和“看上去開源”,打開的是兩種完全不同的生態(tài)前景。

真開源意味著開發(fā)者敢在你平臺上持續(xù)投入——代碼他能改、路線他能參與、技術迭代更新不會某天突然停止。假開源則意味著他永遠得留一條退路,做的每一行優(yōu)化都可能白費。而在Agent時代,當軟件需求開始井噴、新場景以周為單位涌現,開發(fā)者選擇哪個生態(tài)建基礎設施,本質上是信任——信任這個平臺不會因為封閉而讓他走回頭路。

所以,“開放姿態(tài)”能吸引圍觀,“開源生態(tài)”才能留住人。

因此,昇騰這次在開源開放的道路上走得更徹底,其核心不同就在于它正在構建一個完整、高效、開放的算子開發(fā)體系,讓開發(fā)者無論從哪個入口進來,都能找到自己的路徑。

追求極致性能的工程師,可以用Ascend C做細粒度控制如計算、訪存、流水,每一步都可調。同時,昇騰還推出了Tensor API、支持Host-device混合編程、新增CCU通信能力。

而注重快速創(chuàng)新的AI算法工程師,則可以用TileLang或Triton——這兩個主流開源生態(tài)接口已經實現了100%兼容,性能達到Ascend C的0.6到0.9倍,開發(fā)周期壓縮到一周。目前更支持超600個Triton算子和300個TileLang算子。

當然,想在性能和效率之間找甜點區(qū)的開發(fā)者,還可以選PyPTO。

此外,在這套多路徑算子編程體系的另一端,CANNBot 算子智能體則是把“最后一公里”也打通了。它將微架構優(yōu)化經驗融入技能庫,單個Vector算子生成僅需3小時,從生成到部署全流程1天,相比傳統(tǒng)人工開發(fā)效率提升5倍以上。同時,配合覆蓋22類典型算子的評測集以及內置了4000多個評測點的自動化驗證體系,讓開發(fā)者完全不用再從零摸索。

以上,加上AscendNPU IR編譯底座的全面開源、聯合30余家企業(yè)與高校共建的15個以上生態(tài)算子庫,昇騰正在向外界與開發(fā)者們拋出一個關鍵的橄欖枝——在這里,從零寫一個算子,已經不需要“專家身份”了。

在「智能相對論」的視角中,開源的真正分水嶺,從來不是放出了多少代碼,而是開發(fā)者能不能在昇騰上從頭寫一個算子。現在,答案開始變成了“能”。

當然,開了門是一回事,讓人留下來又是另一回事。這取決于第三個維度——開發(fā)者體驗。

開發(fā)者體驗的飛輪,已經全面轉了起來

過去一個模型從想法到部署的路徑,需要調研生態(tài)兼容性、手工適配算子、搭建驗證環(huán)境、手動量化、部署調試等,結果下來周期往往得按周來算,而且每一步都需要全方面能力,而“全方面”就意味著門檻。

但是,我們在DeepSeek-V4-Flash的昇騰實際部署中,卻看到了不一樣的路徑——1分鐘就可以完成模型狀態(tài)檢索、一天內完成適配,再經過小時級的自動驗證和量化后,30分鐘就可以輸出部署服務和模型文檔。相較于傳統(tǒng)手搓,效率提升4倍,如果考慮環(huán)境差異因素,那就遠遠不止4倍了。



這是如何做到的?不是工具變多了,是昇騰把“專家經驗”變成了“系統(tǒng)能力”。

具體來看,我們發(fā)現,有兩套機制正在驅動這個變化的實現。

第一套是Skills體系。4000多名昇騰工程師多年調優(yōu)積累的經驗、踩過的坑、驗證過的最佳實踐,在這里被結構化沉淀為200多個可調用的Skills模塊。它們兼容Claude Code、Codex、OpenClaw等主流Agent平臺,兩行命令就能調用。以前要找對人才能解決的問題,現在Skills里直接就有了。

第二套是Agentic工作流。如今,開發(fā)者只需要描述意圖,7個基礎Agent自動編排接力,調研、適配、優(yōu)化、部署全流程自動化。以前是“人找工具”,現在直接成了“工具找人”,昇騰從根本上改寫了開發(fā)者的工作范式。

以上,我們所看到的,更多是從技術層面來拉升開發(fā)者體驗。但是,若要開發(fā)者體驗的飛輪全面轉起來,或許光靠技術還不夠,昇騰又進一步給出了兩套新體驗。

一是零成本的試錯空間。一鍵自動部署、平均兩分鐘跑通首個Demo、上萬卡算力資源投放支撐開源社區(qū)——這里要解決的不僅是算力成本,更是“第一次嘗試”的心理門檻。很多開發(fā)者不是不想用新平臺,是怕花了時間還跑不通。在這里,昇騰把“試一試”的成本大幅降低,本質上就是在消除這個心理阻力。

二是可兌現的職業(yè)回報。聯合頭部互聯網企業(yè)打造三層認證體系,附帶簡歷推薦、大廠實習等權益,昇騰正在讓“我能用好昇騰”這件事本身具有商業(yè)化的職業(yè)流動性。不難想象,開發(fā)者留在一個生態(tài)里,從來不只是因為工具好用,而是因為他在這里積累的技能能換取實打實的外部回報。正視這一需求,遠比想象的要重要。

那么,這兩樣東西疊加之后,傳遞給開發(fā)者的信息就很清楚了——來昇騰,不需要從頭開始。不管是對于開發(fā)者,還是對于昇騰,飛輪已經全面轉起來了。

在超節(jié)點巔峰對話直播中,我們看到了一個來自產業(yè)端的判斷,“當智能生產軟件的方式變得更高效,人類對軟件的需求會井噴。以前的軟件太昂貴,很多需求被壓抑了。”

對應來說,Agent時代不僅在消耗更多Token,它還在創(chuàng)造過去根本不存在的新需求——軟件不再是標準化產品的復用,而是每個人、每個場景的即時定制。這種需求一旦釋放,對算力的渴求不再是線性的,而是爆炸式的。正如Anthropic聯創(chuàng)Jack Clark的判斷,2028年Agent可能進入自主進化,屆時Token消耗將進入非線性增長通道。



兩條線指向同一個結論,Agent時代的到來是不能等的。你不可能等Agent全面爆發(fā)之后再補架構的課、開軟件的源、降開發(fā)者的門檻——那相當于堵車的時候才開始修路。

因此,回過頭來看昇騰在峰會上鋪開的三件事,本質上是對這一判斷的三重回應。

首先,超節(jié)點重新定義了NPU之間的通信范式,讓Agent時代的算力消耗不再被延遲墻鎖死。這里為Agent時代打好硬件基礎。

其次,CANN的多路徑算子編程體系加CANNBot,讓任何一個開發(fā)者都能在昇騰上從零寫出高性能算子。這里為Agent時代夯實軟件能力。

最后,Skills體系和Agentic工作流,把4000個工程師的經驗打包成每個新手的起點。這里為開發(fā)者們鋪好“好用易用”的路徑。

三道能力疊加在一起,也就解釋了昇騰今天要做的事,不是在應對當下,而是在對標一個還沒到眼前、但已經在路上的Agent時代。

*本文圖片均來源于網絡

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
52歲挪威王妃肺纖維化,只剩一年壽命卻得不到同情:黑歷史太多了

52歲挪威王妃肺纖維化,只剩一年壽命卻得不到同情:黑歷史太多了

毒舌小紅帽
2026-06-11 19:15:07
一對黃埔兄弟:陳賡被捕宋希濂冒死相救,宋希濂被俘陳賡千里探望

一對黃埔兄弟:陳賡被捕宋希濂冒死相救,宋希濂被俘陳賡千里探望

北海史記
2026-06-12 06:38:55
北京高考結束,北京四中考點考生:計劃考駕照、學跳舞、逛蘇州

北京高考結束,北京四中考點考生:計劃考駕照、學跳舞、逛蘇州

極目新聞
2026-06-10 19:19:22
1982年,王震稱阮銘違背四項基本原則,道德敗壞,陳云:開除黨籍

1982年,王震稱阮銘違背四項基本原則,道德敗壞,陳云:開除黨籍

新一說史
2026-06-12 07:17:44
中國這次一毛錢都沒給!菲律賓大地震,馬科斯把援助作沒了!

中國這次一毛錢都沒給!菲律賓大地震,馬科斯把援助作沒了!

通鑒史智
2026-06-12 09:54:30
A股:全體股民做好心理準備了,今天6.12,A股或將再次歷史重演!

A股:全體股民做好心理準備了,今天6.12,A股或將再次歷史重演!

趨勢清風俠
2026-06-12 07:24:00
女兒對快百歲父親說:爸,你活的日子太長了,我媽應該來把你帶走

女兒對快百歲父親說:爸,你活的日子太長了,我媽應該來把你帶走

烙任情感
2026-06-11 08:52:20
現貨黃金漲3.44%

現貨黃金漲3.44%

每日經濟新聞
2026-06-12 05:38:05
和平統(tǒng)一方案公布,國臺辦:統(tǒng)一后“臺獨”戰(zhàn)爭風險徹底清除

和平統(tǒng)一方案公布,國臺辦:統(tǒng)一后“臺獨”戰(zhàn)爭風險徹底清除

今夜繁星墜落
2026-06-10 19:25:39
電梯一吻蒸發(fā)500億!選美冠軍實名爆料:我被富豪圈用完即棄

電梯一吻蒸發(fā)500億!選美冠軍實名爆料:我被富豪圈用完即棄

未曾青梅
2026-06-10 17:24:11
杭州市拱墅區(qū)政協黨組成員、副主席吳偉接受杭州市紀委監(jiān)委紀律審查和監(jiān)察調查

杭州市拱墅區(qū)政協黨組成員、副主席吳偉接受杭州市紀委監(jiān)委紀律審查和監(jiān)察調查

都市快報橙柿互動
2026-06-11 17:32:30
淚崩!廣東一工廠停產通知,稱面臨嚴重虧損,依法補償并推薦就業(yè)

淚崩!廣東一工廠停產通知,稱面臨嚴重虧損,依法補償并推薦就業(yè)

火山詩話
2026-06-11 20:41:11
原子彈轟炸日本始末:扔第一顆日本并未屈服,曾與美國進行了對賭

原子彈轟炸日本始末:扔第一顆日本并未屈服,曾與美國進行了對賭

文史達觀
2026-06-03 17:04:23
餓死人就開戰(zhàn)?菲律賓司令撂狠話威脅,中國會撤出仁愛礁?

餓死人就開戰(zhàn)?菲律賓司令撂狠話威脅,中國會撤出仁愛礁?

萬物知識圈
2026-06-11 12:03:52
5個月神話破滅!Donut Lab固態(tài)電池被實錘造假背后:從未實際生產過電池電芯,固態(tài)電池產業(yè)化仍需五到十年

5個月神話破滅!Donut Lab固態(tài)電池被實錘造假背后:從未實際生產過電池電芯,固態(tài)電池產業(yè)化仍需五到十年

每日經濟新聞
2026-06-11 16:39:10
法國還是最大熱門 但格里茲曼帶走了說明書

法國還是最大熱門 但格里茲曼帶走了說明書

溫柔且自由
2026-06-12 00:09:47
成績或取消?女生開考50分鐘后填錯答題卡,監(jiān)考老師:快嚇死了!

成績或取消?女生開考50分鐘后填錯答題卡,監(jiān)考老師:快嚇死了!

林林先生
2026-06-12 09:29:37
中建八局罕見“雙董事長”配置!

中建八局罕見“雙董事長”配置!

新浪財經
2026-06-11 23:09:44
美軍炸急眼了,伊朗水庫被炸:俄伊生命線打通,強援火速抵達伊朗

美軍炸急眼了,伊朗水庫被炸:俄伊生命線打通,強援火速抵達伊朗

涼羽亭
2026-06-12 09:37:00
2年凈賺5,600萬英鎊!美國華裔億萬富翁在倫敦的老莊園贏麻了!

2年凈賺5,600萬英鎊!美國華裔億萬富翁在倫敦的老莊園贏麻了!

英國那些事兒
2026-06-11 23:03:18
2026-06-12 11:03:00
智能相對論 incentive-icons
智能相對論
智能和車,邊評邊測;未來和家,且品且鑒
2558文章數 2412關注度
往期回顧 全部

科技要聞

SpaceX IPO募資750億美元,馬斯克身家萬億

頭條要聞

含精神藥品釣魚餌料熱銷 部分漁獲被消費者買回家

頭條要聞

含精神藥品釣魚餌料熱銷 部分漁獲被消費者買回家

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

與熱巴戀情曝光1天,陳飛宇現身

財經要聞

“員工不值這么多錢”引爭議 胖東來回應

汽車要聞

佟湘北:全新smart#6 自成一派好看更好開

態(tài)度原創(chuàng)

教育
旅游
健康
公開課
軍事航空

教育要聞

福建這4所大學,不是“雙一流”,卻是本地就業(yè)的硬通貨

旅游要聞

千里大別山,一杯迎駕酒

為什么不建議晚上吃粽子?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版