无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

昇騰「減負」、鯤鵬「鋪路」:中國計算產業生態如何填平開發者的「踩坑」時代?

0
分享至

一個算力生態從“能用”到“好用易用”,中間隔著什么?

過去幾年,國產AI算力行業長期存在一種割裂:硬件參數不斷刷新,但是當開發者真正落地時,大量時間卻依然消耗在環境配置、異構遷移、算子適配和反復踩坑上。

隨著大模型訓練進入千卡級協同、科學計算走向長周期穩定運行,這種割裂的代價被進一步放大了——開發效率本身,開始成為衡量算力平臺競爭力的重要指標。

在最近的鯤鵬昇騰開發者圓桌上,一個很有意思的現象是,無論是做高性能計算的清華團隊和中科大團隊,還是做大模型預訓練的AIGCode,他們談論最多的,都不是芯片參數,而是開發效率。

有人提到,過去遷移異構平臺往往需要幾個月,現在一周就能完成;有人提到,過去大量時間被消耗在硬件適配、環境配置和反復踩坑上,現在終于能把精力重新放回算法本身;還有人提到,過去很多問題必須等待廠商排期解決,現在開發者自己就能在社區里找到方案,甚至直接參與生態共建。

這些變化看似零散,但背后其實指向同一件事:鯤鵬昇騰生態,正在從“能用”進入“好用易用”的新階段。

衡量“好用易用”的標準,從來不是發布會上的參數表,而是開發者實際感知到的工程摩擦是否正在減小。也正是在這個意義上,這些開發者的體驗,成為觀察國產算力生態演進的一組關鍵樣本。

當算法創新卡在工程的“坑”里

過去幾年,AI行業出現了一個越來越明顯的變化:模型迭代越來越快,決定落地速度的關鍵,正從算法轉向算力基礎設施的工程能力。尤其在高性能計算領域,這種變化被進一步放大。

清華大學地球系統模擬團隊對此深有體會。

他們所做的工作,是用AI替代傳統大氣模擬中的經驗估算環節,把全球大氣模擬分辨率推進至公里級,讓極端天氣的模擬精度真正逼近實用價值。

這個方向的科學價值毋庸置疑,但問題在于:當分辨率提升一個量級之后,背后對應的計算復雜度,往往會呈指數級增長。

大氣模擬本質上是一個超長時間連續積分過程,一次完整計算往往持續數天甚至更久,中間任何一次軟硬件異常,都可能導致整個任務重來。相比互聯網業務里常見的“失敗重試”,科學計算更像是在一根極長的鋼絲上行走——很多任務沒有“回滾重開”的余地。

更復雜的問題來自精度。

一個氣候結果的背后,可能是數億次浮點運算的累計結果。單次誤差或許微不足道,但經過長時間迭代之后,誤差會像滾雪球一樣被不斷放大。

這也是為什么高性能計算領域始終強調混合精度、數值穩定性、通信一致性。

但相比計算本身,更隱蔽的消耗,其實來自工程生態的不成熟

過去很長一段時間里,國內算力生態整體仍處于早期階段,硬件迭代速度遠快于軟件生態成熟速度。很多平臺雖然已經能用,但開發工具鏈、編譯器、異構調度、通信框架以及社區經驗仍不完善,科研團隊很難從一開始就完成系統級優化。

于是,大量團隊只能先讓程序“跑起來”,再進入漫長的適配和調優階段。

這意味著,科學研發與工程優化長期處于割裂狀態:先解決科學問題,再回頭填工程的坑。

代價是巨大的:團隊大量精力被消耗在底層環境適配與反復踩坑上,真正的算法創新卻始終處于一種“排隊等待”的狀態。

鯤鵬如何將開發者從“填坑”里解放出來

"鯤鵬讓科研者的精力回到科研本身,不用在硬件適配上反復踩坑。"這是清華團隊王一鳴對鯤鵬最直接的評價。

這句話背后,其實對應著一種開發理念的轉變:團隊不再遵循“先解決科學問題,再做性能優化”的傳統模式,而是在代碼設計階段就開始將硬件特性、并行方式一并納入考量——科學研發與工程優化,從“前后接力”變成了“并行推進”。

理念轉變的前提,是平臺本身能把“坑”填平。

過去很長時間里,高性能計算平臺最大的難點之一,就是軟件生態的碎片化。很多科研團隊遷移代碼時,耗時往往不在算法,而在底層依賴適配:編譯鏈重配、通信庫重裝、指令集兼容、框架重寫,一層套一層。

而鯤鵬做了一件很關鍵的事情——盡可能保持開發環境的連續性。

王一鳴表示,很多主流氣象軟件和依賴庫在鯤鵬平臺上的兼容度已經很高,“加載幾個庫基本就能跑”,大量代碼不需要大規模重構,就能完成初步遷移。

這種差異,在中科大團隊身上體現得更加明顯。

研究員陳俊仕提到,過去遷移到異構平臺,周期往往以月為單位,遷移完成后還要重新做性能優化,但遷移到鯤鵬平臺,一周左右就能完成。

遷移效率差異的背后,本質上是開發復雜度的差異。

目前主流高性能計算系統采用CPU+GPU異構模式,多套指令集并存,開發者往往需要不斷處理CPU與加速器之間的數據搬運與協同問題。很多時候,一個原本只占較少耗時的CPU函數,在應用遷移到GPU后,可能會迅速成為新的性能瓶頸,開發者不得不反復重構并行邏輯。

而鯤鵬選擇了盡可能降低這種異構復雜性,將更多性能釋放建立在通用計算架構之上。對于開發者而言,變化最直接的一點是:大量原有代碼無需重寫就能直接運行,工作的重心開始從“搬運代碼”重新回到“性能調優”。

這種變化,最終轉化為了更實際的性能收益。

陳俊仕提到,通過構造更大的矩陣塊,并結合NUMA(非同一內存訪問)感知的內存分配策略,團隊的新算法相比傳統方法實現平均40多倍加速,部分場景接近200倍。

而對于氣象科學這類高精度、長周期計算場景,這種“少踩坑”的意義更加明顯。

清華團隊遷移到鯤鵬后,最直觀的感受之一,就是大規模長周期作業的穩定性顯著提升,斷點續跑機制也更加成熟。

此外,鯤鵬還提供了適配主流氣象開發語言的編譯器、數學庫和性能調優工具,讓團隊能夠在一個體系完整、反饋高效的平臺上快速調試參數、驗證模型。當底層計算的可靠性有了保障,研究人員就不再需要反復排查計算誤差的來源,而是能夠把更多精力重新放回模型本身。

社區的成熟度也在同步降低這種開發的阻力。在鯤鵬生態中,大部分常見問題都能從社區資料中找到可復用的經驗;更復雜的問題,社區工程師的響應速度也足夠快,開發者終于不用再長期陷在底層工程細節里。

當開發者不再被硬件適配消耗,性能優化的重心,也開始重新回到算法創新本身。

不過,鯤鵬在做的事情,并不只是解決"當下"的問題。

當AI基礎設施的戰場從"模型訓練"向"Agent規模化落地"遷移,Token與內存消耗、沙箱啟動速度、多Agent協同時的數據安全正在成為Agent進入產業場景之前的新一道"基礎設施門檻"。

鯤鵬超節點架構的設計,恰好為這一趨勢提供了系統級支持。基于靈衢互聯,超節點通過大帶寬、低時延把分散的服務器集群組織成統一協同的計算系統——Token開銷可降低約50%,沙箱百毫秒級啟動,基于CCA架構的機密計算則補上安全側的短板。開發者不需要切換一套工具鏈,就能從大模型訓練直接走到Agent部署。

昇騰正在把“堆卡”變成系統工程

如果說鯤鵬解決的是“讓開發者少被遷移與適配消耗”,那么昇騰面對的,則是另一個更復雜的問題:當大模型訓練進入千卡級協同之后,算力競爭開始從“有沒有卡”,轉向“能不能把卡真正跑滿”。

2024年初,AIGCode團隊的陳秋武在昇騰上一代產品上做大模型預訓練時,整個CANN生態在他眼中還是一片“荒漠”——算子覆蓋率低,自研網絡結構的適配需要排期三到四個月,團隊不得不投入大量精力去填補生態的空白。

但這種變化的速度,比他們預想得更快。

大約8個月后,CANN生態覆蓋率已經從不足三成躍升至80%到90%,“這個迭代速度讓我非常驚訝”,陳秋武直言。

再到現在,問題已經變成“第一可解,第二不用排期,自己技術范圍內就能解決”。他給出了一個形象的比喻:“2024年初是嬰兒期,現在有點像青年期。”

如今,AIGCode團隊已經在昇騰平臺完成了MoE模型預訓練優化,算力利用率達到65%,接近行業平均水平的兩倍。

用陳秋武的話說,“一張卡可以當兩張卡用”。

而65%這個數字,是用系統工程優化換來的,而非堆卡堆出來的。

陳秋武拆解了這背后的路徑:核心在于通信與計算的協同調度。依托昇騰超節點架構,團隊能夠將千卡級集群的通信與計算指令做到精細的并行掩蓋,最大限度壓縮芯片空閑窗口;同時為實現裝滿瓶子,先遵循“大的塊MHA先裝到瓶子里,再用小的塊GDN填滿”的方法,結合in_proj、激活函數等小算子做融合,最后QKV重組零拷貝。進一步提升計算資源利用率。

而這背后,對應的正是CANN生態工程能力的快速成熟:預置1500余個基礎算子與100余個融合算子,提供Ascend C、PyPTO等多種算子編程范式,并兼容Triton、TileLang等業界主流編程框架,深度對接90余家主流開源社區,實現70余款國內外主流大模型發布即適配;同時生態加大對開發者激勵的投入,設立2000萬生態創新激勵基金,扶持算子、加速庫等領域創新探索,投放10000卡算力資源,保障開源社區開發者的算力需求,從工具、算力到資金,共同構成了一條從“可用”走向“好用易用”的演進路徑。

對此,圓桌主持人石侃表示:"CANN并不只是一個冷冰冰的組件,而是已經成為了連接極致硬件和開發者無窮創造力的紐帶和橋梁。"向上兼容主流計算框架、向下屏蔽硬件復雜度,讓開發者用自己最熟悉的方式跑出最極致的性能——這正是CANN迭代至今最核心的設計哲學。

更重要的是,當這些技術能力開始轉化為開發者可感知的體驗時,一個更深層的變化開始出現:開發者不再只是生態的“使用者”,而是開始成為“共建者”。


從“用”到“建”:國產算力走向自我驅動

當開發者開始往生態里寫代碼,而不僅僅是跑代碼時,事情就變了。

清華大學、AIGCode、中科大——這些團隊不再只是跑模型、調參數,而是開始往生態里寫代碼、填坑、修路。

清華團隊將基于鯤鵬平臺的項目經驗沉淀為行業參考,為鯤鵬社區貢獻了氣象科學計算領域的最佳實踐;AIGCode則持續推進國產算力與自研模型之間的深度協同,希望打通從底層算力到模型訓練的完整鏈路。

要知道,氣象模擬與高性能科學計算,向來是算力平臺能力的壓力測試場——長周期、高精度、對穩定性幾乎零容忍,在對芯片的要求上,處于金字塔最靠近塔尖的位置。

這類團隊的選擇,歷來不看發布會,只看能不能在最苛刻的場景下穩定交付。他們現在不僅"用",還開始往生態里"建",本身就是一種比任何評測數據都更有分量的背書。

而這,也正是一個生態開始自我驅動的標志。

截至目前,鯤鵬開發者已超過415萬,合作伙伴超過7000家,解決方案認證超過27000個;昇騰開發者超過410萬,合作伙伴超過3000家,解決方案認證超過6700個。這些數字背后,是無數個"清華團隊"、"中科大團隊"和"AIGCode"們每一次工程經驗、優化能力與代碼資產的持續沉淀。

衡量生態是否真正繁榮的標準,不只是開發者數量夠不夠多,更重要的是,是否有越來越多開發者愿意把自己的工程經驗、優化能力與代碼資產持續沉淀進生態之中。

當生態的飛輪真正轉動起來,開發者的每一次共建都在反哺生態,降低后來者的門檻,鯤鵬、昇騰的計算產業生態也隨之繁榮起來。

在圓桌接近尾聲時,有人提了一個問題:如何用一句話概括你們選擇國產算力平臺的理由?

幾位開發者給出了各自不同的答案,但有一種共同的底色:不是沒有選擇,而是用過之后發現值得選。

一個算力生態真正走向成熟,或許不會在某一次發布會上被宣告,而是悄悄發生在開發者決定下次還選它的那一刻。

當越來越多的清華、中科大、AIGCode們把自己的代碼、經驗和判斷押注在同一套生態之上,這場從"能用"到"好用易用"的轉變,或許就已經越過了最難的那段坡。

雷峰網雷峰網

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
黑子們真的知道華為發布“韜定律”意味著什么嗎?

黑子們真的知道華為發布“韜定律”意味著什么嗎?

阿爾法34號
2026-05-30 09:04:45
鄭強教授曾直言:全世界沒有一個國家,像中國現在孩子這么瘋的!

鄭強教授曾直言:全世界沒有一個國家,像中國現在孩子這么瘋的!

不甜的李子
2026-05-31 17:05:17
德甲冠軍頒獎!樊振東奪MVP,全隊高舉獎杯合影,退場與隊友暢聊

德甲冠軍頒獎!樊振東奪MVP,全隊高舉獎杯合影,退場與隊友暢聊

籃球資訊達人
2026-05-31 22:45:36
趙海燕兒子大婚,兒媳漂亮長得像混血兒,大姑閆學晶未出席婚禮

趙海燕兒子大婚,兒媳漂亮長得像混血兒,大姑閆學晶未出席婚禮

TVB的四小花
2026-05-31 17:16:46
襄陽割四賠五新后續:大批麥客連夜撤走,當地部門緊急出手整改

襄陽割四賠五新后續:大批麥客連夜撤走,當地部門緊急出手整改

奇思妙想草葉君
2026-05-31 23:01:42
竇驍媽媽驚現神級氣質!對比何超蓮媽媽,網友:婆婆贏在了骨相里

竇驍媽媽驚現神級氣質!對比何超蓮媽媽,網友:婆婆贏在了骨相里

一盅情懷
2026-05-31 14:49:21
重大歷史時刻,中國正式開啟戶籍制度改革運動

重大歷史時刻,中國正式開啟戶籍制度改革運動

楓冷慕詩
2026-05-30 12:20:17
2.39億美元就這水平,雷霆被馬刺淘汰后,切特的合同面臨嚴峻考驗

2.39億美元就這水平,雷霆被馬刺淘汰后,切特的合同面臨嚴峻考驗

好火子
2026-06-01 03:02:24
豪賭兩岸統一!黃仁勛這招"暗度陳倉",直接把美國政客看傻了

豪賭兩岸統一!黃仁勛這招"暗度陳倉",直接把美國政客看傻了

地球記
2026-05-31 00:23:43
8000公里外傳來意外之喜,這就是中國國運!美國急瘋也沒任何作用

8000公里外傳來意外之喜,這就是中國國運!美國急瘋也沒任何作用

南宗歷史
2026-05-31 20:49:48
貝克漢姆14歲哈珀笑容靈動,拎兩只11萬香奈兒,性感成熟引爭議

貝克漢姆14歲哈珀笑容靈動,拎兩只11萬香奈兒,性感成熟引爭議

譯言
2026-05-31 06:03:51
伊朗大內鬼浮出水面?美媒:要不是美以失手,內賈德早已接管伊朗

伊朗大內鬼浮出水面?美媒:要不是美以失手,內賈德早已接管伊朗

健身狂人
2026-05-30 15:23:24
馬刺尼克斯上一次打總決賽時,世界是這個樣子

馬刺尼克斯上一次打總決賽時,世界是這個樣子

年代回憶
2026-05-31 12:36:23
割四賠五讓當地農戶攔不到收割機,媒體呼吁有關部門調查此事

割四賠五讓當地農戶攔不到收割機,媒體呼吁有關部門調查此事

映射生活的身影
2026-05-31 18:49:29
NBA分析師:獨行俠已經找到了能克制馬刺隊文班亞馬的球員

NBA分析師:獨行俠已經找到了能克制馬刺隊文班亞馬的球員

好火子
2026-06-01 05:03:28
你慶幸自己看過哪本含金量極高的書?網友:顛覆了認知,再不內耗

你慶幸自己看過哪本含金量極高的書?網友:顛覆了認知,再不內耗

夜深愛雜談
2026-05-30 08:34:39
柬埔寨一名中國地產商人被殘忍殺害,生前遭控制毆打及施虐,妻子曾被綁匪索要1300多萬元贖金,警方正全力追緝涉案人士

柬埔寨一名中國地產商人被殘忍殺害,生前遭控制毆打及施虐,妻子曾被綁匪索要1300多萬元贖金,警方正全力追緝涉案人士

極目新聞
2026-05-31 18:46:21
她16歲帶病奪冠,退役后定居美國,嫁美國帥哥,如今已成大老板

她16歲帶病奪冠,退役后定居美國,嫁美國帥哥,如今已成大老板

悅君兮君不知
2026-05-31 18:13:09
告訴大家一個冷知識!我們天天吃的西紅柿,其實不是真正的西紅柿

告訴大家一個冷知識!我們天天吃的西紅柿,其實不是真正的西紅柿

椰青美食分享
2026-05-30 19:41:29
烏克蘭選手頒獎儀式上戴耳機遮眼抗議俄羅斯國歌

烏克蘭選手頒獎儀式上戴耳機遮眼抗議俄羅斯國歌

體壇觀察猿
2026-05-31 00:06:13
2026-06-01 05:52:49
雷峰網 incentive-icons
雷峰網
關注智能與未來!
69529文章數 656138關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

特朗普生日白宮辦格斗賽 近距離觀賽花超100萬美元

頭條要聞

特朗普生日白宮辦格斗賽 近距離觀賽花超100萬美元

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

朱軍退休,正義雖遲但到,女方受懲

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

時尚
家居
手機
藝術
軍事航空

梓渝:慢下來,也很好

家居要聞

云棲 舒展如流云

手機要聞

榮耀7英寸大屏手機曝光,電池繼續升級

藝術要聞

醉人的落日余輝

軍事要聞

解放軍代表質問日防衛大臣:日本何時道歉

無障礙瀏覽 進入關懷版