henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
DeepSeek V4發(fā)布,比模型本身更受關(guān)注的,是一個(gè)根本性的轉(zhuǎn)變:
國產(chǎn)算力生態(tài)正在從過去“芯片被動(dòng)適配模型”的單向奔赴,邁向“芯模協(xié)同”的新階段。
之前,昇騰與不少模型進(jìn)行過協(xié)同探索,但V4是第一次在大規(guī)模、高強(qiáng)度、工程化的尺度上,驗(yàn)證了這種“芯模協(xié)同”的可行性與效率。
而這,恰恰是過去CUDA+英偉達(dá)體系最深的一層護(hù)城河——
模型、框架、芯片在長周期中的共同演化。
昇騰正在補(bǔ)的,不是某一行代碼,而是這十多年的時(shí)間。
但與此同時(shí),更大的變化也正在鯤鵬昇騰開發(fā)者生態(tài)里發(fā)生。
過去一年,金融、科研、AI訓(xùn)練等領(lǐng)域,越來越多團(tuán)隊(duì)開始把核心業(yè)務(wù)遷移到鯤鵬昇騰上;越來越多開發(fā)者開始參與到底層能力、框架適配和社區(qū)共建里。
這些案例或許沒有V4那樣的傳播聲量,卻和V4一起,共同構(gòu)成了鯤鵬昇騰生態(tài)真正的變化。它們最終都在指向同一件事:
鯤鵬昇騰,正在慢慢越過“能用”那條線。
而這一點(diǎn),在剛剛結(jié)束的鯤鵬昇騰開發(fā)者大會(huì)2026開發(fā)者圓桌上,也被不少一線開發(fā)者反復(fù)提到。
![]()
圓桌上,中科院計(jì)算所副研究員、B站UP主石侃(老石談芯),與來自各個(gè)領(lǐng)域的開發(fā)者團(tuán)隊(duì),共同分享了各自在鯤鵬昇騰上的實(shí)戰(zhàn)經(jīng)驗(yàn)。
他們做的方向雖然并不相同,但最后,幾乎所有人的結(jié)論都指向以下幾個(gè)方向:
- 鯤鵬、昇騰讓我們看到,中國自己的算力平臺(tái),已經(jīng)可以成為業(yè)務(wù)首選。
- CANN在2024年初還是幼兒期,現(xiàn)在已經(jīng)更像青年期了。
- 國產(chǎn)算力是潮流,先用起來。
CANN生態(tài)邁向好用易用
過去一年,鯤鵬昇騰生態(tài)進(jìn)入了一輪高密度迭代。
用論壇上陳秋武老師的話理解,就是CANN以前是幼兒期,現(xiàn)在是青年期了。
所謂“青年期”,不是說生態(tài)已經(jīng)成熟,而是開發(fā)者開始脫離“廠商保姆式支持”,能自己解決問題、貢獻(xiàn)代碼、推動(dòng)迭代。
目前為止,65個(gè)源碼倉完成分層解耦,超節(jié)點(diǎn)架構(gòu)正式落地,70余款主流大模型做到發(fā)布即適配。
對很多開發(fā)者來說,CANN也開始從“廠商工具鏈”變成一個(gè)真正可參與、共創(chuàng)的開源生態(tài)。
上個(gè)月DeepSeek V4發(fā)布時(shí)的芯模協(xié)同,就是這一輪變化最集中的一次展示。
而在剛剛結(jié)束的圓桌上,開發(fā)者們給出的反饋則更直接:
在鯤鵬昇騰上干活的體感,確實(shí)變了。
![]()
變在哪?圓桌上大家指向了三件事:適配效率性能天花板生產(chǎn)級信任
適配效率
眾所周知,芯片決定的是算力上限,生態(tài)決定的,才是算力能不能真正釋放出來。
沒有生態(tài),再強(qiáng)的硬件也只是能點(diǎn)亮。開發(fā)者依然會(huì)卡在算子不支持、框架遷移困難、集群調(diào)度復(fù)雜這些細(xì)節(jié)里。
這也是此前很多開發(fā)者不愿遷移、或者遷不動(dòng)的原因。
而這件事,正在發(fā)生變化。
AIGCode分享了自己加入昇騰生態(tài)的原因。創(chuàng)始人陳秋武在圓桌上沒藏著:
說實(shí)話,一開始是因?yàn)楦F。2024年初沒有卡,我們是創(chuàng)業(yè)小公司。
用起來之后,變化來得比預(yù)想快
![]()
早期在昇騰上做MoE預(yù)訓(xùn)練,適配自研網(wǎng)絡(luò)結(jié)構(gòu)給華為提工單,排期需要三到四個(gè)月
到下一代上,同樣的問題自己就能動(dòng)手解決,不用排隊(duì)了。
更讓陳秋武感到震驚的,是CANN生態(tài)補(bǔ)齊的速度。
他回憶,2024年初團(tuán)隊(duì)第一次在昇騰硬件上做7B級預(yù)訓(xùn)練時(shí),整個(gè)生態(tài)“幾乎是一片荒漠”,很多基礎(chǔ)能力都還缺著。
但僅僅過了8個(gè)月,再回頭看時(shí),整個(gè)CANN生態(tài)的覆蓋率已經(jīng)做到80%到90%。
從“很多東西都沒有”,到主流能力基本補(bǔ)齊,速度快得讓他都覺得意外。
類似的變化,也出現(xiàn)在其他團(tuán)隊(duì)身上。
清華的王一鳴把氣象模型遷移到鯤鵬,Load幾個(gè)庫就能跑基線版本,他表示:
開源以后,我們能更充分地學(xué)習(xí)業(yè)界的優(yōu)秀實(shí)踐,在此基礎(chǔ)上進(jìn)行適配和優(yōu)化,也能將一些好的經(jīng)驗(yàn)應(yīng)用到自己的項(xiàng)目中。
![]()
中科大團(tuán)隊(duì)遷移高性能計(jì)算求解器到鯤鵬,編譯層面不到一周搞定
團(tuán)隊(duì)的陳俊仕說,碰到的問題更多是編譯器版本、環(huán)境配置這類工程細(xì)節(jié),跟架構(gòu)本身關(guān)系不大。
這其實(shí)是一個(gè)很重要的信號。
四個(gè)團(tuán)隊(duì),四種完全不同的場景,呈現(xiàn)出同一種趨勢:開發(fā)過程中問題的解決已經(jīng)不依賴廠商貼身服務(wù)了。
這就意味著,國產(chǎn)算力最難的階段,可能已經(jīng)過去了。
性能天花板
適配只是第一步。真正決定開發(fā)者會(huì)不會(huì)留下來的,還是性能。
AIGCode在昇騰上,把MoE模型預(yù)訓(xùn)練的MFU(算力利用率)做到了65%。這個(gè)數(shù)字,已經(jīng)接近行業(yè)平均水平的兩倍。
換句話說,同樣一張卡,真正干活的時(shí)間更多了。
![]()
陳秋武在圓桌上的說法很直接:
一張卡,能頂兩張用。
而支撐這一效率的關(guān)鍵之一,是昇騰超節(jié)點(diǎn)。
預(yù)訓(xùn)練進(jìn)入千卡時(shí)代后,真正困難的已經(jīng)不再只是單卡性能,而是大規(guī)模集群下的通信與調(diào)度效率。
昇騰超節(jié)點(diǎn)通過統(tǒng)一內(nèi)存編址和高速互聯(lián),把原本復(fù)雜的異構(gòu)通信進(jìn)一步抽象化,降低了大規(guī)模訓(xùn)練的系統(tǒng)復(fù)雜度。
AIGCode能做到65%的MFU,背后一個(gè)重要支撐就在這里。
開源降低了底層開發(fā)門檻,同構(gòu)架構(gòu)減少了遷移復(fù)雜度,而超節(jié)點(diǎn)則進(jìn)一步解決了大規(guī)模擴(kuò)展的問題。
它把通信與計(jì)算之間的并行掩蓋做得更深,讓流水線盡可能保持滿載運(yùn)行,減少不同設(shè)備之間的等待和空耗。
最終,在千卡級集群場景下,整體負(fù)載率被拉到很高,用相對有限的算力,完成了更多有效計(jì)算。
另一邊,中科大團(tuán)隊(duì)則基于鯤鵬研發(fā)了面向高性能計(jì)算的新型LU求解器。
LU分解是最基礎(chǔ)的矩陣操作,所有涉及矩陣的科學(xué)計(jì)算場景都離不開它,優(yōu)化LU分解就是在底層優(yōu)化所有科學(xué)計(jì)算問題。
通過算法與硬件協(xié)同設(shè)計(jì),把原本不規(guī)則的計(jì)算重構(gòu)為規(guī)則稠密計(jì)算,優(yōu)化后求解器相比傳統(tǒng)方法實(shí)現(xiàn)平均40多倍加速,部分場景接近200倍。
65%、40倍、200倍。
幾個(gè)看似分散的數(shù)據(jù)背后,其實(shí)對應(yīng)的是同一件事:鯤鵬昇騰正在從“能跑”走向“好用”,生產(chǎn)級能力開始成型。
生產(chǎn)級信任
比性能更難跨過去的,其實(shí)是信任。
這次,一家頭部股份制銀行已經(jīng)把AI直接推進(jìn)了核心風(fēng)控流程。大模型與小模型混合架構(gòu),開始介入資金流轉(zhuǎn)和風(fēng)險(xiǎn)決策。
現(xiàn)場公布的數(shù)據(jù)也很硬:
首Token響應(yīng)500毫秒、日均260億Token、可用性99.999%、全年故障時(shí)間不超過1分鐘,四項(xiàng)金融級指標(biāo)全部達(dá)標(biāo)。
但比性能指標(biāo)更重要的是,他們開始愿意把核心業(yè)務(wù)真正放上去了。
而背后的關(guān)鍵變化之一,是CANN開源之后,整個(gè)系統(tǒng)終于不再是黑盒。
開發(fā)者不再只能“提需求、等適配”,而是可以真正參與到底層能力建設(shè)里。甚至連金融行業(yè)這樣的傳統(tǒng)非算子開發(fā)者,也開始向社區(qū)貢獻(xiàn)特性。
鄭老師在現(xiàn)場提到一句很關(guān)鍵的話:
開源之后,小問題我們自己隨時(shí)能修,大問題可以和社區(qū)一起討論。對整個(gè)方案更有把握,而不是在用一個(gè)黑盒子。
對于很多企業(yè)來說,性能從來不是唯一門檻。
真正決定他們敢不敢上生產(chǎn)環(huán)境的,是系統(tǒng)是否可見、可控、可維護(hù)。
打造開源開放的開發(fā)者生態(tài)
開發(fā)者的這些體感變化不是憑空而來的,背后是華為在開源開放上的一次關(guān)鍵選擇。
去年8月,CANN啟動(dòng)全面開源;12月底,編譯器、運(yùn)行時(shí)等核心代碼全量上線。
![]()
過去,開發(fā)者遇到問題,很多時(shí)候只能提工單、等版本更新。
而開源之后,運(yùn)行時(shí)、算子編譯等核心模塊逐步解耦,開發(fā)者開始能真正參與到底層迭代里。
AIGCode從“排隊(duì)三個(gè)月”到“自己動(dòng)手解決”,背后的變化就在這里。
股份制銀行這類非典型算力開發(fā)者愿意參與的原因,也在這里。
更關(guān)鍵的是,CANN開始逐步兼容主流AI生態(tài)。70余款主流大模型做到發(fā)布即適配,開發(fā)者不用改變原有開發(fā)習(xí)慣,就能直接調(diào)用昇騰的硬件能力。
這正如會(huì)上石侃談到的,向上,兼容主流計(jì)算框架;向下,屏蔽硬件的復(fù)雜度和差異性。
而這種兼容的背后,是CANN在底層做了大量重構(gòu)——
提供豐富的算子庫、敏捷的開發(fā)工具鏈,以及全方位的開發(fā)者支持,大幅降低了算力使用門檻。
當(dāng)然,生態(tài)不能只靠一方使勁。
開發(fā)者每一次正向反饋、每一個(gè)優(yōu)化結(jié)果、每一個(gè)創(chuàng)新應(yīng)用,都能通過昇騰和華為的生態(tài)快速走向產(chǎn)業(yè)界,形成技術(shù)、商業(yè)、生態(tài)的完整閉環(huán)。
還有個(gè)有趣的細(xì)節(jié)是,Agent也在降低生態(tài)的門檻,陳秋武提到:
過去很多重復(fù)性的適配工作,現(xiàn)在已經(jīng)開始被Agent自動(dòng)完成。生成代碼、給出示例、自動(dòng)搭建環(huán)境,很多過去需要啃文檔的流程,被壓縮到了半小時(shí)以內(nèi)。
工具鏈在變化,開發(fā)方式本身也在變化。
飛輪轉(zhuǎn)起來了
說到底,比性能和適配更重要的變化,可能是生態(tài)方向開始變了。
在鯤鵬昇騰社區(qū)里,開發(fā)者不再只是“被動(dòng)適配”,而是開始主動(dòng)貢獻(xiàn)。
圓桌上,某頭部股份制銀行分享其已經(jīng)向多個(gè)社區(qū)累計(jì)貢獻(xiàn)上百個(gè)特性,其中僅向vLLM-Ascend就貢獻(xiàn)了34項(xiàng)優(yōu)化,而且不限于金融場景,全行業(yè)都能復(fù)用。
作為較早投入昇騰生態(tài)的創(chuàng)業(yè)團(tuán)隊(duì),AIGCode則從2024年起便持續(xù)參與社區(qū)共建,并貢獻(xiàn)了不少核心代碼。
一家十幾人的創(chuàng)業(yè)公司,愿意長期往別人的生態(tài)里投入研發(fā)資源,背后的邏輯其實(shí)很簡單:
他們開始相信,這條路會(huì)成為主流,而這些貢獻(xiàn),又反過來加速了整個(gè)生態(tài)閉環(huán)。
硬件托住模型,模型落進(jìn)產(chǎn)品,產(chǎn)品再反哺生態(tài)。
AIGCode在昇騰上做出65%的預(yù)訓(xùn)練效率后,很快推出了自己的智能編程工具,用戶只需要輸入提示詞,15分鐘就能生成一套完整系統(tǒng)。
清華則聯(lián)合其他高校和科研單位在鯤鵬上跑出了戈登貝爾級別的科研成果。
這條閉環(huán),已經(jīng)不局限于來分享的幾個(gè)明星團(tuán)隊(duì)身上。
今年2月,智譜GLM-5開源,昇騰完成Day 0適配;4月,DeepSeek V4發(fā)布,不僅是Day 0適配,更是更深入的芯模協(xié)同。
截至目前,鯤鵬開發(fā)者已經(jīng)超過415萬,昇騰開發(fā)者超過410萬,openEuler裝機(jī)量超過1600萬套
數(shù)字當(dāng)然重要,但比數(shù)字更值得關(guān)注的,是生態(tài)開始出現(xiàn)“自增長”。
當(dāng)創(chuàng)業(yè)公司開始主動(dòng)貢獻(xiàn)代碼,當(dāng)銀行愿意把核心風(fēng)控放上去,當(dāng)高校開始把關(guān)鍵科研項(xiàng)目跑在上面,飛輪就已經(jīng)不再只靠華為一家推動(dòng)了。
當(dāng)被問及用昇騰一年多最大的感受時(shí),陳秋武提到:
參與進(jìn)來的,已經(jīng)不只是科技公司了。
高校、金融、AI大模型行業(yè),以及越來越多不同領(lǐng)域的團(tuán)隊(duì),都開始進(jìn)入這個(gè)生態(tài),從用戶變成生態(tài)貢獻(xiàn)者。這些“非典型”開發(fā)者的加入是國產(chǎn)算力走向“易用好用”最直觀的信號。
而中科大的陳俊仕,則給了現(xiàn)場開發(fā)者一句非常直接的建議:
趕緊用。
可以說,從“能跑”到“有人長期建設(shè)”,從“廠商推動(dòng)”到“生態(tài)自增長”,華為算力生態(tài),正在進(jìn)入新的階段——
一個(gè)成熟的國產(chǎn)算力生態(tài)正在成型。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.