金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
AI圈卷到現(xiàn)在,開始建工廠了。
這不,就在剛剛,北京就開了一家,包含兩個(gè)核心組成部分:
一個(gè)是訓(xùn)練工廠:
目標(biāo)算力規(guī)模10萬P,負(fù)責(zé)把通用大模型、行業(yè)數(shù)據(jù)和算力資源放進(jìn)來,煉成金融、制造、政務(wù)、科研等行業(yè)能用的專業(yè)模型。
另一個(gè)是Token工廠:
目標(biāo)日均產(chǎn)能10萬億Token,負(fù)責(zé)把這些專業(yè)模型封裝成企業(yè)可以調(diào)用、可以計(jì)量、可以結(jié)算、可以穩(wěn)定交付的專業(yè)Token。
![]()
這便是九章云極在2026全球智算科技峰會(huì)暨九章云極戰(zhàn)略發(fā)布會(huì)上,正式拋出一個(gè)新戰(zhàn)略——AI工廠。
它聽起來點(diǎn)像把AI產(chǎn)業(yè)搬進(jìn)現(xiàn)代化工廠:前端煉模型,后端送智能。
然后中間再用DCU(1度算力)度量算力投入,用專業(yè)Token(面向業(yè)務(wù)任務(wù)的智能價(jià)值單元)度量智能產(chǎn)出,再讓業(yè)務(wù)數(shù)據(jù)回流,繼續(xù)推動(dòng)模型迭代。
由此帶來的效益,用一組數(shù)據(jù)展示便是:
10萬P目標(biāo)算力規(guī)模、10萬億目標(biāo)Token日均產(chǎn)能、1000倍目標(biāo)綜合降本、計(jì)劃孵化1000個(gè)高價(jià)值模型與智能應(yīng)用。
更直觀的,一張圖解如下所示:
![]()
不過比起這些數(shù)字來說,從九章云極的這次戰(zhàn)略發(fā)布來看,智算云的商業(yè)邏輯正在發(fā)生變化——
它不再只回答算力夠不夠,還要回答算力能不能變成真正可交付的智能。
而這,便是九章云極此次動(dòng)作的目的,把這上面?zhèn)€問題試圖工程化。
AI工廠,到底怎么運(yùn)轉(zhuǎn)?
要理解這座AI工廠,我們首先需要了解當(dāng)前企業(yè)在擁抱大模型時(shí)面臨的真實(shí)痛點(diǎn)。
過去,大家熱衷于討論的可能是模型參數(shù)有多大、是不是開源、打分高不高;但現(xiàn)在,業(yè)務(wù)一線的真實(shí)拷問是:
模型能不能真正跑進(jìn)我們復(fù)雜的業(yè)務(wù)系統(tǒng)?在超高并發(fā)下,能不能穩(wěn)定輸出可預(yù)期的結(jié)果?每一次API調(diào)用的成本,業(yè)務(wù)部門能不能算清賬、算贏賬?
這已經(jīng)不是一個(gè)純粹的算法競(jìng)賽,更準(zhǔn)確的說,應(yīng)該是一個(gè)典型的工程與工業(yè)化問題。
畢竟阻礙AI落地的現(xiàn)實(shí)瓶頸往往不在大模型本身,而在其背后的整套底層智算基建,包括算力調(diào)度是否高效、異構(gòu)算力能否統(tǒng)一納管、推理成本是否足夠低、任務(wù)失敗時(shí)系統(tǒng)能否自動(dòng)感知并自愈……
因此,九章云極推出的AI工廠,本質(zhì)上是在用一套標(biāo)準(zhǔn)化、規(guī)模化、高可靠性的工業(yè)化流水線,去重構(gòu)智能的生產(chǎn)與交付體系。
從AI工廠的整個(gè)版圖來看,可以分為四個(gè)關(guān)鍵部分來看。
投入側(cè):首創(chuàng)“一度算力”(DCU)
這是解決如何購買算力的問題。
長(zhǎng)期以來,算力行業(yè)最大的痛點(diǎn)就是資源不標(biāo)準(zhǔn)、計(jì)價(jià)不透明、投入不可量化。
過去,企業(yè)通常需要去租用GPU、規(guī)劃網(wǎng)絡(luò)拓?fù)洹⒖紤]存儲(chǔ)帶寬以及機(jī)器的使用時(shí)長(zhǎng)。
這種粗放的租賃模式,就如同在初期的電力時(shí)代,想要用電,必須自己去買煤炭、租發(fā)電機(jī),甚至自己去拉電線,門檻極高、成本混亂、無法規(guī)模化。
九章云極在行業(yè)內(nèi)首創(chuàng)了“一度算力”計(jì)量單位,將其定義為312TFlops×小時(shí)(每秒鐘312萬億次浮點(diǎn)計(jì)算乘以一小時(shí))。
![]()
△九章云極董事長(zhǎng),方磊
它將底層芯片(異構(gòu)的GPU、NPU)、網(wǎng)絡(luò)、存儲(chǔ)、使用時(shí)長(zhǎng)及實(shí)際利用率等極其復(fù)雜的物理資源統(tǒng)一折算計(jì)量。
對(duì)客戶而言,算力采購從此變得像買電一樣簡(jiǎn)單,按“度”付費(fèi)、所見即所得。
![]()
生產(chǎn)側(cè):訓(xùn)練工廠
訓(xùn)練工廠解決的是智能“從0到1”的生產(chǎn)問題。
通俗來講,就是把通用模型、行業(yè)數(shù)據(jù)、算力資源放進(jìn)來,通過數(shù)據(jù)處理、領(lǐng)域精調(diào)、強(qiáng)化學(xué)習(xí)、評(píng)測(cè)反饋等流程,訓(xùn)練出金融、制造、政務(wù)、科研等場(chǎng)景可用的專業(yè)模型。
這里的重點(diǎn)不只是有多少卡。
訓(xùn)練工廠強(qiáng)調(diào)的是千卡到萬卡級(jí)集群、高密度網(wǎng)絡(luò)存儲(chǔ)、故障自愈、跨地域調(diào)度,以及從數(shù)據(jù)、訓(xùn)練、評(píng)測(cè)到部署的全流程工具鏈。訓(xùn)練工廠能夠?qū)⑼ㄓ没A(chǔ)模型,升級(jí)為適配各行各業(yè)的專業(yè)任務(wù)模型。
通用模型存在天然的數(shù)據(jù)邊界與能力邊界,無法覆蓋企業(yè)私有數(shù)據(jù)、行業(yè)Know-How、復(fù)雜業(yè)務(wù)流程。而訓(xùn)練工廠的價(jià)值,就是把行業(yè)專屬知識(shí)沉淀進(jìn)模型,讓AI從會(huì)聊天、會(huì)答題,升級(jí)為能拆解任務(wù)、能自主決策、能風(fēng)險(xiǎn)判斷、能閉環(huán)落地的產(chǎn)業(yè)智能體,真正適配企業(yè)生產(chǎn)環(huán)境。
![]()
封裝側(cè):Token工廠
Token工廠解決的是智能“從1到N”的交付問題。
訓(xùn)練工廠生產(chǎn)出專業(yè)模型之后,模型本身還不是企業(yè)能直接消費(fèi)的商品。企業(yè)真正需要的是穩(wěn)定API、SDK、權(quán)限體系、模型版本管理、監(jiān)控告警、計(jì)量計(jì)費(fèi)和服務(wù)保障。
Token工廠就是把訓(xùn)練工廠產(chǎn)出的專業(yè)模型,封裝成可調(diào)用、可計(jì)量、可運(yùn)營的專業(yè)Token。
這里的Token,也不只是大模型里的技術(shù)計(jì)數(shù)單位。按照九章云極的定義,專業(yè)Token更接近一種面向業(yè)務(wù)任務(wù)的智能價(jià)值單元。不同任務(wù)、不同模型、不同服務(wù)等級(jí),都可以通過Token被計(jì)量和結(jié)算。
![]()
產(chǎn)出側(cè):越用越強(qiáng),越強(qiáng)越便宜
至此,AI工廠的核心飛輪閉環(huán)就此形成:
DCU度量投入 → 訓(xùn)練工廠冶煉專業(yè)模型 → Token工廠轉(zhuǎn)化為專業(yè)Token → 企業(yè)消費(fèi)Token并回流業(yè)務(wù)數(shù)據(jù) → 模型持續(xù)迭代
我們可以把它理解為“越用越強(qiáng),越強(qiáng)越便宜”的增強(qiáng)回路。在這里,數(shù)據(jù)不僅是原料,也是模型進(jìn)化的養(yǎng)分。
![]()
值得注意的是,在這一閉環(huán)中,九章云極重新定義了Token。
他們認(rèn)為,面向消費(fèi)者的泛化Token單價(jià)已經(jīng)由于市場(chǎng)競(jìng)爭(zhēng)趨于零,其價(jià)值正逐漸見頂。而面向產(chǎn)業(yè)的、具有明確 ROI(投資回報(bào)率)的專業(yè)Token,才是驅(qū)動(dòng)產(chǎn)業(yè)智能化的核心組件。
九章云極將這些專業(yè)Token進(jìn)行了清晰的價(jià)值分層,并將其戰(zhàn)略重心聚焦在后兩者:
- 消費(fèi)級(jí)Token:主要服務(wù)于日常AI應(yīng)用、內(nèi)容創(chuàng)作,追求極致體驗(yàn)與規(guī)模普惠,如同穩(wěn)定經(jīng)濟(jì)的基礎(chǔ)電力;
- 專業(yè)級(jí)Token:封裝了行業(yè)深度Know-How與私有數(shù)據(jù),充當(dāng)金融風(fēng)控、質(zhì)量檢測(cè)、政務(wù)服務(wù)的數(shù)字專家,保障流程安全、合規(guī),讓客戶買到確定的效率與風(fēng)控價(jià)值;
- 前沿級(jí)Token:面向復(fù)雜任務(wù)自動(dòng)化與科研突破。例如,封裝了多步驟、多工具的端到端仿真或科研工作流,直接服務(wù)于藥物發(fā)現(xiàn)、新材料研發(fā)、城市級(jí)系統(tǒng)優(yōu)化等曾經(jīng)不可解或成本極高的科學(xué)邊界。
![]()
從租卡到用Token,企業(yè)AI開始變輕了
過去企業(yè)做AI,往往是一條漫長(zhǎng)的重資產(chǎn)建設(shè)路徑。
包括多方協(xié)調(diào)、艱難地在市面上找芯片、拼湊卡;組建專業(yè)的集群運(yùn)維團(tuán)隊(duì),解決算力中斷、故障恢復(fù);搭建復(fù)雜的開發(fā)與模型訓(xùn)練環(huán)境,再進(jìn)行私有化部署。
這一套流程下來,周期通常長(zhǎng)達(dá)6到12個(gè)月,還沒看到業(yè)務(wù)效果,前期資本開支已經(jīng)堆成了天文數(shù)字。
而在九章云極AI工廠的模式下,針對(duì)不同類型的市場(chǎng)玩家,整個(gè)接入路徑被徹底變輕、變薄。
針對(duì)大模型公司和垂類AI企業(yè):從訓(xùn)練開始
大模型創(chuàng)業(yè)公司或者垂直行業(yè)的AI領(lǐng)頭羊,自身擁有極強(qiáng)的算法和數(shù)據(jù)能力,但往往被算力運(yùn)維和成本壓得喘不過氣。
對(duì)于這類客戶,他們可以從訓(xùn)練工廠無縫切入。AI工廠提供千卡到萬卡級(jí)的極致彈性算力集群,不僅保證大規(guī)模模型并行訓(xùn)練的高效運(yùn)行,還提供跨地域調(diào)度和故障自愈的底座。
當(dāng)模型在訓(xùn)練工廠中訓(xùn)練、精調(diào)、評(píng)測(cè)完畢后,客戶無需再折騰復(fù)雜的轉(zhuǎn)轉(zhuǎn)運(yùn)環(huán)境,可以直接在云端一鍵Token化分發(fā)至Token工廠。
AI工廠可以說是幫這類企業(yè)打通了從研發(fā)到商業(yè)化上線的這條路,讓算法科學(xué)家能夠?qū)?00%的精力聚焦于模型本身。
針對(duì)行業(yè)客戶和SaaS公司:從推理開始
對(duì)于絕大多數(shù)金融、制造、政務(wù)領(lǐng)域的實(shí)體企業(yè)和SaaS開發(fā)商,他們未必有必要訓(xùn)練自己底層的基座大模型。他們更現(xiàn)實(shí)、更迫切的需求,是在現(xiàn)有的客服、風(fēng)控、質(zhì)檢或辦公系統(tǒng)中,引入成熟好用的行業(yè)專業(yè)智能。
對(duì)他們而言,Token工廠提供了一條極輕的消費(fèi)型路徑:不用買卡、不用建集群、不用招募昂貴的底層運(yùn)維團(tuán)隊(duì)。
平臺(tái)上已經(jīng)預(yù)置了50多款主流基座模型以及多款面向金融、制造、政務(wù)、科研等真實(shí)場(chǎng)景精調(diào)完畢的模型,這些模型和能力均已就緒。
企業(yè)可以直接調(diào)用已經(jīng)封裝好的Token服務(wù),按需消費(fèi)、按量付費(fèi),將沉重的基建投資轉(zhuǎn)變?yōu)殪`活的運(yùn)營支出。
過去需要大半年的項(xiàng)目建設(shè)周期,現(xiàn)在如果從調(diào)用專業(yè)Token切入,最快只需兩周左右即可完成業(yè)務(wù)概念驗(yàn)證。
針對(duì)開發(fā)者和AI Agent:還有專屬入口
針對(duì)開發(fā)者、科研人員與AI Agent場(chǎng)景,九章智算云打造輕量化算力入口,解決本地算力不足、云端環(huán)境繁瑣、遠(yuǎn)程調(diào)試卡頓等行業(yè)痛點(diǎn)。
對(duì)于AI工程師而言,頭疼的日常莫過于代碼在本地,算力在云端。為了解決遠(yuǎn)程SSH卡頓、環(huán)境同步繁瑣的痛點(diǎn),九章智算云已經(jīng)上線了IDE插件。
現(xiàn)在,開發(fā)者可以在VS Code、Cursor等常用本地編輯器中,實(shí)現(xiàn)直連云端GPU。開發(fā)人員在本地寫下代碼,算力直接在云端跑實(shí)驗(yàn),并且能夠根據(jù)任務(wù)自動(dòng)開啟和關(guān)閉,不用不計(jì)費(fèi)。
同時(shí),九章智算云還將陸續(xù)推出CLI、SDK以及Skills Hub。無需理解底層復(fù)雜的硬件拓?fù)洌褂脮r(shí)通過簡(jiǎn)單的交互即可提交并運(yùn)行任務(wù)使用算力。
與此同時(shí),九章云極在發(fā)布會(huì)上同步啟動(dòng)智算開放計(jì)劃,面向全球開發(fā)者、科研團(tuán)隊(duì)和高校用戶開放普惠算力,消除創(chuàng)意與智能落地的阻礙。
算力戰(zhàn),現(xiàn)在拼的是賣生產(chǎn)力
從行業(yè)視角來看,九章云極這次發(fā)布AI工廠,踩中的是智算云市場(chǎng)正在發(fā)生的一次轉(zhuǎn)向。
早期,市場(chǎng)拼的是有沒有卡。大模型爆發(fā)后,算力短缺是硬約束,誰能提供更多GPU,誰就更有話語權(quán)。
隨后,競(jìng)爭(zhēng)開始轉(zhuǎn)向能不能用好卡。算力規(guī)模上來后,GPU利用率、訓(xùn)練穩(wěn)定性、跨地域調(diào)度、推理成本、異構(gòu)硬件管理,都會(huì)直接影響有效算力。
現(xiàn)在,企業(yè)更關(guān)心的是第三件事,也就是能不能把算力真正交付成業(yè)務(wù)結(jié)果。
算力是投入,模型是中間產(chǎn)物,Token是產(chǎn)出,業(yè)務(wù)效果才是最終價(jià)值。這也是AI工廠概念最核心的變化:九章云極沒有把自己只放在算力供應(yīng)商的位置上,而是試圖成為智能生產(chǎn)力的組織者和交付者。
它的思路可以理解為用DCU定義算力投入,用訓(xùn)練工廠生產(chǎn)專業(yè)模型,用Token工廠建設(shè)智能交付網(wǎng)絡(luò),最終把智能能力送到企業(yè)和開發(fā)者手里。
![]()
當(dāng)然,智算云市場(chǎng)不缺宏大概念,最終還要看真實(shí)交付。客戶會(huì)追問的,仍然是幾個(gè)具體問題:接入是否簡(jiǎn)單?成本是否真的下降?服務(wù)是否穩(wěn)定?賬單是否透明?業(yè)務(wù)效果是否可驗(yàn)證?
尤其是1000倍綜合降本這樣的目標(biāo),足夠吸睛,也需要在更多場(chǎng)景里被持續(xù)驗(yàn)證。它背后依賴的,不只是硬件堆疊,而是全棧自研OS、算電協(xié)同、全局調(diào)度,以及圍繞訓(xùn)練和推理的系統(tǒng)級(jí)優(yōu)化。
這也是AI基礎(chǔ)設(shè)施真正拉開差距的地方。
長(zhǎng)期來看,模型會(huì)繼續(xù)迭代,硬件會(huì)繼續(xù)更新,價(jià)格也會(huì)波動(dòng)。真正稀缺的,是把算力、模型、Token和業(yè)務(wù)價(jià)值串起來的工程系統(tǒng)。
九章云極這次提出AI工廠,意義正在于此。把智算云的競(jìng)爭(zhēng),從誰有更多算力,推向誰能更穩(wěn)定、更低成本、更規(guī)模化地交付智能。
AI圈開工廠了。
接下來要看的,是這座工廠能不能真的開足馬力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.