![]()
算力越來越便宜,但算力的賬越來越難算。
作者|徐珊
編輯|鄭玄
「Token 的成本正在暴跌。」
這句話放在兩年前,會讓每一個 AI 創(chuàng)業(yè)者興奮。從 2023 年到 2025 年,AI 推理成本下降了 99.7%。要知道,GPT-4 發(fā)布時每百萬 Token 成本是 37.5 美元,到 2025 年這個數(shù)字已經(jīng)降至 0.14 美元。按這個趨勢,算力成本對創(chuàng)業(yè)者來說,應(yīng)該不是問題才對。
但現(xiàn)實卻恰恰相反。
同一時期,全球企業(yè) AI 云支出從 115 億美元暴漲到 370 億美元,整整翻了三倍。AI 進入 A2A 時代后,數(shù)十個智能體在反復(fù)交互中,讓 Token 調(diào)用量呈指數(shù)級爆炸。這也導(dǎo)致了盡管 Token 單價更便宜了,但每個任務(wù)消耗的 Token 量瘋狂上漲。
顯然,算力正在成為這個時代最奇特的資源。它越來越便宜,但你花在它上面的錢,只會越來越多。
對巨頭來說,這個問題可以靠自建算力中心來解決。但對大多數(shù)創(chuàng)業(yè)公司來說,他們只能站在公共算力市場里,接受云廠商的定價,看著算力賬單一個月比一個月高,卻毫無議價能力。
共績科技創(chuàng)始人付智看到的,正是這個市場錯位誕生的商機。
在他看來,想要算力成本下降的解法不是只能等待成本自然下降,而是換一種使用算力的方式,同樣可以讓算力成本開始下降。讓算力像電力一樣,隨取隨用,按需計費,把大量被閑置浪費的算力資源重新激活。
近日,共績科技完成 Pre-A 輪融資,投后估值 3.5 億元人民幣,并計劃于近期啟動 A 輪融資。在算力賽道普遍承壓的 2025 年,這家用人工智能方法解決資源調(diào)度問題的科技公司悄悄做到了數(shù)千萬營收,客戶留存率接近 100%。
共績科技,正在把算力調(diào)度變成一門真實的生意。
![]()
共績科技創(chuàng)始人付智 圖源:共績科技
01
當(dāng) AI 公司爆了,
算力成本這筆賬有了新解法
新品上線前夕,Remy 的團隊幾乎沒睡覺,隨時預(yù)備著突發(fā)情況誕生。
但真當(dāng)公司網(wǎng)站在 48 個小時涌入 50 萬用戶時,對一家剛從內(nèi)測走向公測的 AI 創(chuàng)企來說,他們需要在短時間內(nèi)將所有基礎(chǔ)設(shè)施擴容幾十倍。盡管有所準備,上線前,Remy 提前測試過 Ucloud 、阿里云、華為云等多個云服務(wù)平臺,但潑天流量真正砸下來的那一刻,他們的最終解決方案商卻是共績科技。
簡單來說共績科技做的事就是把閑置算力調(diào)度起來,再按需分配給有彈性需求的 AI 企業(yè)。無論是網(wǎng)吧夜里空轉(zhuǎn)的機器、或者個人用戶的 4090,又或者是小機房的空閑資源都能夠成為共績科技可調(diào)度的算力池一部分。如果客戶不夠用,就隨時在算力池子里再調(diào),隨用隨取。
那 48 小時里,共績科技緊急為 Remy 調(diào)配了近 1900 張 GPU 卡。用戶每發(fā)起一次請求,就會誕生一個新訂單;當(dāng)用戶的計算完成,訂單立刻關(guān)閉。那一天,平臺處理了超過百萬個訂單。
「在峰值時刻,一般的算力服務(wù)商臨時能開出 20 張卡就已經(jīng)很難了,更多情況下企業(yè)還需要等待,但等待也意味著流量流失,是企業(yè)絕對不想看到的。」付智談到在這件事之后,Remy 使用的絕大部分的算力都來自共績科技。
Remy 對算力的需求其實很簡單,每一次流量爆發(fā)的時候,用戶的點擊都能及時回應(yīng),算力的調(diào)用要快、要及時,同時成本要低。這些都是剛剛起步的 AI 創(chuàng)企對算力最基礎(chǔ)的需求。
相比之下,有一類 AI 應(yīng)用客戶面對算力需求則是更小眾,但也更現(xiàn)實。
去年春節(jié)期間,有一家在景區(qū)做 AI 換裝拍照的公司找上了共績科技。他們倒不是不知道流量爆發(fā)的節(jié)點在什么時候,但仍然很難算好算力這筆帳。
他們的 AI 設(shè)備多放在景區(qū)里,一到節(jié)假日就人滿為患,算力需求激增。但是假期一過,算力的需求又幾乎歸零。「春節(jié)是全年最大的高峰,剩下大半年,景區(qū)里沒什么人。」他們告訴付智。
這樣的算力波動意味著,如果選擇按峰值租算力,等于平時 90% 的時間都在燒錢養(yǎng)卡;如果按照均值租算力,那春節(jié)期間肯定需求會崩,很影響用戶體驗。「這樣的需求波動,在傳統(tǒng)的算力服務(wù)方案里,比較難獲得一個合適方案。因為這種極端的峰谷差,在標(biāo)準產(chǎn)品里根本沒有對應(yīng)的定價邏輯。」付智說道。
但這樣的場景,卻很適合使用共績科技的算力共享平臺。
那一個月,服務(wù)節(jié)點換了 1963 臺個人電腦,整個春節(jié),服務(wù)沒有出現(xiàn)過一次穩(wěn)定性問題。「相比客戶自己按峰值部署算力,我們幫他們節(jié)約了近 70% 的費用。」付智補充道。
這樣的時間波動需求不僅出現(xiàn)在一些垂類小眾場景里,同樣對不少 AI 新秀公司來說也同樣常見。
liblib 是國內(nèi)用戶量最大的 AI 圖片生成平臺之一,他們曾在云廠商平臺租了大量 GPU 卡。但如果仔細研究的話,他們發(fā)現(xiàn)這些 GPU 平均算下來,整體利用率只有 45%。
這也意味著,超過一半的卡,每天都在白白燒錢。
據(jù)付智介紹,其實像 liblib 這樣的企業(yè)并不是少數(shù),幾乎所有以上班族為核心用戶的 AI 應(yīng)用工具,都會遇到這個問題。白天用戶密集使用,夜里用戶數(shù)大幅下降。如果按峰值配算力,夜里則空置率較高,但如果按均值配則白天很難滿足所有用戶需求。
AI 賽道看著熱鬧,但卡住公司發(fā)展生命線的,有可能就是算力成本這筆賬。不少企業(yè)對算力預(yù)期過高,算力成本把現(xiàn)金流拖垮,也有企業(yè)對算力預(yù)估不足,在用量峰值時服務(wù)崩掉,用戶一走不回頭。
「AI 應(yīng)用的流量天然是波動的,算力市場的定價邏輯是為穩(wěn)定需求設(shè)計的,算力成本的分配方式還一直停留在比較傳統(tǒng)的方式上」付智說道。這也是為什么當(dāng)一家 AI 公司真正爆了,算力成本這筆賬,需要一種新的算法。
過去,傳統(tǒng)的算力服務(wù)模式以長租合同為主。企業(yè)租一年,不管用不用,都需要為算力預(yù)付費用,算力閑置的成本主要由企業(yè)自己承擔(dān)。而共績科技做的事,其實是把這筆成本遷移到另一個地方,也就是那些本來就有閑置算力、但自己跑不滿的人,像是個人用戶、網(wǎng)吧等等,這些算力本來就在浪費,把它們調(diào)度起來,不產(chǎn)生新的算力成本,也盤活了已經(jīng)存在的閑置算力。
「算力不是越多越好」付智說,「而是可以流動的、隨時可調(diào)用的,才好。」
02
彈性算力這筆生意,
考驗的是能源調(diào)度能力
對付智來說,想做算力調(diào)度這筆生意的契機,其實是來自于一個偶然的機會。
2023 年 5 月假期,正是 AI 浪潮剛剛萌發(fā)的階段,付智往一個 AI 創(chuàng)業(yè)者社群里扔了一條消息。內(nèi)容很簡單:我有一臺 A100,租得越短越便宜,有需要的來找我。
他當(dāng)時自己的預(yù)期其實沒抱多大希望,畢竟只有一張顯卡。結(jié)果卻出乎意料最后有 30 個人咨詢他,并且都很爽快地付錢。
「我說誰給錢快我就給誰。」他最后挑了 5 個人服務(wù)。一張卡,5 個客戶,驗證了一個他想了很久的判斷:普通人開始需要算力了。
但他也清楚,這門生意之所以在那個時間點才成立,不是因為他運氣好,而是因為在那之前,這件事根本沒有條件做。
畢竟,1999 年就有人曾提出做算力共享,搭建了 BOINC 平臺,幾十萬人在上面貢獻算力,但當(dāng)時做的是公益性的科學(xué)計算平臺,人人可以免費使用。后來比特幣火熱的時候也有人考慮借著挖礦熱潮把閑置算力調(diào)度起來,但這并不合法。
想法一直都在,但土壤一直沒有。
畢竟,真正有高性能 GPU 的普通用戶,是 90 后、00 后們。在這之前,很少有人的個人電腦配置的是 4090。而讓個人電腦安全運行 Linux 虛擬環(huán)境的 WSL1.0.0,也是到 2022 年才正式發(fā)布,更不用提遠程調(diào)用分布在各地的個人設(shè)備,讓它能被內(nèi)網(wǎng)穿透的技術(shù),到 2021 年前后才算真正成熟。
供給側(cè)、需求側(cè)、以及技術(shù)條件,三項俱全,才讓這門生意在今天變得可能。
但付智覺得真正發(fā)現(xiàn)「時機到了」的信號,不是 DeepSeek,不是一體機,而是 AI 的消費場景,正在從小眾工具向普通人的日常娛樂滲透。
「一旦這個進程加速,對算力的需求就不再是幾家大公司采購,而是要像電力一樣,需要被大規(guī)模、跨節(jié)點地調(diào)度分發(fā)。」付智說道。
這也是共績科技正在推進與國家算力中心談合作的原因。目前他們已經(jīng)參與了京津冀、長三角、深圳、青海的省級算力調(diào)度平臺建設(shè),各地搭起來的調(diào)度系統(tǒng),技術(shù)上 都有共績的參與。
不過,「算力調(diào)度」這件事,比看起來要難得多。
算力調(diào)度和算力管理并非一概而論。付智把調(diào)度和管理做了一個區(qū)分:大廠做的是管理,把一堆機器納入同一套系統(tǒng),知道誰在用、誰閑著,但很難實現(xiàn)跨地域、跨設(shè)備的動態(tài)分配。
而算力調(diào)度是另一回事,它需要把這個地方的峰值需求,用其他地方閑置的算力來填。這在計算機工程里其實沒有現(xiàn)成的解法,反而是能源領(lǐng)域的老問題。「削峰填谷」這個詞,本來就是電力系統(tǒng)的術(shù)語。
付智本科讀的是清華建筑環(huán)境與能源應(yīng)用工程,導(dǎo)師是能源領(lǐng)域的院士。他把能源調(diào)度的算法移植過來,解決的是算力版本的同一個問題,這也是共績最核心的壁壘。
當(dāng)然,在工程化上,這套跨地域的調(diào)度體系也會遇到的麻煩也不少。比如,接入調(diào)度池的個人電腦,隨時可能「被占用」,如果用戶一開游戲,這臺機器就要退出,但下游的客戶要求服務(wù)不能斷。
付智選擇的是熱備加預(yù)測,也就是提前給每個任務(wù)備好冗余節(jié)點,同時用積累的歷史數(shù)據(jù)預(yù)測每個供給方的在線規(guī)律,動態(tài)調(diào)整備份比例。數(shù)據(jù)越多,備份越精準,成本越低。「我原來得給你備兩臺機器。但隨著使用,我現(xiàn)在只要備一臺就夠了。」網(wǎng)絡(luò)傳輸層也不穩(wěn)定,共績的應(yīng)對是同時接入三家頭部云廠商,付智提到,「不可能同時出問題」。
那云廠商為什么不做彈性算力?
付智給出的解釋是,大廠看到了,但大廠的彈性算力在產(chǎn)品定位、定價策略上有所不同,共績的優(yōu)勢是價格和調(diào)度效率。
彈性算力的核心矛盾在于,你得提前備好「隨時能調(diào)用」的算力,但這些算力在沒人用的時候就是純粹的閑置成本。一般算力服務(wù)商的彈性擴容大約是常規(guī)價格的 5 倍,或者讓客戶簽一年長約,由客戶承擔(dān)算力閑置的風(fēng)險。
共績之所以能提供真正的彈性,是因為它用的資源本來就是閑置的,這些資源沒有被提前采購進來壓成本,它們本來就閑著,所以共績可以給出更有優(yōu)勢的價格。
據(jù)付智分析,整個市場里,80% 的算力需求走大廠的長租整包,剩下 20% 是有彈性需求的部分。付智不打算搶那 80%,他更專注的是那 20% 的市場,而且隨著 AI 應(yīng)用持續(xù)生長,這 20% 的市場空間也會越來越大。「在別人那,租得越長越便宜;在我這,租得越短越便宜。」付智補充道。如今共績科技共享算力平臺「suanli.cn」可以讓普通消費者按毫秒去租用相關(guān)算力。
![]()
共績科技團隊合影 圖源:共績科技
這樣的共享商業(yè)模式其實早已在其他領(lǐng)域獲得驗證。
付智把這個生意的本質(zhì)比作 Airbnb:城市辦大型展會,周邊酒店全滿,Airbnb 把有閑置房間的居民和無處可住的參會者撮合起來。算力版本的故事也是相同的路徑,AI 應(yīng)用在版本發(fā)布、流量爆發(fā)的時刻需要大量算力,平時需求遠不及這個量;另一邊,個人用戶、網(wǎng)吧、小機房的算力在夜里和工作日大量閑置,將兩邊連接起來,就是共績在做的事。
只不過,共享的不是房間,而是算力。
03
算力能源調(diào)度,
AI 時代的「軟件定義基礎(chǔ)設(shè)施」
這條路,在國外也有人走過。比如說,RunPod 也在通過閑散算力提供彈性推理服務(wù),2024 年拿到了英特爾資本和戴爾科技資本共同領(lǐng)投的 2000 萬美元種子輪,客戶里有 Cursor、OpenAI、Perplexity。
但在美國做這件事,和在中國做,在付智看來,完全是兩回事。
AWS 從誕生起就在提供彈性算力,一開始就承諾按需取用,通過高價彈性服務(wù)去服務(wù)成熟的市場。但國內(nèi)的云計算廠商更傾向于提供長租模式,相關(guān)優(yōu)惠政策也傾向于此,并不太重視彈性服務(wù),用戶為彈性算力的付費意愿也比美國低得多。因此,如果將 RunPod 那套邏輯搬到國內(nèi),定價就跑不通。
不過付智認為,算力調(diào)度并不是一門只看算力出租的生意。「共享算力可能只是一個敲門磚。」他說這話的時候沒有猶豫。在他的判斷里,這門生意大概有兩三年的窗口期,只要算力供需錯位還在,這個縫隙就存在,但它不會永遠存在。
這種清醒,在創(chuàng)業(yè)者里并不多見。但正因為如此,他很早就開始想一件更根本的事:下一個真正爆發(fā)的 AI 應(yīng)用會從哪里長出來?這個判斷,將會直接決定了算力需求的走向,對此,付智有兩個面向未來的判斷。
第一個是,據(jù)他分析,中國的超級應(yīng)用不會從 PC 端的生產(chǎn)力工具里長出來,中國真正有機會的方向,是移動端的社交娛樂、結(jié)合供應(yīng)鏈的跨境硬件,以及能嵌入真實生活場景的 AI 應(yīng)用。
中國的互聯(lián)網(wǎng)從來沒有經(jīng)歷過深厚的 PC 生產(chǎn)力工具時代,用戶直接從功能機時代跳到了移動互聯(lián)網(wǎng)。那些在美國跑出來的 AI 文檔、AI 幻燈片、AI 代碼助手,背后依賴的是幾千萬習(xí)慣在 PC 上辦公、愿意為 SaaS 工具付費的用戶群體,而中國并不是。「全中國有超過 1 億人需要寫 Word 嗎?我覺得可能沒有。」更麻煩的是,即便有這個需求,大廠也會很快把這些功能做成免費插件。
他反而在社交娛樂場景看到了高增長。他對話過很多做短劇、影視的從業(yè)者,問他們?yōu)槭裁茨敲捶e極地擁抱 AI,對方的反饋讓他有了新的想法:「我已經(jīng)沒有可失去的了,沒有人去看電影和電視劇了,我們已經(jīng)快死了。」這些人是中國市場里最積極擁抱 AI,不是因為最懂技術(shù),而是因為退無可退。「現(xiàn)在,已經(jīng)沒什么人看電視、電影了。」
而對于 AI 硬件的發(fā)展,他也有些不同的看法。
過去幾年,AI 硬件的主流思路是「萬物加對話框」,也就是什么設(shè)備都配上一個聊天窗口。付智覺得這個方向并不對。「消費者不需要一個會寫詩的冰箱。」
真正有生命力的 AI 硬件,是進入用戶本來就有的高頻場景,讓 AI 在背后默默完成運轉(zhuǎn),而不是拉著用戶專門坐下來和它聊天。
就好比,寵物攝像頭應(yīng)該可以自動識別貓咪是否生病,景區(qū)相機自動完成換裝拍照。用戶什么都不用改變,AI 悄悄把事情做完了。「如果這類硬件可以采用開源模型部署,流量爆發(fā)的時刻,也會成為彈性算力的客戶。」付智覺得這也是共績科技未來的增長點之一。
付智的第二個判斷,藏得更深,2024 年底就已經(jīng)成形,但他等到今年才等到了驗證它的機會。
他認為,讓人直接去跟 AI 對話,本身就是一種效率浪費。人類信息輸入輸出的速度有上限,一次只能提一個問題,需要等答案出現(xiàn)再提下一個。但 AI 可以同時處理成千上萬個線程,在毫秒之間完成機器之間的信息傳遞。「用人去驅(qū)動 AI,是用最慢的那一環(huán),拖住了整個系統(tǒng)的速度。」
真正應(yīng)該發(fā)生的,是 AI 與 AI 之間直接協(xié)作,A2A。一個任務(wù)下達,觸發(fā)一組 AI 的連鎖運轉(zhuǎn),人只需要定義目標(biāo),不需要參與中間的每一步。這也是為什么 OpenClaw 在今天被人們所看重。這也是付智覺得 OpenClaw 真正重要的原因,不是這個產(chǎn)品本身,而是它證明了一件事:AI 與 AI 之間可以自己形成社區(qū),A2A 有人買單,這個方向是走得通的。
一旦 A2A 模式成為主流,算力的消耗將是今天的數(shù)倍乃至數(shù)十倍。黃仁勛在 GTC 2026 上說,由于 Agentic AI 和推理能力的爆發(fā),當(dāng)下所需的計算量比一年前預(yù)期的多了至少 100 倍,而這只是開始。那時候算力真的會像電一樣,考慮的不再是你需要囤多少卡的問題,而是整張「算力電網(wǎng)」能不能按需分發(fā),算力資源管理來到了調(diào)度的領(lǐng)域。
當(dāng) A2A 真正到來,算力會像電力一樣成為每個人、每個任務(wù)、每個 AI 節(jié)點背后的基礎(chǔ)設(shè)施。那時候,誰能跨地域、跨設(shè)備、跨時段地把算力精密調(diào)度起來,誰就掌握了這張網(wǎng)真正的運營能力。
共績科技現(xiàn)在做的事,在付智看來是在為那個時刻做準備,用這兩三年的窗口期,把調(diào)度能力、節(jié)點網(wǎng)絡(luò)、客戶關(guān)系都建起來。等 A2A 的需求真正爆發(fā),這套體系才是共績科技真正的護城河。
他最近在公司內(nèi)部發(fā)了一句話,采訪快結(jié)束時,他又說了一遍:
「即便如此,這一切也才剛剛開始。」
放在彈性算力的語境里,這句話或許只是一個創(chuàng)業(yè)者對市場的樂觀判斷。但放在 A2A 的語境里,他說的「開始」,或許并不是這門生意的開始,而是算力作為基礎(chǔ)設(shè)施這個命題,迎來了真正開始的時刻。
*頭圖來源:豆包 AI
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你看好彈性算力市場嗎?
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.