網易首頁 > 網易號 > 正文 申請入駐

“百萬Token一分錢”,徐冰的AI算力新賭局

0
分享至



4月20日,一家名叫曦望(Sunrise)的國產GPU公司宣布完成超10億元新一輪融資,估值突破百億。對這家成立僅一年多、從商湯科技分拆出來的公司來說,這已經是它的第七輪融資,累計融資約40億。

但真正讓人意外的不是這個數字。

翻開曦望的產品手冊,你會發現一個奇怪的事實:它的旗艦芯片啟望S3,居然“不會”訓練大模型——它只做推理,徹底放棄了訓練能力。

這在國產GPU公司競相標榜“訓推一體”或“算力領先”的語境里,就像是自斷一臂。

曾有人私下問曦望董事長徐冰:這不是把一半市場拱手讓人嗎?

他則回答說:“訓練是巨頭的游戲,推理的需求看不到天花板。”

放棄訓練,押注推理——這位商湯聯合創始人,押上了一盤誰也沒看懂的棋。

01

在創立曦望之前,徐冰是商湯科技最核心的創始團隊成員之一。

2012年,徐冰在香港中文大學多媒體實驗室攻讀博士,師從深度學習領域先驅湯曉鷗。彼時,湯曉鷗團隊剛剛發布了GaussianFace和DeepID兩套算法,人臉識別效果首次超越人類,登上了《自然》《科學》的報道。

2014年,徐冰和徐立、楊帆等人隨湯曉鷗共同創辦商湯科技,徐冰在其中負責資本運作,主導了商湯累計超66億美元的融資,還操盤了港交所IPO,創下全球AI融資紀錄。

十年間,商湯從一個學術實驗室成長為亞洲最大的AI軟件公司之一。但徐冰很快發現,商湯被同一個難題反復“卡脖子”:算力成本。

“在商湯的時候,我們每年要花大量資金采購算力,而且絕大部分流向海外!币晃唤咏毂娜耸炕貞洠@個痛點始終沒有找到解法。

2020年,商湯下定決心在內部組建大芯片部門,投入自研AI推理芯片。

五年過去,商湯的芯片團隊成功量產了兩代產品,S1視覺推理芯片和S2大模型推理芯片,累計投入超20億研發,交付量突破1萬片。但大芯片部門在上市公司體系內始終面臨兩難:既無法像外部創業公司那樣靈活融資,又難以吸引最頂尖的芯片人才。

2024年底,商湯推出了“1+X”戰略,將芯片業務分拆獨立,命名為“曦望”。徐冰做出了一個大膽決定:辭去商湯執行董事職務,親自下場做芯片。

他還拉來了兩位關鍵人物:前AMD全球GPU首席架構師、百度昆侖芯核心設計師王勇,以及百度創始團隊成員、“鳳巢之父”王湛。

三人的分工也堪稱教科書級配置,王勇管技術,王湛管產品和商業化,徐冰則統籌全局。2025年4月,為了說服王湛加入,徐冰在北京設了一場飯局,兩人從加微信到敲定合作,不到24小時。

02

所謂“曦望”,曦,破曉之光;望,遠方的期許。但開局就選擇All-in推理、放棄訓練,徐冰賭對了嗎?

要理解徐冰的選擇,得先看清AI算力市場正在發生什么。

過去幾年,大模型的競爭圍繞一個詞展開:訓練。誰的模型參數更大、誰的訓練速度更快,誰就能贏。這催生了英偉達H100、A100等高端GPU的軍備競賽。但徐冰的判斷是,游戲規則正在翻轉。

“訓練市場是頭部玩家的游戲,門檻越來越高,收斂得很快!彼f,“但推理是百花齊放的,需求看不到天花板!

數據支撐了這個判斷。德勤預計,2026年推理算力占整體AI計算的比例將達到約三分之二。中國市場更甚,2026年3月日均Token調用量已突破140萬億,較2024年初的1000億增長超千倍。曦望測算,2026年AI推理計算需求將達到訓練需求的4-5倍,推理算力租賃價格半年漲幅近40%。



訓練是“一次性爆發”,即做一次訓練花幾千萬,做完就結束了。推理則是“持續性消耗”,每一次用戶提問、每一次AI生成,都在消耗算力。調用規模一旦上來,成本就會成為決定企業能否盈利的關鍵。

但問題來了:市場上已有的GPU,幾乎都是“訓推一體”的通用型產品。曦望聯席CEO王勇曾講過一個關鍵發現:在做上一代產品S2的過程中,盡管實驗室測試表現優異,但到了客戶那里,芯片最終幾乎全部被用于推理場景。

原因很簡單。訓推一體芯片為了兼顧訓練,采用了昂貴的高級封裝和HBM(高帶寬內存),芯片成本和功耗居高不下。但在推理場景中,這些昂貴的算力資源實際利用率往往只有5%到10%,造成了巨大的電力浪費和持有成本。

用王勇的話說:“用為訓練優化的昂貴芯片來做推理,性價比太低了。”

徐冰的解法是三個字:做減法。

啟望S3徹底砍掉了為訓練準備的冗余模塊。它沒有采用昂貴的HBM,而是選了成本低得多、但容量更大的LPDDR6內存,顯存容量較上一代提升4倍。在計算核心上,S3將絕大部分面積用來加強FP4低精度算力,因為現在絕大部分推理運算已經是FP4了。

這套減法邏輯的成果令人咋舌:在DeepSeek V3/R1等主流大模型推理場景中,S3的單位Token成本較上一代產品下降約90%,整體性價比提升超過10倍。

徐冰的目標是:“將推理成本降至‘百萬Token一分錢’,讓AI像水電一樣成為普惠基礎設施!

03

曦望的策略,在國產GPU圈子里引發了不少爭議。

“不做訓練,你的芯片會不會被客戶嫌‘不夠全面’?”有人當面問王勇。

他的回答很硬核:“我們拒絕做‘跑分黨’。不希望用benchmark來定義芯片,而是希望能夠做到幫客戶賺錢的算力!

這句話背后,藏著曦望與主流國產GPU廠商的根本分歧。過去幾年,國產GPU的競爭邏輯很簡單:參數對標英偉達。誰家的FP16算力更高、誰家的顯存帶寬更大,誰就更“能打”。但徐冰和王勇認為,推理場景的邏輯完全不同。推理的本質不是“算得更快”,而是“算得更便宜、更穩定”。

啟望S3針對兩個核心算子——GEMM和Flash Attention——做了深度優化,算子利用率分別推至約99%與98%,標稱算力幾乎全部轉化為有效吞吐。

它還圍繞Agent(智能體)的原生需求重新設計了指令集和微架構,精準匹配智能體的復雜控制流,大幅提升多輪推理效率。

“推理側的效率瓶頸已不再是‘算力不夠’,而是‘算力用不滿’!毙毂J為,這恰恰是國產芯片可以彎道超車的地方。



當然,僅僅有芯片遠遠不夠。任何一塊國產GPU要真正打入市場,最大的攔路虎是英偉達的CUDA生態。全球數百萬開發者已經習慣了在CUDA上寫代碼、跑模型,遷移成本高得驚人。

曦望的策略很務實:打不過就兼容。

它在軟件棧上做到了95%的CUDA兼容,開發者幾乎可以無縫遷移。目前,曦望的軟件體系已適配ModelScope平臺90%以上的主流大模型形態,包括DeepSeek、通義千問等。

但兼容只是第一步。曦望真正的野心,是重新定義算力的交付方式。

傳統模式下,客戶買GPU卡、搭服務器、做集群、適配模型,每一層都要自己折騰。徐冰提出的商業模式是“Token as a Service”——算力不再按卡賣,而是按Token消耗量計價。

用王湛的話說:“我們的競爭不是‘又一個芯片’,而是‘重寫中國AI產業的損益表’。”

04

故事講到這里,聽起來一切都很順。但芯片創業從來不是童話。

曦望最大的挑戰不在技術,而在生態。一位行業分析師直言不諱:“Hugging Face上有200萬個模型,頂尖國產GPU能順暢支持的只有幾十到幾百個!奔幢汴赝龅搅95%的CUDA兼容,要讓大量開發者真正遷移過來,還需要投入海量的生態建設成本——不是幾千萬,是幾十億。

競爭對手也在提速。英偉達在2026年GTC大會上釋放了強烈的“防守”信號。它不再只賣GPU,而是推出包含CPU、DPU、NVLink、光子以太網的完整計算系統,用全棧優勢來抹平單一維度的成本優勢。英偉達甚至花200億美元收購了AI推理初創公司Groq,補強推理能力。

國內競爭同樣激烈。摩爾線程、沐曦已相繼上市,華為昇騰910C也在推理市場試水,天數智芯公布了四代架構路線圖,號稱2027年超越英偉達。曦望雖然率先聚焦推理賽道,但窗口期可能只有兩到三年。

徐冰的回應很克制:“AI算力基建的重心已徹底切換。我們的目標不是做最大的,而是做推理場景里最好的!

曦望已規劃好未來三年的產品路線:2026年啟望S3量產,2027年高性能推理芯片S4上市,2028年安全可控推理芯片S5上市。2026年的核心任務是推進S3量產交付,完成與國內外主流大模型、多模態模型和Agent框架的全面適配。



在中國科技創業的敘事里,我們習慣了“做大做強”的劇本:做全棧、做平臺、做生態,恨不得把所有賽道都占滿。但徐冰和曦望的故事,給出了一個反向的啟示,有時候,戰略的關鍵不在于你做什么,而在于你不做什么。

放棄訓練,不是能力不夠,而是看清了訓練市場已被巨頭瓜分殆盡的現實。做減法,不是偷工減料,而是把所有資源押注在一個真正能發揮優勢的細分戰場。

曦望的芯片不再追求“訓練性能”這個虛名,而是直擊客戶最真實的痛點——單位Token成本。

這種“聚焦”的思維方式,在當下中國商業環境中尤為珍貴。當所有人都往同一個方向擁擠時,敢于逆流而上的人,才可能開辟新路。

當然,徐冰的賭局還遠未到揭曉勝負的時刻。曦望的百億估值,既是市場對其技術路線的認可,也是對其商業化能力的前置考驗。400人的團隊、40億的融資彈藥,真正的戰斗才剛剛打響。

百萬Token一分錢——這個聽起來像童話的目標,徐冰能把它變成現實嗎?

答案不在發布會上,而在接下來每一片芯片的流片良率里,在每一行驅動代碼的適配效率里,在每一個客戶的信任與遷移里。

但至少,他選擇了那條更難、也更有可能贏的路。在中國AI芯片這條漫長而崎嶇的征途上,敢于做減法,本身就是一種罕見的勇氣。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅馬諾:曼聯已和巴萊巴達成口頭加盟協議!皇馬了解穆帥希望回歸

羅馬諾:曼聯已和巴萊巴達成口頭加盟協議!皇馬了解穆帥希望回歸

足球偵探
2026-04-27 08:35:08
央行終于出手!借唄、微粒貸逾期的朋友,再不用為網絡支付為難了

央行終于出手!借唄、微粒貸逾期的朋友,再不用為網絡支付為難了

我不叫阿哏
2026-04-27 11:09:33
尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

詭譎怪談
2025-04-30 22:17:42
“二女兒會恨死你”,家長曬兩娃名字,重男輕女簡直刻在骨子里

“二女兒會恨死你”,家長曬兩娃名字,重男輕女簡直刻在骨子里

澤澤先生
2026-04-25 21:49:06
孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

喜歡歷史的阿繁
2026-04-28 00:37:17
突發!艾頓高效19+10后肘擊申京脖頸 被吹罰二級惡犯驅逐離場

突發!艾頓高效19+10后肘擊申京脖頸 被吹罰二級惡犯驅逐離場

醉臥浮生
2026-04-27 11:26:52
官宣 | 張效瑞,臨時接手主教練!

官宣 | 張效瑞,臨時接手主教練!

硯底沉香
2026-04-27 13:21:39
明碼標價5折甩賣,番禺這個樓盤看得人心驚肉跳!

明碼標價5折甩賣,番禺這個樓盤看得人心驚肉跳!

黃師娘
2026-04-27 22:00:46
別再惡意抹黑!余承東曬問界車有多結實:5輛車才算把M6撞翻

別再惡意抹黑!余承東曬問界車有多結實:5輛車才算把M6撞翻

快科技
2026-04-27 12:47:35
竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

老好人的憤怒
2026-04-27 08:07:21
未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

細說職場
2026-04-25 19:55:42
有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

裝修秀
2026-04-26 10:55:03
女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

李晚書
2026-04-24 10:39:33
斯諾克世錦賽太殘酷:隨著吳宜澤13-11晉級,11名中國選手僅存2名

斯諾克世錦賽太殘酷:隨著吳宜澤13-11晉級,11名中國選手僅存2名

側身凌空斬
2026-04-28 00:07:38
華子缺陣G5:森林狼的背水一戰

華子缺陣G5:森林狼的背水一戰

賽場速報局
2026-04-28 04:04:26
東南亞隱藏的“電詐大佬”,一個個正在浮出水面

東南亞隱藏的“電詐大佬”,一個個正在浮出水面

現實的聲音
2026-04-27 20:36:14
廣東一男子臆想同學要害自己,持刀致同學及其弟弟1死1傷,經鑒定男子患精神分裂癥;被害人:兇手行兇前曾問有什么話要跟他說

廣東一男子臆想同學要害自己,持刀致同學及其弟弟1死1傷,經鑒定男子患精神分裂癥;被害人:兇手行兇前曾問有什么話要跟他說

臺州交通廣播
2026-04-28 02:15:19
五次“末日現金”押注!巴菲特60年只出手5次,每次都在崩盤前夜

五次“末日現金”押注!巴菲特60年只出手5次,每次都在崩盤前夜

徐sir財經
2026-04-27 08:39:49
Opta更新歐冠奪冠概率:阿森納35.7%,拜仁34.9%

Opta更新歐冠奪冠概率:阿森納35.7%,拜仁34.9%

懂球帝
2026-04-28 03:51:04
北京車展最貴展臺火了!2000萬國產超跑被富豪當場拿下

北京車展最貴展臺火了!2000萬國產超跑被富豪當場拿下

科技湃
2026-04-26 23:21:11
2026-04-28 05:12:49
觀瀾人物 incentive-icons
觀瀾人物
在這里看見不一樣的內容!
124文章數 7關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

時尚
教育
游戲
旅游
公開課

絲巾的10種系法,愛美的女人必看

教育要聞

你不說這是計算障礙,我真以為我是智障呢

《AC黑旗》重制版新增專屬劇情!原版編劇親自執筆

旅游要聞

不止看花 京津冀春日游花樣翻新

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版