網易首頁 > 網易號 > 正文 申請入駐

36氪首發 | “華為天才少年”創業連融超4億元,做新一代推理芯片重構顯存成本

0
分享至

作者 | 喬鈺杰

編輯 | 袁斯來

硬氪獲悉,國內全自研GPGPU創新企業「北京行云集成電路有限公司」(以下簡稱“行云”)宣布連續完成Pre-A及Pre-A+多輪融資,融資金額超4億元人民幣。五源資本、賽富投資基金、春華資本聯合領投,以及北京、江蘇等地方國資、佰維存儲(688525)、金沙江聯合帶動知名GPU企業創始人家辦、創維資本等產業資本跟投。云岫資本連續多輪服務并擔任下一輪獨家融資財務顧問。

北京行云集成電路有限公司成立于2023年8月,專注針對大模型的新一代推理芯片,致力于使用非3D DRAM架構打造超大顯存規格、CUDA兼容的全自研GPGPU產品,推動AI大模型推理的普惠化。

行云創始人季宇博士,清華大學計算機系博士,“華為天才少年”計劃的一員,曾在華為海思深度參與昇騰AI芯片的編譯器與架構研發。CTO余洪敏博士,中科院半導體所博士,曾主導百度昆侖芯、海思昇騰等多款芯片的研發與量產,擁有十余款芯片成功流片經驗。

當前,在大模型架構持續演進的背景下,算力系統的瓶頸正在發生結構性變化。

季宇在接受硬氪采訪時表示,當前算法側的演進正在重塑硬件設計邏輯。以MoE(Mixture of Experts)為代表的稀疏模型,在計算效率上更具優勢,但需要預先加載更多專家參數,使得整體對內存容量的需求顯著高于傳統Transformer稠密模型。

大模型(千億/萬億參數)的顯存需求已從GB級躍升至TB級,這一過程中,系統成本結構也隨之重構——按GB計價的顯存成本,正逐步超過算力芯片本身,成為主導項。因此,“降本的關鍵已經不在算力,而在顯存”季宇稱。

基于這一判斷,行云選擇了一條與主流路徑不同的技術路線:放棄成本高昂的HBM(高帶寬內存),轉而采用LPDDR乃至NAND(SSD顆粒)等更低成本的存儲介質作為顯存介質。通過介質替換,使顯存成本降低1到2個數量級。

但低成本介質也意味著單顆粒帶寬較低。為彌補這一短板,行云在架構上采用多顆粒、多通道并行的設計,通過規模化堆疊將整體帶寬提升至TB級別,以滿足大模型推理對數據吞吐的需求。

季宇表示,隨著稀疏化和MoE架構的發展,模型對帶寬的絕對需求正在下降,系統設計不再需要一味追求極致帶寬,而是可以通過軟硬件協同,實現成本與效率之間的平衡。

這種思路也體現在行云的整體技術策略中。季宇強調,公司真正的稀缺性并不在單一芯片指標,而在于系統級的設計能力。通過諸如Prefill/Decode分離(PD分離)、KV Cache稀疏化等工程手段,行云能夠更靈活地適配AI應用形態的快速變化,從早期的Chatbot到當前逐步興起的Agent場景,降低因芯片研發周期較長所帶來的技術滯后風險。

產品驗證層面,行云此前推出的“褐蟻一體機”,已嘗試用CPU與通用內存構建低成本推理方案,驗證稀疏模型在非高端硬件上的可行性。目前,該方案已在DeepSeek的本地化部署場景中落地。


(圖源/企業)

接下來,公司將把重心轉向自研芯片的推進。季宇表示,公司今年的核心目標是完成芯片流片,并盡快推向市場,以芯片產品作為商業化的主要抓手。

當下,Open Claw的現象級傳播也揭示了市場對消費級硬件承載高質量AI的巨大需求。季宇表示,行云希望通過其芯片產品,將低成本、高質量的萬億級模型算力真正落地到如龍蝦機等端側設備,突破當前端側僅能運行100B小模型的局限,為消費電子市場打開新的想象空間。

CTO余洪敏表示,行云的設計優先級已從追求單芯片極致性能,轉變為從板級系統角度追求可擴展性與供應鏈穩定性。通過分布式設計和采用成熟工藝與低成本存儲,在系統層面實現成本最優與性能體驗一致,這是公司實現算力普惠的重要基礎。

投資方觀點

峰瑞資本副總裁李罡表示:作為天使輪投資人,行云團隊從23年創業開始,對AI芯片(特別是大模型環境下的AI芯片)有著極為前瞻的視角和思路。在近三年的模型和應用的快速變化中,我們看到行云針對下一代通用大模型的芯片方案和前瞻的設計思想,不斷得到驗證,始終領先時代半步。

五源資本表示:行云是AI芯片領域少有的‘第一性原理’思考者,季宇博士24年就前瞻性地洞察到MoE稀疏架構下硬件瓶頸從算力向顯存遷移的結構性轉變——放棄HBM、以LPDDR乃至NAND重構顯存成本,不是漸進優化,而是通過系統級的軟硬件協同設計能力推動行業范式創新。2026年以來隨著AI模型coding和agent能力持續增強,AI推理需求爆發,OpenClaw等Agent的現象級破圈,正在將推理算力需求從云端拉向多端,從程序員推向大眾,高效低成本的推理能力成為行業剛需。伴隨未來推理需求的指數級增長,行云的技術路徑將成為推動算力普惠的重要基礎設施。

賽富投資基金負責科技賽道的管理合伙人蔣馳華表示:在AI大模型向萬億參數演進的過程中,降本的關鍵已經不在算力,而在顯存和系統的架構,特別是在國產算力受限的前提下。季宇和行云團隊展現出了罕見的系統級工程視野,他們跳出了盲目堆砌HBM的行業定式,通過LPDDR/NAND等介質替換與并行架構設計,將顯存和系統成本打下來一到兩個數量級,進而實現單Token成本極值,符合行業演進的方向。我們始終聚焦AI與具身智能領域的底層顛覆者。行云兼具前瞻的架構創新與扎實的落地能力,賽富很榮幸能在這一輪重倉支持。我們期待行云的新一代推理芯片徹底重構算力成本模型,真正實現大模型推理在云端與端側的全面普惠。

春華資本表示:在國產算力生態加速構建的大背景下。行云敏銳地將設計重心錨定在顯存成本重構上,以LPDDR與NAND替代HBM、通過多通道并行架構彌補單顆粒帶寬不足,本質上是在重新定義推理芯片的成本架構。季宇博士對AI芯片架構的演進方向有著超越行業慣性的深度思考,他對‘降本關鍵在顯存而非算力’的判斷,始終領先行業共識半步,且每一步都在被市場持續驗證;余洪敏博士作為從海思昇騰到百度昆侖芯一路走來的芯片老兵,對芯片從設計到量產的每一個環節都有實戰積累。這種‘敢想’與‘能做’的結合,讓行云具備了從架構創新到產品交付的完整閉環能力。我們期待行云的首顆自研芯片順利流片,開啟AI推理算力的新一輪成本革命。

佰維存儲科技股份有限公司副總經理王燦:在大模型從通用AI向Agent形態演進的發展階段,季宇博士展現了極具前瞻性的系統級洞察。他精準地識別出:大模型推理的結構性瓶頸已不再僅僅是算力本身,而是制約規模化落地的更低成本的存儲。行云的核心邏輯非常清晰——通過介質替換與架構創新,以低成本的LPDDR乃至NAND介質挑戰昂貴的HBM霸權,這不僅是物理介質的更迭,更是對大模型推理成本結構的底層重構。圍繞這一核心路徑,行云構建了極致的軟硬件協同設計,通過PD分離、分布式擴展等手段,在系統層面實現了性能與成本的平衡。芯片行業,工程經驗決定了從‘實驗室架構’到‘商業化量產’的跨度。行云團隊在昇騰、昆侖芯等頂尖項目上積淀的深厚流片與量產經驗,是其確定性的來源。在AI Agent爆發的當下,我堅信行云能夠真正擊穿算力成本,讓高質量的萬億級模型實現真正的算力普惠。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你見過最離譜的網購是什么?網友:倉庫是不會承認自己發錯了的

你見過最離譜的網購是什么?網友:倉庫是不會承認自己發錯了的

另子維愛讀史
2026-02-16 20:35:50
廣東一女子在閑魚上充200元話費,一個月后因涉詐被停機,警方:已第一時間為其申請解除,手機無法恢復通訊可能還有其它原因

廣東一女子在閑魚上充200元話費,一個月后因涉詐被停機,警方:已第一時間為其申請解除,手機無法恢復通訊可能還有其它原因

洪觀新聞
2026-04-22 14:47:37
隊報:伊朗預計不會退出世界杯,真退出也是阿聯酋遞補而非意大利

隊報:伊朗預計不會退出世界杯,真退出也是阿聯酋遞補而非意大利

蘭亭墨未干
2026-04-24 03:59:01
2-0!凱恩44戰52球,迪亞斯壓哨建功,豪取8連勝,拜仁劍指4冠王

2-0!凱恩44戰52球,迪亞斯壓哨建功,豪取8連勝,拜仁劍指4冠王

我的護球最獨特
2026-04-23 04:44:10
暴漲11萬億!中國外貿甩開美國,出口跌破10%,美霸權全線潰敗?

暴漲11萬億!中國外貿甩開美國,出口跌破10%,美霸權全線潰敗?

小莜讀史
2026-04-23 04:07:58
與伊朗沖突還沒解決,以色列有了新目標,不是古巴,也不是格陵蘭

與伊朗沖突還沒解決,以色列有了新目標,不是古巴,也不是格陵蘭

小蔣愛嘮嗑
2026-04-24 01:36:58
“中產階級”及格線誕生!全國只有3320萬戶,你達標了嗎?

“中產階級”及格線誕生!全國只有3320萬戶,你達標了嗎?

李云飛Afey
2026-01-01 12:52:31
爆料!全紅嬋網暴案,犯案的真正目的

爆料!全紅嬋網暴案,犯案的真正目的

藝利森
2026-04-23 22:29:28
國家衛健委:肺癌高危人群篩查推薦使用低劑量螺旋CT,普通CT的輻射劑量是低劑量螺旋CT的3到6倍

國家衛健委:肺癌高危人群篩查推薦使用低劑量螺旋CT,普通CT的輻射劑量是低劑量螺旋CT的3到6倍

大象新聞
2026-04-23 17:45:23
狄龍30+6登全美熱搜!美媒調侃他超厭惡SGA 被贊如超巨該獲尊重

狄龍30+6登全美熱搜!美媒調侃他超厭惡SGA 被贊如超巨該獲尊重

顏小白的籃球夢
2026-04-23 12:44:32
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

書紀文譚
2026-04-23 23:08:56
4200萬人社保斷繳刷屏全網,真相沒那么簡單

4200萬人社保斷繳刷屏全網,真相沒那么簡單

流蘇晚晴
2026-04-23 19:53:55
玩的就是心跳

玩的就是心跳

牛彈琴
2026-04-22 07:39:41
馬鞍山一中學多名學生研學就餐后腹痛腹瀉,官方:涉事酒店停業整頓

馬鞍山一中學多名學生研學就餐后腹痛腹瀉,官方:涉事酒店停業整頓

界面新聞
2026-04-23 21:01:05
廣東5歲女童吃香蕉噎死,父母向贈香蕉老人索賠73萬,結果如何?

廣東5歲女童吃香蕉噎死,父母向贈香蕉老人索賠73萬,結果如何?

雍親王府
2026-04-20 20:10:03
奧斯卡影后查理茲·塞隆公開講述:為了保護我,母親槍殺了父親……

奧斯卡影后查理茲·塞隆公開講述:為了保護我,母親槍殺了父親……

大風新聞
2026-04-23 17:21:03
喜訊!上海足壇今日已迎來久違大牌外援,數百名申花球迷熬夜接機

喜訊!上海足壇今日已迎來久違大牌外援,數百名申花球迷熬夜接機

寶哥精彩賽事
2026-04-23 20:23:14
湖人變季后賽頭號黑馬,晉級次輪概率超6成,兩數據驚艷改變戰局

湖人變季后賽頭號黑馬,晉級次輪概率超6成,兩數據驚艷改變戰局

謝說籃球
2026-04-23 16:51:33
特朗普延長停火竟在“等他”?遲遲未露面的伊朗新最高領袖將對美方最新提議作出回應

特朗普延長停火竟在“等他”?遲遲未露面的伊朗新最高領袖將對美方最新提議作出回應

紅星新聞
2026-04-23 12:38:15
《蜜語紀》直到許蜜語生父現身,紀封才知,魏董事長重用他的真相

《蜜語紀》直到許蜜語生父現身,紀封才知,魏董事長重用他的真相

娛樂傾城巷
2026-04-23 19:10:30
2026-04-24 04:47:00
36氪 incentive-icons
36氪
讓一部分人先看到未來
151216文章數 2848744關注度
往期回顧 全部

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

手機
教育
藝術
公開課
軍事航空

手機要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發!

教育要聞

推薦一款高考志愿卡,五大功能助你解決志愿疑難

藝術要聞

吉達塔蓋到第100層,“它是沙特唯一能按期完成的大項目”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進入關懷版