投資界4月17日消息,國內全自研GPGPU創新企業「北京行云集成電路有限公司」(以下簡稱"行云")宣布連續完成Pre-A及Pre-A+多輪融資,融資金額超4億元人民幣。本輪由五源資本、賽富投資基金、春華資本聯合領投,北京、江蘇等地方國資、佰維存儲、金沙江聯合帶動全球知名GPU企業創始人家辦、創維資本等產業資本跟投。云岫資本連續多輪服務并擔任下一輪獨家融資財務顧問。
行云成立于2024年,專注面向大模型推理的新一代GPGPU芯片。技術上打造超大顯存規格、極致CUDA兼容的全自研產品,公司目標直指AI大模型推理的普惠化。
創始人季宇博士,清華大學計算機系博士,"華為天才少年"計劃成員,曾在華為海思深度參與昇騰AI芯片的編譯器與架構研發。CTO余洪敏博士,中科院半導體所博士,曾深度參與包括兩款國產AI芯片在內的多款芯片的研發與量產,擁有十余款芯片成功流片經驗。一位是站在算法×編譯器交界處的架構師,一位是十余次走完"實驗室到量產"全流程的芯片老兵這恰好對應了行云技術路線的兩個重點:架構判斷要不要賭錯、工程交付能不能扛住。
行云的技術路徑,可以拆成"介質替換"和"系統級工程"兩層。
介質層面,行云放棄成本高昂的HBM,轉而采用LPDDR乃至NAND(SSD顆粒)作為顯存介質,使顯存成本下降1到2個數量級。低成本介質單顆粒帶寬較低,行云用多顆粒、多通道并行架構把整體帶寬堆疊到TB級,匹配大模型推理的吞吐需求。
系統層面,公司通過Prefill / Decode分離(PD分離)、KV Cache稀疏化、分布式擴展、極致CUDA兼容等手段,在系統級構建軟硬件協同壁壘。CTO余洪敏強調,行云的設計優先級已經從"追求單芯片極致性能"轉向"從板級系統角度追求可擴展性與供應鏈穩定性"通過分布式設計與成熟工藝、低成本存儲的組合,在系統層面實現成本最優與體驗一致。
物化到產品,就是行云即將推出的首款消費級桌面計算產品,CUDA極致兼容,面向消費級價位點設計。它不是一張被裁剪過的計算卡,而是從底層就為"在端側跑千億模型"重新設計的芯片,讓用戶可以在萬元價位高吞吐運行萬億級別參數的大模型。
行云援引一個產業類比:當19世紀的交通革命中鐵路剛出現的時候,英國產生了巨大的鐵路泡沫,認為所有的道路將通過鐵路流通,并最終留下了商業模型的崩潰出清。但最后并不是只靠貫穿大洲的鐵路干線完成所有的交通需求,更依賴于深入毛細血管的汽車與公路。今天的AI算力網絡也站在同樣的分岔口是走向超算壟斷的"中心化鐵軌",還是走向端側普惠的"分布式公路"?
行云給出的答案是后者。在公司的產品路線里,首顆芯片只是第一個錨點。當技術路徑進一步推向NAND介質,端側算力設備的價位有望下探到千元級,覆蓋主流千億乃至萬億參數模型,并在單用戶場景下反超云端體驗,最終讓AI算力設備的普及率接近今天的智能手機。
與此對應,季宇明確表示,公司今年的核心目標是完成芯片量產并盡快推向市場,以芯片產品作為商業化的主要抓手。OpenClaw 和Hermers這類Agent平臺的現象級傳播也已經印證了下游需求市場對"消費級硬件承載高質量AI"的渴望,已經具備實際購買力。
峰瑞資本副總裁李罡表示:作為天使輪投資人,行云團隊從23年創業開始,對AI芯片,特別是大模型環境下的AI芯片,有著極為前瞻的視角和思路。在近三年模型與應用的快速變化中,我們看到行云針對下一代通用大模型的芯片方案和前瞻設計思想,不斷得到驗證,始終領先時代半步。
五源資本表示:行云是AI芯片領域少有的"第一性原理"思考者,季宇博士24年就前瞻性地洞察到MoE稀疏架構下硬件瓶頸從算力向顯存遷移的結構性轉變放棄HBM、以LPDDR乃至NAND重構顯存成本,不是漸進優化,而是通過系統級軟硬件協同設計能力推動行業范式創新。2026年以來隨著AI模型coding和agent能力持續增強,AI推理需求爆發,OpenClaw 等Agent的現象級破圈,正在把推理算力需求從云端拉向多端、從程序員推向大眾,高效低成本的推理能力成為行業剛需。伴隨未來推理需求的指數級增長,行云的技術路徑將成為推動算力普惠的重要基礎設施。
賽富投資基金負責科技賽道的管理合伙人蔣馳華表示:在AI大模型向萬億參數演進的過程中,降本的關鍵已經不在算力,而在顯存和系統的架構,特別是在國產算力受限的前提下。季宇和行云團隊展現出了罕見的系統級工程視野,他們跳出了盲目堆砌HBM的行業定式,通過LPDDR/NAND等介質替換與并行架構設計,將顯存和系統成本打下來一到兩個數量級,進而實現單Token成本極值,符合行業演進方向。我們始終聚焦AI與具身智能領域的底層顛覆者。行云兼具前瞻的架構創新與扎實的落地能力,賽富很榮幸能在這一輪重倉支持。
春華資本表示:在國產算力生態加速構建的大背景下,行云敏銳地把設計重心錨定在顯存成本重構上,以LPDDR與NAND替代HBM、通過多通道并行架構彌補單顆粒帶寬不足,本質上是在重新定義推理芯片的成本架構。季宇博士對AI芯片架構演進方向有著超越行業慣性的深度思考;余洪敏博士作為從海思昇騰到百度昆侖芯一路走來的芯片老兵,對芯片從設計到量產的每一個環節都有實戰積累。"敢想"與"能做"的結合,讓行云具備了從架構創新到產品交付的完整閉環能力。
佰維存儲科技股份有限公司副總經理王燦表示:在大模型從通用AI向Agent形態演進的發展階段,季宇博士展現了極具前瞻性的系統級洞察。他精準識別出:大模型推理的結構性瓶頸已不再僅僅是算力本身,而是制約規模化落地的更低成本的存儲。行云的核心邏輯非常清晰通過介質替換與架構創新,以低成本的LPDDR乃至NAND介質挑戰昂貴的HBM霸權,這不僅是物理介質的更迭,更是對大模型推理成本結構的底層重構。在AI Agent爆發的當下,我堅信行云能夠真正擊穿算力成本,讓高質量的萬億級模型實現真正的算力普惠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.