近日,由中科創星參投的清程極智團隊系統構建了以赤兔推理引擎、AI Ping評測路由平臺、八卦爐智能軟件棧為核心的全鏈路Token解決方案。清程極智圍繞大模型推理降本、國產算力生態適配、Token服務質量與性價比三大行業關鍵痛點,集中推出了多項核心技術突破與規模化落地成果,以技術創新推動中國AI產業從“能用”邁向好用、省錢、自主可控的新階段。(雷峰網)
清程極智成立于2023年12月,核心團隊來自清華大學計算機系高性能計算所,已完成天使輪、PreA、PreA+三輪融資,獲得中科創星、中金資本、考拉基金、聯想創投、中關村科學城公司等多家國資與明星投資機構加持,是國內專注AI基礎設施(AI Infra)的標桿企業,致力于打造一站式全鏈路Token解決方案。
當前,全球 AI 產業已進入規模化落地的關鍵階段,Token 成為 AI 時代的 “水電煤”,是大模型服務與智能應用的核心生產要素。數據顯示,2024 年初至 2026 年 3 月,中國 Token 日均調用量激增約1400 倍,規模突破140 萬億。伴隨 Agent 智能體、多模態應用快速普及,Token 正從交互用量轉向生產用量,直接推動產業對推理效率、部署成本、服務穩定性的要求持續攀升。
在 Token 需求爆發的同時,國產算力與國產模型迎來高速發展,但二者之間的推理環節卻長期依賴海外引擎,難以充分釋放國產硬件性能;而 Token 服務市場也面臨亂、貴、慢、選型難等突出問題,供需錯位、成本高企、體驗不一,成為制約 AI 技術普惠化、規模化落地的核心瓶頸。
針對大模型部署成本高、國產算力適配不足的痛點,清程極智推出赤兔推理引擎。作為完全自主研發的國產推理引擎,赤兔打破海外技術壟斷,構建“國產算力+國產引擎+國產模型”全國產化閉環,針對昇騰、海光、沐曦、摩爾線程等國產芯片的硬件特性深度優化,實現標量向量計算、數據表達、硬件調度、卡間互聯的全維度適配,解決國產算力“能用不好用”的難題。
在性能與成本上,赤兔推理引擎實現突破性提升:通過軟件方案在不具備FP4/FP8硬件能力的算力設備上支持FP4/FP8低位寬量化,使用FP8量化可降低50%算力門檻,FP4量化可降低75%算力門檻;部署DeepSeek?V3滿血版模型時,僅需1臺8卡910B服務器即可替代傳統4臺8卡機,硬件成本從600萬元降至150萬元。目前,赤兔已在券商、能源央企等場景落地應用,某能源央企實現3500+員工全國產化算力穩定使用,算力效率提升近40%,相關案例榮獲2025人工智能應用大賽銅獎。(雷峰網)
面對Token服務市場服務商林立、指標混亂、選型成本高的行業亂象,清程極智打造AI Ping一站式大模型服務評測與API智能路由平臺,成為國內首個集“信息匯總、客觀評測、智能路由”于一體的Token服務樞紐。平臺已接入30余家主流服務商、600余個大模型服務,覆蓋文本、圖片、視頻等全場景;通過7×24小時多地域分布式監測,實時輸出延遲、吞吐、可靠性、價格等核心指標,數據真實可核驗;依托智能路由算法,以統一API接口為用戶自動匹配最優服務商,實現成本降低超37%、吞吐提升超90%、延遲降低超20%,讓開發者“一鍵調用、省心省錢”,專注業務創新。
此外,清程極智還推出八卦爐智能軟件棧,面向大模型訓練、微調場景提供高效Token生產與智能調度能力,與赤兔推理引擎、AI Ping平臺形成協同,覆蓋AI“訓練?推理?應用”全流程,構建完整的AI基礎設施生態。
清程極智相關負責人表示,公司將持續深耕AI基礎設施領域,堅持核心技術自主可控,不斷迭代赤兔推理引擎對國產芯片的適配能力,完善AI Ping評測與路由服務,聯動國產算力、國產模型、行業應用等產業鏈伙伴,打造高效、普惠、安全的國產AI基礎設施體系,響應國家“人工智能+”行動,以技術創新推動中國AI產業高質量發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.