![]()
今年以來,當頭部的大模型廠商在圍繞模型迭代、產品力、融資、上市等集體搶占時間窗口時,商業化這個命題也被悄然塞進了他們的時間表里。
結合近期Kimi對外的披露,以及與月之暗面Kimi B端負責人黃震昕的交流,可以梳理出這家公司在商業化路徑上的一系列戰略選擇與自我定位。
在過去兩年間,Kimi首次大規模應用二階優化器Muon取代了已成為行業標準10年之久的Adam優化器,推出基于KDA注意力機制的Kimi Linear架構,以及推出注意力殘差方案,對計算效率得以大幅提升。
關于Harness,Kimi的判斷是:隨著基礎模型變強,對外部復雜Harness的要求會降低,類似去年Prompt工程熱度的下降。因此Kimi內部已開始實踐Loop Engineering(循環工程)。
黃震昕認為,隨著Token市場價格走高,用戶對于高性能的Token需求仍有支付意愿,同時,雖然由于芯片荒和算力成本上升導致成本在漲,但模型廠商也在通過技術優化,將Token的實際成本往下降低。
在定價策略上,Kimi的定位是做高性能模型,而非最便宜的模型。尤其是伴隨今年模型價格的集體上漲,背后核心原因仍然是全球算力供應跟不上Token需求增長。為此,Kimi對沖成本壓力的方式是通過技術優化,其KV-Cache命中率達到90%以上。
“評估模型價格不能只看輸入輸出定價,還要看KV-Cache命中率。只要命中,成本就會降很多,能給用戶節省成本。” 黃震昕告訴筆者。
作為Kimi B端負責人,黃震昕還著重提及了Kimi在To B業務的布局,包括三層服務體系:模型層提供K2.7 Code、K2.6等基礎模型;架構層提供API及Agent SDK;產品層推出企業版,包含Kimi Agent集群、Kimi Code、Kimi Work等工具。黃震昕指出,Kimi不會做太重的交付工作,“模型本身還有大量技術難題待攻克,Kimi能把模型做好已經非常不易。”
對于企業級應用所需的“最后一公里”服務,Kimi選擇通過FDE合作伙伴來完成端到端交付,而非自建重服務團隊。在行業解決方案層面,Kimi也在嘗試與亞馬遜云科技等合作構建金融、醫療、制造等垂直場景的方案,前者提供模型能力,而后者主要提供行業經驗與客戶資源。
以下是黃震昕在亞馬遜云科技中國峰會上的演講全文。
我是月之暗面(Moonshot AI)的黃震昕,負責公司的B端業務。很高興能在亞馬遜云科技中國峰會上和大家分享我們的思考。
我加入月之暗面時,就被一個愿景所吸引:致力于尋找將能源轉化為智能的最優解。為什么選擇這個命題?人類歷史上有三次真正的能源變遷。第一次是我們學會了利用陽光,第二次是我們發掘了煤炭,第三次,也就是現在,我們正在學習如何將能源高效地轉化為智能。前兩次轉化是線性的、有限的,而這一次轉化是可逆的、可擴展的、可存儲的。
關于實現這一最優解,我們的目標一直是做出全球領先的模型。因此,對于月之暗面來說,擴大模型規模(Scaling)是一個必選項。大家從新聞中也了解到,我們近期完成了規模不小的融資,但和海外同行相比,這筆資金并不算多。因此,我們致力于找到效率的最優解。
為此,我們選擇了三個技術方向,因為它們對應了智能體的三個核心能力維度:聰明程度、干活時長(Long Context)和協作能力(Agent Swarm)。
第一,聰明程度。數據并非無限,在相同的算力下,誰能學得更聰明,誰就更具優勢。
第二,干活時長。這決定了模型如何能處理更長時間的任務,同時不忘記最初的目標是什么。
第三,協作能力。單個智能體再強大,也有其局限性。如何讓多個智能體有效組隊,協作完成復雜的用戶任務,是另一個關鍵。
這三個維度結合起來,就是AI產品能力的整體體現。自2025年以來,我們在這三個方向上都取得了關鍵突破。大家可以看到,Kimi的每一項創新,都瞄準了最基礎的模型架構,而不僅僅是工程效率的優化。
以優化器為例,經典的Adam優化器誕生于11年前,我們將一種新的優化技術運用到了大部分訓練中,使實際數據的使用效率提升了27%,整體效率直接翻倍。在長文本(Long Context)方面,傳統的Attention架構誕生于八年前,我們推出了Kimi Linear Attention技術,將在下一代模型中應用。傳統架構下,模型擴大十倍,訓練和推理成本將擴大一百倍;而采用新技術后,僅需十倍的算力即可實現。此外,殘差連接技術誕生于十年前,我們推出了注意力殘差(Attention Residual)技術,使效率提升了25%。
馬斯克也曾專門為我們的技術點贊。可以說,模型的規模瓶頸正在被我們逐一解決,更大規模、更高質量的模型成為可能。一個行業常識是,KV緩存命中率很大程度上影響用戶的最終使用成本。我們通過研發Kimi的工程優化,持續提升效率,降低KV緩存失效率,從而降低了API的使用成本,讓更多用戶能夠用得起。
最近,我們也發布了Kimi K2.7,其代碼能力大幅提升。我們還特別推出了高速版本,輸出速度達到了180 token/秒。很多朋友反饋,用上之后就再也回不去了。這也是我們努力通過推理優化提升客戶體驗的例證。
Kimi是一家注重審美的公司,我們的品牌調性很明確,專注于生產力領域。我們把有限的能源和算力,集中在學術研究、軟件工程、復雜推理等領域。長期使用的用戶會發現,我們的核心場景始終圍繞著提升生產力。
大家可能對Kimi的印象更多停留在To C端,但其實我們在To B領域也并非簡單地售賣API,而是提供了一整套完整的生產力賦能體系。該體系具備三層能力:
模型層:Kimi持續做最強的基礎模型。目前底座已涵蓋K2.7 Code、K2.6和K2.5等模型,為企業級應用提供堅實的智能底座。
服務層:Kimi提供豐富的API,開發者可以借此進行深度集成,將Kimi的能力無縫嵌入到企業自身的工作流中,例如網頁搜索、PPT生成等。
工具/產品層:Kimi提供包括Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等開箱即用的產品。該層級直接解決企業真實場景中的復雜問題,例如讓Agent自動處理報表、生成行業分析、管理項目文檔等。
在全球化業務拓展方面,Kimi正攜手亞馬遜云科技推進全球業務協同,借助其從基礎設施層到應用落地層面的全方位助力,實現全球化規模加速,為全球企業賦能生產力:
基礎設施和服務層面:Kimi運行在亞馬遜云科技遍布全球的數據中心和網絡基礎設施上,獲得了穩定可靠的算力支持,確保模型運行得又快又穩。Kimi多個模型現已登陸Amazon SageMaker,讓更多開發者可以進行模型的訓練與推理,大幅降低使用門檻。同時,Amazon Bedrock已經接入了Kimi K2.5等開源模型,未來Kimi正在積極推進接入更多最新模型,讓用戶無需自行管理基礎設施或單獨部署服務器就能使用Kimi模型。此外,Amazon Bedrock Guardrails的企業級安全能力也將自動適用于Kimi,提供有害內容過濾、提示詞攻擊防護以及企業合規保障。
業務合作層面:Kimi已登陸亞馬遜云科技Marketplace,直接觸達全球數百萬活躍企業客戶。全球客戶可以通過該數字軟件市場簡化采購流程,實現一鍵使用、按量付費與零門檻接入。同時,借助APN合作伙伴網絡,Kimi正在快速拓展企業客戶。
垂直行業層面:Kimi與亞馬遜云科技聯合打造行業解決方案,已覆蓋金融、醫療、制造等垂直行業場景。在合作中,Kimi提供核心大模型,亞馬遜云科技發揮其豐富的行業經驗與客戶資源,共同將Kimi的能力無縫嵌入到企業的真實業務流程中。
以上就是今天的分享。我們期待與亞馬遜云科技攜手,繼續探索將能源轉化為智能的最優解。
(作者 | 楊麗,編輯 | 楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.