无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

月之暗面黃震昕:Kimi不做重交付,FDE難點不在于模型廠商

0
分享至


今年以來,當頭部的大模型廠商在圍繞模型迭代、產品力、融資、上市等集體搶占時間窗口時,商業化這個命題也被悄然塞進了他們的時間表里。

結合近期Kimi對外的披露,以及與月之暗面Kimi B端負責人黃震昕的交流,可以梳理出這家公司在商業化路徑上的一系列戰略選擇與自我定位。

在過去兩年間,Kimi首次大規模應用二階優化器Muon取代了已成為行業標準10年之久的Adam優化器,推出基于KDA注意力機制的Kimi Linear架構,以及推出注意力殘差方案,對計算效率得以大幅提升。

關于Harness,Kimi的判斷是:隨著基礎模型變強,對外部復雜Harness的要求會降低,類似去年Prompt工程熱度的下降。因此Kimi內部已開始實踐Loop Engineering(循環工程)。

黃震昕認為,隨著Token市場價格走高,用戶對于高性能的Token需求仍有支付意愿,同時,雖然由于芯片荒和算力成本上升導致成本在漲,但模型廠商也在通過技術優化,將Token的實際成本往下降低。

在定價策略上,Kimi的定位是做高性能模型,而非最便宜的模型。尤其是伴隨今年模型價格的集體上漲,背后核心原因仍然是全球算力供應跟不上Token需求增長。為此,Kimi對沖成本壓力的方式是通過技術優化,其KV-Cache命中率達到90%以上。

“評估模型價格不能只看輸入輸出定價,還要看KV-Cache命中率。只要命中,成本就會降很多,能給用戶節省成本。” 黃震昕告訴筆者。

作為Kimi B端負責人,黃震昕還著重提及了Kimi在To B業務的布局,包括三層服務體系:模型層提供K2.7 Code、K2.6等基礎模型;架構層提供API及Agent SDK;產品層推出企業版,包含Kimi Agent集群、Kimi Code、Kimi Work等工具。黃震昕指出,Kimi不會做太重的交付工作,“模型本身還有大量技術難題待攻克,Kimi能把模型做好已經非常不易。”

對于企業級應用所需的“最后一公里”服務,Kimi選擇通過FDE合作伙伴來完成端到端交付,而非自建重服務團隊。在行業解決方案層面,Kimi也在嘗試與亞馬遜云科技等合作構建金融、醫療、制造等垂直場景的方案,前者提供模型能力,而后者主要提供行業經驗與客戶資源。

以下是黃震昕在亞馬遜云科技中國峰會上的演講全文。

我是月之暗面(Moonshot AI)的黃震昕,負責公司的B端業務。很高興能在亞馬遜云科技中國峰會上和大家分享我們的思考。

我加入月之暗面時,就被一個愿景所吸引:致力于尋找將能源轉化為智能的最優解。為什么選擇這個命題?人類歷史上有三次真正的能源變遷。第一次是我們學會了利用陽光,第二次是我們發掘了煤炭,第三次,也就是現在,我們正在學習如何將能源高效地轉化為智能。前兩次轉化是線性的、有限的,而這一次轉化是可逆的、可擴展的、可存儲的。

關于實現這一最優解,我們的目標一直是做出全球領先的模型。因此,對于月之暗面來說,擴大模型規模(Scaling)是一個必選項。大家從新聞中也了解到,我們近期完成了規模不小的融資,但和海外同行相比,這筆資金并不算多。因此,我們致力于找到效率的最優解。

為此,我們選擇了三個技術方向,因為它們對應了智能體的三個核心能力維度:聰明程度、干活時長(Long Context)和協作能力(Agent Swarm)。

第一,聰明程度。數據并非無限,在相同的算力下,誰能學得更聰明,誰就更具優勢。

第二,干活時長。這決定了模型如何能處理更長時間的任務,同時不忘記最初的目標是什么。

第三,協作能力。單個智能體再強大,也有其局限性。如何讓多個智能體有效組隊,協作完成復雜的用戶任務,是另一個關鍵。

這三個維度結合起來,就是AI產品能力的整體體現。自2025年以來,我們在這三個方向上都取得了關鍵突破。大家可以看到,Kimi的每一項創新,都瞄準了最基礎的模型架構,而不僅僅是工程效率的優化。

以優化器為例,經典的Adam優化器誕生于11年前,我們將一種新的優化技術運用到了大部分訓練中,使實際數據的使用效率提升了27%,整體效率直接翻倍。在長文本(Long Context)方面,傳統的Attention架構誕生于八年前,我們推出了Kimi Linear Attention技術,將在下一代模型中應用。傳統架構下,模型擴大十倍,訓練和推理成本將擴大一百倍;而采用新技術后,僅需十倍的算力即可實現。此外,殘差連接技術誕生于十年前,我們推出了注意力殘差(Attention Residual)技術,使效率提升了25%。

馬斯克也曾專門為我們的技術點贊。可以說,模型的規模瓶頸正在被我們逐一解決,更大規模、更高質量的模型成為可能。一個行業常識是,KV緩存命中率很大程度上影響用戶的最終使用成本。我們通過研發Kimi的工程優化,持續提升效率,降低KV緩存失效率,從而降低了API的使用成本,讓更多用戶能夠用得起。

最近,我們也發布了Kimi K2.7,其代碼能力大幅提升。我們還特別推出了高速版本,輸出速度達到了180 token/秒。很多朋友反饋,用上之后就再也回不去了。這也是我們努力通過推理優化提升客戶體驗的例證。

Kimi是一家注重審美的公司,我們的品牌調性很明確,專注于生產力領域。我們把有限的能源和算力,集中在學術研究、軟件工程、復雜推理等領域。長期使用的用戶會發現,我們的核心場景始終圍繞著提升生產力。

大家可能對Kimi的印象更多停留在To C端,但其實我們在To B領域也并非簡單地售賣API,而是提供了一整套完整的生產力賦能體系。該體系具備三層能力:

模型層:Kimi持續做最強的基礎模型。目前底座已涵蓋K2.7 Code、K2.6和K2.5等模型,為企業級應用提供堅實的智能底座。

服務層:Kimi提供豐富的API,開發者可以借此進行深度集成,將Kimi的能力無縫嵌入到企業自身的工作流中,例如網頁搜索、PPT生成等。

工具/產品層:Kimi提供包括Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等開箱即用的產品。該層級直接解決企業真實場景中的復雜問題,例如讓Agent自動處理報表、生成行業分析、管理項目文檔等。

在全球化業務拓展方面,Kimi正攜手亞馬遜云科技推進全球業務協同,借助其從基礎設施層到應用落地層面的全方位助力,實現全球化規模加速,為全球企業賦能生產力:

基礎設施和服務層面:Kimi運行在亞馬遜云科技遍布全球的數據中心和網絡基礎設施上,獲得了穩定可靠的算力支持,確保模型運行得又快又穩。Kimi多個模型現已登陸Amazon SageMaker,讓更多開發者可以進行模型的訓練與推理,大幅降低使用門檻。同時,Amazon Bedrock已經接入了Kimi K2.5等開源模型,未來Kimi正在積極推進接入更多最新模型,讓用戶無需自行管理基礎設施或單獨部署服務器就能使用Kimi模型。此外,Amazon Bedrock Guardrails的企業級安全能力也將自動適用于Kimi,提供有害內容過濾、提示詞攻擊防護以及企業合規保障。

業務合作層面:Kimi已登陸亞馬遜云科技Marketplace,直接觸達全球數百萬活躍企業客戶。全球客戶可以通過該數字軟件市場簡化采購流程,實現一鍵使用、按量付費與零門檻接入。同時,借助APN合作伙伴網絡,Kimi正在快速拓展企業客戶。

垂直行業層面:Kimi與亞馬遜云科技聯合打造行業解決方案,已覆蓋金融、醫療、制造等垂直行業場景。在合作中,Kimi提供核心大模型,亞馬遜云科技發揮其豐富的行業經驗與客戶資源,共同將Kimi的能力無縫嵌入到企業的真實業務流程中。

以上就是今天的分享。我們期待與亞馬遜云科技攜手,繼續探索將能源轉化為智能的最優解。

(作者 | 楊麗,編輯 | 楊林)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
世界杯動容1幕:27歲球星跪地痛哭!兒子胎中夭折 全隊安慰

世界杯動容1幕:27歲球星跪地痛哭!兒子胎中夭折 全隊安慰

葉青足球世界
2026-06-30 10:50:44
云南省委常委、組織部部長趙月霞:2025年,全省共調整不適宜擔任現職干部518名,重新使用處分影響期滿、實績突出的干部301名

云南省委常委、組織部部長趙月霞:2025年,全省共調整不適宜擔任現職干部518名,重新使用處分影響期滿、實績突出的干部301名

政知新媒體
2026-06-30 13:51:04
別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

細說職場
2026-06-30 15:58:38
《百年孤獨》:你給子女搭的每一座橋都是多余,你替爹娘扛的每一座山都是沒用的,親情里最涼的孤單,是你操碎了心他們卻各活各的命

《百年孤獨》:你給子女搭的每一座橋都是多余,你替爹娘扛的每一座山都是沒用的,親情里最涼的孤單,是你操碎了心他們卻各活各的命

心理觀察局
2026-06-30 06:43:12
田中碧哭成淚人!日媒:多人傷病已踢出風采 海外球迷贊譽一片

田中碧哭成淚人!日媒:多人傷病已踢出風采 海外球迷贊譽一片

顏小白的籃球夢
2026-06-30 09:20:58
男女的性壓抑已經恐怖如斯了?

男女的性壓抑已經恐怖如斯了?

燈錦年
2026-06-29 17:15:19
世界杯預測,科特迪瓦隊淘汰挪威隊,法國隊擊敗瑞典隊晉級16強

世界杯預測,科特迪瓦隊淘汰挪威隊,法國隊擊敗瑞典隊晉級16強

足球分析員
2026-06-30 11:00:03
森保一:接下來專注亞洲杯爭冠,但即使奪冠也無法抹去世界杯之痛

森保一:接下來專注亞洲杯爭冠,但即使奪冠也無法抹去世界杯之痛

蘭亭墨未干
2026-06-30 06:25:03
心理學:一個男的一旦跟婚外的女人睡過了,他就很難再死心塌地愛自己老婆了,別不信

心理學:一個男的一旦跟婚外的女人睡過了,他就很難再死心塌地愛自己老婆了,別不信

心理觀察局
2026-06-30 07:04:26
專訪|??《四渡》導演徐展雄:這部電影是拍給年輕人看的

專訪|??《四渡》導演徐展雄:這部電影是拍給年輕人看的

澎湃新聞
2026-06-30 11:00:29
總計3年6400萬!熱火降薪續約維金斯 鋒線扎堆還追詹姆斯嗎

總計3年6400萬!熱火降薪續約維金斯 鋒線扎堆還追詹姆斯嗎

醉臥浮生
2026-06-30 07:28:35
幾乎下了一夜!北京降雨達中雨,局地大暴雨,今天可能還有雨

幾乎下了一夜!北京降雨達中雨,局地大暴雨,今天可能還有雨

愛上昌平
2026-06-30 11:46:45
廣東一愛心企業捐贈的350套路燈竟全是“三無”產品,還有村民曾因此受傷,企業回應:很無奈,是通過正規途徑購買的,一共花費33萬多元

廣東一愛心企業捐贈的350套路燈竟全是“三無”產品,還有村民曾因此受傷,企業回應:很無奈,是通過正規途徑購買的,一共花費33萬多元

瀟湘晨報
2026-06-30 15:20:18
美的空調卡bug 完美適配歐洲各國法規!網友:活該人家賣爆

美的空調卡bug 完美適配歐洲各國法規!網友:活該人家賣爆

快科技
2026-06-29 15:32:21
女演員千萬別整容,看45歲馬蘇和40歲江疏影同框,就知道了

女演員千萬別整容,看45歲馬蘇和40歲江疏影同框,就知道了

阿廢冷眼觀察所
2026-06-30 00:52:34
A股:緊急提醒2.5億股民!從今天6月30日起,A股或迎紅色星期二行情?

A股:緊急提醒2.5億股民!從今天6月30日起,A股或迎紅色星期二行情?

趨勢清風俠
2026-06-30 08:06:55
鄭欽文打的到底是誰的臉?

鄭欽文打的到底是誰的臉?

網球之家
2026-06-30 09:31:03
快訊!臺灣唐湘龍發聲了!

快訊!臺灣唐湘龍發聲了!

故事終將光明磊落
2026-06-30 10:53:58
德國隊被淘汰,總理默茨發文:出局固然令人心痛,但我仍為你們驕傲;此前韓國隊出局后,韓國總統李在明怒批球隊表現

德國隊被淘汰,總理默茨發文:出局固然令人心痛,但我仍為你們驕傲;此前韓國隊出局后,韓國總統李在明怒批球隊表現

大風新聞
2026-06-30 11:24:04
兩大芯片巨頭,直線拉升

兩大芯片巨頭,直線拉升

21世紀經濟報道
2026-06-30 13:54:37
2026-06-30 18:08:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
135876文章數 862355關注度
往期回顧 全部

科技要聞

iPhone18 Pro遭泄密!印度代工商惹禍

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

體育要聞

大熱倒灶壓力給到法國 王楚揭法國隊隱患

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

本地
游戲
時尚
公開課
軍事航空

本地新聞

貴州小城的新目標:舉辦“村超”世界杯!

玩家歷時八個月白嫖GTA6!官方羊毛要被薅禿了

“復古波點”又流行回來了!夏天簡單穿就很時髦

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以色列防長:穆杰塔巴已被列入死亡名單

無障礙瀏覽 進入關懷版