无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Kimi K2.6 開(kāi)源,最強(qiáng)大Agent模型,部署教程

0
分享至

月之暗面剛剛開(kāi)源了Kimi K2.6,直接把 Agent 能力拉到了一個(gè)新高度


一句話總結(jié)

Kimi K2.6 是目前最強(qiáng)的開(kāi)源原生多模態(tài) Agent 模型

1T 參數(shù) MoE 架構(gòu),32B 激活參數(shù),256K 上下文,原生支持圖片和視頻輸入,還能同時(shí)指揮 300 個(gè)子 Agent 協(xié)同執(zhí)行 4000 步任務(wù)

說(shuō)白了,這次升級(jí)的核心不是"更聰明",而是"更能干"——從一個(gè)會(huì)思考的模型,進(jìn)化成了一個(gè)能自主執(zhí)行復(fù)雜任務(wù)的 Agent 引擎

模型架構(gòu)

K2.6 延續(xù)了 K2.5 的 MoE 架構(gòu),參數(shù)規(guī)模沒(méi)變,但能力大幅躍升:

參數(shù)

規(guī)格

總參數(shù)量

1T

激活參數(shù)

32B

層數(shù)

61(含 1 層 Dense)

專家數(shù)

384

每 Token 激活專家數(shù)

8

上下文長(zhǎng)度

256K

注意力機(jī)制

MLA

激活函數(shù)

SwiGLU

視覺(jué)編碼器

MoonViT(400M)

詞表大小

160K

跟 K2.5 架構(gòu)完全一致,部署方法可以無(wú)縫復(fù)用

這對(duì)運(yùn)維來(lái)說(shuō)是好消息——換模型不用換部署流程

四大核心能力

K2.6 這次主打四個(gè)方向,每一個(gè)都指向"干活":

1. 長(zhǎng)程編程(Long-Horizon Coding)

不是寫(xiě)個(gè)函數(shù)那種小活兒,是端到端的復(fù)雜編程任務(wù)——跨語(yǔ)言(Rust、Go、Python 都行)、跨領(lǐng)域(前端、DevOps、性能優(yōu)化全覆蓋)??纯?Terminal-Bench 2.0 的成績(jī):K2.6 拿了 66.7 分,GPT-5.4 和 Claude Opus 4.6 都是 65.4。SWE-Bench Pro 更直接,K2.6 拿了 58.6,GPT-5.4 是 57.7,Claude 只有 53.4

2. 代碼驅(qū)動(dòng)設(shè)計(jì)(Coding-Driven Design)

簡(jiǎn)單一句話 prompt 甚至一張圖,K2.6 就能給你生成生產(chǎn)級(jí)的前端界面——結(jié)構(gòu)化布局、交互元素、動(dòng)畫(huà)效果一步到位。這個(gè)能力對(duì)全棧開(kāi)發(fā)者來(lái)說(shuō)太香了。

下面是 Kimi Design Bench 的測(cè)試結(jié)果,在四大類設(shè)計(jì)任務(wù)上 K2.6 表現(xiàn)很強(qiáng):


Kimi Design Bench 設(shè)計(jì)能力測(cè)試

3. Agent 集群(Elevated Agent Swarm)

這個(gè)是我最激動(dòng)的

K2.6 能橫向擴(kuò)展到300 個(gè)子 Agent,協(xié)同執(zhí)行 4000 步任務(wù)。它可以動(dòng)態(tài)把一個(gè)大任務(wù)拆解成并行的專業(yè)化子任務(wù),一次性輸出文檔、網(wǎng)站、電子表格等多種交付物

BrowseComp Agent Swarm 測(cè)試?yán)?,K2.6 拿了 86.3 分,GPT-5.4 只有 78.4——Agent 編排能力已經(jīng)是開(kāi)源模型里的天花板了

4. 主動(dòng)式編排(Proactive & Open Orchestration)

K2.6 能驅(qū)動(dòng) 7×24 小時(shí)后臺(tái)運(yùn)行的自主 Agent,主動(dòng)管理日程、執(zhí)行代碼、跨平臺(tái)操作,不需要人盯著。月之暗面自家 RL 基礎(chǔ)設(shè)施團(tuán)隊(duì)用 K2.6 驅(qū)動(dòng)的 Agent連續(xù)自主運(yùn)行了 5 天,負(fù)責(zé)監(jiān)控、故障響應(yīng)和系統(tǒng)運(yùn)維。

Claw Bench 內(nèi)部評(píng)測(cè)顯示,K2.6 在持續(xù)自主運(yùn)行場(chǎng)景下比 K2.5 有顯著提升:


Kimi Claw Bench 自主 Agent 能力評(píng)測(cè)

配合 Kimi Code CLI(https://www.kimi.com/code),體驗(yàn)最佳

跑分解讀:和頂級(jí)閉源模型正面硬剛

K2.6 的對(duì)手是 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro 這些頂級(jí)閉源模型??纯搓P(guān)鍵數(shù)據(jù):

Agent 能力(最亮眼):

測(cè)試項(xiàng)

K2.6

GPT-5.4

Claude Opus 4.6

K2.5

HLE-Full(帶工具)

54.0

52.1

53.0

50.2

DeepSearchQA(準(zhǔn)確率)

83.0

63.7

80.6

77.1

BrowseComp(Agent Swarm)

86.3

78.4

MCPMark

55.9

62.5

56.7

29.5

Claw Eval(pass^3)

62.3

60.3

70.4

52.3

OSWorld-Verified

73.1

75.0

72.7

63.3

在 DeepSearchQA 上,K2.6 的準(zhǔn)確率 83.0% 比 GPT-5.4 的 63.7% 高了接近 20 個(gè)點(diǎn),這差距太大了

HLE-Full(帶工具)上也超過(guò)了所有閉源模型

編程能力:

測(cè)試項(xiàng)

K2.6

GPT-5.4

Claude Opus 4.6

K2.5

Terminal-Bench 2.0

66.7

65.4

65.4

50.8

SWE-Bench Pro

58.6

57.7

53.4

50.7

SWE-Bench Verified

80.2

80.8

76.8

LiveCodeBench v6

89.6

88.8

85.0

編程方面跟 GPT-5.4 和 Claude 基本持平甚至略有優(yōu)勢(shì),作為開(kāi)源模型,這個(gè)成績(jī)很炸裂

相比 K2.5 的躍升:

最能說(shuō)明問(wèn)題的是跟自家 K2.5 的對(duì)比:

  • MCPMark:29.5 → 55.9(近乎翻倍

  • APEX-Agents:11.5 → 27.9(翻了 2.4 倍

  • Terminal-Bench 2.0:50.8 → 66.7(**+15.9**)

  • BrowseComp:74.9 → 83.2

  • Claw Eval pass^3:52.3 → 62.3

MCPMark 的躍升最能說(shuō)明問(wèn)題——K2.5 對(duì)工具調(diào)用還比較生疏,K2.6 已經(jīng)輕車(chē)熟路了。

部署方式

K2.6 跟 K2.5 架構(gòu)相同,部署流程完全復(fù)用。官方推薦三個(gè)推理引擎:

vLLM 部署(推薦):

# 安裝 vLLM(穩(wěn)定版推薦 0.19.1)
uv pip install -U vllm \
--torch-backend=auto \
--extra-index-url https://wheels.vllm.ai/nightly


# 啟動(dòng)服務(wù)(H200 單機(jī) TP8)
vllm serve $MODEL_PATH -tp 8 \
--mm-encoder-tp-mode data \
--trust-remote-code \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2

注意兩個(gè)關(guān)鍵參數(shù):--tool-call-parser kimi_k2開(kāi)啟工具調(diào)用,--reasoning-parser kimi_k2開(kāi)啟思考模式。

SGLang 部署:

# 安裝 SGLang
pip install "sglang @ git+https://github.com/sgl-project/sglang.git=python"
pip install nvidia-cudnn-cu12==9.16.0.29


# 啟動(dòng)服務(wù)
sglang serve --model-path $MODEL_PATH --tp 8 \
--trust-remote-code \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2

KTransformers 部署(消費(fèi)級(jí)顯卡也能跑!):

這個(gè)是重點(diǎn)——KTransformers 支持 CPU+GPU 異構(gòu)推理,8 張 L20 + Intel CPU 就能跑起來(lái),Prefill 640 tokens/s,Decode 24.5 tokens/s(48 并發(fā))。更絕的是,配合 LLaMA-Factory 做 LoRA 微調(diào),2 張 4090 就能搞定,訓(xùn)練吞吐 44.55 tokens/s。

# KTransformers + SGLang 異構(gòu)推理
python -m sglang.launch_server \
--model /path/to/kimi-k2.6 \
--kt-weight-path /path/to/kimi-k2.6 \
--kt-cpuinfer 96 \
--kt-num-gpu-experts 30 \
--kt-method RAWINT4 \
--tensor-parallel-size 4 \
--trust-remote-code

transformers版本要求:>=4.57.1, <5.0.0

API 使用

K2.6 支持 Thinking 模式和 Instant 模式,API 兼容 OpenAI 和 Anthropic 格式:

import openai

client = openai.OpenAI(
base_url="https://platform.moonshot.ai/v1",
api_key="YOUR_API_KEY"
)

# Thinking 模式(默認(rèn),推薦 temperature=1.0)
response = client.chat.completions.create(
model="kimi-k2.6",
messages=[{"role": "user", "content": "解釋量子糾纏"}],
max_tokens=4096
)
# response.choices[0].message.reasoning ← 思考過(guò)程
# response.choices[0].message.content ← 最終回答

# Instant 模式(推薦 temperature=0.6)
response = client.chat.completions.create(
model="kimi-k2.6",
messages=[{"role": "user", "content": "解釋量子糾纏"}],
max_tokens=4096,
extra_body={"thinking": {"type": "disabled"}}
)

K2.6 還支持一個(gè)實(shí)用功能:Preserve Thinking——多輪對(duì)話中保留完整的推理鏈,對(duì) Coding Agent 場(chǎng)景特別有用

另外,圖片和視頻輸入也都支持(視頻目前僅限官方 API)

我的觀點(diǎn)

說(shuō)幾個(gè)讓我印象深刻的點(diǎn):

1. Agent 集群能力是真正的差異化

GPT-5.4 和 Claude 在單步推理上依然強(qiáng)悍,但 K2.6 在 Agent 編排層面做出了差異化。300 個(gè)子 Agent 協(xié)同 4000 步,這個(gè)能力在開(kāi)源世界里沒(méi)有對(duì)手。BrowseComp Agent Swarm 的 86.3 vs GPT-5.4 的 78.4,差距一目了然

2. 從 K2.5 到 K2.6 的進(jìn)步幅度驚人

MCPMark 翻倍、APEX-Agents 翻 2.4 倍,這說(shuō)明月之暗面在 Agent 能力上做了非常多針對(duì)性的優(yōu)化。K2.5 在工具調(diào)用上還有點(diǎn)笨拙,K2.6 已經(jīng)很絲滑了。

3. 部署門(mén)檻在降低

KTransformers 讓 L20 甚至 4090 用戶也有機(jī)會(huì)跑萬(wàn)億參數(shù)模型,雖然速度不算快,但至少讓更多人能體驗(yàn)到。LoRA 微調(diào)只要 2 張 4090,這個(gè)門(mén)檻對(duì)很多團(tuán)隊(duì)來(lái)說(shuō)已經(jīng)可以接受了。

不足之處也得說(shuō):

  • 在純推理任務(wù)(AIME、HMMT、HLE-Full 無(wú)工具)上,跟 GPT-5.4 和 Gemini 3.1 Pro 還有差距

  • BabyVision 得分 39.8 遠(yuǎn)低于 GPT-5.4 的 49.7,視覺(jué)理解還有提升空間

  • 1T 參數(shù)的部署成本依然不低,H200 單機(jī) TP8 才是推薦配置

  • Modified MIT License,商用需要注意許可條款

總結(jié)

Kimi K2.6 的定位非常清晰:開(kāi)源世界的最強(qiáng) Agent 模型

它不追求在所有維度碾壓閉源模型,而是在 Agent 編排、工具調(diào)用、長(zhǎng)程編程這些"干活"場(chǎng)景上做到了最好

如果你在做 AI Agent 相關(guān)的產(chǎn)品,K2.6 值得認(rèn)真評(píng)估

.6

制作不易,如果這篇文章覺(jué)得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見(jiàn)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
外交部:中方禁止對(duì)日本的軍事用戶軍事用途出口 目的是制止日本“再軍事化”和擁核的企圖

外交部:中方禁止對(duì)日本的軍事用戶軍事用途出口 目的是制止日本“再軍事化”和擁核的企圖

極目新聞
2026-06-18 15:47:16
國(guó)際油價(jià)直線跳水,外媒稱以色列與黎巴嫩真主黨已同意停火

國(guó)際油價(jià)直線跳水,外媒稱以色列與黎巴嫩真主黨已同意停火

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-19 22:10:50
人大代表:建議將機(jī)關(guān)企事業(yè)單位工齡滿30年的帶薪年假延長(zhǎng)到20天

人大代表:建議將機(jī)關(guān)企事業(yè)單位工齡滿30年的帶薪年假延長(zhǎng)到20天

職場(chǎng)資深秘書(shū)
2026-06-19 11:33:48
"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

深圳晚報(bào)
2026-06-17 12:10:46
最煩親戚之間的假客氣,網(wǎng)友:這些彎彎繞太復(fù)雜了

最煩親戚之間的假客氣,網(wǎng)友:這些彎彎繞太復(fù)雜了

阿康四歲啦
2026-06-20 14:30:49
董方卓公開(kāi)質(zhì)疑梅西戴帽!直言進(jìn)了淘汰賽誰(shuí)會(huì)慣著你,引發(fā)熱議

董方卓公開(kāi)質(zhì)疑梅西戴帽!直言進(jìn)了淘汰賽誰(shuí)會(huì)慣著你,引發(fā)熱議

振剛說(shuō)足球
2026-06-19 10:30:27
今日足協(xié)杯裁判:杜健鑫執(zhí)法山東泰山客戰(zhàn)廣西恒宸

今日足協(xié)杯裁判:杜健鑫執(zhí)法山東泰山客戰(zhàn)廣西恒宸

懂球帝
2026-06-20 11:28:50
別笑了鄭州汽配城火災(zāi)那個(gè)躺平的醉漢,其實(shí)是我們大多數(shù)人的縮影

別笑了鄭州汽配城火災(zāi)那個(gè)躺平的醉漢,其實(shí)是我們大多數(shù)人的縮影

小影的娛樂(lè)
2026-06-20 12:36:05
賓利新車(chē)官宣,6月20日,已正式上市

賓利新車(chē)官宣,6月20日,已正式上市

科技堡壘
2026-06-20 11:55:05
齊達(dá)內(nèi)全家合影曝光!三個(gè)兒子碌碌無(wú)為,最矮二兒子卻成全村希望

齊達(dá)內(nèi)全家合影曝光!三個(gè)兒子碌碌無(wú)為,最矮二兒子卻成全村希望

觀星娛記
2026-06-18 15:27:16
澤連斯基做夢(mèng)都沒(méi)想到,先來(lái)的不是俄軍攻城,而是中方劃下的紅線

澤連斯基做夢(mèng)都沒(méi)想到,先來(lái)的不是俄軍攻城,而是中方劃下的紅線

芳芳?xì)v史燴
2026-05-30 21:17:02
哈里王子全家時(shí)隔4年將重返英國(guó),王室提供莊園住宿,無(wú)專屬安保

哈里王子全家時(shí)隔4年將重返英國(guó),王室提供莊園住宿,無(wú)專屬安保

譯言
2026-06-20 07:35:58
基恩炮轟世界杯太太團(tuán):球員伴侶穿丈夫球衣簡(jiǎn)直太荒唐了

基恩炮轟世界杯太太團(tuán):球員伴侶穿丈夫球衣簡(jiǎn)直太荒唐了

懂球帝
2026-06-20 11:28:50
佩佩怒懟伊布:你只是過(guò)客,而C羅將被歷史永遠(yuǎn)銘記!

佩佩怒懟伊布:你只是過(guò)客,而C羅將被歷史永遠(yuǎn)銘記!

體育閑話說(shuō)
2026-06-20 07:34:46
有哪些著名的陽(yáng)謀?看網(wǎng)友講述感覺(jué)自己的腦子不夠用了。

有哪些著名的陽(yáng)謀?看網(wǎng)友講述感覺(jué)自己的腦子不夠用了。

侃神評(píng)故事
2026-06-17 15:16:27
《教父》:壞人敢騎在你頭上作惡,從不是他實(shí)力強(qiáng),也不是你太軟弱,而是你身上飄著這2個(gè)任人拿捏的弱者信號(hào)

《教父》:壞人敢騎在你頭上作惡,從不是他實(shí)力強(qiáng),也不是你太軟弱,而是你身上飄著這2個(gè)任人拿捏的弱者信號(hào)

心理觀察局
2026-06-20 07:17:08
巴基斯坦總理取消瑞士之行 美伊諒解備忘錄簽署儀式將于明日在瑞士舉行

巴基斯坦總理取消瑞士之行 美伊諒解備忘錄簽署儀式將于明日在瑞士舉行

每日經(jīng)濟(jì)新聞
2026-06-20 10:31:11
馬上停止5類運(yùn)動(dòng),很可能加速血栓形成,等血管“堵死”就遲了

馬上停止5類運(yùn)動(dòng),很可能加速血栓形成,等血管“堵死”就遲了

觀星賞月
2026-06-20 15:48:44
320.9萬(wàn)元起!新款賓利飛馳上市

320.9萬(wàn)元起!新款賓利飛馳上市

新浪財(cái)經(jīng)
2026-06-20 16:09:28
《百年孤獨(dú)》揭露最殘酷真相:人走到最后,能托住你的不是父母,不是伴侶,而是你早年種下的這兩顆種子

《百年孤獨(dú)》揭露最殘酷真相:人走到最后,能托住你的不是父母,不是伴侶,而是你早年種下的這兩顆種子

心理觀察局
2026-06-20 07:38:37
2026-06-20 17:07:00
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3436文章數(shù) 11166關(guān)注度
往期回顧 全部

科技要聞

DeepSeek上線識(shí)圖模式,看誰(shuí)都像梁文鋒

頭條要聞

特朗普和高市早苗當(dāng)眾發(fā)生口角 日媒:真是令人震驚

頭條要聞

特朗普和高市早苗當(dāng)眾發(fā)生口角 日媒:真是令人震驚

體育要聞

全隊(duì)抱頭痛哭!5億歐土耳其出局 2場(chǎng)轟62腳0進(jìn)球

娛樂(lè)要聞

官媒發(fā)文,張柏芝終迎一大喜訊

財(cái)經(jīng)要聞

金飾克價(jià)年內(nèi)大跌近450元 跌幅最高達(dá)26%

汽車(chē)要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
親子
時(shí)尚
家居
公開(kāi)課

本地新聞

世界杯黑馬佛得角:河北人開(kāi)超市,溫州人當(dāng)老板

親子要聞

紙尿褲危機(jī):4家企業(yè)資本運(yùn)作受影響,嬰童產(chǎn)品安全國(guó)標(biāo)亟待提高

白背心能顯瘦?關(guān)鍵在領(lǐng)口和肩帶

家居要聞

綠意盎然 自然之境

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版