无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

GPT-5.6首批實測來了!精準狙擊Mythos

0
分享至

聽雨 發自 凹非寺量子位 | 公眾號 QbitAI

剛剛,Anthropic放出藏了倆月的大殺器——Claude Fable 5Mythos 5,無異于扔下一枚炸彈。

現在壓力直接給到OpenAI。



同一時間,GPT-5.6也泄露了。

上周開始,OpenAI已測試內部代號為keplerkindle的兩個新檢查點。kindle-alpha被曝已選為發布候選。



GPT-5.6的內部測試版本,開始在海外開發者和泄露圈里被瘋狂實測。代號、候選版本、跑分體感,全被翻了出來。



無論是爭搶IPO,還是旗艦模型撞車,兩家「你遞表我也遞表」「你發新模型我也發新模型」。

純純是打得不可開交。

但問題是,GPT-5.6真的能打過Mythos嗎??



GPT-5.6浮出水面

截至目前,OpenAI對GPT-5.6還是零官宣,尚未正式發布。

不過,海外不少網友已經對還沒公開的「內部檢查點」做了探針測試。

所謂檢查點(checkpoint),就是模型在訓練過程中某個時間點存下的一份參數快照。

OpenAI內部會存很多份,橫向比較,再從里面挑一個認為「夠好、可以拿去發」的版本,這個版本就叫發布候選版(RC)。

從上周開始,OpenAI內部正在測兩個新檢查點,代號分別是kindle和kepler。其中kindle-alpha被選為發布候選版。



從流出的體感來看,GPT-5.6這次最被反復提及的升級,是前端/UI生成

網友Pankaj Kumar的說法是,kindle-alpha的前端生成能力大幅提升,不需要復雜的提示詞或額外技巧,就能直接產出更強的界面輸出



此外,它的視覺能力也很能打,在圖像理解和圖像引用類任務上表現不錯,整體在推理、編碼、UI生成上都有明顯改善。

這是網友Chris實測kindle的效果,使用medium檔位:



而這是另一位網友此前在非推理版本Joule上實測的效果:



可以看出前者精美很多。

但網友Leo拿同一個prompt、在xhigh檔位上分別實測了kepler和kindle兩個版本。

發現kindle比起kepler,反而還退步了。



嗯…這效果確實很難評。

他甚至判斷,OpenAI很可能還會繼續打磨,不排除最后棄用kindle這個候選版

最新消息是,kindle已被移出Arena,出現了一個新模型Levi

有網友猜測Levi也可能是GPT-5.6內部版本的一個代號,并對比了它和GPT-5.5的前端能力:

【此處無法插入視頻,遺憾……可到量子位公眾號查看~】

可以看出Levi的前端也挺能打的,風格清爽簡約,富有高級感,細節處理也很到位。

不過有網友調查后發現,Levi可能來自Meta,而非GPT-5.6。



那么,GPT-5.6究竟能打過Mythos嗎?

網友mark_k聲稱,GPT-5.6「在多個agentic coding基準上擊敗Mythos」。



但目前來看,更有說服力的是前面展示的網友Leo的實測。他認為GPT-5.6的情況不容樂觀:

  • kindle相比kepler是退步。以它目前的形態,會被Mythos輕松擊敗。

6月,上演御三家「速度與激情」

6月,夏天來了,大模型圈也是火熱起來了。

海外AI御三家的模型發布時間全撞在了一起:Fable 5、Gemini 3.5 Pro、GPT-5.6,上演了一出「生死時速」。

而且打的是同一批能力——推理、智能體、編碼、前端生成。

有意思的是,三家雖然都把節點壓在6月,但到現在真正把卷子交上來的,只有A社一家

Gemini 3.5 Pro在5月19日的谷歌I/O大會上亮相,主打200萬token上下文和Deep Think推理。

但還未正式上線,官方定于6月正式可用。

GPT-5.6,消息傳出是本月晚些時候發布。

這也給OpenAI的處境添了一層張力:對手已經把分數貼出來了,內部可能還在為該交哪一版RC糾結。

但除了跑分,定價也是一個重要因素。

Fable 5和Mythos 5統一定價為每百萬輸入Token10美元、每百萬輸出Token50美元。

約為現有Opus的兩倍。

如果GPT-5.6在能力上和Mythos打平甚至略輸,但價格便宜得多,那它在真實采用率上還是有可能扳回一城的~

目前,OpenAI還未有任何官方公告,真正的對決要等GPT-5.6正式版和Fable正面跑分那一刻——

這個月內大概率見分曉,敬請期待吧~


[1]https://x.com/mark_k/status/2063922897341567488?s=20
[2]https://x.com/AiBattle_/status/2064078302394917157?s=20
[3]https://x.com/pankajkumar_dev/status/2063272015214354908?s=20
[4]https://x.com/synthwavedd/status/2063245096951160865?s=20
[5]https://x.com/ChrissGPT/status/2063135842906808579?s=20
[6]https://x.com/koltregaskes/status/2062806155139912164?s=20

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
最爭氣亞洲隊!被誤判點球 卻94分鐘絕平+破紀錄!兩隊身價差16倍

最爭氣亞洲隊!被誤判點球 卻94分鐘絕平+破紀錄!兩隊身價差16倍

郝小小看體育
2026-06-14 05:39:56
蘭州相親現場:35+女士站成排,男士都繞著走,評論區全是大實話

蘭州相親現場:35+女士站成排,男士都繞著走,評論區全是大實話

譚談社會
2026-05-24 23:20:37
偷雞不成蝕把米!舉報董路后,這位前國腳被扒了個底朝天

偷雞不成蝕把米!舉報董路后,這位前國腳被扒了個底朝天

追蹤之點
2026-06-13 11:11:25
維尼修斯爆射追平比分,巴西隊史23場世界杯首戰僅1次被零封

維尼修斯爆射追平比分,巴西隊史23場世界杯首戰僅1次被零封

懂球帝
2026-06-14 07:08:20
“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

素十三兒
2026-04-13 07:12:36
貝克漢姆家14歲小女兒上門尋兄卻吃閉門羹,本人回應“全是作秀”

貝克漢姆家14歲小女兒上門尋兄卻吃閉門羹,本人回應“全是作秀”

熱搜摘要官
2026-06-14 00:17:20
夢鴿李天一赴美不歸?看到85歲李雙江“現狀”,原來楊洪基沒說謊

夢鴿李天一赴美不歸?看到85歲李雙江“現狀”,原來楊洪基沒說謊

阿纂看事
2024-11-05 11:54:58
自封“最佳雇主”于東來一席話,讓胖東來員工普遍寒心:原來我們只是遭縱容的乞討者

自封“最佳雇主”于東來一席話,讓胖東來員工普遍寒心:原來我們只是遭縱容的乞討者

戶外釣魚哥阿旱
2026-06-13 18:28:50
難以置信!成績未出先辦升學宴,一吉林家長曬出邀請函,引發爭議

難以置信!成績未出先辦升學宴,一吉林家長曬出邀請函,引發爭議

呼呼歷史論
2026-06-14 02:44:06
千萬別在健身房穿灰色褲子運動!這也太尷尬了...

千萬別在健身房穿灰色褲子運動!這也太尷尬了...

健身迷
2026-06-09 17:37:16
一印度女子做完美甲不付錢,口出狂言:我來自印度,你不能收錢

一印度女子做完美甲不付錢,口出狂言:我來自印度,你不能收錢

魔都姐姐雜談
2026-06-08 12:05:42
1996年,武警在轉彎時出現的一個疏忽,釀成新中國最嚴重越獄事件

1996年,武警在轉彎時出現的一個疏忽,釀成新中國最嚴重越獄事件

明月清風閣
2026-06-13 07:25:10
海底撈“付費上班”,老板張勇親自道歉,網友:他太會抓人心了

海底撈“付費上班”,老板張勇親自道歉,網友:他太會抓人心了

商業人物志
2026-06-14 08:30:22
臺灣地區最后12個“邦交”全是硬茬

臺灣地區最后12個“邦交”全是硬茬

人工島分布
2026-06-07 08:18:25
比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

芳芳歷史燴
2025-12-25 20:32:52
李想官宣理想L8:一臺不做任何妥協的五座旗艦SUV 舒適度看齊邁巴赫

李想官宣理想L8:一臺不做任何妥協的五座旗艦SUV 舒適度看齊邁巴赫

快科技
2026-06-12 12:03:26
不再低調!小米尋天N90實車亮相,帶升降車頂對標理想L9

不再低調!小米尋天N90實車亮相,帶升降車頂對標理想L9

沙雕小琳琳
2026-06-13 17:25:25
中國公開賽首爆大冷!7冠王1-6潰敗,傅家俊也出局了,張安達6-2

中國公開賽首爆大冷!7冠王1-6潰敗,傅家俊也出局了,張安達6-2

球場沒跑道
2026-06-13 08:23:49
055和基洛夫并排的對比圖,我才驚覺軍艦設計已經隔了一個時代

055和基洛夫并排的對比圖,我才驚覺軍艦設計已經隔了一個時代

安安說
2026-06-02 12:46:29
NBA總決G5馬刺主場將打響

NBA總決G5馬刺主場將打響

體壇周報
2026-06-14 05:06:12
2026-06-14 09:04:49
量子位 incentive-icons
量子位
追蹤人工智能動態
12787文章數 176495關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

“五星”巴西首戰戰平 德國“戰車”凌晨登場

頭條要聞

“五星”巴西首戰戰平 德國“戰車”凌晨登場

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

游戲
本地
家居
親子
軍事航空

LPL淘汰賽:就差一點,今天無奇跡!BLG五局戰勝WE,決賽見

本地新聞

AK劉彰邂逅河北南大港濕地

家居要聞

空間微調 移形換境

親子要聞

真正覺醒的家庭

軍事要聞

特朗普:美伊協議周日簽 還有終極手段

無障礙瀏覽 進入關懷版