亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude強(qiáng)到不敢發(fā)的Mythos,被質(zhì)疑用了字節(jié)Seed技術(shù)

0
分享至

夢(mèng)晨 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI


Claude最強(qiáng)“神話(huà)”模型,可能用到來(lái)自字節(jié)的技術(shù)?

這條猜測(cè)直接沖上熱搜榜。



這款“強(qiáng)到不敢公開(kāi)發(fā)布”的Mythos模型,確實(shí)刺激了人們對(duì)下一代LLM架構(gòu)的想象。

社區(qū)正在熱烈討論它是否采用了循環(huán)語(yǔ)言模型(Looped Language Model)架構(gòu)。

這個(gè)概念來(lái)自字節(jié)Seed團(tuán)隊(duì)與多個(gè)高校合作的一篇論文,Yoshua Bengio也參與其中。



關(guān)鍵線(xiàn)索在于Anthropic公布的一組測(cè)試數(shù)據(jù)。

字節(jié)論文指出,圖搜索是循環(huán)算法相比標(biāo)準(zhǔn)RLVR具有巨大理論優(yōu)勢(shì)的領(lǐng)域之一。

再看Mythos,正是在廣度搜索優(yōu)先的圖搜索測(cè)試GraphWalks BFS中,超越對(duì)手GPT5.4最多。



80%對(duì)21.4%,接近4倍的差距。

在其他類(lèi)型的任務(wù)上,并沒(méi)有出現(xiàn)如此異常的分差。

說(shuō)明這種進(jìn)步很可能不是來(lái)自通用的Scaling Law,而是架構(gòu)創(chuàng)新。

循環(huán)語(yǔ)言模型:同一層”多轉(zhuǎn)幾圈”,小模型碾壓大模型

GraphWalks BFS測(cè)試,就是給模型一個(gè)復(fù)雜的圖結(jié)構(gòu),讓它做廣度優(yōu)先搜索,從起點(diǎn)出發(fā),一層一層地訪(fǎng)問(wèn)所有相鄰節(jié)點(diǎn)。

標(biāo)準(zhǔn)Transformer處理這類(lèi)問(wèn)題只能一次前向傳播,從頭走到尾,輸出結(jié)果,沒(méi)有“迭代”這個(gè)概念。

Mythos在圖遍歷上拿到了80%的分?jǐn)?shù),表明它內(nèi)部很可能在“”反復(fù)計(jì)算”,對(duì)同一組信息來(lái)回處理了好幾遍。

那么什么樣的架構(gòu)能實(shí)現(xiàn)“反復(fù)計(jì)算”?

字節(jié)Seed團(tuán)隊(duì)在論文中提出LoopLM循環(huán)語(yǔ)言模型。



簡(jiǎn)單總結(jié)LoopLM有三個(gè)特點(diǎn)。

1、不寫(xiě)長(zhǎng)文思考,在模型內(nèi)部潛空間迭代,不額外輸出更多token。

2、簡(jiǎn)單題少想幾步,難題多想幾步,自動(dòng)調(diào)節(jié)。

3、預(yù)訓(xùn)練時(shí)就學(xué) “怎么在潛空間思考”,而不是只學(xué) “怎么預(yù)測(cè)下一個(gè)token”。

在實(shí)驗(yàn)中,團(tuán)隊(duì)訓(xùn)練了Ouro系列循環(huán)語(yǔ)言模型,內(nèi)置了循環(huán)思考。



測(cè)試結(jié)果,1.4B的Ouro模型性能對(duì)標(biāo)約4B的傳統(tǒng)模型。2.8B的Ouro模型相當(dāng)于8B–12B的傳統(tǒng)模型。



至于循環(huán)模型的能力提升來(lái)自何處,論文詳細(xì)分析了知識(shí)存儲(chǔ)vs知識(shí)操作的區(qū)別。

知識(shí)存儲(chǔ)(Knowledge Storage)的容量是有限的,大約每個(gè)參數(shù)2bits,不管用什么架構(gòu),這個(gè)數(shù)字基本不變。

循環(huán)也不會(huì)讓你“記住”更多東西。

但知識(shí)操作(Knowledge Manipulation)不一樣,把已知事實(shí)組合起來(lái)做多跳推理、執(zhí)行程序、搜索圖結(jié)構(gòu),這類(lèi)能力隨循環(huán)步數(shù)和訓(xùn)練tokens指數(shù)級(jí)增長(zhǎng)。

換句話(huà)說(shuō),循環(huán)模型沒(méi)有給AI一個(gè)更大的知識(shí)庫(kù),但它讓AI在知識(shí)庫(kù)庫(kù)里的搜索和組合能力提升了一個(gè)量級(jí)。

那么Mythos究竟是不是循環(huán)模型架構(gòu),有人總結(jié)出除了GraphWalks之外的更多線(xiàn)索。



三條線(xiàn)索指向循環(huán)模型架構(gòu)

第一條線(xiàn)索,也就是廣度優(yōu)先圖搜索測(cè)試結(jié)果。

Mythos除了分?jǐn)?shù)是GPT5.4的4倍,比上一代Opus提升幅度也異常大。



第二條線(xiàn)索,Anthropic報(bào)告Mythos每個(gè)任務(wù)使用的token數(shù)量是Opus4.6的1/5,但速度更慢。

(價(jià)格也貴5倍!)

這在標(biāo)準(zhǔn)Transformer框架下很難說(shuō)得通,token少,生成步驟就少,應(yīng)該更快才對(duì)。

但循環(huán)模型剛好解釋了這個(gè)矛盾:推理不發(fā)生在token層面,而是發(fā)生在潛空間,計(jì)算量花在了看不見(jiàn)的地方。

線(xiàn)索三,Mythos在網(wǎng)絡(luò)安全方面非常突出。

Mythos在CyberGym測(cè)試上拿到83.1%,Opus4.6是66.6%,領(lǐng)先近17個(gè)百分點(diǎn)。

以及找到上千個(gè)零日漏洞,主流操作系統(tǒng)和瀏覽器全都沒(méi)逃過(guò)。

漏洞發(fā)現(xiàn)的本質(zhì)就是對(duì)控制流圖做遍歷。找到一條從輸入到危險(xiǎn)函數(shù)的路徑,也就是圖的可達(dá)性問(wèn)題。

又是圖遍歷。又是循環(huán)架構(gòu)的天生強(qiáng)項(xiàng)。

說(shuō)了這么多,終歸只是大家的猜測(cè),Anthropic沒(méi)有公開(kāi)任何關(guān)于Mythos架構(gòu)的信息,很可能以后也不會(huì)公開(kāi)。

但有一句話(huà)值得思考:

Scaling Law改善一切,相對(duì)均勻,架構(gòu)創(chuàng)新在匹配其歸納偏置的任務(wù)上創(chuàng)造異常尖峰值。



循環(huán)Transformer的歸納偏置就是迭代圖算法。Mythos的異常尖峰,恰好出現(xiàn)在圖遍歷任務(wù)上。

Anthropic不說(shuō),但測(cè)試數(shù)據(jù)已經(jīng)替它說(shuō)了。

字節(jié)論文:
https://arxiv.org/abs/2510.25741

參考鏈接:
[1]
https://x.com/ChrisHayduk/status/2042711699413926262
[2]
https://aiia.ro/blog/claude-mythos-looped-language-model-theory

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
變卦了?鄭麗文訪(fǎng)美日期確定,聲稱(chēng)兩岸要和平,美國(guó)同樣至關(guān)重要

變卦了?鄭麗文訪(fǎng)美日期確定,聲稱(chēng)兩岸要和平,美國(guó)同樣至關(guān)重要

阿龍聊軍事
2026-04-15 06:17:36
金球無(wú)水貨!登貝萊歐冠封神,極致表現(xiàn)印證金球獎(jiǎng)絕對(duì)含金量!

金球無(wú)水貨!登貝萊歐冠封神,極致表現(xiàn)印證金球獎(jiǎng)絕對(duì)含金量!

田先生籃球
2026-04-15 08:53:05
巴基斯坦空軍傳來(lái)喜訊,6架空警500今年抵達(dá),首批殲-35A一同交付

巴基斯坦空軍傳來(lái)喜訊,6架空警500今年抵達(dá),首批殲-35A一同交付

嘆知
2026-04-15 23:31:10
78歲連路都走不穩(wěn)還開(kāi)演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

78歲連路都走不穩(wěn)還開(kāi)演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

LULU生活家
2026-04-14 18:43:54
兌現(xiàn)目標(biāo)!37歲奧運(yùn)冠軍退役5個(gè)月減肥40斤 網(wǎng)友驚呼:變美認(rèn)不出

兌現(xiàn)目標(biāo)!37歲奧運(yùn)冠軍退役5個(gè)月減肥40斤 網(wǎng)友驚呼:變美認(rèn)不出

我愛(ài)英超
2026-04-14 10:44:22
隨著深圳豪取14連勝,山東4連敗,廣廈爆冷輸球,CBA最新積分出爐

隨著深圳豪取14連勝,山東4連敗,廣廈爆冷輸球,CBA最新積分出爐

小火箭愛(ài)體育
2026-04-15 22:12:01
北約和多個(gè)國(guó)家支持美國(guó)封鎖霍爾木茲海峽

北約和多個(gè)國(guó)家支持美國(guó)封鎖霍爾木茲海峽

一種觀點(diǎn)
2026-04-13 15:34:58
美軍封鎖禁令剛下,4艘中方巨輪直沖霍爾木茲,我國(guó)054A軍艦護(hù)送

美軍封鎖禁令剛下,4艘中方巨輪直沖霍爾木茲,我國(guó)054A軍艦護(hù)送

漫步獨(dú)行俠
2026-04-15 08:30:07
誰(shuí)能想到,蘇林上任首訪(fǎng)中國(guó),竟是自家人都擺不平的大麻煩

誰(shuí)能想到,蘇林上任首訪(fǎng)中國(guó),竟是自家人都擺不平的大麻煩

動(dòng)物奇奇怪怪
2026-04-15 13:19:42
全線(xiàn)大漲!特朗普稱(chēng)美國(guó)對(duì)伊朗的戰(zhàn)爭(zhēng)已經(jīng)結(jié)束,油價(jià)重挫

全線(xiàn)大漲!特朗普稱(chēng)美國(guó)對(duì)伊朗的戰(zhàn)爭(zhēng)已經(jīng)結(jié)束,油價(jià)重挫

每日經(jīng)濟(jì)新聞
2026-04-15 10:35:26
歷史性突破!人民幣躍居全球二大結(jié)算貨幣,美元霸權(quán)加速崩塌!

歷史性突破!人民幣躍居全球二大結(jié)算貨幣,美元霸權(quán)加速崩塌!

夢(mèng)回千年a
2026-04-15 10:48:20
公安部公布5起危害生態(tài)安全犯罪典型案例

公安部公布5起危害生態(tài)安全犯罪典型案例

界面新聞
2026-04-15 10:22:27
斯諾克戰(zhàn)報(bào):張安達(dá)5破百4桿50+,10-3勝舒爾第晉級(jí)正賽

斯諾克戰(zhàn)報(bào):張安達(dá)5破百4桿50+,10-3勝舒爾第晉級(jí)正賽

小皷拍客在北漂
2026-04-16 01:32:36
國(guó)合署:中方將在發(fā)展中國(guó)家再開(kāi)展2000個(gè)“小而美”民生項(xiàng)目

國(guó)合署:中方將在發(fā)展中國(guó)家再開(kāi)展2000個(gè)“小而美”民生項(xiàng)目

澎湃新聞
2026-04-14 22:16:28
拜仁vs皇馬前瞻:皇馬兩大將缺席 拜仁主場(chǎng)反擊戰(zhàn)可不敗晉級(jí)

拜仁vs皇馬前瞻:皇馬兩大將缺席 拜仁主場(chǎng)反擊戰(zhàn)可不敗晉級(jí)

智道足球
2026-04-15 12:45:14
浙江溫州一男子滑旱冰摔倒去世,年僅31歲,目擊者:摔倒后不愿去醫(yī)院,第二天加重

浙江溫州一男子滑旱冰摔倒去世,年僅31歲,目擊者:摔倒后不愿去醫(yī)院,第二天加重

瀟湘晨報(bào)
2026-04-15 18:47:24
仰望U8為何“涼了”

仰望U8為何“涼了”

趣味萌寵的日常
2026-04-15 04:07:54
李在明萬(wàn)萬(wàn)沒(méi)想到,被判無(wú)期的尹錫悅,竟能比當(dāng)總統(tǒng)還掙得多

李在明萬(wàn)萬(wàn)沒(méi)想到,被判無(wú)期的尹錫悅,竟能比當(dāng)總統(tǒng)還掙得多

說(shuō)歷史的老牢
2026-04-08 04:57:56
今夜,太瘋狂!暴漲,熔斷!

今夜,太瘋狂!暴漲,熔斷!

中國(guó)基金報(bào)
2026-04-16 00:15:20
恒大集團(tuán)許家印坑的最慘的9位大佬

恒大集團(tuán)許家印坑的最慘的9位大佬

地產(chǎn)微資訊
2026-03-29 19:08:15
2026-04-16 02:11:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12476文章數(shù) 176450關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶(hù)又怎樣?Anthropic直接貼臉

頭條要聞

法國(guó)全票通過(guò) “將不義之財(cái)歸還中國(guó)”

頭條要聞

法國(guó)全票通過(guò) “將不義之財(cái)歸還中國(guó)”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車(chē)要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

手機(jī)
親子
數(shù)碼
本地
公開(kāi)課

手機(jī)要聞

一加Ace6至尊版再次被確認(rèn):魔改天璣9500+165Hz屏,本月發(fā)布!

親子要聞

孕婦200買(mǎi)水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網(wǎng)友炸鍋

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專(zhuān)業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版