无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

日本大模型要超過中美?“河豚AI”干翻GPT-5.5比肩Fable5,到底隱藏著什么秘密?

0
分享至


2026 年 6 月 22 日,日本 AI 獨角獸 Sakana AI 扔下了一枚炸彈:新模型“河豚(Fugu Ultra)”正式發布。


開場就是一張讓人倒吸涼氣的成績單——在目前難度最高、水分最少的真實代碼修復榜單 SWE-Bench Pro 上,Fugu Ultra 拿下 73.7 分。


作為對比,OpenAI 的 GPT-5.5 只有 58.6,Anthropic 的 Claude Opus 4.8 是 69.2。Sakana 甚至公開宣稱:Fugu 已經和剛被美國出口管制“一夜下架”的頂級模型 Claude Fable 5 旗鼓相當。


日本 AI 踩在 GPT-5.5 的肩膀上,煉出了新一代的神級大模型?

真正自以為看懂的人,立即從震驚變成群嘲:這哪是大模型,它分明是個“包工頭”!核心只是一個 7B 參數小模型的“指揮家”,參數不大,自己不干活,把任務拆給池子里的 GPT-5.5、Opus、Gemini,最后匯總交卷。


“高級 API 路由器”“套殼的”“大廠一斷供它明天就死”……罵聲一片。

但深入調研分析后重新審視了這家公司極其反常的底層邏輯。

結論:可能大家都看錯了。

Sakana AI 與 OpenAI 的差異,根本不是技術路線,而是兩種截然不同的“第一性原理”與“世界觀”的碰撞。

這條估值高達 26.5 億美元的日本“河豚”身上,藏著三個比跑分更性感、也更殘酷的真相。今天,我們連同它底褲里的秘密,一個個拆給你看。

真相一:你以為它是套殼?這是“進化論”的降維打擊


Fugu 不親自解題,只干 3 件事,全部用自然語言完成,不用人類寫代碼配置:

  1. 拆任務

    :拿到用戶問題,自動拆成好幾步細分小活;

  2. 選人派活

    :判斷每一步交給哪個 AI 最合適,比如規劃交給 Gemini、寫代碼交給 GPT5、校對交給 Claude;

  3. 定信息權限

    :規定每個 AI 能看到前面哪些步驟的結果(有的只看原始問題,有的能看所有人的答案)。

舉個例子:用戶要寫復雜算法題Conductor 自動安排:

  • 第一步:Gemini 做解題思路規劃(看不到別的結果)

  • 第二步:GPT5 按思路寫代碼(只看 Gemini 的規劃)

  • 第三步:Claude 檢查代碼 bug(看前面兩個人全部輸出)

簡單選擇題它就偷懶:直接派 1 個 AI 一步出答案,不浪費算力。

Fugu 只是個“做編排的包工頭”?

Anthropic、OpenAI 篤信“Scaling Law(規模法則)”,這是一種“神創論”暴力美學:燒幾百億美金、建幾個核電站,試圖煉出一個全知全能的超級大腦。

而 Sakana(日語“河豚”)的哲學,是“演化論”與群體智慧。大自然從不靠算力設計完美的生物,而是靠“組合與變異”讓適應力最強的基因活下來。

Fugu并不是簡單編排API組合 , 它有深入骨髓的硬件級優化:

Sakana 和全球算力霸主英偉達聯合發布了 TwELL 稀疏數據架構,直接改寫了 CUDA 底層內核的計算邏輯,硬生生把大模型的真實推理速度拔高了 20%。

零成本造血的“AI 科學家”: 他們做出了能自己寫代碼、自己發《Nature》論文的 The AI Scientist 系統,把單篇頂級論文的產出成本壓到了 15 美元。

加上能修改自己底層代碼的 DGM(達爾文-哥德爾機),Sakana 擁有了一座成本趨零、7x24 小時自我迭代的超級研發中心。

用最底層的 CUDA 榨干硬件性能,用演化算法“白嫖”并融合全球開源小模型,再用強化學習做 Fugu 的頂層調度。這不叫套殼,這叫生態系統對單體怪獸的“全棧工程壓制”。

真相二:跑分“吊打”是人造神話,這其實是一臺昂貴的“逆熵引擎”

來自知名開發者 Julian Goldie 對 Sakana AI 的三個模型 和 Fusion(一個基于 OpenRouter 的多模型路由器/編排系統) 的真實視覺構建測試對比。

測試對象

  • Fugu Ultra :Sakana 的頂級旗艦模型

  • Fugu Mini :Sakana 的輕量快速版

  • Fusion :第三方路由器方案(把提示同時發給 3~5 個不同大模型 并行運行 → 一個“裁判模型”(Judge)融合輸出)

最終排名:
1. Fugu Ultra(視覺質量王者)
2. Fusion(穩定第二,性價比高)
3. Fugu Mini(速度快,但質量和 Bug 較多)

但是一個常規的復雜任務,Fugu 能拖拖拉拉跑上 30 分鐘。輸入 $5/M,輸出高達 $30/M。由于多層循環編排,實際花銷可能是單調大模型的好幾倍。代價如此高昂,企業為什么還要用它?

隨著大模型算力越來越便宜,制造“幻覺”和垃圾信息的成本趨近于零(算力熵增)。

Fugu 系統里的 7B 指揮家,為了挑戰模型的不確定性,通過打回重寫、交叉驗證,不斷將大模型輸出中的“混亂”剔除,強行提取出“絕對正確的代碼”。

未來Token 價格會越來越便宜,而“在混亂信息中建立確定性秩序”的能力,才是宇宙中最昂貴的能力。

Fugu 賣的根本不是模型,而是一臺能抵抗幻覺的“逆熵引擎”。

真相三:“主權AI”崛起,日本財閥的真金白銀投入


為什么 Fugu 偏偏選在 6 月 22 日發布?

因為 10 天前的 6 月 12 日,美國商務部一紙出口管制,逼迫 Anthropic 把頂級模型對全球非美客戶一鍵下架。無數海外企業的業務一夜停擺。

這就是企業級客戶最深的恐懼:“單一供應商鎖定(Vendor Lock-in)”。

日本最大的券商大和證券、金融巨頭三井住友銀行(SMBC),甚至涉足軍工的三菱重工,早就用真金白銀買單,把 Sakana 的系統深度嵌入了資產管理和情報處理的血脈里。

一個帶著美國西海岸價值觀的單體大模型,永遠無法映射日本金融業的保守規則,也無法對齊嚴苛的數據隱私法。

因此,金融業永遠不會依賴于一家模型提供商,因此誰掌握了這個網絡的“路由編排”,誰就掌握了主權。

為了收割這波“主權紅利”,Sakana 打出了一套完美的 B端雙鉗攻勢:

底層用 Fugu 的編排層提供了魯棒性,不會因為個別模型斷供而停止服務。

應用層則直接推出了核心產品 Marlin(自治研究代理) ,它 是一款針對企業決策和深度研究設計的自治研究代理(Autonomous Research Agent)


Marlin 專注于長時間的深度推理與長周期任務,無需人工干預即可自主進行長達 8 小時以上的假設驗證、網頁檢索和信息整合。

直接生成 100 頁帶嚴格引用的投行級研報。它對企業的 Team 版定價,直接賣到 $2495/月(近2萬人民幣/月)。

當普通套殼應用還在 C 端為 20 美金的月費卷生卷死時,Sakana 已經用輕資產撬動了極高客單價的政企訂閱。這才是風投眼里的印鈔機。

終局推演:硅基知識發現的奇點,與懸在頭頂的開源之劍

算清了這筆賬,你就會明白為什么 Sakana 能在不到兩年內,估值狂飆到 26.5 億美元。


看看它股東名單:

NVIDIA 給算力底座,Google 給全球生態,日本三大銀行給巨額訂單,甚至連美國情報局背景的 IQT 基金都入局為其安全背書。

加上精準榨取了日本政府的 GENIAC 補貼計劃(免費白嫖國家級超算集群),這哪里是一家創業公司?這分明是跨國資本巨頭在日本布下的“主權 AI 聯合艦隊”。

但懸在它頭頂的達摩克利斯之劍,真的不存在嗎?

有的。但真正的死穴,絕不是 OpenAI 封它的 API 接口,而是“開源生態的反噬”。

Sakana 的高資本效率,高度依賴于 Llama、Mistral 等開源模型權重的無償開放。一旦美國以國家安全為由收緊開源協議,失去免費“原材料”的 Sakana,其“演化融合”的魔法就會瞬間失效,被拉回燒錢煉大模型的無底洞。

最后,送給所有 AI 創業者的終極啟示:

  1. 小團隊別碰底座大模型,ALL IN 編排: 連估值 26 億美金的獨角獸都不去死磕底層參數了。把大模型當成極其廉價的水電煤,去建你自己的“Agent OS”(智能體操作系統),在單一前沿模型與多智能體調度之間自由切換,這才是未來的核心資產。

  2. 尋找大廠進不去的行業盲區: 去解決真實行業里因為斷供、合規、數據隱私而產生的具體痛點。大廠模型再聰明,也跨不過金融和軍工的政企安檢門。

跑分超越 GPT 只是營銷手段。商業的本質,永遠是回答三個問題:

  1. 你的系統是不是一臺合格的逆熵引擎?

  2. 你的命根子是不是攥在開源巨頭手里?

  3. 以及,誰愿意為你的不可替代性,每月支付 2495 美金?

附:本文核心數據與論據核實來源(參考引用表)

為了保證一級市場研判的嚴謹性,本文所有核心數據、論文背景及商業案例均來源于以下公開或權威盡調渠道,非營銷杜撰:

1. 核心技術報告與頂會論文背書: Fugu 系統的核心架構方法論基于其被國際表征學習大會(ICLR 2026)接收的兩篇論文,分別為負責角色分配的 TRINITY 模型和負責強化學習協同的 Conductor 架構。相關論文與數據集詳見技術報告 arXiv:2606.21228v1 及 arXiv:2512.04388 / arXiv:2512.04695。

2. 跑分數據與成本定價源:

SWE-Bench Pro 的 73.7 分、超越 Claude Opus 4.8 和 GPT-5.5 的對比數據,以及輸入 $5/M、輸出 $30/M 的定價,均截取自 Sakana AI 官方于 2026 年 6 月 22 日發布的 Fugu 產品發布基準測試表及 Pricing 官網頁面。

3. 底層執行技術與自動化科研突破:

與 NVIDIA 聯合開發的 TwELL (Tile-wise ELLPACK) 稀疏架構帶來 20% 加速的論文發表于 ICML 2026。(出處:Sakana AI & NVIDIA 聯合發布報告,Sparser, Faster, Lighter Transformer Language Models)

將單篇頂會論文生成成本壓至 15 美元的自動化系統 The AI Scientist 發表在頂級學術期刊《Nature》主刊上。(出處:The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery)

代碼自演化系統 DGM (Darwin G?del Machine) 技術詳情亦來自官方發布。

4. B端商業化訂單與定價實錘:

政企綁定案例: Sakana AI 深度綁定大和證券(Daiwa Securities Group)用于資產管理咨詢平臺,綁定三井住友銀行(SMBC)自動生成提案,以及深度參與日本防務生態(如三菱重工等)的信息均來自其官方企業級案例通報與日本媒體的公開報道。

Marlin 產品定價: Sakana Marlin(深度研究代理)針對企業級客戶的高昂 Team 版定價($2495/月)及其邊際成本收斂邏輯,源于其 SaaS 訂閱頁面及第三方數據調研機構(如 Tech Jacks Solutions)的商業分析。

5. 融資、估值與股東結構:

公司在 2025 年 11 月完成 1.35 億美元 B 輪融資、投后估值達到 26.5 億美元的數據由官方披露,并經 Crunchbase 及 GetLatka 等創投數據平臺確認。

包括 NVIDIA、Google(Alphabet)、花旗集團(Citi)、三菱 UFJ、KDDI,以及 In-Q-Tel (IQT) 等極其豪華的地緣與產業資本入局,均可追溯至相應投融資新聞公報(如 Citi Makes Strategic Investment in Sakana AI)。

6. 政府補貼與宏觀紅利: 其利用日本政府 GENIAC 計劃(725 億日元規模)免費獲取國家級超級計算 GPU 集群的事實,由日本經濟產業?。∕ETI)與 NEDO 官方公示確認。

7. 開發者實測反饋與開源局限:

部分開源代碼框架可見于官方 GitHub:?https://github.com/SakanaAI/fugu?(核心權重未開源)。

關于 Fugu 在復雜任務上高達 30 分鐘的延遲以及成本過高的批評,匯總自知名 AI 學者 Ethan Mollick、開發者 Julian Goldie 等在 X (Twitter) 及 Hacker News 上的真實測試反饋。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
68歲馬秋華:丈夫金鐵霖走后4年,兒子33歲未婚成她最大心病

68歲馬秋華:丈夫金鐵霖走后4年,兒子33歲未婚成她最大心病

飄飄然的娛樂匯
2026-07-01 09:55:09
多家檢測機構拒絕個人申請紙尿褲甲酰胺檢測

多家檢測機構拒絕個人申請紙尿褲甲酰胺檢測

財聞
2026-06-30 20:56:42
陳建斌有個毛病改不掉,那就是見前任吳越當是一個沒事人一樣

陳建斌有個毛病改不掉,那就是見前任吳越當是一個沒事人一樣

手工制作阿殲
2026-07-01 08:48:48
我真蠢,我竟然去看了《抓特務》

我真蠢,我竟然去看了《抓特務》

呦呦鹿鳴
2026-06-28 22:42:42
退休干部夫妻工資2萬孩子留美,因病不能做家務申請困難補助!

退休干部夫妻工資2萬孩子留美,因病不能做家務申請困難補助!

兵叔評說
2026-06-30 21:03:25
3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

3場5球追平挪威隊史紀錄!哈蘭德絕殺后坦言:戰勝巴西隊機會非常小

紅星新聞
2026-07-01 08:20:15
神了!范志毅成功猜中德國荷蘭出局+巴西贏日本 預測:C羅止步32強

神了!范志毅成功猜中德國荷蘭出局+巴西贏日本 預測:C羅止步32強

童叔不飆車
2026-07-01 01:48:50
美股盤前,美光科技跌幅擴大至4%,閃迪跌近5%

美股盤前,美光科技跌幅擴大至4%,閃迪跌近5%

每日經濟新聞
2026-07-01 16:41:05
我今年56歲發現了一個怪現象:50歲以后的中年女人,能活到90歲的,基本上在50歲的時候,就不再做這件事了

我今年56歲發現了一個怪現象:50歲以后的中年女人,能活到90歲的,基本上在50歲的時候,就不再做這件事了

心理觀察局
2026-07-01 07:58:17
你家的房子,可能正被一臺空調「抬價」

你家的房子,可能正被一臺空調「抬價」

知識碎碎念
2026-06-30 15:47:30
3-0!2-0!世界杯狂歡:絕殺+碾壓局 巨星閃耀 16強確定7席

3-0!2-0!世界杯狂歡:絕殺+碾壓局 巨星閃耀 16強確定7席

葉青足球世界
2026-07-01 12:03:01
A股:不必等待了!明天(7月2日),股市或將迎來大級別的變化?

A股:不必等待了!明天(7月2日),股市或將迎來大級別的變化?

財經大拿
2026-07-01 13:57:47
別笑梅威瑟破產,他的死局,90%的有錢人都逃不掉!

別笑梅威瑟破產,他的死局,90%的有錢人都逃不掉!

格斗時代
2026-06-30 20:34:39
替董事長坐12年牢,出來后他轉我600萬,他女兒:我爸要我嫁給你

替董事長坐12年牢,出來后他轉我600萬,他女兒:我爸要我嫁給你

千秋文化
2026-06-27 19:44:16
外媒:庫爾圖瓦等比利時老將開會自救,主教練沒有參與

外媒:庫爾圖瓦等比利時老將開會自救,主教練沒有參與

懂球帝
2026-07-01 15:49:14
WTT美國大滿貫亂了:隨著佐藤瞳3-0,3大世界前十的名將已經出局

WTT美國大滿貫亂了:隨著佐藤瞳3-0,3大世界前十的名將已經出局

側身凌空斬
2026-07-01 09:46:45
拒簽率飆到80%,遣返人數翻兩倍!印度人怎么突然被踢出了"朋友圈"?

拒簽率飆到80%,遣返人數翻兩倍!印度人怎么突然被踢出了"朋友圈"?

阿柒的訊
2026-07-01 09:46:13
六代機,就這么明晃晃的官宣了

六代機,就這么明晃晃的官宣了

俠客棧
2026-06-30 13:35:58
穆勒怒噴:我們德國人被欺騙了,這是在最大舞臺上明目張膽的搶劫

穆勒怒噴:我們德國人被欺騙了,這是在最大舞臺上明目張膽的搶劫

硯底沉香
2026-07-01 04:30:06
太厲害了!俄羅斯最新戰報!

太厲害了!俄羅斯最新戰報!

故事終將光明磊落
2026-07-01 14:02:43
2026-07-01 18:52:49
PM熊叔
PM熊叔
聊AI科技+商業,一人公司的產品經理
6文章數 1關注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

頭條要聞

副行長借朋友名義貸款470萬 400萬自用70萬給朋友用

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團銷量突破200萬輛

態度原創

家居
手機
本地
親子
旅游

家居要聞

傳奇筑 日常詩

手機要聞

華為Mate 80 RS非凡大師手機開啟1000元優惠活動,10999元起

本地新聞

強烈建議,全國高校都向這所大學看齊!

親子要聞

云南文山:托幼一體化破解幼兒入園銜接難題

旅游要聞

洋面孔成旅游推介官,三亞的“朋友圈”為何越擴越大?

無障礙瀏覽 進入關懷版