早上看了個新聞,日本一家 AI 公司發布了一個新模型,號稱對標目前人類最強的 Fable 5。
但看完他們的技術文檔后我發現,著實有點扯。
這家名叫 Sakana AI 的公司發布了名為Sakana Fugu 系列編排器模型,某種程度上說,這個 Fugu 都不能稱之為模型,而是一個分發器。
因為這個 Fugu 本身并不是大模型基座,而是根據不同任務類型去調用其他模型能力。
比如,用戶發出一個編程任務,Fugu 去調用 Claude Opus 4.8,用戶發出一個數學任務,Fugu 去調用 GPT-5.5。
當然,實際的執行過程肯定比我說的更復雜,但大概邏輯其實就是這樣。
![]()
所以,Fugu 自己其實并不生產模型能力,他們只是模型的搬運工。
在這種技術架構和邏輯下,他們還跟包括 Opus 4.8 和 GPT-5.5 在內的模型做了一些跑分測試。
從結果看,Fugu Ultra 的結果都超過 Opus 4.8。
![]()
另外,Fugu Ultra 在工程、科學和推理測試中,性能接近或超越了目前最強的 Fable 5 和 Mythos Preview。
![]()
看到這我在想,這家公司還真有點拿面子當里子用。
明明調用的是別人的能力,結果還說自己的模型在各項比拼中超過了別人。
當然,不能說他們毫無用處,畢竟賣水的還是要做點包裝和加工。在我看來,Fugu 的核心能力其實就是任務分類和調度能力。
現在各家模型能力號稱都很強,但確實各有所長,沒有一個全能模型可以勝任所有任務。
因此,Fugu 算是捕捉到了這個需求,所以才做了這么一個產品。
他們會識別和判斷用戶提出的任務類型,然后對任務進行拆解,比如科研類、代碼類、推理類,也會對是否需要調用多模態能力做判斷。
接下來就是根據細分后的任務調用不同的工作模型,這些工作模型其實就是現在一些主流的模型,比如 Claude 和 GPT、Gemini 這些。
即便是在同一個任務內部,也可以根據任務拆解去調用不同模型的能力。
![]()
這種集眾家之所長的模式,讓 Fugu 在測評中取得了這樣的成績。本質上,它扮演了一個調度者的角色。
價格方面,Fugu Ultra 的每百萬 token 輸入價格是 5 美元,輸出價格是 30 美元,如果上下文超過 272k,價格還會貴一點。
![]()
目前使用方式也是通過 API 調用,有專門的 API Key 和開發文檔。
今天我之所以跟你們聊這個案例,其實是想說一個問題,就是 AI 發展到今天,接下來的競爭可能會發生轉向。
過去是比模型能力,未來會比應用能力。
在接下來的一段時間,模型能力進化的上限可能不會像之前那么高,所以很多基于用戶場景的需求會逐漸得到落地。
Fugu 就是一個典型的例子,他們有點像當年的 Hao123,自己本身只起到一個中轉調度作用。
但是這種統一入口的方式,的確解決了很多人的場景化需求。
我自己現在使用 Agent 其實就有這樣的問題,不同場景下的需求是交給不同 Agent 去做的,每個 Agent 用的也是不同的模型。
雖然中轉站現在能解決一個 API Key 搞定所有模型的問題,但是依舊還是得各配各的。
但 Fugu 的好處就是實現了內部路由,其實一定程度上是產生用戶價值的。
不過,我覺得作為一個賣水的,不確定性就在于被他們調用的模型廠商是否長期支持。
你想啊,入口被你拿走了,自己反而成了供應商,這顯然不符合模型廠商的利益。
有一種可能,就是假設 Fugu 到一定規模后,大概率會受到打壓,到時候模式就不成立了。
我覺得,這個例子對于做產品的讀者或許會有所啟發。
做產品從來不是新發明技術,而是把技術跟場景、用戶、需求、產品定位組合在一起。
雖然我不看好 Fugu 的長期發展,但是這個思路是值得借鑒的,發現問題、識別需求、回歸場景、給出方案。
有時候,做產品最難的不是把產品做出來,而是識別到那個需求信號。
AI 時代就這么迅速來了,但是我反而覺得產品經理的含金量提升了。
那些需要識別、洞察、判斷、決策的場景,依舊少不了優秀產品經理的參與。
如果具備這些能力的產品經理能和 AI 結合,那將是生產力爆棚的。
最后,我查了下 Fugu 這個詞是什么意思,原來是河豚。
看來,小日子是想一魚通吃。
················· 唐韌出品 ·················
用AI思維發現下一個機會
安可時刻
最近我朋友圈陸續有人拿到了微信 Agent 小微的灰度資格,雖然還沒灰度到我,但基本功能我已經了解了。
還是之前的判斷,不算很驚艷,但卻很普適化。
可以幫你整理群聊和朋友圈內容,可以篩選公眾號文章,還可以調用小程序,能干的事比預想的更多。
對于微信團隊來說,這種新設計要考慮的是毛細血管終端的用戶場景,包括地域、習慣、語言等。
所以,越是核心地區的主流用戶,被灰度的速度可能更慢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.