![]()
新智元報道
![]()
【新智元導讀】當Fable、Mythos因禁令下線,當OpenRouter Fusion、Fugu、Hermes MoA集體登場,行業共識已成:未來競爭力不在于單一模型有多強,而在于AI組織力。浪潮信息元腦企智EPAI的多模融合API,正帶著這份群體智能的降維打擊,走向更廣闊的企業戰場。
今年6月12日,全球最強的Fable 5與Mythos 5,因一紙禁令對所有人下線。
6月13日,OpenRouter放出Fusion,自稱「市場上最智能的復合模型」,半價對標Fable。
6月22日,Sakana AI放出Fugu,官方說法是Ultra版比肩Fable 5與Mythos Preview。
緊接著,Hermes官方也上線了Mixture of Agents功能(MoA)。
在智能體基準測試HermesBench上,基于Opus 4.8 + GPT 5.5的MoA得分比 Opus 高出 8%,比GPT高出11%。
![]()
他們補位的方式出奇地一致:不是再造一個更大的單一模型,而是把一群現成的模型組織起來,用「群體智能」擊敗更大參數的單體模型。
Sakana說得最直白:「超越更大模型:編排模型是下一個前沿領域」。
但這件事上,還漏了一家。
在OpenRouter推出Fusion API之前,國內已有企業有類似的想法,最近也推出了相關服務。
不過,他們為什么不卷單模參數,卻不約而同選擇了這一條路?
AI的下一站
真正的問題是什么?
要理解多模融合的價值,得先承認一件事:「選出最強模型」是個偽命題。
因為真實業務里的復雜任務,都不是單點能力的博弈。
舉個例子,一份「競品技術方案分析」,里面同時藏著
事實檢索:對方用了什么技術;
邏輯推理:這套架構的瓶頸在哪;
專業判斷:值不值得跟進;
內容表達:寫成一份能給老板看的報告。
這四種能力,幾乎不可能由同一個模型在每一個環節都保持最佳狀態。
AI的能力邊界并不是一條平滑的曲線,而是一道布滿深淵的斷崖。
這一殘酷真相叫做:「鋸齒狀前沿」(Jagged Frontier)。
![]()
OpenAI奧特曼曾低估了AI會有多參差不齊,直言:「在有些事上AI做得極其出色,但在那種長期的復雜任務監督方面卻完全不行。」
在哈佛商學院與BCG的一項實地實驗中,研究者發現:一旦任務跨出模型能力前沿,使用AI的人類顧問反而更容易給出錯誤答案。
![]()
最危險的地方在于:AI會把錯誤包裝得更像正確答案。
![]()
傳送門:https://www.hbs.edu/ris/Publication%20Files/dell-acqua-et-al-2026-navigating-the-jagged-technological-frontier_5c589c8c-fbb5-458f-b285-c944746cd717.pdf
也就是說,單一AI不是「越難越強、越簡單越穩」。
這似乎也是通往真正AGI(通用人工智能)智能的最后幾個前沿問題之一。
更糟糕的是,企業級應用依賴單一API,本質上是在刀尖上行走。
如果企業陷入「測試—調整—再測試」的單模型選型死循環,那其實用農業「挑種子」思維,應對數字時代的「工業化協作」。
所以行業的重心,正在悄然變化:從「接入更多模型」,轉向「如何根據任務,組織和使用多個模型」。
AI的下一戰開始了。
元腦企智EPAI的降維打擊
群體智能
浪潮信息元腦企智EPAI的邏輯非常犀利:企業級AI的下半場,比的是誰能讓不同模型的長處,在同一個任務里自動「補位」。
最近,元腦企智EPAI上線了多模融合API。
![]()
目前,該多模融合API已在積算科技Token服務平臺正式上線,并面向開發者和企業用戶開放內測申請。
試用申請鏈接:https://www.icompify.com/api_request/index.html
他們堅信:群體智能超越單模上限。
很多人認為多模融合就是簡單的「1+1」,但元腦企智EPAI告訴我們,這是一場關于「AI組織力」的革命。
它的多模融合API,本質上是給企業配了一個「AI首席執行官」。
它的玩法分為三步:
眾模并行(候選生成):把同一個任務丟給一池子模型,讓它們各顯神通。
智能評審(評審分析):請一個高階模型坐在首席,識別不同答案里的共識、分歧和遺漏。
深度融合(最終輸出):挑出最優解,拼出一張最完整的拼圖。
![]()
關鍵在于,這一整套流程,開發者只需要一次API調用。
不用自己搭多模型調度系統,不用手寫評審邏輯,不用做結果整合。
在OpenClaw、Hermes、OpenCode這些主流智能體框架里,把多模融合API當成一個普通的模型服務配置進去就行,原有的對話、推理、工具調用能力照常用,應用一行都不用重構。
效果有多硬核?
在內部實測中,元腦企智EPAI的多模融合API在DRACO(深度研究)基準測試中拿到了53.9%的成績,遠超單一模型。
![]()
甚至數學在AIME 2026和研究生級問答基準GPQA Diamond這些硬核推理榜單上,也跑贏了候選池里的所有單一模型。
![]()
![]()
說了這么多,多模融合落地到底能干什么?
答案,藏在那些「一個模型搞不定」的復雜場景里。
比如,方案對比:
![]()
財務分析:
![]()
游戲編程:
游戲任務是生成一個「隕石防御」HTML網頁游戲,對兩類模型接入OpenCode使用同樣的提示詞,交付任務后不再干預。
![]()
單個大參數模型生成效果不錯,流暢度還可以
而多模融合方案的生成效果,整體運行更加流暢,動效更豐富、畫面更精致。
![]()
為什么效果這么好?
這套機制聽起來合理,但它憑什么真能出效果?
答案,藏在一個比大模型古老得多的道理里——群體智能。
早在1785 年,法國數學家孔多塞就證明過一件事:
如果每個陪審員的判斷都比瞎猜略強一點,而且各自獨立投票,那么人越多,多數意見判對的概率就越高,趨近于百分之百。
![]()
但這里有條鐵律:群體要變聰明,得同時滿足三個前提,缺一個就翻車。
一是多樣性。一百個想法一致的人,等于一個人。
二是獨立性。不能互相抄襲或共謀,否則會形成「羊群效應」,要么全對,要么全錯。
三是聚合要有章法。簡單平均或隨意投票,只會抹煞真正的分歧與洞見。必須有人能分辨:誰說到點上,誰漏了關鍵。
看出來了嗎?元腦企智EPAI 的「候選生成—評審分析—融合輸出」,幾乎是照著這三條前提設計的。
這也順帶解釋了一件很多人想不通的事:為什么把模型堆大,堆不出多模融合的效果?
因為AI的盲區,刻在它的訓練數據和參數里。
![]()
你把它做得再大,那個系統性偏差還在——它不知道的,做大了還是不知道。
而多樣性能補的,恰恰是這種盲區:A模型漏掉的,B模型正好知道。
智者千慮,必有一失;愚者千慮,必有一得。規模解決不了的問題,多樣性能解決。
元腦企智EPAI的多模融合API,用一組便宜模型,替下一個昂貴模型。
另外,它還把已經買下的算力盤活。
企業早投了錢建算力集群、部署模型,可很多算力和模型平時利用率并不高。
多模融合給這些「閑置產能」派了活——它們成了候選模型,跑在你已經付過錢的基礎設施上。
這不是讓你多買算力,而是把手里算力的利用率提上去。
這套機制還白送了企業一個很看重的東西:答案不再是黑箱。
![]()
評審這一步本身就要展示參與模型、貢獻內容、采納理由等。
在金融、醫療、政務這些強監管、要留痕的場景里,這幾乎是剛需。
未來,元腦企智EPAI先邁出去了
不過,這里要給一句難得的清醒話。
多模融合,并不是用來替代所有單模型調用的。
官方自己也說得很明白:
簡單問答、格式轉換、低復雜度的內容生成,單模型在成本和響應速度上通常更劃算。
算力「按需分配」,別再殺雞用牛刀。
這正是 EPAI 計劃要做的事:根據任務復雜度、效果要求、成本和時延,自動決定要不要觸發融合、調哪些模型、上多大規模。
簡單任務,一個輕量模型解決,不浪費;復雜任務,才動用多模融合。
算力花在刀刃上,而不是要么長期「配置不足」(單模便宜但常出錯)、要么一律「配置過剩」。
此外,未來還可能出現多模態融合:文本模型與視覺、語音、音頻模型融合,用戶無需手動選擇模態。
未來,真正的競爭力或許不再是模型有多強,而是你能不能把已有的算力、模型和業務任務,組織成一套可管理、可評審、可持續優化的協同系統。
從「選擇模型」,到「組織模型」。這一步,元腦企智EPAI先邁出去了。
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.