亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.4養(yǎng)龍蝦太貴?OpenAI自己出手砍到了一折

0
分享至



最近OpenClaw可以說是火遍了大江南北。各大廠商都說自己的模型如何支持小龍蝦,唯獨(dú)沒人推薦ChatGPT。

事實(shí)上OpenAI才收購了OpenClaw。

原因就一個(gè)“貴”。

讓AI幫你完成一個(gè)稍微復(fù)雜的任務(wù),比如自動(dòng)化處理一批客戶郵件,背后可能要調(diào)用模型幾十上百次:理解意圖、檢索信息、生成草稿、校對潤色、逐封發(fā)送……如果每一步都調(diào)用滿血版GPT-5.4,一輪操作下來,飼料費(fèi)(token)比蝦本身還貴。

特別是隨著OpenClaw這類agent框架的爆發(fā),AI的工作模式已經(jīng)發(fā)生了根本性轉(zhuǎn)變:從前我們向AI提問,它盯著問題想很久,然后吐出一長串文字;現(xiàn)在AI面對一個(gè)復(fù)雜任務(wù),要將其拆解成微小步驟分步推進(jìn)。每一步都調(diào)用旗艦大模型,不僅延遲讓人崩潰,成本也會(huì)高到離譜。

在這種背景下,OpenAI正式發(fā)布GPT-5.4 mini與nano兩款小型模型,并宣稱其為公司“迄今最強(qiáng)大的小型模型”。

麻雀雖小五臟俱全,不要小瞧這兩個(gè)小玩意,不僅GPT-5.4核心的優(yōu)勢和能力它們繼承了下來,同時(shí)還更快、更省資源,并且適合于大批量、高頻率的AI任務(wù)調(diào)用。

OpenAI貌似是覺得mini還不夠小,所以做出了更輕量的nano。

nano是GPT-5.4最輕量、最快速的版本,專為對速度和成本要求極高的任務(wù)而設(shè)計(jì)。

事實(shí)就是,用單一模型處理所有事務(wù)性價(jià)比太低,經(jīng)常陷入高射炮打蚊子的境況,不如調(diào)整成大模型決定任務(wù)方向,小模型進(jìn)行大規(guī)模快速執(zhí)行的方案。

OpenAI自家的Codex就是這么干的。

一個(gè)主模型負(fù)責(zé)理解任務(wù)意圖、拆解步驟,然后調(diào)度mini/nano級別的子agent去執(zhí)行具體的代碼修改、測試運(yùn)行、結(jié)果校驗(yàn),每個(gè)子任務(wù)只消耗極低的成本。

大模型就像坐鎮(zhèn)中軍、運(yùn)籌帷幄的主帥,只抓頂層戰(zhàn)略、調(diào)度全局資源。小模型則是無數(shù)支精銳輕騎,身形輕便、行動(dòng)迅捷、批量奔赴前線,專一完成細(xì)分任務(wù)。

01

OpenAI為什么這么做

mini和nano在價(jià)格上確實(shí)“mini”以及“nano”。要理解OpenAI為什么押注輕量化,先看看這兩款模型到底便宜到什么程度。

mini和nano均支持 400k tokens 的上下文窗口。在輸入價(jià)格上,GPT-5.4旗艦版是2.5 美元/百萬token,mini版是0.75美元/百萬 token,nano版更是夸張,僅0.2美元/百萬token,輸入成本僅為旗艦?zāi)P虶PT-5.4的8%。

而輸出價(jià)格上,GPT-5.4是15美元/百萬 token,mini版約為它的1/3(4.5 美元),nano版約為它的1/12(1.25 美元)。

換句話說,OpenAI用戶們的賬單直接砍到了零頭。



價(jià)格只是表象,真正驅(qū)動(dòng)OpenAI做這件事的,是整個(gè)行業(yè)的使用趨勢已經(jīng)發(fā)生了根本性轉(zhuǎn)向。

輕量化小模型主要有調(diào)用成本低、響應(yīng)快這兩大特征,不少證據(jù)表明小模型已經(jīng)成為當(dāng)前AI落地最具性價(jià)比、最具增長潛力的選擇。

在OpenRouter本月度最受歡迎LLM排行榜前十中,輕量化模型占到了6個(gè)席位,它們參數(shù)量普遍集中在數(shù)十億至數(shù)百億級別,和Claude Opus這類動(dòng)輒數(shù)千億甚至萬億參數(shù)的通用旗艦大模型形成鮮明的差異。

榜單Top 2席位被輕量化小模型包攬,第1名MiniMax M2.5以8.29T tokens的調(diào)用量斷層領(lǐng)跑全榜,月度漲幅高達(dá) 476%;第2名Google Gemini 3 Flash Preview,調(diào)用量也達(dá)到4.24T tokens,遠(yuǎn)超多數(shù)通用旗艦大模型。



Hugging Face Hub的模型下載量統(tǒng)計(jì)同樣印證了這一趨勢:92.48%的下載量來自少于10億參數(shù)的模型,86.33% 為5億以下,69.83% 為2億以下。

大模型也進(jìn)入了薄利多銷的時(shí)代。

1B+參數(shù)量的模型,即便包含多款輿論熱度極高的開源大模型,整體下載占比僅為7.52%,不足輕量化模型的十分之一,這說明大模型的高關(guān)注度,似乎并未轉(zhuǎn)化為真實(shí)的落地與采用。



從OpenAI自身的商業(yè)賬本來看,做小模型更是一道必答題。

今年2月底,OpenAI宣布ChatGPT全球每周活躍用戶已突破9億,付費(fèi)用戶約5000 萬,付費(fèi)轉(zhuǎn)化率僅約5%左右,絕大多數(shù)用戶仍停留在免費(fèi)版本。這也成為其未來商業(yè)化最核心的增長空間。

絕大多數(shù)的C端付費(fèi)用戶,核心使用場景是日常對話、文案潤色、信息檢索、輕量代碼編寫等高頻輕量需求。

這類場景完全不需要GPT-5.4這類旗艦大模型的極限復(fù)雜推理能力,百億級以內(nèi)的輕量化小模型足以覆蓋大部分需求,同時(shí)又能提供毫秒級響應(yīng)、無排隊(duì)等待的使用體驗(yàn),完美匹配絕大多數(shù)用戶的核心訴求。

說了這么多“為什么”,接下來看看這兩款模型到底交出了怎樣的答卷——畢竟,飼料便宜了,蝦的個(gè)頭要是也縮水了,那就不叫降本增效,叫偷工減料。

02

mini、nano能力幾何

mini和nano的優(yōu)勢就只是小和便宜嗎?

No No No

根據(jù)OpenAI官網(wǎng)的一系列跑分測試,可以說它們能力表現(xiàn)也很突出。

在業(yè)內(nèi)公認(rèn)最權(quán)威的AI程序員測試SWE-bench Pro 中,GPT-5.4 mini的準(zhǔn)確率達(dá)到了54.4%,表現(xiàn)極具殺傷力,逼近滿血版GPT-5.4的57.7%。

GPT-5.4 nano的準(zhǔn)確率為52.4%,再考慮到它極低的成本,非常適合作為快速迭代的代碼審查和輔助子agent。

以下兩張圖表看得更直觀,橫軸分別代表模型的響應(yīng)時(shí)長和所用成本,縱軸均表示模型在任務(wù)中的準(zhǔn)確率。

GPT-5.4雖然準(zhǔn)確率穩(wěn)居第一,但是在橫軸上卻延伸了太遠(yuǎn),也就是不僅思考久,燒的錢還多。而nano和mini的折線則整體居于坐標(biāo)圖左側(cè),標(biāo)志了它們極高的性價(jià)比。



它們只是犧牲了一點(diǎn)點(diǎn)終極的邏輯上限,就換來了極快的響應(yīng)速度和極低的成本。

對此,不少網(wǎng)友戲稱:小龍蝦的飼料費(fèi)終于被打下來了。

的確,mini和nano未來可能會(huì)成為養(yǎng)蝦的主流API選擇。

在OSWorld-Verified(真實(shí)電腦環(huán)境操作測試)中,GPT-5.4 mini達(dá)到了72.1%的準(zhǔn)確率,幾乎追平了滿血旗艦版的75%。



這項(xiàng)測試主要是讓AI像人一樣,通過看顯示器、動(dòng)鼠標(biāo)、敲鍵盤來使用一臺真的電腦,包括使用Chrome、Office、VS Code等軟件。

這才是OpenClaw等agent玩家最看重的指標(biāo)。

過去讓AI操控電腦,AI經(jīng)常會(huì)瞎點(diǎn)或者反應(yīng)遲鈍。mini版本的這個(gè)高分意味著,它識別按鈕、滑塊、輸入框的精度極高,在一些自動(dòng)化任務(wù)上可以更加得心應(yīng)手。

然而,也不是所有場景都適合用小模型。

nano模型在OSWorld-Verified上的得分僅為39.0%,甚至低于上一代GPT-5 mini的42.0%。

這意味著在需要精細(xì)操控電腦界面的復(fù)雜任務(wù)上,nano還力有不逮。

同樣,對于需要深度推理、長鏈條邏輯的高難度任務(wù),旗艦版GPT-5.4仍然不可替代。

小模型的價(jià)值不在于取代大模型,而在于和大模型搭配使用——把對的模型放在對的位置,才是子agent架構(gòu)真正的精髓。

這也恰恰是nano和mini發(fā)布的深層意義,它們不是來搶旗艦版飯碗的,而是來幫旗艦版分擔(dān)那些“高射炮打蚊子”的活兒。

當(dāng)大模型不再需要親自處理每一個(gè)瑣碎步驟,整個(gè)系統(tǒng)的效率和成本結(jié)構(gòu)都會(huì)發(fā)生質(zhì)變。

OpenAI想打的不是一場簡單的價(jià)格戰(zhàn),OpenAI內(nèi)心OS是這樣的:“我可以每個(gè)token少賺你點(diǎn)錢,但是我要讓你多用我的小模型,把總收入抬上去。”

典型的薄利多銷。

過去“便宜”是國產(chǎn)模型的護(hù)城河,可是這道護(hù)城河正在被填平。對普通開發(fā)者和企業(yè)用戶而言,AI可能很快就會(huì)變成各行各業(yè)用得起、跑得快的新基礎(chǔ)設(shè)施。

小龍蝦的飼料費(fèi)打下來了,養(yǎng)蝦的門檻也在悄悄降低。接下來的問題是:誰能養(yǎng)出最肥的蝦?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
99年我回村葬母無人搭理,只有1戶人家熱心幫忙,15年后我去報(bào)恩

99年我回村葬母無人搭理,只有1戶人家熱心幫忙,15年后我去報(bào)恩

千秋文化
2025-09-05 11:30:00
1952年,抗日名將柏輝章被押往刑場,曾在淞滬會(huì)戰(zhàn)立下赫赫戰(zhàn)功

1952年,抗日名將柏輝章被押往刑場,曾在淞滬會(huì)戰(zhàn)立下赫赫戰(zhàn)功

磊子講史
2026-02-03 12:47:11
中國移動(dòng):4月30日起全國統(tǒng)一執(zhí)行!話費(fèi)、流量將迎來重大變化

中國移動(dòng):4月30日起全國統(tǒng)一執(zhí)行!話費(fèi)、流量將迎來重大變化

Thurman在昆明
2026-04-15 19:05:34
2026 年最穩(wěn)的 5 個(gè) “鐵飯碗” 排名:醫(yī)生排不上,第一竟然是它

2026 年最穩(wěn)的 5 個(gè) “鐵飯碗” 排名:醫(yī)生排不上,第一竟然是它

細(xì)說職場
2026-04-13 11:14:47
浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車?yán)锝Y(jié)束了生命

浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車?yán)锝Y(jié)束了生命

魔都姐姐雜談
2026-03-30 19:25:57
長的太漂亮了,真正的珠圓玉潤,標(biāo)準(zhǔn)的東方美

長的太漂亮了,真正的珠圓玉潤,標(biāo)準(zhǔn)的東方美

生活新鮮市
2026-03-27 07:21:32
最大“騙局”是山姆超市,靠一張 260 元的會(huì)員卡一年狂攬 660 億

最大“騙局”是山姆超市,靠一張 260 元的會(huì)員卡一年狂攬 660 億

南權(quán)先生
2026-01-19 15:38:30
美股三大指數(shù)悉數(shù)轉(zhuǎn)漲 費(fèi)城半導(dǎo)體指數(shù)持續(xù)拉升

美股三大指數(shù)悉數(shù)轉(zhuǎn)漲 費(fèi)城半導(dǎo)體指數(shù)持續(xù)拉升

財(cái)聯(lián)社
2026-04-16 23:26:03
張倫碩節(jié)目直言要親生孩子,無視鐘麗緹高齡,張泉靈當(dāng)場翻白眼

張倫碩節(jié)目直言要親生孩子,無視鐘麗緹高齡,張泉靈當(dāng)場翻白眼

明星爆料客
2026-04-14 20:55:07
央視官宣:意甲直播版權(quán)正式回歸,至此五大聯(lián)賽轉(zhuǎn)播權(quán)已集齊

央視官宣:意甲直播版權(quán)正式回歸,至此五大聯(lián)賽轉(zhuǎn)播權(quán)已集齊

懂球帝
2026-04-16 21:15:11
遲到的正義!又一名伊朗高官后代被吊銷美國綠卡,將被驅(qū)逐出境

遲到的正義!又一名伊朗高官后代被吊銷美國綠卡,將被驅(qū)逐出境

大洛杉磯LA
2026-04-16 04:08:29
國內(nèi)成品油4月21日24時(shí)開啟調(diào)價(jià)窗口,汽柴油預(yù)計(jì)下調(diào)每噸510元

國內(nèi)成品油4月21日24時(shí)開啟調(diào)價(jià)窗口,汽柴油預(yù)計(jì)下調(diào)每噸510元

金融界
2026-04-16 15:26:01
50歲李小冉雙馬尾甜翻全網(wǎng),老公徐佳寧:悔不該讓她上節(jié)目

50歲李小冉雙馬尾甜翻全網(wǎng),老公徐佳寧:悔不該讓她上節(jié)目

童叔不飆車
2026-04-16 21:36:37
年薪近億!DeepSeek 郭達(dá)雅加盟字節(jié)

年薪近億!DeepSeek 郭達(dá)雅加盟字節(jié)

云頭條
2026-04-16 22:30:27
猝死的人越來越多?醫(yī)生再次強(qiáng)調(diào):寧可睡到中午,也別做這8事

猝死的人越來越多?醫(yī)生再次強(qiáng)調(diào):寧可睡到中午,也別做這8事

侯醫(yī)生談健康
2026-04-15 18:35:03
零跑D19正式上市,售價(jià)21.98萬起

零跑D19正式上市,售價(jià)21.98萬起

界面新聞
2026-04-16 20:41:19
陳麗華追悼會(huì)曝光,原來73歲無兒無女的遲重瑞,早已被安排好“退路”

陳麗華追悼會(huì)曝光,原來73歲無兒無女的遲重瑞,早已被安排好“退路”

LULU生活家
2026-04-16 08:13:59
BBC名記:拉什福德和奧納納都愿意在需要時(shí)回歸;記者:納格爾斯曼對各種潛在的機(jī)會(huì)持開放態(tài)度

BBC名記:拉什福德和奧納納都愿意在需要時(shí)回歸;記者:納格爾斯曼對各種潛在的機(jī)會(huì)持開放態(tài)度

MUREDS
2026-04-17 00:03:11
特朗普“封鎖令”影響幾何?分析:若石油出口完全斷流 伊朗最多兩月后須減產(chǎn)!

特朗普“封鎖令”影響幾何?分析:若石油出口完全斷流 伊朗最多兩月后須減產(chǎn)!

財(cái)聯(lián)社
2026-04-16 12:06:09
央國企變味了:從內(nèi)退到息崗,鐵飯碗全面破碎!

央國企變味了:從內(nèi)退到息崗,鐵飯碗全面破碎!

黯泉
2026-04-16 22:08:11
2026-04-17 04:03:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2383文章數(shù) 8059關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

本地
時(shí)尚
教育
房產(chǎn)
親子

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

教育要聞

網(wǎng)傳建鄴區(qū)即將迎來大動(dòng)作?多校學(xué)區(qū)要變?

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會(huì),擠爆了!

親子要聞

兒子認(rèn)字還可以吧? 董路的微博視頻

無障礙瀏覽 進(jìn)入關(guān)懷版