![]()
3月6日凌晨,OpenAI發布了最新模型版本:GPT-5.4。如果在以往,也許這又是一次模型能力更高更快更強的更新而已,但如今,OpenClaw正在被“全民熱議”,在這個時間點上,GPT-5.4作為第一次擁有直接操作電腦能力的大模型,尤為值得關注。
緊跟小龍蝦,GPT也要把手伸進你的電腦了
這次上新,ChatGPT最引人注目的是什么呢?顯然是它的原生電腦操控能力,這個版本的ChatGPT可以直接操作你的軟件和瀏覽器。
這和當下爆火的OpenClaw剛好呼應,只不過,過去模型操作電腦要使用專門的Computer Use Agent,而GPT-5.4第一次讓這個功能直接融入通用模型。
看起來,大模型“伸手”操作你的電腦已經是大勢所趨,相信很快會成為各家模型跟進的焦點。順便說一句,據業內人士透露,其實阿里半年前就在做屏幕捕捉和長期記憶,看來大模型未來很可能全面跳過小龍蝦,直接接管用戶的電腦。
不僅如此,GPT5.4操作電腦的能力可以說非常順滑,它的操作成功率居然超過了人類。
在OSWorld-Verified測試(用于驗證大模型Agent在操作計算機方面能力)中,GPT?5.4通過截圖識別桌面界面并執行鍵鼠操作的成功率達到75%,不僅遠遠超過了上一代模型GPT?5.2的47.3%,更是超過了人類平均水平72.4%。
同時,GPT5.2可以直接靠一張截圖就理解圖中網頁的結構,從而順滑操作原網頁,根據通過截圖理解網頁結構的Online-Mind2Web測試,成功率達到了92.8%,這讓它更接近人類使用電腦的邏輯。
![]()
基于截圖解析和坐標來操控瀏覽器發郵件
因此,GPT-4.5在職業場景測試中也取得了好成績。
OpenAI使用GDPval基準測試(要求模型完成完整職業任務),覆蓋美國GDP貢獻最大的九個行業和四十四種職業場景,包括制作銷售演示文稿、建立會計電子表格、安排醫院急診排班、繪制制造流程圖或生成短視頻內容。
GPT?5.4在83%的任務中達到或超過行業專業人士水平。
另外,GPT-5.4還可以接入OpenAI同時推出的Excel插件,可以在Excel中直接調用模型,實現AI與傳統辦公軟件的無縫協作。
OpenAI特別關注GPT?5.4在電子表格、演示文稿和文檔創建及編輯能力上的提升。在一項內部電子表格建模測試中,GPT?5.4的平均得分達到87.3%,經測試,人類在68%的情況下更偏好GPT?5.4生成的內容,認為它視覺設計更成熟、結構更清晰、視覺變化更豐富,圖像生成更有效。
![]()
多模態智能的全面躍升
在如今最受人關注的多模態方面,這次GPT-4.5也可圈可點。
無需外部工具輔助的情況下,GPT-5.4的視覺理解準確率達到了81.2%。
值得一提的是,GPT-4.5對高分辨率和高密度圖像的處理能力也有所增強,支持“原始圖像輸入細節”,可處理總量最高達1024萬像素或最大邊長6000像素的全保真圖像,“高細節”模式支持最高256萬像素或最大邊長2048像素。
與操作電腦的能力相結合,GPT-4.5已經為大模型完成復雜工作打下了基礎。
GPT-5.4還具備很強的編程能力,與專注編程的前代模型GPT?5.3-Codex不分伯仲。
![]()
GPT-5.4與前代模型評分對比
更讓人驚喜的是,GPT-5.4還能自動用瀏覽器測試自己編寫的web應用。
利用此次發布的實驗性Codex技能Playwright(交互版),只需要一句提示詞,GPT-5.4 就生成了一個類似過山車大亨的模擬經營小游戲。游戲可以建造游樂設施、道路、門票系統,游客可以自主游覽和排隊。
![]()
GPT-4.5制作的游戲截圖
Playwright Interactive 執行了自動化測試,驗證路徑鋪設、攝像機導航、游客行為以及界面指標的準確性。
總體來看,GPT-5.4在Agent可用性的層面又進了一大步。
![]()
更低的價格,更高的Token使用效率
最后,來看看價格。
GPT-5.4 Thinking(基礎版)的輸入價格為:2.5美元/百萬token,輸出:為15美元。
GPT-5.4 Pro(企業版)的輸入價格為:30美元/百萬token,輸出為:180美元(對標專業級服務)。
![]()
OpenAI官網顯示的Token價格
盡管單位Token價格比GPT-5.2略高,但GPT-5.4的又一個亮點就在這里。
GPT?5.4擁有“工具搜索”機制,允許模型按需查詢工具定義,大幅減少Token開銷。在過去,大量外部工具定義必須在每次請求時全量加載,占用大量Token并拖慢響應,也是的Token使用量偏高。
經過測試,在36個MCP服務器的情況下,GPT-5.4的總Token使用量降低了47%。
![]()
“工具搜索”機制顯著降低了Token使用量
應該說,在被稱為Agent元年的2026年,OpenAI交出了第一份令人滿意的答卷。
參考資料:
https://openai.com/index/introducing-gpt-5-4/
免責聲明:本內容由Alpha說編輯團隊基于公開信息整理,代表編輯團隊觀點,不構成任何投資建議。如需引用,請注明出處。
Alpha說編輯團隊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.