IT之家 4 月 24 日消息,OpenAI 公司今天(4 月 24 日)宣布推出 GPT-5.5 模型,是其迄今最智能、最直觀的 AI 模型,在 Agentic Coding、計算機使用及科研領域表現卓越,相比較 GPT-5.4,在完成相同任務的情況下減少詞元(Token)消耗。
![]()
OpenAI 總裁格雷格 · 布羅克曼(Greg Brockman)強調,GPT-5.5 的核心突破,在于能夠以更少的指導完成更多任務,最大的亮點在于在處理模糊問題時,展現出更強的自主性,能快速理解用戶意圖,自主規劃并執行多步驟復雜任務,在代碼編寫調試、在線研究、數據分析及跨工具操作等場景表現出色。
![]()
GPT-5.5 的核心優勢在于 Agent(智能體)能力,用戶無需精細管理每一步,只需下達模糊的多部分任務,模型即可自主規劃、調用工具、檢查結果并持續推進直至完成。
性能方面,GPT-5.5 進一步平衡智能與速度。盡管模型更大、能力更強,但在實際服務中,其每個 Token 的延遲與 GPT-5.4 持平,且完成相同任務所需的 Token 顯著減少:
- 在 Artificial Analysis 的 Coding Index 中,它以競爭模型一半的成本提供了 SOTA(最先進)的智能水平。
- 在 Terminal-Bench 2.0 測試中,GPT-5.5 取得了 82.7% 的準確率;
- 在評估 GitHub 問題解決的 SWE-Bench Pro 中達到 58.6%;在 Expert-SWE 等長周期任務中均超越前代模型。
- 早期測試者反饋,該模型在理解系統架構、定位故障及預測審查需求方面能力顯著增強。
科研與知識工作領域迎來質變。GPT-5.5 在 GeneBench 基因數據分析及 BixBench 生物信息學基準測試中取得領先成績,甚至協助發現了關于 Ramsey Numbers(拉姆齊數)的新證明。
![]()
![]()
在企業應用中,OpenAI 內部超 85% 的員工每周使用 Codex,財務團隊利用其審核了超 7 萬頁稅務文件,效率提升顯著。NVIDIA 等合作伙伴證實,該模型將調試時間從數天縮短至數小時。
GPT-5.5 目前已向 Plus、Pro 等用戶開放,API 版本即將上線,輸入定價為每百萬 Token 售價 5 美元(IT之家注:現匯率約合 34.2 元人民幣),Pro 版本輸入定價為每百萬 Token 30 美元。
![]()
山姆 · 奧爾特曼稱在 GPT-5.5 模型上,OpenAI 和英偉達高度合作,推廣 Codex 到英偉達全公司,并曬出了和黃仁勛的交流郵件:
![]()
英偉達在新聞稿中指出,OpenAI 發布的 GPT-5.5 模型是其最新前沿成果,目前已在 NVIDIA GB200 NVL72 機架級系統上運行,為智能體編程應用 Codex 提供核心動力。
NVIDIA 內部已有超過 10000 名員工率先使用該技術,涵蓋工程、產品、法務、市場等多個部門,員工反饋稱其效果令人震撼。
英偉達工程師通過 Codex 應用使用 GPT-5.5 已數周,基于 GB200 NVL72 系統,該模型實現了極具競爭力的經濟效益:相比前代系統,百萬 Token 成本降低至 35 分之一,每兆瓦 Token 輸出量提升 50 倍。
![]()
在實際應用中,原本耗時數天的調試周期縮短至數小時,復雜多文件代碼庫的實驗周期從數周壓縮至一夜之間。團隊甚至能通過自然語言提示實現端到端功能交付。
IT之家附上參考地址
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.