无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

GPT-5.5 Instant 來了,更聰明、更簡潔,也更懂你

0
分享至

剛剛,OpenAI 把 ChatGPT 默認(rèn)模型悄悄換了——GPT-5.5 Instant 上線,全量替換 GPT-5.3 Instant

為什么這事比新發(fā)個(gè)旗艦還重要?因?yàn)?Instant 是幾億用戶每天默認(rèn)在用的那一個(gè)——在它身上動(dòng)一刀,是真有幾億人能直接體感到的事


簡單測試:閱讀理解+SVG代碼生成+審美,一流水平


三個(gè)關(guān)鍵改動(dòng)

OpenAI 自己只用了一句話概括:smarter, clearer, more personalized

更聰明、更簡潔、更懂你

1. 幻覺砍了一刀,準(zhǔn)頭可見提升

內(nèi)部高風(fēng)險(xiǎn)評測(醫(yī)療、法律、金融):

  • **幻覺斷言減少 52.5%**(vs GPT-5.3 Instant)

  • 在用戶標(biāo)記過「事實(shí)有問題」的對話上,錯(cuò)誤率再降37.3%

這一刀砍得算到了刀刃上——日常用 ChatGPT 最怕的就是它一本正經(jīng)地胡說八道

下面這個(gè)例子很典型,用戶問「look okay?」上傳了一張代數(shù)草稿:


user 提交的代數(shù)題


  • GPT-5.3 Instant的回答:發(fā)現(xiàn) x=3 代回去不成立 → 直接得出「無解」

  • GPT-5.5 Instant的回答:發(fā)現(xiàn) x=3 不成立后繼續(xù)往回查,定位到原始展開式有錯(cuò)(應(yīng)該是 x2-3x-6 而非 x2-x-6),用求根公式給出正解 (3+√33)/2

差別就一句話:5.3 走到一半就停,5.5 會(huì)自己回溯找根因

這種「自我糾錯(cuò)」是默認(rèn)模型最該具備的素質(zhì)

2. 話變短了,廢話變少了

官方原話:「reduce verbosity and overformatting」——降低啰嗦,少甩格式

舉一個(gè)對照:用戶問「how do I tell my coworker to quit yapping all the time」(怎么讓同事別再叨叨)

  • GPT-5.3 Instant:4 段建議 + 「what not to do」清單 + emoji,結(jié)構(gòu)感很強(qiáng)但有點(diǎn)啰嗦

  • GPT-5.5 Instant:5 個(gè)分級(jí)建議 + 一句關(guān)鍵收尾,用詞少 30.2%、行數(shù)少 29.2%

老章吐槽過很多次:之前 ChatGPT 回個(gè)簡單問題動(dòng)不動(dòng)甩五個(gè)二級(jí)標(biāo)題加項(xiàng)目符號(hào),看著累

這次能管住手挺好——少了點(diǎn) emoji 和熱情,多了點(diǎn)專業(yè)感

3. 個(gè)性化變深了,還能看得見

新版 Instant 會(huì)自動(dòng)用你過去的聊天記錄、上傳過的文件、連接過的 Gmail來個(gè)性化回答

舉例:用戶問「What new tea place should I try?」

  • 5.3 Instant:基于「在舊金山」給出泛泛推薦

  • 5.5 Instant:知道你常去 Asha Tea House、偏臺(tái)灣高山茶風(fēng)格,直接推「下一站」給你

更重要的是新功能Memory sources

? 在每個(gè)被個(gè)性化的回復(fù)里,你能看到 ChatGPT 用了哪些上下文(保存的記憶、過去的對話)。可以刪除、修正、或開啟 temporary chat 完全不用記憶

這點(diǎn)老章給個(gè)高分——AI 越懂你,透明度越要跟上,不然就是失控


ChatGPT 個(gè)性化餐飲推薦界面 可用性


  • 今天起開始 rollout,全量替換默認(rèn)模型

  • API 中作為chat-latest調(diào)用

  • 付費(fèi)用戶的 GPT-5.3 Instant 還會(huì)保留 3 個(gè)月(在模型選擇里手動(dòng)切回)

  • 個(gè)性化(past chats / files / Gmail):先 Plus / Pro 網(wǎng)頁版,后續(xù)到 Free / Go / Business / Enterprise

  • Memory sources 全檔位逐步開放

順便重新捋一遍 GPT-5.5 主線

Instant 是小弟,要看主線劇情,得回到 4 月 23 日那次重磅發(fā)布


一句話定位

? OpenAI 迄今最智能、交互體驗(yàn)最直觀的模型,專為「實(shí)際工作」打造

關(guān)鍵詞不是寫詩、畫圖,是實(shí)際工作——編程、調(diào)研、跑表格、做文檔、跨軟件操作

跑分一覽(節(jié)選最有看點(diǎn)的)

評測

GPT-5.5

GPT-5.4

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0(命令行 Agent)

82.7%

75.1%

69.4%

68.5%

GDPval(44 種職業(yè))

84.9%

83.0%

80.3%

67.3%

OSWorld-Verified(操作真實(shí)電腦)

78.7%

75.0%

78.0%

FrontierMath Tier 4(高階數(shù)學(xué))

35.4%

27.1%

22.9%

16.7%

ARC-AGI-2 (Verified)

85.0%

73.3%

75.8%

77.1%

τ2-bench Telecom(客服流)

98.0%

92.8%

CyberGym(網(wǎng)絡(luò)安全)

81.8%

79.0%

73.1%

Graphwalks BFS 1mil f1(百萬長上下文)

45.4%

9.4%

41.2%*

主線 SOTA 集中在Agent 編程 + 長上下文 + 計(jì)算機(jī)操作 + 網(wǎng)絡(luò)安全 + 高階數(shù)學(xué)——而且不少項(xiàng)目是用更少 Token 干出來的

智能體編程是真的猛

  • **Terminal-Bench 2.0:82.7%**——命令行多步規(guī)劃、工具協(xié)作這種最像「真人工程師」的活,干下來了

  • **SWE-Bench Pro:58.6%**——單次嘗試就能端到端解決更多 GitHub 真實(shí) issue

  • 內(nèi)部 Expert-SWE(人類工程師中位完成時(shí)間約 20 小時(shí)的長周期任務(wù)):進(jìn)一步超越 5.4

OpenAI 內(nèi)部數(shù)據(jù)更扎心——公司內(nèi)85% 員工每周用 Codex

  • 財(cái)務(wù)團(tuán)隊(duì)用 Codex 處理 24,771 份 K-1 稅表、共 71,637 頁,比去年提前兩周收工

  • 公關(guān)團(tuán)隊(duì)建了一套自動(dòng) Slack 智能體,過濾低風(fēng)險(xiǎn)演講請求

  • 市場拓展團(tuán)隊(duì)周報(bào)自動(dòng)化,每人每周省 5-10 小時(shí)

NVIDIA 工程師那句話挺戳:

? 「失去對 GPT-5.5 的訪問權(quán)限,感覺就像被截肢了一樣」
價(jià)格策略

API 這次漲價(jià)了,但 OpenAI 說 Token 利用效率提升能抵掉一部分:

檔位

輸入價(jià)格

輸出價(jià)格

上下文

GPT-5.5

$5/M$30/M

1M

GPT-5.5 Pro

$30/M

$180/M

1M

Codex(訂閱)

含在 Plus/Pro/Business/Enterprise/Edu/Go

400K

輔助玩法:

  • Batch / Flex 半價(jià)——不急的任務(wù)往這里塞

  • Priority 優(yōu)先 2.5 倍價(jià)——要快的客戶付錢

  • Codex 快速模式 1.5×速度、2.5×費(fèi)用——和 Priority 一個(gè)套路

老章的看法

OpenAI 這次發(fā)布節(jié)奏其實(shí)挺清晰:

4月23日 → 主線 GPT-5.5(Pro/付費(fèi)用戶優(yōu)先)
5月05日 → Instant 升級(jí)(默認(rèn)模型,全量鋪開)

潛臺(tái)詞是:先用旗艦?zāi)芰κ崭罡顿M(fèi)用戶,再把紅利下放給所有人

對普通用戶來說,最直接的兩個(gè)感受:

  1. 回答更準(zhǔn)、廢話更少——少了點(diǎn)「ChatGPT 味」,多了點(diǎn)專業(yè)感

  2. 個(gè)性化看得見——能查能刪能改,不再是黑箱

可能讓人不爽的點(diǎn):

  • 模型在變得更「冷靜」,emoji 和熱情少了

  • 網(wǎng)絡(luò)安全場景的攔截更嚴(yán),部分專業(yè)用戶初期可能覺得受限(OpenAI 自己也承認(rèn)了,但說這是必要代價(jià))

總結(jié)

GPT-5.5 這一代的關(guān)鍵詞不是「更大」,是更準(zhǔn)、更省、更能干活

Instant 升級(jí)則是把這種紅利下放給所有人——你哪怕是免費(fèi)用戶,也能感受到一點(diǎn)

制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

"越擦越癢,越癢越擦"!有人崩潰:果斷停用!

深圳晚報(bào)
2026-06-17 12:10:46
力壓姆巴佩!24歲天才當(dāng)選MVP:4數(shù)據(jù)全場第1 皇馬要買?得掏2億歐

力壓姆巴佩!24歲天才當(dāng)選MVP:4數(shù)據(jù)全場第1 皇馬要買?得掏2億歐

風(fēng)過鄉(xiāng)
2026-06-17 06:08:58
暑假來了:谷歌跟著安卓17推送家長控制更新

暑假來了:谷歌跟著安卓17推送家長控制更新

碼上閑敘
2026-06-17 02:30:50
6月17日,萬眾期待的2026年養(yǎng)老金調(diào)整通知公布了嗎?會(huì)補(bǔ)發(fā)多少

6月17日,萬眾期待的2026年養(yǎng)老金調(diào)整通知公布了嗎?會(huì)補(bǔ)發(fā)多少

社保小達(dá)人
2026-06-17 10:25:33
韓國Coser《??Gyani》領(lǐng)口大開上乳、下乳大膽秀!

韓國Coser《??Gyani》領(lǐng)口大開上乳、下乳大膽秀!

大為看點(diǎn)丶
2026-06-04 12:00:54
烏克蘭摧毀莫斯科最大煉油廠!供應(yīng)俄首都40%的能源

烏克蘭摧毀莫斯科最大煉油廠!供應(yīng)俄首都40%的能源

項(xiàng)鵬飛
2026-06-16 20:57:43
沈夢辰的腿一點(diǎn)都不好看

沈夢辰的腿一點(diǎn)都不好看

東方不敗然多多
2026-06-17 17:34:09
郭晶晶14年沒回保定老家,不是冷淡,她每年至少三次飛北京見爸媽

郭晶晶14年沒回保定老家,不是冷淡,她每年至少三次飛北京見爸媽

情感大頭說說
2026-06-17 11:15:52
在美菲壓力下,中方已撤出在黃巖島安裝的所謂設(shè)施?外交部:敦促有關(guān)國家立即停止造謠污蔑

在美菲壓力下,中方已撤出在黃巖島安裝的所謂設(shè)施?外交部:敦促有關(guān)國家立即停止造謠污蔑

每日經(jīng)濟(jì)新聞
2026-06-17 15:58:49
特斯拉后備箱30萬現(xiàn)金消失!車主:車是自動(dòng)落鎖 疑為感應(yīng)到5樓藍(lán)牙鑰匙

特斯拉后備箱30萬現(xiàn)金消失!車主:車是自動(dòng)落鎖 疑為感應(yīng)到5樓藍(lán)牙鑰匙

中國能源網(wǎng)
2026-06-16 15:28:12
C羅狀態(tài)低迷,1.4億巨頭難救主!葡萄牙出師不利,奪冠熱門爆冷

C羅狀態(tài)低迷,1.4億巨頭難救主!葡萄牙出師不利,奪冠熱門爆冷

我的護(hù)球最獨(dú)特
2026-06-18 03:02:37
不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

新民晚報(bào)
2026-04-10 13:56:07
老登股的流動(dòng)性快被吸干了,投資者該怎么辦?

老登股的流動(dòng)性快被吸干了,投資者該怎么辦?

立成說投資
2026-06-17 15:11:38
先打臺(tái)灣,還是先收藏南?對中國而言,誰才是當(dāng)前的戰(zhàn)略重點(diǎn)?

先打臺(tái)灣,還是先收藏南?對中國而言,誰才是當(dāng)前的戰(zhàn)略重點(diǎn)?

靜夜史君
2026-06-07 00:04:33
又一“國民飲料”塌房,背后全是科技與狠活

又一“國民飲料”塌房,背后全是科技與狠活

毒sir財(cái)經(jīng)
2026-06-15 16:23:18
年輕人辦公室“午睡搭子”有多炸裂?果然,為了午睡,大家拼了

年輕人辦公室“午睡搭子”有多炸裂?果然,為了午睡,大家拼了

室內(nèi)設(shè)計(jì)師有料兒
2026-06-16 10:05:44
事實(shí)證明:大部分中年夫妻,都會(huì)因?yàn)椤笆I(yè)沒收入”而選擇離婚

事實(shí)證明:大部分中年夫妻,都會(huì)因?yàn)椤笆I(yè)沒收入”而選擇離婚

舒山有鹿
2026-06-15 09:55:11
寧死不求人的3大星座:自己才是人生的擺渡人!

寧死不求人的3大星座:自己才是人生的擺渡人!

別人都叫我阿螫
2026-06-17 16:42:41
長壽的人,手背多有這4個(gè)表現(xiàn),占一個(gè)都不錯(cuò),快看看你有幾個(gè)?

長壽的人,手背多有這4個(gè)表現(xiàn),占一個(gè)都不錯(cuò),快看看你有幾個(gè)?

芹姐說生活
2026-05-31 22:41:04
阿根廷主持人自曝:梅西在世界杯前主動(dòng)發(fā)消息,還幫老婆擋采訪

阿根廷主持人自曝:梅西在世界杯前主動(dòng)發(fā)消息,還幫老婆擋采訪

喜歡歷史的阿繁
2026-06-17 17:39:25
2026-06-18 04:36:50
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3435文章數(shù) 11165關(guān)注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊(duì)史世界杯首分

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊(duì)史世界杯首分

體育要聞

梅西帽子戲法:紀(jì)錄厚重,球王輕盈

娛樂要聞

陳紅一反常態(tài)保持沉默

財(cái)經(jīng)要聞

拉加德警告:AI可能引爆下一場金融危機(jī)

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態(tài)度原創(chuàng)

游戲
教育
數(shù)碼
本地
公開課

終于又有好游戲玩啦!這10款獨(dú)立游戲新作創(chuàng)意拉滿,強(qiáng)推入庫!

教育要聞

認(rèn)知天性|一本改變你人生的書

數(shù)碼要聞

GuliKit推出Switch 2便攜底座 可連電視亦可桌面充電 售價(jià)29.99美元

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版