无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

絕殺!OpenAI正式接管人類耳朵,首個GPT-5級推理音頻模型來了

0
分享至


新智元報道

編輯:Aeneas

【新智元導讀】絕殺!OpenAI發布GPT-Realtime-2:首個GPT-5級推理音頻模型,OpenAI正式接管人類耳朵人類與機器的最后一道「防火墻」——鍵盤,正在徹底消失。

今天凌晨,OpenAI又給世界帶來一次震撼。

這一次,他們不卷文字,不卷視頻,而是要把那個曾讓無數人驚艷、又讓無數人遺憾的Samantha——電影《Her》中的AI——徹底帶進現實。

OpenAI正式宣布,推出GPT-Realtime-2


這不僅僅是一次音頻模型的升級,這是OpenAI首次明確將「GPT-5級別」的推理能力注入到語音交互中。

伴隨它一同而來的,還有GPT-Realtime-Translate(實時翻譯)和GPT-Realtime-Whisper(流式轉寫)。


正如OpenAI官博所言:「語音正成為人們使用軟件最自然的方式。」

而今天,OpenAI要把這種自然變成全能。

「GPT-5級」推理注入:

語音助手終于有了「腦子」

回想一下,你以前調侃Siri或Alexa時,最大的槽點是什么?是「聽不清」,還是「智障」?

大多數時候是后者。它們能聽清字,卻聽不懂人話。它們只能完成「打電話給某某」這種線性任務,一旦涉及復雜的邏輯糾纏,就會陷入死循環。

GPT-Realtime-2徹底終結了這一時代。

它是全球首個具備GPT-5級別推理能力的音頻模型。這意味著,當你和它對話時,它不再只是一個「復讀機」,而是一個正在實時思考的協作者。

  1. 它是真的在「想」

GPT-Realtime-2引入了可調節的推理強度(Minimal到xhigh五檔)。

在最高級別的推理模式下,它在邏輯謎題、戰略決策、空間感知方面的表現近乎恐怖。

在OpenAI展示的一個案例中,一位創業者描述了自己在通勤火車站旁開咖啡館的構想:900平方英尺、昂貴的租金、周二到周四的高峰、文藝的慢沖咖啡。


以前的AI只會說:「聽起來很棒,加油!」

而現在的GPT-Realtime-2,會停頓,會思考,然后給你做一套詳細的「事后檢查」。

它會告訴你,如果你一年后倒閉了,大概率是因為租金與客流周期的不匹配。接著,它會建議你先嘗試「最小可行化產品」——比如先做一個站臺咖啡推車。


這種戰略推理,以往只能在復雜的文字對話中實現。現在,你只需要一邊開車一邊和它聊天,它就能在幾秒鐘內通過音頻流輸出同等級別的深度洞察。

  1. 「會做人」:情緒價值拉滿

最讓人頭皮發麻的是它的音調控制力。 GPT-Realtime-2不再是冷冰冰的播音腔。

它能感知你的情緒:當你感到沮喪時,它會用更加同理心、輕柔的語調安撫;當任務成功完成時,它的聲音會變得歡快、充滿活力。



它可以完成空間推理。


還能解決邏輯謎題。


GPT-5級的推理能力,就是這么全能。

為了解決「AI處理任務時的死寂感」,OpenAI還給它加了「前導語」(Preambles)功能。

比如當你問一個極難的問題,它不會沉默五秒然后蹦出答案,而是會先自然地接一句:「讓我幫你查一下哈,請稍等片刻……」

這種極具人性的交互細節,直接模糊了碳基生命與硅基生命的界限!


三劍客齊發:重新定義「實時」

除了GPT-Realtime-2這顆大心臟,OpenAI這次還配套了另外兩件神器。

GPT-Realtime-Translate:同傳神器來了

支持70+種輸入語言和13種輸出語言。

它的核心優勢在于「步調一致」。 以往的實時翻譯往往有明顯的滯后感,但這套新模型能緊跟演講者的語速,同時保留情感起伏。

Vimeo已經開始用它為產品教學視頻做實時全球同步。想象一下,未來你參加一場跨國會議,耳邊傳來的翻譯不僅準確,連對方開玩笑時的那種語氣都能精準復刻。

GPT-Realtime-Whisper:把延遲降到冰點

這是Whisper家族的最新成員,專為流式轉寫而生。它不是等你說完一句話才去翻譯,而是在你吐字的同時,文本就已經像流水一樣傾瀉而出。

這對于實時會議記錄、直播字幕以及醫療診斷等高頻互動場景,簡直是降維打擊。

從「對話」到「行動」:Agent的終極形態

OpenAI在發布中反復提到了一個詞:Agentic(代理性)。

在OpenAI看來,語音交互正在從單純的「一問一答」進化為「語音觸發行動」。

比如在Zillow(房產巨頭),用戶可以直接說:「幫我找一套我買得起的房,離鬧市區遠點,周六幫我約個看房時間。」AI會聽、會算、會翻查數據庫,最后直接幫你訂好日程。

在Priceline(旅游平臺),當你的航班延誤時,AI會主動在語音里告訴你:「別急,我幫你找到了新登機口,規劃了最快路線,順便幫你把目的地酒店的入住時間往后挪了。」

這就是GPT-Realtime-2的底氣:它把上下文窗口從32K提升到了128K。 這意味著,你可以跟它聊上幾個小時,它依然記得你最開始提過的那個冷門要求。

它具備了多任務并行調用工具的能力,它能一邊跟你說話,一邊查日歷,一邊訂票,且這一切過程都在后臺絲滑運行。

性能與成本:OpenAI的「陽謀」

在數據表現上,GPT-Realtime-2展現了絕對的霸權。

在衡量音頻智能的Big Bench Audio上,它比1.5版本高出15.2%。

在衡量多輪對話指令遵循能力的Audio MultiChallenge上,它提升了13.8%。


更重要的是價格。

GPT-Realtime-2的每百萬輸入Token 32美元,輸出 64美元。

實時翻譯每分鐘僅需 0.034 美元。

實時轉寫每分鐘僅需 0.017 美元。

顯然,這個價格極具殺傷力。

OpenAI正試圖通過API把這種「GPT-5級」的語音能力,像自來水一樣接入到每一臺手機、每一個App、每一輛汽車中。

你好,薩曼莎

在電影《Her》的結尾,男主角西奧多問AI薩曼莎:「你還在跟我說話的同時,也在跟其他人說話嗎?」 薩曼莎回答:「是的,我同時在和8316個人聊天,并且和其中的641個人戀愛了。」

隨著GPT-Realtime-2的發布,那個能夠同時處理海量邏輯、具備深度情感共鳴、且能實時介入物理世界并采取行動的AI,已經不再是科幻幻想。

它能聽懂你的嘆息,能算清你的財務報表,能帶你穿越語言的障礙。

當推理能力與實時語音完美融合,我們或許正處于人機交互歷史上最徹底的一次變革前夜。

鍵盤已老,語音永生。

參考資料:

https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/

https://developers.openai.com/api/docs/guides/realtime

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
深圳夫妻精準囤貨,5個月身家暴漲320億

深圳夫妻精準囤貨,5個月身家暴漲320億

都市快報橙柿互動
2026-05-12 20:25:59
外交部通告全世界:強烈譴責巴方有關行徑,引全球高度關注

外交部通告全世界:強烈譴責巴方有關行徑,引全球高度關注

科技處長
2026-05-12 22:43:25
《低智商犯罪》:近期最解壓的懸疑喜劇

《低智商犯罪》:近期最解壓的懸疑喜劇

阿廢冷眼觀察所
2026-05-12 19:31:01
成龍砸四千萬只為認回女兒,房祖名幫忙,林鳳嬌沉默,吳卓林的話最清醒

成龍砸四千萬只為認回女兒,房祖名幫忙,林鳳嬌沉默,吳卓林的話最清醒

可樂談情感
2026-05-13 01:07:17
45歲獨身男子病逝15萬存款被民政局轉走?該局回應:系另一親屬所為,警方已赴外地調查|求真

45歲獨身男子病逝15萬存款被民政局轉走?該局回應:系另一親屬所為,警方已赴外地調查|求真

紅星新聞
2026-05-12 13:32:22
官宣,王勵勤勸了都沒用,樊振東深夜發文戳穿現實:不做工具人

官宣,王勵勤勸了都沒用,樊振東深夜發文戳穿現實:不做工具人

隱于山海
2026-05-13 00:49:15
2026年最強反腐已來了 , 中紀委:害群之馬將清除到底!

2026年最強反腐已來了 , 中紀委:害群之馬將清除到底!

細說職場
2026-05-11 18:50:29
女子碩士入學清華后參與智力測驗,僅得25分,回應:無論是學習、工作、創業,我都沒有遇到困難,但我居然智力中下

女子碩士入學清華后參與智力測驗,僅得25分,回應:無論是學習、工作、創業,我都沒有遇到困難,但我居然智力中下

揚子晚報
2026-05-11 07:48:21
湖人0-4遭橫掃后,東契奇逼宮管理層:承諾必須兌現

湖人0-4遭橫掃后,東契奇逼宮管理層:承諾必須兌現

籃壇第一線
2026-05-13 06:40:43
亞洲杯太殘酷了:隨著中國2-0,日本3-1,2大勁旅已經被送回家

亞洲杯太殘酷了:隨著中國2-0,日本3-1,2大勁旅已經被送回家

側身凌空斬
2026-05-13 02:00:18
4月汽車銷量前十只剩一款燃油車了

4月汽車銷量前十只剩一款燃油車了

金融界
2026-05-12 18:21:50
A·史密斯認為尼克斯隊,是勒布朗·詹姆斯5億美元合同的最佳選擇

A·史密斯認為尼克斯隊,是勒布朗·詹姆斯5億美元合同的最佳選擇

好火子
2026-05-13 00:41:17
熱議U17沖出亞洲:最后真的膽戰心驚;趕緊把教練換掉吧

熱議U17沖出亞洲:最后真的膽戰心驚;趕緊把教練換掉吧

懂球帝
2026-05-13 02:45:07
馬斯克庫克隨特朗普訪華

馬斯克庫克隨特朗普訪華

財聯社
2026-05-12 21:20:18
特朗普時隔9年再訪華,隨行商界大佬都有誰?庫克、馬斯克在列

特朗普時隔9年再訪華,隨行商界大佬都有誰?庫克、馬斯克在列

上游新聞
2026-05-12 12:50:37
山東37歲女子離婚當天徹底瘋了,當場撒潑嘶吼前夫,網友紛紛叫好

山東37歲女子離婚當天徹底瘋了,當場撒潑嘶吼前夫,網友紛紛叫好

社會日日鮮
2026-05-12 08:09:39
76人更衣室徹底亂了!恩比德帶頭,球員集體倒戈,毒瘤早該離隊

76人更衣室徹底亂了!恩比德帶頭,球員集體倒戈,毒瘤早該離隊

你的籃球頻道
2026-05-12 07:31:00
網友屏蔽大批“愛國”名人企業,康輝、華為在列,評論區一片叫好

網友屏蔽大批“愛國”名人企業,康輝、華為在列,評論區一片叫好

譚談社會
2026-05-12 16:38:21
北京淘汰廣東后上海卻急了?復仇11冠王沒戲:半決賽還可能被爆冷

北京淘汰廣東后上海卻急了?復仇11冠王沒戲:半決賽還可能被爆冷

籃球快餐車
2026-05-13 02:55:10
樊振東沒想到,國乒倫敦奪冠不到24小時,他“處境”變得如此唏噓

樊振東沒想到,國乒倫敦奪冠不到24小時,他“處境”變得如此唏噓

好賢觀史記
2026-05-12 11:03:43
2026-05-13 06:52:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15194文章數 66863關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

體育要聞

騎士終于玩明白了?

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

利潤再腰斬 京東干外賣后就沒過過好日子

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

手機
數碼
家居
藝術
公開課

手機要聞

谷歌攜手蘋果升級換機體驗:iPhone轉安卓可遷移密碼、主屏布局

數碼要聞

看電視的人越來越多了 3億臺電視在線 小米第一

家居要聞

極簡主義下的居住場域與空間

藝術要聞

這位女攝影師的航拍風景照片,簡直太美了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版