无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

北大校友Lilian Weng出鏡,爆出120億估值首個(gè)交互模型!

0
分享至


北大校友翁荔首次出鏡,介紹了Thinking Machines的又一產(chǎn)品——交互模型!200毫秒神同步,能聽懂你的猶豫,更能實(shí)時(shí)感知協(xié)作。AI不再是冷冰冰的回復(fù)機(jī)器,更是同頻呼吸的靈魂隊(duì)友。OpenAI前高管天團(tuán),終于又有新作亮相了。

就在剛剛,Thinking Machines又一重磅產(chǎn)品——交互模型(Interaction Models)正式亮相了!


作為OpenAI前安全負(fù)責(zé)人、如今Thinking Machines Lab的聯(lián)合創(chuàng)始人,Lilian Weng獻(xiàn)出了她的出鏡首秀。

在這段備受矚目的視頻中,她展示了AI如何從一個(gè)「只會(huì)對話的工具」進(jìn)化為「能實(shí)時(shí)協(xié)作的伙伴」。

在視頻中,Lilian Weng提了一個(gè)要求:每聽到一次動(dòng)物的名字,都計(jì)數(shù)一次。

而且,非常難得的是,即使她在喝水或思考而停止說話時(shí),AI也并沒有打斷。

最后,當(dāng)她講完,AI給出正確答案:鹿出現(xiàn)一次,綿羊一次,郊狼一次,卡皮巴拉一次。

注意,這個(gè)交互模型可以隱式地追蹤她是在思考、讓步、自我糾正還是邀請回應(yīng),這個(gè)過程中,并沒有專門內(nèi)置的對話管理組件!

此前,這家由前OpenAI CTO Mira Murati創(chuàng)辦的明星公司,在0產(chǎn)品、0論文的情況下,就憑借全明星創(chuàng)始團(tuán)隊(duì)完成了高達(dá)20億美元的種子輪融資,由a16z領(lǐng)投,英偉達(dá)、AMD、微軟等巨頭跟投,估值直接沖上120億美元,刷新了硅谷早期融資紀(jì)錄。

繼去年10月發(fā)布首個(gè)開發(fā)者平臺(tái)Tinker(一個(gè)讓大模型微調(diào)變得像呼吸一樣簡單的工具)之后,這一次,他們又交出了一份讓業(yè)界刮目相看的成績單。


當(dāng)交互帶寬被拉滿,AI 就不再是我們的工具,而是我們意識(shí)的實(shí)時(shí)延伸。這或許徹底改變?nèi)祟惻cAI互動(dòng)的方式,取得通往AGI路徑上又一次勝利的里程碑!


AI時(shí)代的iPhone時(shí)刻終將到來!


AI終于學(xué)會(huì)了「插嘴」

這一步比AGI更動(dòng)人

想象一下,你正在和一位博學(xué)的朋友聊天。你話還沒說完,只是稍作停頓,在腦海中搜尋一個(gè)詞,他便敏銳地捕捉到了你的猶豫,輕聲給出了那個(gè)詞。

或者當(dāng)你正興奮地描述一個(gè)構(gòu)思時(shí),他眼神微動(dòng),在恰當(dāng)?shù)臅r(shí)機(jī)發(fā)出一聲贊嘆。

這種「同頻呼吸」的節(jié)奏感,是我們作為人類最習(xí)以為常、也最珍視的協(xié)作體驗(yàn)。

但在過去兩年里,盡管AI的智力在指數(shù)級增長,我們與它的交互卻始終像是在進(jìn)行一場跨世紀(jì)的電郵往來

無論ChatGPT多么博學(xué),你必須打包好你的思想,點(diǎn)擊發(fā)送,然后屏息凝神,等待反饋。


這種尷尬的「回合制」(Turn-based)殘余,正是阻礙人機(jī)真正融合的那層障礙。


就在剛剛,由OpenAI前研究主管Lilian WengMira Murati等人領(lǐng)銜的初創(chuàng)公司Thinking Machines (TML) 發(fā)布了其首個(gè)重磅成果:交互模型(Interaction Models)

這一次,AI終于打破了沉默,學(xué)會(huì)了「插嘴」。

除了Lilian Weng展示的無縫對話管理功能之外,這個(gè)AI還有以下令人深刻的記憶點(diǎn)。

它會(huì)根據(jù)上下文按需介入,而不僅僅是在用戶說完話之后。

用戶和模型可以同時(shí)說話,這樣就能實(shí)現(xiàn)實(shí)時(shí)翻譯這類功能。

令人驚訝的是,這個(gè)模型還具有對時(shí)間流逝的直接感知。

在與用戶對話和聆聽的同時(shí),它可以同時(shí)進(jìn)行搜索、瀏覽網(wǎng)頁或生成用戶界面,并根據(jù)需要將搜索結(jié)果融入對話中。

在更長的真實(shí)會(huì)話中,這些過程都會(huì)持續(xù)進(jìn)行,讓你感覺更像是在和它合作,而不是在提示它。

網(wǎng)友們直言:這個(gè)產(chǎn)品太酷了。




200毫秒的革命

終結(jié)AI的「冷場」時(shí)代

目前,AI模型大多患有一種「數(shù)字自閉癥」。

當(dāng)你說話時(shí),它是耳聾的——它必須等待一個(gè)名為VAD(語音活動(dòng)檢測)的「外掛腳手架」告訴它:「好了,人類說完了,你現(xiàn)在可以處理了。」

在它生成回復(fù)時(shí),它又是盲目的——如果你在它說話中途指著屏幕上的Bug大喊,它往往聽不見。


Thinking Machines決定拆掉這些腳手架。

他們發(fā)布的交互模型采用了名為「時(shí)間對齊微回合(Time-Aligned Micro-Turns)」的架構(gòu)。


傳統(tǒng)的AI是以「句子」或「段落」為單位處理信息的,但這個(gè)架構(gòu)不再把對話看作是一塊塊巨大的「磚頭」,而是將其切碎成200毫秒為一個(gè)單位的微小流片段。

這是什么概念?200毫秒正是人類反應(yīng)時(shí)間的生理極限。

在這種頻率下,輸入與輸出不再是先后順序,而是交織共生

AI并不是等你把話說完才開始理解,而是每200毫秒就在進(jìn)行一次「感知-反饋」的循環(huán)。


這就像人類的神經(jīng)反射系統(tǒng)——你還沒意識(shí)到自己說錯(cuò)話,AI的耳朵和大腦已經(jīng)捕捉到了你的發(fā)音偏差。

在Lilian Weng出鏡的演示中,模型不再是被動(dòng)等待指令,它能實(shí)時(shí)追蹤Lilian何時(shí)在思考、何時(shí)在讓步、何時(shí)在進(jìn)行自我糾正,甚至能預(yù)判她何時(shí)邀請回應(yīng)。

技術(shù)從指令響應(yīng)進(jìn)化為了感知共振

正如Lilian Weng所言:「人與人之間的協(xié)作,對于改善人機(jī)協(xié)作至關(guān)重要。」


徹底告別VAD(語音檢測外掛)

市面上幾乎所有的實(shí)時(shí)語音AI都在用一種叫VAD的技術(shù)。它的邏輯是:監(jiān)測靜音,如果用戶超過0.5秒沒說話,就判定「用戶說完了」,然后觸發(fā)AI回復(fù)。

這就是為什么目前的AI總是接話太慢,或者在你思考停頓時(shí)粗魯?shù)卮驍嗄恪?/strong>

TML的模型則是原生感知

它不需要靜音檢測,它能通過你的語氣、語速、呼吸聲,甚至是視頻里的眼神,判斷你是在「思考」、「想讓人接話」還是「自我糾正」。這種「懂你」的能力是長在模型骨子里的。

「前臺(tái)交互+后臺(tái)思考」的雙模型協(xié)作

這是TML最天才的設(shè)計(jì)。

實(shí)時(shí)交互模型(InteractionModel),就像人類的「直覺」和「反射」,負(fù)責(zé)保持在線,負(fù)責(zé)聽、看、說、感知情緒,確保200ms的響應(yīng)速度。

異步背景模型(Background Model):就像人類的「深度思考」,負(fù)責(zé)調(diào)用工具、搜索網(wǎng)頁、運(yùn)行復(fù)雜邏輯。


當(dāng)你跟AI聊天時(shí),前臺(tái)模型負(fù)責(zé)陪你「扯淡」和感知,后臺(tái)模型在瘋狂幫你查資料。

一旦后臺(tái)有了結(jié)果,前臺(tái)模型會(huì)找一個(gè)「合適的時(shí)機(jī)」(而不是粗暴打斷)把結(jié)果揉進(jìn)對話里。

他們的出發(fā)點(diǎn)是連續(xù)的音頻與視頻——這些模態(tài)本質(zhì)上是實(shí)時(shí)的。

文本可以等,但實(shí)時(shí)對話不能等。通過優(yōu)先針對最困難的場景進(jìn)行設(shè)計(jì),TML團(tuán)隊(duì)最終得到了一種架構(gòu):它原生支持多模態(tài)、具備時(shí)間感知能力,并且能夠處理跨所有模態(tài)的并發(fā)輸入與輸出流。

他們不使用大型獨(dú)立編碼器來處理音視頻,而是采用預(yù)處理盡可能少的方案。

  • 音頻:以dMel格式輸入,通過輕量級嵌入層轉(zhuǎn)換

  • 圖像:分割成40×40的圖塊,由hMLP編碼

  • 音頻解碼:使用流頭(flow head)

所有組件與Transformer從零開始聯(lián)合訓(xùn)練。


這一切,都證明了他們官網(wǎng)的這句話:「好的協(xié)作,不是某個(gè)人最后給出一個(gè)完美答案。好的協(xié)作,是有人在當(dāng)下真正投入、共同在場。」

行業(yè)地震:GPT真的被超越了嗎?

很多人會(huì)問:OpenAI的GPT Realtime API不也能做到實(shí)時(shí)嗎?

答案是:邏輯完全不同。

根據(jù)TML發(fā)布的技術(shù)報(bào)告,他們的TML-Interaction-Small模型(12B活躍參數(shù)的MoE架構(gòu))在FD-bench(專門衡量交互質(zhì)量的基準(zhǔn)測試)上,已經(jīng)全面領(lǐng)先于GPT Realtime等競爭對手。


核心差距在于「主控權(quán)」:

  • GPT等模型:依然是被動(dòng)的。除非你叫它,否則它不動(dòng)。

  • TML模型:具有視覺主動(dòng)性(VisualProactivity)。它能主動(dòng)看到世界發(fā)生了變化,并在不需要你發(fā)指令的情況下開口。


比如你做俯臥撐,GPT必須等你問「我做了幾個(gè)」才會(huì)回答;而TML的模型能一邊看著你做,一邊自然地喊出:「1、2、3……加油,最后兩個(gè)!」

Mira Murati的復(fù)仇,還是新征途?

曾經(jīng),Thinking Machines的橫空出世,讓整個(gè)硅谷為之側(cè)目。

作為前OpenAI的二號(hào)人物,Mira Murati在離職后并沒有選擇復(fù)刻一個(gè)更大參數(shù)的GPT,而是選擇了「交互」這個(gè)切口。

這反映了她對AI未來的判斷:智能固然重要,但協(xié)作才是AI進(jìn)入人類生活的入場券。

過去三年,所有AI實(shí)驗(yàn)室都在拼誰更聰明,參數(shù)更大、推理更強(qiáng)、上下文更長。但幾乎沒有人認(rèn)真想過,人類跟AI之間的交互界面本身,就是一個(gè)巨大的瓶頸。

如果AI永遠(yuǎn)需要人類去「伺候」它的Prompt,去忍受它的延遲,那它永遠(yuǎn)只是個(gè)好用的計(jì)算器。只有當(dāng)AI能夠「感知時(shí)間」、「感知猶豫」、「自然插嘴」時(shí),它才真正具備了人的屬性。

Thinking Machines選擇的行業(yè)路線告訴我們:AI的下一個(gè)戰(zhàn)場,不在參數(shù)表上。

你覺得,他們押對方向了嗎?

參考資料:

https://x.com/thinkymachines/status/2053938892152435174

https://x.com/miramurati/status/2053939069890298321

https://thinkingmachines.ai/blog/interaction-models/

文章來源:新智元。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國頂級戰(zhàn)略家一針見血,中國的這場危機(jī)不解決,未來后果很嚴(yán)重

美國頂級戰(zhàn)略家一針見血,中國的這場危機(jī)不解決,未來后果很嚴(yán)重

古史青云啊
2026-06-12 10:05:17
你見過多少賭博做局內(nèi)幕?網(wǎng)友:全是精心套路,根本贏不了

你見過多少賭博做局內(nèi)幕?網(wǎng)友:全是精心套路,根本贏不了

另子維愛讀史
2026-05-13 07:43:50
曾經(jīng)月銷過萬的日系神車,兩廂省油又好開!二手跌到1萬多塊

曾經(jīng)月銷過萬的日系神車,兩廂省油又好開!二手跌到1萬多塊

閑搞機(jī)
2026-06-12 11:03:40
取關(guān)!字母終于要走了!湖人是來搞笑的嗎?

取關(guān)!字母終于要走了!湖人是來搞笑的嗎?

柚子說球
2026-06-12 10:48:26
被美國父親拋棄后,他跟母親來到中國,靠自己成明星媽媽的依靠

被美國父親拋棄后,他跟母親來到中國,靠自己成明星媽媽的依靠

青橘罐頭
2026-06-05 14:38:41
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團(tuán)長
2026-06-02 15:09:12
張雪一句話讓阿里員工笑崩:學(xué)歷再高,也得服這個(gè)初中生的本事

張雪一句話讓阿里員工笑崩:學(xué)歷再高,也得服這個(gè)初中生的本事

呼呼歷史論
2026-06-11 15:48:59
北京人真會(huì)享受?1個(gè)細(xì)節(jié)曝光他們年花50萬在這件事上

北京人真會(huì)享受?1個(gè)細(xì)節(jié)曝光他們年花50萬在這件事上

自愈小日子
2026-06-12 01:11:15
“鵝腿阿姨”的生意在廣東活不過一天

“鵝腿阿姨”的生意在廣東活不過一天

美芳
2026-06-10 21:47:19
LG杯四強(qiáng)對陣出爐!中韓對決前瞻,多方研判勝率走勢

LG杯四強(qiáng)對陣出爐!中韓對決前瞻,多方研判勝率走勢

羅納爾說個(gè)球
2026-06-12 07:03:07
49歲當(dāng)大官,73歲被開除黨籍!薄一波親家李雪峰,后勁太大了

49歲當(dāng)大官,73歲被開除黨籍!薄一波親家李雪峰,后勁太大了

混沌錄
2026-05-19 19:23:07
開拓者主帥為楊瀚森設(shè)計(jì)戰(zhàn)術(shù),隊(duì)友學(xué)中文配合,笨功夫成捷徑

開拓者主帥為楊瀚森設(shè)計(jì)戰(zhàn)術(shù),隊(duì)友學(xué)中文配合,笨功夫成捷徑

寶哥精彩賽事
2026-06-12 09:31:12
每月花兩三千雇傭一對夫妻看管祖宅,卻被“鳩占鵲巢”,有產(chǎn)證也收不回!居住人回應(yīng):危樓也要住……

每月花兩三千雇傭一對夫妻看管祖宅,卻被“鳩占鵲巢”,有產(chǎn)證也收不回!居住人回應(yīng):危樓也要住……

環(huán)球網(wǎng)資訊
2026-06-10 22:08:27
2002年,東北第一殺手李正光被執(zhí)行死刑,臨走要求:想喝一碗白酒

2002年,東北第一殺手李正光被執(zhí)行死刑,臨走要求:想喝一碗白酒

墨策史
2026-06-12 00:55:08
紅薯哥妻子李然因病醫(yī)治無效不幸離世,年僅35歲!8歲兒子曾捐髓救母

紅薯哥妻子李然因病醫(yī)治無效不幸離世,年僅35歲!8歲兒子曾捐髓救母

都市快報(bào)橙柿互動(dòng)
2026-06-11 13:49:43
人狂必有禍!80歲黃百鳴被判入獄,更多惡行被扒,還是周星馳高明

人狂必有禍!80歲黃百鳴被判入獄,更多惡行被扒,還是周星馳高明

大中國
2026-06-11 08:21:48
南京市委書記帶隊(duì),赴廣東考察

南京市委書記帶隊(duì),赴廣東考察

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-11 20:02:23
一夫一妻制讓男性陰莖骨退化,還會(huì)導(dǎo)致智力下降?

一夫一妻制讓男性陰莖骨退化,還會(huì)導(dǎo)致智力下降?

宇宙時(shí)空
2026-06-07 18:00:16
外交部發(fā)言人宣布中方對菲律賓國防部長特奧多羅及其親屬實(shí)施制裁

外交部發(fā)言人宣布中方對菲律賓國防部長特奧多羅及其親屬實(shí)施制裁

界面新聞
2026-06-11 20:07:10
蔣介石侍衛(wèi)長94歲吐露:蔣公的失誤不在撤臺(tái),而是接受雅爾塔協(xié)定

蔣介石侍衛(wèi)長94歲吐露:蔣公的失誤不在撤臺(tái),而是接受雅爾塔協(xié)定

磊子講史
2026-06-11 11:02:28
2026-06-12 11:59:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5609文章數(shù) 64624關(guān)注度
往期回顧 全部

科技要聞

SpaceX IPO募資750億美元,馬斯克身家萬億

頭條要聞

"墨西哥吳鎮(zhèn)宇"比肩梅西C羅 成世界杯"六朝元老"

頭條要聞

"墨西哥吳鎮(zhèn)宇"比肩梅西C羅 成世界杯"六朝元老"

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

與熱巴戀情曝光1天,陳飛宇現(xiàn)身

財(cái)經(jīng)要聞

萬億美元順差背后,透露這些信號(hào)

汽車要聞

佟湘北:全新smart#6 自成一派好看更好開

態(tài)度原創(chuàng)

本地
藝術(shù)
教育
數(shù)碼
房產(chǎn)

本地新聞

AK劉彰邂逅河北南大港濕地

藝術(shù)要聞

盛夏清涼|甘南 · 扎尕那 暑期寫生

教育要聞

仙外學(xué)子,駕駛“三駕馬車”:數(shù)學(xué)、物理與攝影的融合,把自己送進(jìn)了世界名校!

數(shù)碼要聞

LG推出新顯示器:內(nèi)置webOS 無需主機(jī)可云游戲

房產(chǎn)要聞

科城·美林學(xué)筑5月領(lǐng)跑崖州灣:成交價(jià)、銷售套數(shù)、轉(zhuǎn)化率三項(xiàng)第一

無障礙瀏覽 進(jìn)入關(guān)懷版