作者 | 山竹
出品 | 鋅產(chǎn)業(yè)(公眾號:xinchanye2021)
經(jīng)歷了2023年的百模大戰(zhàn)后,2024年,大模型之戰(zhàn)進(jìn)一步聚焦到了頭部企業(yè)。
在上周阿里在北京的大模型主題發(fā)布會上,就有阿里云高管在現(xiàn)場指出,截至目前,有競爭力的基礎(chǔ)通用大模型已經(jīng)收斂到了10個以內(nèi)。
兩只手就數(shù)得過來的對手意味著,那些在資源和技術(shù)上占據(jù)優(yōu)勢的頭部玩家,就可以根據(jù)對手動態(tài)做出針對性策略,今年年初OpenAI對谷歌的精準(zhǔn)狙擊就是一個很好的例子。
2024年2月15日,谷歌對外重磅發(fā)布了多模態(tài)大模型Gemini 1.5 Pro,官方測試結(jié)果顯示,這個最高支持100萬tokens的多模態(tài)大模型,性能遠(yuǎn)超GPT-4 Turbo。
然而,就在同一天,OpenAI發(fā)布了文生視頻大模型Sora。
Sora的發(fā)布讓全網(wǎng)關(guān)注度再次聚焦到了OpenAI這一文生視頻產(chǎn)品上,搶走了本應(yīng)屬于谷歌的高光時刻,也讓谷歌Gemini 1.5 Pro在大模型發(fā)展歷史上的意義再次被低估。
作為本應(yīng)是大模型領(lǐng)域絕對領(lǐng)導(dǎo)者的谷歌,在召開2024年谷歌I/O大會前夕,全球大模型市場再次暗潮涌動。
阿里云發(fā)布通義千問2.5、零一萬物發(fā)布千億參數(shù)大模型……,更重要的是,OpenAI也再次有了新動作。
01GPT-4o緩解Altman的焦慮
作為硅谷技術(shù)團(tuán)隊創(chuàng)業(yè)中為數(shù)不多的“商人”CEO,Altman能夠掌舵OpenAI靠的不是技術(shù)有多牛或是解決工程化問題的能力有多強(qiáng),而是他的商業(yè)頭腦,因而一直被認(rèn)為是一位營銷大師。
甚至有業(yè)內(nèi)人士猜測,在OpenAI內(nèi)部,最終拍板決定一個產(chǎn)品何時發(fā)布的,不是技術(shù)團(tuán)隊或產(chǎn)品團(tuán)隊,而是公關(guān)團(tuán)隊。
無論這樣的猜測準(zhǔn)確與否,我們能夠看到的是,在Altman的推動下,OpenAI的ChatGPT、GPT-4、GPTs、Sora等產(chǎn)品的發(fā)布,最終都在全球范圍內(nèi)形成了廣泛的關(guān)注。
尤其是在今年年初(北京時間2月16日),已經(jīng)在生成式AI領(lǐng)域占據(jù)絕對優(yōu)勢的OpenAI,在谷歌多模態(tài)大模型Gemini 1.5 Pro發(fā)布僅兩個小時后,就對外發(fā)布了文生視頻模型Sora,這波操作直接“截獲”了本應(yīng)屬于谷歌的潑天流量。
被官方稱作“世界模擬器”的Sora發(fā)布有多炸裂?
在Sora發(fā)布那兩周里,幾乎所有人都在談?wù)揝ora,華大集團(tuán)CEO尹燁就曾在一篇署名文章中曾引經(jīng)據(jù)典地論證了Sora將人工智能技術(shù)提升到了一個更高維度。
不過,對于OpenAI而言,Sora最直接的作用是狙擊了谷歌的Gemini 1.5 Pro,以及隨后發(fā)布的Claude 3,這讓OpenAI至今依舊站在AI之巔。
為什么OpenAI必須是行業(yè)第一?
原因在于,生成式AI本質(zhì)上是靠大算力、大數(shù)據(jù)、大模型,通過量變實現(xiàn)的質(zhì)變,在早期商業(yè)模式中,OpenAI玩的還是互聯(lián)網(wǎng)那套:
通過高增長的用戶量不斷拿到大額融資進(jìn)行技術(shù)研發(fā),再通過快速迭代的技術(shù)改善產(chǎn)品體驗來獲得更多用戶、保持業(yè)務(wù)增長。
作為已經(jīng)在收斂的基礎(chǔ)大模型領(lǐng)域,已經(jīng)是行業(yè)第一的OpenAI要想繼續(xù)拿到巨額融資和高估值,就需要保持自己老大的行業(yè)地位,既需要保證用戶量的高增長,也需要保證持續(xù)的行業(yè)關(guān)注度,以換取增長空間。
這是Sora在今年2月面世的一個主要原因,也是這次,在谷歌I/O大會前一天,OpenAI再次放出GPT-4o這個超級大招的一個重要原因。
什么是GPT-4o?
官網(wǎng)給出的解釋是,GPT-4o是一個可以實時對音頻、視覺和文本進(jìn)行實時推理的(多模態(tài))模型,是邁向更自然的人機(jī)交互的一步。
實際上,早在去年9月,OpenAI就為ChatGPT加入了語音對話和圖像識別功能,前者讓ChatGPT真正成為了手機(jī)上的一個對話式APP,后者則讓用戶可以上傳圖片作為輸入數(shù)據(jù),并基于圖片進(jìn)行交互。
然而,在此之前,手機(jī)版ChatGPT在與人類交互時有兩個影響用戶體驗的問題:
首先是需要較長的等待時間,ChatGPT需要較長的時間才能給出答案,彼時ChatGPT給出的答案可能已經(jīng)很不錯了,但交互體驗并不好;
其次是交互模式更多是問答模式,沒有做到自然交互。
GPT-4o解決了這些問題,不僅將延時控制在了320毫秒內(nèi)(幾乎感覺不到延時),還實現(xiàn)了隨時可打斷的自然交互,甚至能聽懂、看懂人的情緒。
這是語音交互方面帶來的能力,圖像識別方面,這次更是直接從圖像識別和分析升級到了實時視頻解讀和分析,這樣的能力除了為發(fā)布會上展示的手機(jī)端識別真實世界場景的玩法外,鋅產(chǎn)業(yè)認(rèn)為,更重要的是帶來了兩個變化:
第一,結(jié)合文生視頻的Sora,或?qū)碚嬲饬x上的“世界模擬器”;
第二,結(jié)合人形機(jī)器人,將為具身智能帶來一次基礎(chǔ)能力提升。
而這樣的GPT-4o和此前ChatGPT Plus會員版所有能力,將對所有用戶免費(fèi)開放使用。
這無疑將為OpenAI帶來新一波用戶增長,也將緩解Altman的用戶增長焦慮。
02搜索引擎,未盡的戰(zhàn)役
在OpenAI正式公布GPT-4升級消息之前,行業(yè)中還有一個更重磅的猜測——OpenAI這次會推出SearchGPT來狙擊谷歌。
這一消息一經(jīng)媒體發(fā)布,全球嘩然。
要知道,搜索引擎依然是當(dāng)下互聯(lián)網(wǎng)最主要的基礎(chǔ)設(shè)施,作為全球最值錢的公司之一(市值排全球第三),谷歌每年千億美元營收中,超一半來自于搜索引擎廣告。
如果OpenAI瞄準(zhǔn)搜索引擎,會不會危及谷歌在搜索引擎領(lǐng)域的江湖地位?
畢竟,網(wǎng)上路透社等權(quán)威媒體援引知情人士的消息報道有鼻子有眼,網(wǎng)上甚至還傳出了OpenAI的AI搜索引擎測試界面。
剛剛過去的那一周,谷歌決策層必然也在焦急地等待著這一消息的官方回應(yīng)或是產(chǎn)品發(fā)布。
后經(jīng)OpenAI和Altman在Twitter上親自出面澄清:不是GPT-5,也不是搜索引擎,而是ChatGPT和GPT-4的更新。
有業(yè)內(nèi)人士稱,這是Altman的策略——博取流量為自己產(chǎn)品更新造勢的手段。
實際上,想要直接從搜索引擎上顛覆谷歌,即便是OpenAI,也幾乎是一個不可能完成的任務(wù)。
上一個想要借AI狙擊谷歌搜索引擎的,是給OpenAI投了百億美元的微軟。
谷歌一直都是全球搜索引擎領(lǐng)域堪稱壟斷者的存在,即便大多數(shù)中國人習(xí)慣用百度,但就全球搜索引擎市場份額來看,谷歌占比仍超90%,千年老二的微軟Bing只占據(jù)了不到3%的市場份額。
2022年年底,ChatGPT的出現(xiàn)讓微軟嗅到了機(jī)會。
作為OpenAI商業(yè)化后早期投資者,微軟在2023年初緊急向OpenAI追加了100億美元的投資,成了OpenAI最大的股東。
成為OpenAI最大股東的一個好處是,微軟獲得了OpenAI人工智能產(chǎn)品的優(yōu)先訪問權(quán)。也是基于此,微軟引入ChatGPT的搜索引擎AI Bing在2023年2月8日正式對外發(fā)布。
對于AI Bing,微軟內(nèi)部極為看重,微軟CEO薩蒂亞·納德拉當(dāng)時在接受外媒采訪時聲稱,“在AI技術(shù)的推動下,微軟的Bing搜索引擎和Edge瀏覽器將有能力挑戰(zhàn)谷歌的領(lǐng)導(dǎo)地位。”
對于這一新生事物,谷歌確實也被嚇到了,就在微軟發(fā)布AI Bing前一天,谷歌緊急對外發(fā)布了自己的生成式AI聊天機(jī)器人Bard,彼時還因上線倉促、體驗糟糕,Bard在互聯(lián)網(wǎng)上經(jīng)歷了一波“差評”。
這是新舊兩代技術(shù)在搜索引擎上第一次真正的較量。
然而,從結(jié)果來看,事情并沒有向著納德拉想象的方向發(fā)展:
Statcounter統(tǒng)計數(shù)據(jù)顯示,截至今年2月,谷歌全球搜索引擎市場份額為91.6%,同比僅下降了1.75%,微軟Bing市場份額為3.3%,增長了不到1%。
Bing并沒能因為AI起飛,谷歌依舊是搜索引擎市場的霸主。
03谷歌、蘋果必有一戰(zhàn)
和所有新興技術(shù)剛出現(xiàn)時一樣,當(dāng)下大模型的創(chuàng)業(yè)者總被問及一個問題:大模型的殺手級應(yīng)用是什么?
同樣和所有新興技術(shù)剛出現(xiàn)時一樣,沒有人能給出一個肯定的答案。
在此之前,我們在消費(fèi)端看到了AI PC、AI手機(jī)這些“舊產(chǎn)品”的升級,也看到了AI PinRabbit R1等“新”硬件的出現(xiàn),鋅產(chǎn)業(yè)對這些產(chǎn)品也出過一些分析文章,目前來看,這些產(chǎn)品依舊沒有跳出現(xiàn)有應(yīng)用體驗范疇;
在商業(yè)市場,我們看到了具身智能、數(shù)字員工、虛擬專家等概念的熱議,但這些概念也都還是線性變化,難以形成商業(yè)上的階躍體驗。
在和一些互聯(lián)網(wǎng)行業(yè)從業(yè)者聊天過程中,鋅產(chǎn)業(yè)發(fā)現(xiàn),不少從業(yè)者認(rèn)為,生成式AI影響的是互聯(lián)網(wǎng)的根技術(shù),甚至可以說生成式AI本身就是下一個時代的根技術(shù),帶來的是一次真正的全產(chǎn)業(yè)智能化。
以搜索模式為例,AI搜索的工作原理將變?yōu)椋?strong>先搜索,再總結(jié),最后通過智能體進(jìn)行結(jié)果優(yōu)化。
這樣的AI搜索模式除了會將內(nèi)容更簡單地呈現(xiàn)給用戶——從「內(nèi)容排序」到「直給」外,由此帶來的搜索習(xí)慣潛移默化的改變,也將使得端側(cè)AI變得更重要。
或許也是因為察覺到了端側(cè)AI的重要性,也或許是為了與蘋果在大模型上的合作鋪路,OpenAI此次GPT-4o的發(fā)布主要也是基于手機(jī)進(jìn)行的演示。
實際上,此前彭博社就曾援引知情人士消息稱,蘋果正在與谷歌、OpenAI洽談在大模型上進(jìn)行合作。
在2023年百模大戰(zhàn)中,并沒有蘋果的身影,喜歡做后來者的蘋果,直到今年被曝出解散造車團(tuán)隊、轉(zhuǎn)投生成式AI后,蘋果才逐漸放出自己在生成式AI上的相關(guān)消息:
先是收購了AI創(chuàng)業(yè)公司DarwinAI,又發(fā)布了多模態(tài)大模型MM1(論文),而蘋果大模型與Siri的結(jié)合應(yīng)用消息也緊隨其后。
蘋果官方關(guān)于生成式AI的技術(shù)發(fā)布,預(yù)計會是今年WWDC的重點(diǎn),在此之前,OpenAI與谷歌的大模型之爭,也從基礎(chǔ)通用大模型賽場燃燒到了端側(cè)AI。
值得注意的是,為了成為蘋果系產(chǎn)品上的默認(rèn)搜索引擎,谷歌每年都要向蘋果支付百億美元(2022年是200億美元)的合作費(fèi)用。
而在AI語音助手經(jīng)過這一波升級后,在接下來從「內(nèi)容排序」到「內(nèi)容直給」的搜索習(xí)慣轉(zhuǎn)變下,AI語音助手是否會代替?zhèn)鹘y(tǒng)搜索引擎,成為沒有鍵盤的終端產(chǎn)品真正意義上的搜索引擎?
倘若如此,接下來,谷歌在搜索引擎上的對手或?qū)⒉辉偈俏④洠钦谇那挠?xùn)練Siri的蘋果。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.