亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

開源權(quán)重模型崛起:填補(bǔ)企業(yè)級(jí)與前沿AI之間的鴻溝

0
分享至


春季如約而至,谷歌、微軟、阿里巴巴和英偉達(dá)等科技巨頭再度掀起開源權(quán)重AI模型的新浪潮。但這一次,感覺有些不同尋常。

過去,這些模型更像是"玩具":雖然在規(guī)模或創(chuàng)新性上令人印象深刻,但本質(zhì)上仍是研究項(xiàng)目或概念驗(yàn)證,與OpenAI、Anthropic或谷歌的頂級(jí)模型相比仍有相當(dāng)大的差距。

然而,Qwen 3.5、谷歌的Gemma 4,以及微軟的MAI語音與圖像模型,卻呈現(xiàn)出截然不同的面貌。這些模型不再只是概念驗(yàn)證,而更像是真正面向企業(yè)的產(chǎn)品。

IDC高級(jí)研究總監(jiān)安德魯·巴斯(Andrew Buss)向媒體表示:"我們已經(jīng)從'令人感興趣'邁入了'真正嚴(yán)肅的企業(yè)級(jí)平臺(tái)'階段。"

這批模型揭示了一個(gè)清晰的現(xiàn)實(shí):企業(yè)級(jí)AI與前沿AI之間的鴻溝在過去幾年中愈發(fā)明顯,而那些功能最強(qiáng)大的前沿模型,已經(jīng)超出了許多企業(yè)的承受能力。

巴斯說:"我認(rèn)為我們正在目睹一種分化趨勢(shì)。一方面,出現(xiàn)了那些體量龐大、追求全能的綜合性模型;另一方面,針對(duì)特定場(chǎng)景或查詢類型的小型專用模型也在快速崛起。"

前沿模型的主權(quán)AI盲區(qū)

使用OpenAI或Anthropic的頂級(jí)模型,意味著企業(yè)需要將潛在的敏感客戶數(shù)據(jù)或知識(shí)產(chǎn)權(quán)暴露給API接口或聊天機(jī)器人。

盡管兩家公司均聲稱不會(huì)將企業(yè)或API數(shù)據(jù)用于模型訓(xùn)練,但這些公司此前已多次因版權(quán)問題被訴諸法庭。

企業(yè)或許愿意借助Gemini或Copilot來起草郵件或銷售提案,但絕不會(huì)輕易將核心專有數(shù)據(jù)交由其處理。

另一條路也并非坦途。來自DeepSeek、阿里巴巴、Moonshot AI和MiniMax等中國(guó)廠商的大型模型,在性能上已能接近OpenAI或Anthropic,但這些模型仍需要相當(dāng)規(guī)模的基礎(chǔ)設(shè)施投入。即便是英偉達(dá)和AMD面向企業(yè)的系統(tǒng),單臺(tái)售價(jià)也在25萬至50萬美元之間。

不過,巴斯指出,根據(jù)具體應(yīng)用場(chǎng)景,企業(yè)未必需要前沿級(jí)別的模型——真正重要的是模型能否足夠出色地完成預(yù)期任務(wù)。

就規(guī)模而言,谷歌、阿里巴巴、微軟和英偉達(dá)最新推出的開源模型不僅競(jìng)爭(zhēng)力相當(dāng)出色,運(yùn)行成本也相對(duì)低廉。

在Arena AI的文本排行榜上(該榜單允許公眾投票評(píng)選最佳輸出模型),谷歌的Gemma 4 31B(31B指其包含310億個(gè)參數(shù))目前排名第四,僅次于Z.AI的GLM-5和Moonshot AI的Kimi 2.5 Thinking——后兩者參數(shù)量分別高達(dá)7440億和1萬億,體量要大出數(shù)個(gè)數(shù)量級(jí)。

巴斯表示:"各類規(guī)模的企業(yè)對(duì)AI都有著強(qiáng)烈的需求,我們認(rèn)為中端市場(chǎng)同樣存在巨大機(jī)遇。為此,我們需要多樣化的基礎(chǔ)設(shè)施硬件,以及能夠在其上運(yùn)行的各類模型。"

谷歌最新發(fā)布的310億參數(shù)模型可輕松在單張RTX Pro 6000 Blackwell顯卡上以完整的16位精度運(yùn)行,同時(shí)仍有充裕的資源支撐合理數(shù)量的并發(fā)請(qǐng)求和交互操作。

這款顯卡的市場(chǎng)售價(jià)通常在8000至10000美元之間。Qwen 3.5的情況與此類似——除兩個(gè)最大規(guī)格的版本外,其余模型均可在單張GPU上輕松運(yùn)行。

巴斯還指出,在許多場(chǎng)景下,這些小型企業(yè)級(jí)模型甚至無需大量算力支持。他表示:"很多時(shí)候我們并不需要GPU加速,相當(dāng)一部分AI工作負(fù)載完全可以在一臺(tái)配置較新的CPU服務(wù)器上加載并運(yùn)行。"

這些更小巧、更專注的模型意味著,使用QLoRA微調(diào)或強(qiáng)化學(xué)習(xí)等技術(shù)對(duì)其進(jìn)行定制時(shí),幾乎不需要額外的資源投入。

究竟發(fā)生了什么變化?

是什么讓這些模型的能力實(shí)現(xiàn)了如此大幅的提升?其實(shí),背后發(fā)生的變化相當(dāng)深遠(yuǎn)。

過去一年間,不僅模型訓(xùn)練技術(shù)取得了一系列突破,驅(qū)動(dòng)這些模型實(shí)際落地應(yīng)用的框架也得到了顯著完善。

不少人還記得DeepSeek R1引發(fā)的市場(chǎng)轟動(dòng)——這是最早采用強(qiáng)化學(xué)習(xí)(RL)復(fù)現(xiàn)GPT-o1思維鏈推理能力的開源權(quán)重前沿模型之一,通過以時(shí)間換質(zhì)量的方式提升輸出水平。

這種如今被稱為"測(cè)試時(shí)擴(kuò)展"(test-time scaling)的方法,讓小型模型得以通過"更長(zhǎng)時(shí)間的思考"來彌補(bǔ)參數(shù)量不足的局限。

與此同時(shí),過去一年中越來越多的模型開始支持視覺和音頻處理,具備了分析圖像數(shù)據(jù)的能力;更智能的架構(gòu)設(shè)計(jì)和更先進(jìn)的壓縮技術(shù),則進(jìn)一步降低了運(yùn)行這些模型所需的算力和內(nèi)存資源。

但最為關(guān)鍵的變化,或許在于用于驅(qū)動(dòng)這些模型完成實(shí)際任務(wù)的軟件框架已經(jīng)走向成熟。

這些框架使模型不再局限于訓(xùn)練數(shù)據(jù)——它們能夠從互聯(lián)網(wǎng)、數(shù)據(jù)庫和API中檢索信息,并通過工具調(diào)用基于檢索結(jié)果采取行動(dòng)。

谷歌和英偉達(dá)的模型在訓(xùn)練之初便將函數(shù)調(diào)用(function calling)納入核心考量。換言之,這些模型并非設(shè)計(jì)為獨(dú)立運(yùn)行的系統(tǒng)。部分模型(如微軟的MAI)更進(jìn)一步,針對(duì)語音識(shí)別和圖像生成等特定領(lǐng)域進(jìn)行了深度優(yōu)化。

巴斯指出,如何為具體任務(wù)選擇合適的模型,隨之成為一大挑戰(zhàn),并認(rèn)為某種形式的推薦系統(tǒng)可能不可或缺。

模型開發(fā)者能從中獲得什么?

在本地運(yùn)行可訪問專有數(shù)據(jù)的智能體,本身具備獨(dú)特的商業(yè)價(jià)值。一方面,盡管這些模型是開源的,但其中仍存在一定程度的生態(tài)綁定——基于這些模型構(gòu)建的智能體,其系統(tǒng)提示詞和工具配置都是針對(duì)特定架構(gòu)深度調(diào)優(yōu)的。

巴斯解釋道,這背后的邏輯是觸達(dá)那些大型模型無法覆蓋的市場(chǎng)。

"如果有人選擇基于你的技術(shù)、方法和知識(shí)產(chǎn)權(quán)進(jìn)行開發(fā),他們就更有可能向上遷移并留在你的生態(tài)系統(tǒng)中。這本質(zhì)上是在入口處布局產(chǎn)品……從早期就吸引用戶,隨著他們的成長(zhǎng),他們往往會(huì)持續(xù)留在你的陣營(yíng)。"

除了生態(tài)布局層面的考量,這些本地化模型還有助于降低數(shù)據(jù)中心的能耗。這一思路與OpenAI的GPT-5有異曲同工之處——后者并非單一模型,而是由多個(gè)子模型組成,系統(tǒng)會(huì)根據(jù)請(qǐng)求的復(fù)雜程度和不同策略動(dòng)態(tài)進(jìn)行路由分發(fā)。

類似的邏輯同樣可以以分布式方式落地:本地運(yùn)行的路由模型將涉及專有數(shù)據(jù)的請(qǐng)求定向至本地大語言模型處理,而對(duì)敏感度要求較低的請(qǐng)求則卸載至外部API提供商。

巴斯表示:"我認(rèn)為可選方案是一個(gè)完整的譜系,涵蓋從完全私有的本地部署、托管在同址數(shù)據(jù)中心的專用節(jié)點(diǎn)、公有云中的專屬實(shí)例,到針對(duì)非敏感負(fù)載的共享環(huán)境以節(jié)省成本——各種選擇應(yīng)有盡有。"

Q&A

Q1:開源權(quán)重AI模型和前沿AI模型有什么區(qū)別?

A:前沿AI模型(如OpenAI、Anthropic的頂級(jí)模型)參數(shù)規(guī)模更大、能力更強(qiáng),但使用成本高昂,且需要將企業(yè)數(shù)據(jù)暴露給外部API,存在數(shù)據(jù)安全隱患。開源權(quán)重模型(如谷歌Gemma 4、阿里巴巴Qwen 3.5)參數(shù)量相對(duì)較小,可在企業(yè)本地部署,運(yùn)行成本低,數(shù)據(jù)不必外傳,且隨著技術(shù)進(jìn)步,性能已大幅提升,足以滿足多數(shù)企業(yè)實(shí)際需求。

Q2:Gemma 4 31B模型需要什么硬件才能運(yùn)行?

A:谷歌Gemma 4 31B模型可在單張RTX Pro 6000 Blackwell顯卡上以完整16位精度運(yùn)行,該顯卡市場(chǎng)售價(jià)通常在8000至10000美元之間。對(duì)于部分AI工作負(fù)載,甚至不需要GPU加速,使用配置較新的CPU服務(wù)器即可加載并運(yùn)行,大幅降低了企業(yè)的硬件投入門檻。

Q3:企業(yè)部署本地大語言模型有哪些優(yōu)勢(shì)?

A:企業(yè)在本地部署開源權(quán)重大語言模型,主要有以下幾點(diǎn)優(yōu)勢(shì):第一,數(shù)據(jù)安全,專有數(shù)據(jù)無需上傳至外部服務(wù);第二,成本可控,小型模型對(duì)算力要求低,運(yùn)行成本遠(yuǎn)低于前沿模型;第三,靈活定制,可使用QLoRA微調(diào)或強(qiáng)化學(xué)習(xí)等技術(shù)進(jìn)行低成本定制;第四,支持智能體,可結(jié)合工具調(diào)用框架訪問數(shù)據(jù)庫和API,完成實(shí)際業(yè)務(wù)任務(wù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
遠(yuǎn)親突然來電,要來旅游,命令我高規(guī)格接待,我冷笑反問:你是誰

遠(yuǎn)親突然來電,要來旅游,命令我高規(guī)格接待,我冷笑反問:你是誰

阿凱銷售場(chǎng)
2026-04-16 16:40:37
炸裂!王曼昱空降上海!5萬薪酬引爆爭(zhēng)議,馬琳力挺藏多大局?

炸裂!王曼昱空降上海!5萬薪酬引爆爭(zhēng)議,馬琳力挺藏多大局?

好乒乓
2026-04-16 12:15:25
大動(dòng)作!潮汕地區(qū)“山姆地塊”2.1億成交!預(yù)計(jì)2028年開業(yè)

大動(dòng)作!潮汕地區(qū)“山姆地塊”2.1億成交!預(yù)計(jì)2028年開業(yè)

潮州玩家
2026-04-16 22:33:40
臺(tái)灣突然宣布重磅決定,島內(nèi)數(shù)萬人聯(lián)名反對(duì),鄭麗文成眾望所歸

臺(tái)灣突然宣布重磅決定,島內(nèi)數(shù)萬人聯(lián)名反對(duì),鄭麗文成眾望所歸

阿訊說天下
2026-04-16 12:40:44
普京敲定訪華,特朗普緊急下命令,中國(guó)通告全球,無懼美國(guó)威脅

普京敲定訪華,特朗普緊急下命令,中國(guó)通告全球,無懼美國(guó)威脅

混沌錄
2026-04-16 16:05:17
人民日?qǐng)?bào)“點(diǎn)名”董勇,言辭犀利,釋放3大信號(hào),影壇風(fēng)向要變了

人民日?qǐng)?bào)“點(diǎn)名”董勇,言辭犀利,釋放3大信號(hào),影壇風(fēng)向要變了

做一個(gè)合格的吃瓜群眾
2026-04-10 11:59:37
針對(duì)伊朗石油運(yùn)輸網(wǎng)絡(luò),美國(guó)宣布新制裁措施,還涉及阿聯(lián)酋、印度!伊朗警告:若美國(guó)繼續(xù)封鎖,伊朗將封鎖波斯灣、阿曼灣和紅海

針對(duì)伊朗石油運(yùn)輸網(wǎng)絡(luò),美國(guó)宣布新制裁措施,還涉及阿聯(lián)酋、印度!伊朗警告:若美國(guó)繼續(xù)封鎖,伊朗將封鎖波斯灣、阿曼灣和紅海

每日經(jīng)濟(jì)新聞
2026-04-16 09:48:21
新血糖標(biāo)準(zhǔn)已更新,餐后血糖最佳值不再是6.2,早知早受益

新血糖標(biāo)準(zhǔn)已更新,餐后血糖最佳值不再是6.2,早知早受益

荊醫(yī)生科普
2026-04-16 15:24:36
廣西攔路的路霸已被刑事拘留,網(wǎng)友好奇為啥只抓5人

廣西攔路的路霸已被刑事拘留,網(wǎng)友好奇為啥只抓5人

映射生活的身影
2026-04-16 23:47:58
真是頭鐵啊!一女生補(bǔ)數(shù)學(xué),高一補(bǔ)到高三考了27分,直言堅(jiān)持到底

真是頭鐵啊!一女生補(bǔ)數(shù)學(xué),高一補(bǔ)到高三考了27分,直言堅(jiān)持到底

火山詩話
2026-04-16 15:49:54
《八千里路云和月》田家泰上線!張汝賢犧牲,丁玉嬌改嫁的真相

《八千里路云和月》田家泰上線!張汝賢犧牲,丁玉嬌改嫁的真相

慢半拍sir
2026-04-16 19:15:36
四川光臂男砸車后續(xù),知情人透露男子身份,真相公布,相當(dāng)解氣

四川光臂男砸車后續(xù),知情人透露男子身份,真相公布,相當(dāng)解氣

奇思妙想草葉君
2026-04-17 01:38:31
何潤(rùn)東被考古,曾參加《非誠(chéng)勿擾》被嫌嘴唇厚,介紹完滅了7盞燈

何潤(rùn)東被考古,曾參加《非誠(chéng)勿擾》被嫌嘴唇厚,介紹完滅了7盞燈

非常先生看娛樂
2026-04-04 16:57:06
15天狂漲88.3萬粉!張雪峰女兒賬號(hào)爆火,流量狂歡下藏著多少?

15天狂漲88.3萬粉!張雪峰女兒賬號(hào)爆火,流量狂歡下藏著多少?

老吳教育課堂
2026-04-16 20:27:43
中國(guó)的4大名面,據(jù)說兩碗在北方,兩碗在南方,吃過的請(qǐng)舉手!

中國(guó)的4大名面,據(jù)說兩碗在北方,兩碗在南方,吃過的請(qǐng)舉手!

洪洋美食日記
2026-04-13 07:46:01
紀(jì)委不會(huì)查這3種情況,很多人不知道,要切記!

紀(jì)委不會(huì)查這3種情況,很多人不知道,要切記!

細(xì)說職場(chǎng)
2026-04-16 15:27:18
刺激! iPhone 17 再次降價(jià),創(chuàng)歷史新低!

刺激! iPhone 17 再次降價(jià),創(chuàng)歷史新低!

科技堡壘
2026-04-16 11:35:17
拒絕5個(gè)月集訓(xùn)!中國(guó)女籃名單中4人離隊(duì),宮魯鳴無可奈何,忍了吧

拒絕5個(gè)月集訓(xùn)!中國(guó)女籃名單中4人離隊(duì),宮魯鳴無可奈何,忍了吧

萌蘭聊個(gè)球
2026-04-16 09:37:36
“天下誰人不貪污,你殺得完嗎?”朱元璋回答了8個(gè)字,流傳至今

“天下誰人不貪污,你殺得完嗎?”朱元璋回答了8個(gè)字,流傳至今

千秋文化
2026-02-21 19:39:28
斯諾克世錦賽抽簽解讀!趙心童運(yùn)氣爆棚,丁俊暉避免一輪游對(duì)手弱

斯諾克世錦賽抽簽解讀!趙心童運(yùn)氣爆棚,丁俊暉避免一輪游對(duì)手弱

曹說體育
2026-04-16 19:22:51
2026-04-17 02:24:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
3306文章數(shù) 169關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

美國(guó)威脅加大對(duì)伊朗制裁 伊朗回應(yīng)

頭條要聞

美國(guó)威脅加大對(duì)伊朗制裁 伊朗回應(yīng)

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

本地
時(shí)尚
藝術(shù)
教育
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

藝術(shù)要聞

你絕對(duì)想不到!這幅油畫背后的美麗故事!

教育要聞

網(wǎng)傳建鄴區(qū)即將迎來大動(dòng)作?多校學(xué)區(qū)要變?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版