无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

國產大模型“集體”更新后能力有多強?記者實測

0
分享至


近期,國產大模型迎來密集更新。從模型性能、應用場景到落地能力全面提升,同時在海外開發者平臺,Token調用量超過美國。

國產大模型集體更新有哪些亮點?

為什么能夠吸引全球開發者來體驗使用?

記者近期對幾款大模型進行了實測

一起了解

能力究竟有多強?記者實測來了

近期,國產大模型迎來井噴式更新,且Token調用量排名持續在海外開發者平臺OpenRouter上名列前茅。數據顯示,截至5月4日至5月10日當周,中國主要大模型周調用量達到7.94萬億Token,對比美國模型3.76萬億Token,調用量超美國兩倍。

國產大模型都有哪些能力迭代呢?記者做了一個實測。



當前,騰訊混元大模型在海外開發者平臺排名第一。依托該模型賦能,只要輸入一句話的指令,沒有任何技術背景的人也可以按需生成一個微信小程序的應用。

另一個大模型Kimi K2.6則主打智能體能力。它一次最多可以調動300個子智能體,并行完成4000個協作步驟,持續代碼開發時間長達5天,將復雜任務執行時間縮短3倍以上。


記者給Kimi提出任務進行實測:參考一個旅游推薦集錦,制作一個包含34個旅行目的地的網站。只用了一個小時,一個名為“探索中國”的網站就建好了,部分熱門景點還可以跳轉至購票和預約頁面。這個效率對比傳統工程師敲代碼已經快到難以想象。

月之暗面Kimi研究員 杜羽倫:它具有非常強的長程代碼能力。它在我們內部、外部的很多任務上可以單獨跑十幾個小時,并且寫4000多行代碼,不需要人為干預。


而在這輪模型迭代中,最大的亮點是以國產開源大模型DeepSeek為代表的大模型,進入了百萬token上下文時代。百萬token上下文可以簡單理解為大模型一次能“記住”或者“看完”的信息量,大約相當于75萬個漢字,能力比之前的國產開源模型翻了4至8倍。

記者將約80萬字的《西游記》全書投喂給了最新的DeepSeek大模型。

孫悟空被唐僧驅逐出去幾次,原因是什么?

它9秒鐘給出了答案:三次,并告訴了對應的章節和情節。由于這個情節跨越全文,所以答案是它基于全文理解基礎之上給出的。

記者還考驗了DeepSeek的代碼能力。


請將所有的妖怪羅列出來,并根據出現的順序作出妖怪圖譜,并以動態html網頁形式展示。

DeepSeek開啟了思考,僅僅數分鐘操作,一個西游記妖怪圖譜的搜索引擎就做好了,里面包含不同門類、不同特點的歸納。它還細心地為搜索引擎設計了一個logo。記者嘗試搜索,真的找到了相關妖怪的介紹。


DeepSeek的迭代真正令人贊嘆的,不僅僅是它能解決的問題,還有它的成本:目前,DeepSeek-V4-Flash百萬token的輸出價格僅為0.28美元,這個價格是美國頂尖大模型GPT-5.5的約百分之一。正是因為極致的性價比和綜合能力,DeepSeek-V4成了國際開發者OpenClaw上智能體“龍蝦”的默認大模型。在百萬上下文極長推理的背后,DeepSeek的推理計算量卻降至上一代模型的27%。也就是說,它并不是靠算力硬扛,而是通過架構創新將成本實打實地打了下來。

如何實現性能和性價比“雙重”升級?

國產大模型集體能力升級的背后,是我國大模型技術在開源生態上的緊密合作。從模型的技術迭代到芯片的系統適配,我國大模型技術如何實現性能和性價比的雙重升級?

無論是DeepSeek最新升級的V4模型,還是Kimi K2.6,它們都是開源模型。開源就是將軟件或者技術的源代碼公開,允許任何人自由查看、使用、修改和分發。開源主要的目的是希望通過社區協作的方式推動技術的共同改進。

開源合作 國產大模型生態協作加深

記者翻看了DeepSeek迭代后發布的技術報告,從中發現了國產大模型之間的緊密合作。比如,DeepSeek-V4中關鍵的一個優化器,其有效性率先由另一個國產大模型團隊Kimi驗證,DeepSeek在技術報告中公開致謝。在開源生態中,大家不需要重復“造輪子”,這也是模型迭代效率和整體水平加速提升的一個重要原因。


月之暗面Kimi研究員 杜羽倫:我們的優化器加速了DeepSeek模型的訓練,它可以增加一倍的訓練效率。我認為技術的開源鼓勵了各家公司做更快AI的迭代。

不僅僅是開源生態下大模型能力之間的互相借鑒,本次DeepSeek的更新在成本和效率上做到了更底層的優化。DeepSeek的技術報告中指出,它已經在系統層面完成了跨平臺適配,可以同時運行在英偉達和華為昇騰兩套硬件架構之上。通過底層代碼的深度遷移以及芯片和模型的協同優化,DeepSeek-V4在華為昇騰芯片上的推理效率實現了低延遲、高吞吐,證明了國產芯片能“跑得好”頂級模型。


同時,由北京智源研究院自主研發的AI大模型操作系統FlagOS,也在DeepSeek-V4發布當天完成了10個國產芯片廠商對新模型的開源適配,讓大模型能在更多架構和國產芯片上運行,提高效率,降低成本。記者來到國家超算中心,基于智源研究院研發的FlagOS,工作人員將算力中心不同品牌的芯片進行了第一時間適配。


國家超算互聯網應用發展主任 安磊:超算互聯網目前已經匯聚了超過340家線上的合作伙伴,提供了超過7300款的軟件和應用。FlagOS也是我們整個生態里比較重要的一個伙伴。超算互聯網秉持了開放開源、合作共贏的心態,為國產芯片和國產算力對接,尤其是國產模型的對接,提供普惠式的技術服務和支撐底座。

北京智源研究院副院長兼總工程師 林詠華:過去這三年不斷堅持,首先是能夠讓不同的芯片廠商都接入我們的技術棧,讓我們的技術棧能夠跑到不同的芯片上,這要克服很多芯片架構的差異、芯片指令集的差異,這些事還是很有挑戰性的。今天我們已經支持了10多家芯片企業,超過30款芯片。

大模型深度賦能

到底能為我們做什么?

開源生態和產業鏈上下游協作推動國產大模型加速優化。同時,隨著大模型能力的提升,它也更加深度賦能各類場景應用。戳視頻,看大模型升級如何助力人工智能技術的應用走入我們的工作和生活。

皮膚的紋理、眼部細節、鸚鵡的羽毛層次……剛剛升級的可靈視頻大模型全新迭代了全球首個原生4K直出功能,可以幫助影視制作者省去復雜的后期處理,直接達到電影院線的畫面質感。


一位專業的動畫片導演,正在利用大模型的新能力進行一部動畫電影的創作。從美術師設計的手稿到生成出單幀圖片,再到用視頻大模型生成出動態效果,電影畫面的細節和清晰度都得到了保障。


AI長片電影執行導演 曹漢:之前也會有一些提升分辨率的工具,比如說1080P提升到4K,因為它不是原生的,可能分辨率提升后人物面部會有一些很微妙的變化,有一點不像那個人了。可靈大模型因為是原生4K,生成的視頻可以更還原角色,這可能是后期提升分辨率沒辦法達到的。


大模型能力的提升可以幫助導演團隊打造出清晨陽光下細微的灰塵變化,看到人物臉上的雀斑,展示出不同層次的物品和光影的透視效果,甚至連老木頭桌子上的陳年油污都清晰可見,從而讓動畫電影的制作效率和效果雙雙提升。

在大模型技術賦能下,同樣實現了效率提升的還有我們的日常生活。近期,千問大模型完成迭代,與淘寶全面打通,網友們只要提出自己的購買需求,不管是具體的還是模糊的,甚至可以配合圖片等多模態信息,大模型就可以完成推薦。


千問AI購物項目負責人 黎煜章:淘寶20年積累的40億的商品數據庫,包括背后的一些訂單交易能力、物流履約能力,翻譯給千問大模型,讓千問大模型能夠理解用戶一些隱性的需求。舉個例子,用戶說想買一個掃地機器人,家里有貓。大模型通過我們的訓練后,可以關聯到像防毛發纏繞、需要高溫消毒等商品屬性標簽,能夠快速搜索到符合用戶需求的商品。

從上網購物到網絡打車,再到航空公司訂票,人工智能正在打通越來越多的網絡生態,幫助用戶更加直接地完成各類干活的任務。深度走入工作和生活場景,也將成為下一步大模型技術發展的趨勢。

國產大模型靠什么贏下一程?

如今,大模型技術已經從單純的拼參數走向拼性價比、拼應用落地、拼“干活”能力。在這個過程中,中國大模型產業發展又將迎來哪些機遇?

近期,斯坦福大學發布了《2026年AI指數報告》,報告的目的是通過數據與實證分析呈現AI發展現狀與趨勢。在這份400多頁的報告中,可以看到,隨著AI能力的持續進化,全球超90%的頂尖大模型在博士級科學問題、多模態推理、競賽數學等任務上已追平或超越人類水平。中美AI大模型性能差距已大幅縮小至2.7%。而在近期中國大模型頻頻迭代的背后,也折射出技術發展的新趨勢。


清華大學技術創新研究中心主任 陳勁:大模型已經走出單純模仿的發展道路,正在通過和國產芯片的整合,包括精巧的算力,包括我國豐富的數據資源相結合,以獨特的高性價比和強大的工程化能力,已經構成了強大的全球競爭力。

大模型技術落地 走向好用和高性價比

正如這份報告所指出的,未來大模型能力的關鍵并不在于誰的評分更高,而在于與落地場景結合后,誰的使用更加穩定、更加便宜、更加合規。產品和落地能力已成為目前大模型技術競爭的一個重要方向。


數據顯示,截至2025年底,我國累計有748款生成式AI服務完成備案,全年新增446款。2026年《政府工作報告》首次將“打造智能經濟新形態”寫入頂層設計,同時強調“完善人工智能治理”,表明大模型的發展與安全已同步進入國家戰略規劃。專家同時指出,大模型安全治理能力與技術進步速度之間還存在治理滯后的“剪刀差”。

清華大學技術創新研究中心主任 陳勁:進一步加強安全防范體系的建設,建立以倫理剎車的機制,建立起人工智能行業的安全評估模型,從被動響應到主動防御。安全為準繩,促進人工智能健康和諧發展。

(總臺央視記者 張春玲 張喆)

原標題:《國產大模型“集體”更新后能力有多強?記者實測》

欄目主編:張武 文字編輯:盧曉川

來源:作者:央視新聞客戶端

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
利物浦標價2500萬歐放人,基耶薩或重返意甲

利物浦標價2500萬歐放人,基耶薩或重返意甲

體壇觀察猿
2026-05-19 01:47:33
14歲被送上導演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

14歲被送上導演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

不似少年游
2026-04-17 19:31:49
同一棵楊梅樹:出口歐洲干干凈凈,賣給國人瘋狂泡藥,真相扎心了

同一棵楊梅樹:出口歐洲干干凈凈,賣給國人瘋狂泡藥,真相扎心了

寶哥精彩賽事
2026-05-19 01:33:09
浙江杭州一校花太漂亮了,身高170五官精致,美得讓人移不開眼

浙江杭州一校花太漂亮了,身高170五官精致,美得讓人移不開眼

小椰的奶奶
2026-05-18 14:41:15
唯一不與中國建交的鄰國,首都離中國僅45公里,曾實行一妻多夫

唯一不與中國建交的鄰國,首都離中國僅45公里,曾實行一妻多夫

抽象派大師
2026-05-17 02:10:48
史上最大泰坦重現東南亞!身高體重打破紀錄,全球變暖竟是誘因

史上最大泰坦重現東南亞!身高體重打破紀錄,全球變暖竟是誘因

補懂事的孩紙
2026-05-15 20:47:17
天壇為什么不能隨便去?真正原因很多人不知道,不是迷信

天壇為什么不能隨便去?真正原因很多人不知道,不是迷信

叮當當科技
2026-05-15 18:23:34
事事順心!下月運道最旺的3個生肖:終于輪到你們發財了

事事順心!下月運道最旺的3個生肖:終于輪到你們發財了

毅談生肖
2026-05-17 10:14:29
中國紅會被國際紅會拒絕承認的原因,善款規則讓自己人都憤怒

中國紅會被國際紅會拒絕承認的原因,善款規則讓自己人都憤怒

干史人
2025-01-23 07:05:02
說實話,我從沒見過比她更絕的美人!一眼絕仙女棒,看呆了

說實話,我從沒見過比她更絕的美人!一眼絕仙女棒,看呆了

東方不敗然多多
2026-05-19 01:56:40
一定要多存錢,存款達到“這個數”,以后的生活就有保障了,你有嗎?

一定要多存錢,存款達到“這個數”,以后的生活就有保障了,你有嗎?

CG說科技
2026-05-18 17:32:08
烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

我心縱橫天地間
2026-01-22 18:41:25
高血壓一點酒都不能沾?醫生怒斥:高血壓喝酒,或許有這3個變化

高血壓一點酒都不能沾?醫生怒斥:高血壓喝酒,或許有這3個變化

冷眼看世界728
2026-05-18 22:27:01
2-3!英超金靴在美職聯12場0球+率隊4連敗,梅西的含金量還在提升

2-3!英超金靴在美職聯12場0球+率隊4連敗,梅西的含金量還在提升

球場沒跑道
2026-05-18 12:16:48
廈門一男子向好友借10萬元并出具借條,收到后當日轉回7500元,法院認定7500元是“砍頭息”,實際借款本金92500元

廈門一男子向好友借10萬元并出具借條,收到后當日轉回7500元,法院認定7500元是“砍頭息”,實際借款本金92500元

大風新聞
2026-05-18 11:09:41
未來10 年哪些行業可能迎來爆發?高考報什么專業?

未來10 年哪些行業可能迎來爆發?高考報什么專業?

新浪財經
2026-05-17 23:58:16
狂奔的泰蘭尼斯,還穩嗎

狂奔的泰蘭尼斯,還穩嗎

北京商報
2026-05-18 22:40:14
75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

娛說瑜悅
2026-04-04 15:38:01
殺夫案主犯程海燕被執行死刑,執刑前,向兒子坦白丈夫的秘密

殺夫案主犯程海燕被執行死刑,執刑前,向兒子坦白丈夫的秘密

紙鳶奇譚
2025-03-15 15:19:06
2億成本,《出入平安》?上映3天票房跌至8萬,片方虧到懷疑人生

2億成本,《出入平安》?上映3天票房跌至8萬,片方虧到懷疑人生

電影票房預告片
2026-05-18 23:56:58
2026-05-19 03:56:49
上觀新聞 incentive-icons
上觀新聞
站上海,觀天下
484696文章數 761503關注度
往期回顧 全部

科技要聞

蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

頭條要聞

賴清德要求美國繼續向臺出售武器 外交部表態

頭條要聞

賴清德要求美國繼續向臺出售武器 外交部表態

體育要聞

58順位的保羅,最強第三中鋒

娛樂要聞

票房會破14億!口碑第一電影出現了

財經要聞

中國芯片,怎么突然不便宜了?

汽車要聞

40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

態度原創

數碼
家居
游戲
手機
軍事航空

數碼要聞

TOPPING拓品推出DX1 II游戲HiFi解碼耳放一體機,769元

家居要聞

觀山隱秀 心靈沉淀

《GTA6》多個取景地在現實已消失!開發太久的弊端

手機要聞

全系2億像素主攝+超大底!榮耀Magic9系列影像規格曝光了

軍事要聞

莫斯科遭一年多來最大規模無人機襲擊 3死18傷

無障礙瀏覽 進入關懷版