網易首頁 > 網易號 > 正文申請入駐

要倒掉一大批？國產大模型即將進入寒冬……

2024-09-05 19:52:25　來源: 世范財經

廣東舉報

分享至

正文共2517字，預計閱讀時間7分鐘

世范看點

【香港保險不香了】今年上半年，源自內地訪客的新增保費較去年同期下跌6.9%至297億港元；若單從二季度來看，源自內地訪客的新增保費為141億港元，同比減少36.77%。

【個人房貸縮水超3000億】A股上市銀行2024年半年報數據顯示，截至二季度末，六大國有銀行合計個人住房貸款余額25.49萬億元，相比年初凈減少3254.71億元。

【馬云要帶阿里重新出發】阿里整改完畢，馬云在日本表示：相信國家會給阿里提供堅實保障，相信阿里會有更好的未來。據知情人士，馬云本人將于9月回國，重新出任阿里最高管理層職務，帶領阿里人重新出發。

國產大模型要倒掉一大批

最近，中央網信辦公布了最新一批生成式人工智能模型的備案信息。到今年8月，已經有超過200個大模型通過備案。如果加上那些還沒有通過備案的大模型，國產大模型已經超過300個。

這些國產大模型性能怎么樣，能否持續穩定提供服務？目前看來，盡管個大模型在各種評測中都表現出趕超GPT4的水平，但是在實際應用中卻看不到突出效果。一些大模型的下載量雖然超過千萬，但是用戶都是用了幾天就不玩了。這說明，它們實際使用效果尚未達到GPT4、Claude及Gemini的水平。另外一些發布的大模型始終沒有公開使用，一直在內測，估計效果也不怎樣。

不過，對于這些大模型公司來說，產品性能怎么樣還不重要，重要的是，錢快燒沒了，但現在創投業也處于半死不活的狀態，這導致國內AI公司融資很難，雖然去年上馬的時候，一窩蜂地很熱鬧，但現在大家卻感受到寒意，有人甚至說寒冬已經到了。

有人在社交媒體上發布了AI六小虎的動態，只有一家還在擴張：

有“六小虎”，那就還有“大貓”，那就是幾個大廠——百度、騰訊、阿里及華為。這幾個大廠有實力，而且都有自己渠道在一些行業場景中推廣，因此暫時問題不大。

這六小虎中的一號，可能是智譜，他們的大模型產品“智譜清言”其實性能還是很不錯的，在國內屬于第一梯隊，可以和百度、騰訊相抗衡的。

二號可能是百川，其性能也是歸于第一梯隊的，他們發布的新一代基座大模型Baichuan 4的模型能力取得了長足進步，還將搜索技術與大模型深度融合，推出了懂搜索、會提問的AI助手“百小應”，對標國外的perplexity.ai，但整體實力差距還是明顯的。

三號可能是minimax。MiniMax的技術路線全面轉向MoE架構，相比傳統的Dense模型，速度更快，效率更高。現在他們新推出的海螺視頻生成，效果據說不錯，這有可能成為他們熬過寒冬的資本。

四號可能是李開復投資孵化的“零一萬物”。剛開始發布大模型的時候，因為“套殼”什么的，動靜很大，但后來學乖了，沒什么聲響。

五號可能是月之暗面。和零一萬物一樣，曾非常高調，尤其是上半年宣布百萬token上下文，轟動一時，但也沒啥用，創始人迅速套現部分資金，現在也不知何去何從。

六號可能是上海的“階躍星辰”，成立才一年就推出大模型，然后一個月后有宣布和某財經媒體合作，發布了一個財經大模型，畢竟搶占先機很重要，可以迅速拉到投資。

目前，大多數國產大模型都有一個顯著的問題，就是在產品馬馬虎虎可用的情況下，高調宣布，吸引流量但是不能轉換為收入，不過可以拉投資進來。少數表現好的大模型，也不過是可以歸納總結各種文章、報告，寫寫摘要；可以對話聊天；可以回答常識性問題……但是在推理方面普遍不足，而且回答時有幻覺，或者干脆不回答。所以，很多大模型公司把AI當做社交娛樂工具開發，而不是效率工具，作為娛樂工具又太單調，這樣的話，不走進死胡同才怪。

中國的AI大模型正面臨即將到來的寒冬，目前推出的兩三百個國產大模型估計會在2025年倒掉一大批。除了幾個大廠的，以及少數幾個有技術實力的公司，會熬過這個寒冬。比如前面說到的Minimax的海螺視頻生成，無論從美學、運鏡、動作等方面來看，效果都達到世界前列水準，而視頻生成的應用估計會在2025年爆發，因此像Minimax這樣的公司熬過寒冬沒問題。

為什么我們的語言大模型效果不突出，而視頻大模型卻可以后來趕超呢？這個問題的確值得研究。我的看法是，在于訓練的語料上。前面我一直提到過，中文互聯網的數據信息在數量上比較落后，而且很多亂七八糟的東西，再加上中文語法的困難，因此要訓練出一個優秀的大語言模型實在不容易。視頻則好得多，可以利用的視頻資源這些年也積累得夠多，不存在中文英文的問題，只有敢堆算力，就能做出效果來。

用戶用 MiniMax 生成的視頻

就目前發布的視頻生成效果來看，可以滿足一般的社交娛樂、簡單廣告的制作，顯示出一定的應用場景，因此明年視頻生成火爆時，對算力會有很大需求。生成一條視頻，比生成一兩千字的算力大得多。

熬過寒冬，AI產業才會迎來一波理性發展的浪潮。不過，身處寒冬之中的AI從業者，需要認真反思和總結，如何才能在下一波中抓住AI的機會。實際上，國內大模型開發者認為只要有技術有算力有數據就可以上，但忽略了產品的性能與應用場景，沒有適當的應用場景，導致沒辦法落地變現。實際上國內應用層面需求很大，隱藏的數據也很多，但是技術開發層面與應用需求層面市脫節的。

因此，國內AI應在觀念、原理、技術乃至應用層面超越簡單的大模型：

應用層面需要超越大模型的是，數字化轉型過程中對行業小模型、智能體（agent）、RAG（增強搜索）等有著豐富的需求；

技術層面需要超越大模型的是，降低能耗、提升性能，對世界模型、具身智能、非transformer架構等有著強烈的期待，現在的大模型能耗太高，性能也不太穩定，容易出現幻覺；

在方法論層面需要超越的是，不能依賴現有的各種數據，而需要在從各行業各領域去挖掘領域專家的“默會知識”，尋找新的方法強化大模型的推理能力；

在科學原理層面，現在大模型開發中工程技術思維占據主導地位，相應的哲學思考和人文關懷則嚴重不足，導致創新不足，難以實現真正意義上的突破。想要推動大模型的顛覆性創新，需要引入更多人文社科領域的專家，將哲學思考和社會倫理融入技術研發中，才能打造真正具有社會價值和應用潛力的模型。

圖片來源于網絡

本文為“世范區”原創文章，未經授權不得轉載或抄襲。如需轉載，請在文末留言區申請并獲得授權。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.