正文共2517字,預計閱讀時間7分鐘
世范看點
【香港保險不香了】今年上半年,源自內地訪客的新增保費較去年同期下跌6.9%至297億港元;若單從二季度來看,源自內地訪客的新增保費為141億港元,同比減少36.77%。
【個人房貸縮水超3000億】A股上市銀行2024年半年報數據顯示,截至二季度末,六大國有銀行合計個人住房貸款余額25.49萬億元,相比年初凈減少3254.71億元。
【馬云要帶阿里重新出發】阿里整改完畢,馬云在日本表示:相信國家會給阿里提供堅實保障,相信阿里會有更好的未來。據知情人士,馬云本人將于9月回國,重新出任阿里最高管理層職務,帶領阿里人重新出發。
國產大模型要倒掉一大批
最近,中央網信辦公布了最新一批生成式人工智能模型的備案信息。到今年8月,已經有超過200個大模型通過備案。如果加上那些還沒有通過備案的大模型,國產大模型已經超過300個。
這些國產大模型性能怎么樣,能否持續穩定提供服務?目前看來,盡管個大模型在各種評測中都表現出趕超GPT4的水平,但是在實際應用中卻看不到突出效果。一些大模型的下載量雖然超過千萬,但是用戶都是用了幾天就不玩了。這說明,它們實際使用效果尚未達到GPT4、Claude及Gemini的水平。另外一些發布的大模型始終沒有公開使用,一直在內測,估計效果也不怎樣。
不過,對于這些大模型公司來說,產品性能怎么樣還不重要,重要的是,錢快燒沒了,但現在創投業也處于半死不活的狀態,這導致國內AI公司融資很難,雖然去年上馬的時候,一窩蜂地很熱鬧,但現在大家卻感受到寒意,有人甚至說寒冬已經到了。
有人在社交媒體上發布了AI六小虎的動態,只有一家還在擴張:
有“六小虎”,那就還有“大貓”,那就是幾個大廠——百度、騰訊、阿里及華為。這幾個大廠有實力,而且都有自己渠道在一些行業場景中推廣,因此暫時問題不大。
這六小虎中的一號,可能是智譜,他們的大模型產品“智譜清言”其實性能還是很不錯的,在國內屬于第一梯隊,可以和百度、騰訊相抗衡的。
二號可能是百川,其性能也是歸于第一梯隊的,他們發布的新一代基座大模型Baichuan 4的模型能力取得了長足進步,還將搜索技術與大模型深度融合,推出了懂搜索、會提問的AI助手“百小應”,對標國外的perplexity.ai,但整體實力差距還是明顯的。
三號可能是minimax。MiniMax的技術路線全面轉向MoE架構,相比傳統的Dense模型,速度更快,效率更高。現在他們新推出的海螺視頻生成,效果據說不錯,這有可能成為他們熬過寒冬的資本。
四號可能是李開復投資孵化的“零一萬物”。剛開始發布大模型的時候,因為“套殼”什么的,動靜很大,但后來學乖了,沒什么聲響。
五號可能是月之暗面。和零一萬物一樣,曾非常高調,尤其是上半年宣布百萬token上下文,轟動一時,但也沒啥用,創始人迅速套現部分資金,現在也不知何去何從。
六號可能是上海的“階躍星辰”,成立才一年就推出大模型,然后一個月后有宣布和某財經媒體合作,發布了一個財經大模型,畢竟搶占先機很重要,可以迅速拉到投資。
目前,大多數國產大模型都有一個顯著的問題,就是在產品馬馬虎虎可用的情況下,高調宣布,吸引流量但是不能轉換為收入,不過可以拉投資進來。少數表現好的大模型,也不過是可以歸納總結各種文章、報告,寫寫摘要;可以對話聊天;可以回答常識性問題……但是在推理方面普遍不足,而且回答時有幻覺,或者干脆不回答。所以,很多大模型公司把AI當做社交娛樂工具開發,而不是效率工具,作為娛樂工具又太單調,這樣的話,不走進死胡同才怪。
中國的AI大模型正面臨即將到來的寒冬,目前推出的兩三百個國產大模型估計會在2025年倒掉一大批。除了幾個大廠的,以及少數幾個有技術實力的公司,會熬過這個寒冬。比如前面說到的Minimax的海螺視頻生成,無論從美學、運鏡、動作等方面來看,效果都達到世界前列水準,而視頻生成的應用估計會在2025年爆發,因此像Minimax這樣的公司熬過寒冬沒問題。
為什么我們的語言大模型效果不突出,而視頻大模型卻可以后來趕超呢?這個問題的確值得研究。我的看法是,在于訓練的語料上。前面我一直提到過,中文互聯網的數據信息在數量上比較落后,而且很多亂七八糟的東西,再加上中文語法的困難,因此要訓練出一個優秀的大語言模型實在不容易。視頻則好得多,可以利用的視頻資源這些年也積累得夠多,不存在中文英文的問題,只有敢堆算力,就能做出效果來。
用戶用 MiniMax 生成的視頻
就目前發布的視頻生成效果來看,可以滿足一般的社交娛樂、簡單廣告的制作,顯示出一定的應用場景,因此明年視頻生成火爆時,對算力會有很大需求。 生成一條視頻,比生成一兩千字的算力大得多。
熬過寒冬,AI產業才會迎來一波理性發展的浪潮。不過,身處寒冬之中的AI從業者,需要認真反思和總結,如何才能在下一波中抓住AI的機會。實際上,國內大模型開發者認為只要有技術有算力有數據就可以上,但忽略了產品的性能與應用場景,沒有適當的應用場景,導致沒辦法落地變現。實際上國內應用層面需求很大,隱藏的數據也很多,但是技術開發層面與應用需求層面市脫節的。
因此,國內AI應在觀念、原理、技術乃至應用層面超越簡單的大模型:
應用層面需要超越大模型的是,數字化轉型過程中對行業小模型、智能體(agent)、RAG(增強搜索)等有著豐富的需求;
技術層面需要超越大模型的是,降低能耗、提升性能,對世界模型、具身智能、非transformer架構等有著強烈的期待,現在的大模型能耗太高,性能也不太穩定,容易出現幻覺;
在方法論層面需要超越的是,不能依賴現有的各種數據,而需要在從各行業各領域去挖掘領域專家的“默會知識”,尋找新的方法強化大模型的推理能力;
在科學原理層面,現在大模型開發中工程技術思維占據主導地位,相應的哲學思考和人文關懷則嚴重不足,導致創新不足,難以實現真正意義上的突破。想要推動大模型的顛覆性創新,需要引入更多人文社科領域的專家,將哲學思考和社會倫理融入技術研發中,才能打造真正具有社會價值和應用潛力的模型。
圖片來源于網絡
本文為“世范區”原創文章,未經授權不得轉載或抄襲。如需轉載,請在文末留言區申請并獲得授權。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.