![]()
“訓練全程由國產算力集群完成,動用5-6萬張算力卡。”
作者:蘇打
編輯:tuya
出品:財經涂鴉
公司情報專家《財經涂鴉》獲悉,4月24日,DeepSeek宣布全新系列模型 DeepSeek-V4的預覽版本正式上線并同步開源,引發廣泛關注。該版本擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。
當天,有消息稱美團新一代基礎大模型LongCat-2.0-Preview亦已開放測試,該模型總參數規模突破萬億,量級躋身全球頂尖大模型行列。
據知情人士透露,DeepSeek同日發布的新一代V4大模型,總參數量和激活參數量與美團LongCat-2.0-Preview基本一致。
總參數量決定了大模型的知識容量上限及存儲成本。據悉,LongCat-2.0-Preview和DeepSeek V4,均支持1M上下文窗口,可在單次推理中處理數百萬字的輸入,其處理量級等同于新發布的GPT-5.5。
此外,新的LongCat模型還面向Agent應用場景進行了深度優化,可有效適配代碼生成、復雜任務規劃、企業自動化等生產場景。
除參數規模外,美團新一代基礎大模型的更大突破在于,其訓練推理全程依托國產算力集群完成。
據上述人士透露,美團本次訓練階段動用的算力卡數量在5萬至6萬之間,這也是迄今為止,在國產算力上完成的規模最大的大模型訓練任務。“這不僅是對國產算力生態成熟度的一次有效驗證,也標志著國產自主算力上邁出了關鍵一步。”該人士表示。
一年多前,美團CEO王興曾表示:“在AI領域,美團唯一的策略是進攻”。在近期的財報電話會上,他強調,要"爭取把美團App率先升級成為AI-Powered App"。
公開報道顯示,美團是中國不包含云業務的公司中,在AI領域投入規模最大的企業。去年以來,美團先后發布了多款AI應用和自研大模型。
除自研外,美團還先后投資了摩爾線程、沐曦股份、紫光展銳、愛芯元智等多家算力及半導體公司,以及智譜AI、月之暗面等領先的大模型企業。
24日下午,美團已開放新模型測試,用戶可通過其官網longcat.ai申請領取免費測試名額。
官網介紹顯示,測試期間,LongCat-2.0-Preview每天會給用戶提供1000萬免費Token的額度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.