網易首頁 > 網易號 > 正文 申請入駐

美團悄悄開源重度推理模型!8個腦子并行思考,有點東西。

0
分享至

大家好,我是袋鼠帝。

2026年剛開年,AI圈子終于開始稍微安靜一點了,不過各家似乎都在憋大招。

前兩天我刷X的時候,發現美團居然悄悄咪咪又開源了一個新模型:LongCat-Flash-Thinking-2601。


不得不說,美團這個更新節奏是真滴卷。

我回憶了下,從去年9月發布Chat版本,到后來的Thinking版本,再到Omni全能版,他們的模型路走得非常穩。

這次的2601版本,更是全面提升了Agent和Thinking能力

不過真正吸引我去深入研究的,其實是 X 上的一條評論:它居然有8位思考者并行推理。


這一下子就勾起了我的好奇心,我們之前用的深度推理模式,大多是單線程的,就像一個人在走路,哪怕走得再快,也就是那一條路。

美團這個設計,像是直接開了一個AI專家團

趁著上周末去北京參加AIGC開發者大會的間隙,我把這個新模型好好研究了一下。

這一試,我發現它還真有點東西。

先給大家總結一下這次新模型更新的核心亮點(省流版):

1.泛化能力極強,在那種混亂的真實環境里表現很穩,在復雜隨機任務中甚至優于Claude。

2.自動構建多個高質量環境;密集依賴關系圖

3.多環境強化學習:擴展的DORA(我們的強化學習基礎設施),支持大規模多環境智能體訓練

4.核心創新叫Heavy Thinking Mode,也就是深度思考模式:

平行思維:通過多個獨立的推理路徑擴展思維廣度

迭代式摘要:通過使用摘要模型來綜合輸出,增強深度,支持迭代推理循環。

在這個模式下,模型會啟動并行思考,相當于你有多個不同領域的大腦在同時幫你琢磨同一件事。

另外,據說1M(100萬)token的上下文版本也快來了。


光看參數也沒意思,咱們直接上實測。

目前,深度推理模式可在LongCat AI平臺免費體驗

https://longcat.chat/

讓美團AI團隊解決問題

以后遇到問題不用焦慮了,可以試試美團這個AI團隊,團隊8人,效率極高,還有第9人是個小領導,總結發言,是個全方位思考的智囊團。



團建聚餐,專治眾口難調

來個美團的拿手好戲,點餐

不過有點刁鉆:

prompt:我們在深圳,有8個同事要聚餐,預算只有300元。小張不吃辣,小李對麩質過敏,小王必須喝冰美式,老板想吃地道的本地菜,剩下的4個人里有人在減肥,有人想吃重口味。請尋找最優性價比方案,并給出具體的點單組合和湊單攻略。

這要是讓人來想,估計頭發都得掉一把。

當時打開深度思考后,嚇我一跳,原來這就是重度思考嗎

屏幕上直接冒出來8條并行的思維鏈!直接多出來8個腦子


有一種從單行道突然變成8車道的開闊感

來看看 LongCat 的 8 位 Thinker 是怎么應對的。


它們分別給出了不同的策略:有的建議分開點外賣,有的推薦了性價比極高的潮汕套餐,還有的另辟蹊徑建議去吃早茶。

這8個大腦并行工作完之后,還會有一個裁判角色的模型出來做總結,把各個方向的精華提煉出來,形成最終的答案。

俗話說三個臭皮匠頂個諸葛亮,美團這是直接給我安排了三個諸葛亮啊。

最后的綜合方案很不錯,模型經過權衡后發現,在深圳 300 塊錢滿足這么多人的堂食需求幾乎是不可能的,所以最優解是點外賣,并且給出了具體的分店鋪湊滿減攻略。


最讓我驚訝的是細節:它甚至提醒我,醬油里可能含有麩質,一定要給商家備注小李的過敏情況。

這種細致程度,單靠一條思維鏈是很容易遺漏的。這也體現了并行思考的優勢:既有廣度,又有深度。

而且速度依然很快,這也是我一直比較喜歡美團模型的一點,干活講究效率


假如明天AGI到來?

前端時間,馬斯克的訪談提到,AGI可能很快就會實現

所以我又問了一個稍微宏大一點的問題:假如明天AGI突然到來,世界會變成什么樣?

這回的思維鏈就像是一場高質量的圓桌論壇,類似上周六我參與分享的圓桌會議

有的Thinker在分析對就業市場的沖擊,有的在預測經濟結構的重組,還有的在探討人類認知的顛覆。


看著這 8 個大腦在屏幕上互搏,非常有意思。

它們各有各的觀點,但最后又能達成某種共識。這和我們人類社會其實很像,真理往往就是在不斷的辯論和碰撞中產生的。



法律智囊團:隨身攜帶的律師天團

這個場景非常實用,假設我不小心在商場碰碎了一個標價8.8萬的藝術品,商場態度強硬要我全額賠償,那不是完犢子了?

我把情況描述給LongCat,讓它做我的辯護律師。

prompt:我在商場行走時,背包不慎剮蹭到了擺放在轉角處的一個藝術品展架,導致一件標價 8.8 萬元的藝術瓷器摔碎。商場方目前態度強硬,拒絕任何調解,要求我按照標價全額賠償。作為被告,我的抗辯點在于:展架位于人流量大的轉角處,且沒有任何物理防護(如玻璃罩);展架底座極輕,明顯不符合擺放易碎重物的安全標準;我只是正常行走,并無跑跳等過激行為。請你作為我的專業辯護律師。

反應速度非常快,幾個 Thinker 迅速從不同角度切入。

有的負責分析商場的過錯,有的提到一些案例參考,還有的側重風險評估和緊急措施。


它給出的一些答案,我怕是幻覺,還特地去核實了以下思維鏈中提到民法典1198條、1165條、1173條,也是正確的。


有點可惜的是重度思考暫時還沒接入聯網搜索,所以這塊大家還是要謹慎,出的條款最好都去印證一下,畢竟思考模型普遍都會有幻覺,有出錯的概率。把它當做輔助律師團即可。

最終回答:


不過對于我們普通人來說,遇到這種突發狀況,能有這么一個智囊團,可以第一時間快速了解一些信息,心里真的會踏實很多。


中西結合的身心健康指導

有一些朋友和我聊起最近莫名不太好入睡,想起來下個月就過年了,

是丙午馬年,丙火和午火雙火疊加,六十年一遇,

部分朋友可能會有水火交戰的情況,明明沒有什么心煩的事情,卻睡不著,趕緊來試試Longcat怎么說。

還有,我從小到大基本上午覺就沒睡著過,可能是過度焦慮的原因?

很好玩的是,居然得到了中西結合的回答,還是那句話,集百家之所長,取其精華,去其糟粕,很好用。

如果是其他大模型,被我引導提問,就只會從中醫的角度回答了。

下面豆包的回答,被我提問之后,只會從中醫角度回答問題:


但 LongCat的 8 個Thinker 里,有的Thinker提供中醫視角,有的提供現代醫學視角,有的提供改善睡眠建議,真的是面面俱到,中西結合,完美!


以下是正文回答,有需要的朋友可以參考一下,也可以點贊轉發,說不定你就有朋友也遇到了。



風格化寫作,絕了

我讓它用最強烈的文學風格描寫一碗螺螄粉,并且讓它自己選擇流派。

prompt:我現在手里端著一碗熱騰騰的、聞起來臭吃起來香的螺螄粉。 我希望看到風格極度強烈的文學描寫。請選擇一個你認為最有趣的文學流派(例如:魯迅的冷峻諷刺、古龍的簡潔蕭殺、王家衛的曖昧破碎、張愛玲的華麗蒼涼等等)。

8 位大作家開始吭哧吭哧寫作。最后的評判環節非常有意思。有 5 位 Thinker 選擇了張愛玲風格,2 位選了古龍,1 位選了王家衛。


按理說,少數服從多數,最后應該是張愛玲風格勝出。因為已經有5位部下都選了張愛玲風格,

畢竟作為領導,最輕松最不用擔責的決策才是最經濟的。

但那個負責總結的裁判模型展現出了驚人的批判性思維,它認為古龍那種簡潔蕭殺的風格,反而更能突出一碗螺螄粉的江湖氣,而且能避免答案的同質化。

最終輸出的古龍風描寫,文筆真的是一絕。


這也讓我突然意識到,這種多模型并行思考加裁判決策的機制,可能真的代表了未來AI決策的一種新方向。


代碼能力

Prompt:幫我設計一個貓貓狗狗掛飾網站的前端,要可愛風,寫在一個HTML文件里

迅速完成了代碼,購物車邏輯、結算功能都寫了,交互體驗也很流暢。

后來我又試著讓它寫一個大魚吃小魚的游戲。

它通過聯網搜索參考了最佳實踐,還自動給游戲里的魚加上了 AI 判定,大魚會追,小魚會跑,可玩性瞬間提升了一個檔次。

為什么美團這個模型值得關注?

美團這次的 Heavy Thinking Mode,本質上是在解決大模型思考深度不足的問題。

以前我們覺得大模型像個百科全書,問啥知道啥,但一遇到需要推理、規劃的復雜問題就容易掉鏈子。

LongCat的思路是:既然一個腦子不夠用,那就用八個。

通過并行推理(Parallel Thinking),先讓思維發散出去,覆蓋盡可能多的可能性;再通過迭代摘要(Iterative Summarization),把這些發散的思維收斂回來,提煉出最優解。

這就像我們在公司開會解決難題,先大家頭腦風暴,各抒己見,這是廣度。然后項目經理把大家的想法匯總、去重、優化,形成方案,這是深度。

而且美團在訓練這個模型的時候,用了大量的合成環境和抗噪聲訓練,這意味著什么?

意味著這個模型不是溫室里的花朵,它是真的被扔到那種充滿了不確定性、信息不完整的真實環境里去摸爬滾打過的。

所以它在面對我們現實生活中那些亂七八糟的任務時,適應性會特別強。

美團雖然在這一波大模型浪潮里起步不算最早的,但他們追趕的速度真的讓人驚訝。

上周末我們幾個博主聊天還在感慨,像 Meta、微軟這些巨頭,有錢有卡,但在大模型上也逐漸沒啥聲音了。

這也側面反映,做大模型這事兒,門檻真的很高,不是誰都能一直在牌桌上的。

美團能堅持下來,并且不斷有這種高質量的產出,說明他們對 AI 是有自己獨立的思考和戰略定力的。

如果你也對AI Agent感興趣,或者在開發相關的應用,可以去試試這個LongCat-Flash-Thinking-2601。

可能會給你帶來一些意想不到的驚喜。

點擊關注下方賬號,你將感受到一個朋克的靈魂,且每篇文章都有驚喜。

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯,隨手點個贊、在看、轉發三連吧~

如果想第一時間收到推送,也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
丈夫落水妻子施救雙雙溺亡!留下兩孩,后續已啟動幫扶

丈夫落水妻子施救雙雙溺亡!留下兩孩,后續已啟動幫扶

南風不及你溫柔
2026-04-23 16:16:23
徐帆回應離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

徐帆回應離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

天天熱點見聞
2026-04-19 08:13:15
美國現在徹底沒希望了,因為已經遇到了,世界上最強大的大國崛起

美國現在徹底沒希望了,因為已經遇到了,世界上最強大的大國崛起

混沌錄
2026-04-23 16:50:14
被扇耳光后續!大家只猜對一半,知情人曝光保安身份,竟有黑歷史

被扇耳光后續!大家只猜對一半,知情人曝光保安身份,竟有黑歷史

西莫的藝術宮殿
2026-04-23 13:24:14
“東鵬0糖特飲”是商標,客服:商標注冊為品牌保護,原罐裝0糖特飲已暫停售賣

“東鵬0糖特飲”是商標,客服:商標注冊為品牌保護,原罐裝0糖特飲已暫停售賣

界面新聞
2026-04-22 21:43:04
海昏侯簡牘的價值,為什么遠高于他墓中的巨量黃金

海昏侯簡牘的價值,為什么遠高于他墓中的巨量黃金

澎湃新聞
2026-04-21 08:08:40
以彼之道,還施彼身:當“封鎖”遭遇“封鎖”,伊朗更受不了

以彼之道,還施彼身:當“封鎖”遭遇“封鎖”,伊朗更受不了

高博新視野
2026-04-22 08:00:21
吃相難看!段睿深夜發訃告僅4天,不對勁的一幕出現,蔡磊太可憐

吃相難看!段睿深夜發訃告僅4天,不對勁的一幕出現,蔡磊太可憐

風月得自難尋
2026-04-23 04:41:06
鴻蒙智行發布會被質疑出意外,僅尚界新車最后停留在舞臺上沒有移動,“尚界Z7 趴窩”沖上熱搜,工作人員:請大家不要過度解讀傳播

鴻蒙智行發布會被質疑出意外,僅尚界新車最后停留在舞臺上沒有移動,“尚界Z7 趴窩”沖上熱搜,工作人員:請大家不要過度解讀傳播

魯中晨報
2026-04-23 07:04:04
我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
郭冬臨現狀:住北京老房子,身形消瘦、臉頰凹陷,59歲無兒無女

郭冬臨現狀:住北京老房子,身形消瘦、臉頰凹陷,59歲無兒無女

娛說瑜悅
2026-04-23 16:04:39
金融圈突發!涉嫌嚴重違紀違法,張文被查

金融圈突發!涉嫌嚴重違紀違法,張文被查

中國基金報
2026-04-23 12:23:24
涉破壞耕地、非法開采等,兩部門通報違法違規典型問題

涉破壞耕地、非法開采等,兩部門通報違法違規典型問題

界面新聞
2026-04-23 11:19:04
中方不伺候了!對荷光刻機優待全部取消,450億芯片不做了!

中方不伺候了!對荷光刻機優待全部取消,450億芯片不做了!

混沌錄
2026-04-22 16:08:10
姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

千秋文化
2026-04-20 19:48:09
軟件開發最后的一塊兒陣地,被AI攻克了......

軟件開發最后的一塊兒陣地,被AI攻克了......

碼農翻身
2026-04-23 08:59:23
北青:馬寧將以四官身份執法亞冠精英賽決賽,主裁坦塔舍夫

北青:馬寧將以四官身份執法亞冠精英賽決賽,主裁坦塔舍夫

懂球帝
2026-04-23 18:46:34
9級大地震前的一幕再次上演,毀天滅地的海嘯或于本周席卷日本

9級大地震前的一幕再次上演,毀天滅地的海嘯或于本周席卷日本

霽寒飄雪
2026-04-23 11:46:45
CBA最新消息!曝浙江廣廈裁掉威廉姆斯,廣東宏遠換掉爭議外援

CBA最新消息!曝浙江廣廈裁掉威廉姆斯,廣東宏遠換掉爭議外援

體壇瞎白話
2026-04-23 18:19:13
伊朗革命衛隊瘋狂攻擊通過霍爾木茲海峽的集裝箱貨船

伊朗革命衛隊瘋狂攻擊通過霍爾木茲海峽的集裝箱貨船

一種觀點
2026-04-22 19:28:19
2026-04-23 22:48:49
袋鼠帝 incentive-icons
袋鼠帝
持續分享AI實踐干貨,走超級個體崛起之路
72文章數 71關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

媒體:莫氏雞煲陷入怪圈 在流量裹挾下真實反饋沒人聽

頭條要聞

媒體:莫氏雞煲陷入怪圈 在流量裹挾下真實反饋沒人聽

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

房產
健康
游戲
教育
家居

房產要聞

三亞安居房,突然官宣!

干細胞如何讓燒燙傷皮膚"再生"?

《極限競速:地平線5》PS5版銷量已超500萬

教育要聞

四七九師資領銜、清北名師超20人!這個新校區,到底什么來頭?

家居要聞

浪漫協奏 法式風格

無障礙瀏覽 進入關懷版