作者 | 山竹
出品 | 鋅產業
就在昨天,又有兩個產品在國產AI圈刷屏。
一個是大廠阿里的QwQ-32B,另一個是“黑馬”Monica的Manus。
前者是性能打滿的開源推理模型,后者被官方稱為“首個通用AI Agent”。
二者共同之處在于,在昨天的傳播發酵過程中均對標DeepSeek,被稱為國產AI之光,尤其是后者,頂著“全球首個通用AI Agent”的頭銜,產品內測碼一度被炒到5萬一個。
我是在仔細翻看了官方演示視頻和一些媒體評測視頻后發現,Manus其實和去年年底Anthropic演示的computer use、智譜AI演示的AutoGLM原理上有幾分神似。
而這個被炒得沸沸揚揚的Manus,更像是大家對AI Agent的一場狂想,一個期望,一個知其必然,卻又在苦苦等待中的一絲光亮。
不過,要正視的是,Manus的產品力,在這次萬眾“造神”的運動中被放大了不少,就像今年CES上的Mirumi陪伴機器人一樣。
01 Manus不是DeepSeek
2025年春節期間,DeepSeek的橫空出世掀翻了大佬們的大模型牌桌。
從后來的產業變化來看,DeepSeek帶來了兩方面影響:
第一,DeepSeek對算力需求的下降,讓苦于GPU的國內大模型市場迎來了一波國產算力曙光。
國產芯片連夜適配DeepSeek成了這幾個月的常態,甚至不少國內芯片大廠、明星企業都沒能過一個安穩的春節,集體回公司加班適配DeepSeek。
與此同時,DeepSeek先是讓英偉達股價受挫,后又讓英偉達能夠賣到國內市場、算力大打折扣的H20(H20八卡服務器算力僅為H100的15%)芯片需求大增。
第二,性能對標OpenAI o1的DeepSeek R1,帶動了一波大模型開源熱潮。
在此之前,開源大模型在于閉源大模型路線之爭上并不占優勢是因為,開源大模型的性能往往與閉源大模型有著代際的差距。
這次,DeepSeek R1性能直接對標OpenAI o1,連這么能打的DeepSeek R1都全面開源了,那些矜持的大模型廠商,也就沒有了不開源的理由。
就連一貫奉行大模型閉源的百度,也在前不久選擇了開源。
而之所以能對人工智能產業帶來這樣巨大的震動,從技術層面來看,是因為DeepSeek R1在算法層面采用的混合專家模型架構(MoE)和改進的多頭潛在注意力機制(MLA),將顯存占用降到了主流大模型的10%左右,采用群組策略優化(GRPO)又進一步降低了數據標注成本,甚至強化學習也因此翻紅。
從大模型發展進程來看,信奉Scaling Law的OpenAI卡在GPT-5發布的節點上,遲遲未能再進一步,OpenAI前首席科學家Ilya Sutskever在2024年年底的NeurIPS大會上更是直言,規模法則已觸頂,大模型預訓練時代將結束。
李國杰院士在近日公開發表的文章中則指出,“DeepSeek的問世標志著人工智能訓練模式從‘大力出奇跡’的外延式發展階段,轉向集約化系統優化的內涵式發展階段。”
這是DeepSeek給我們帶來變化,堪稱一個歷史的轉折點。
再看昨天Monica發布的Manus,其實,某種意義上而言,可以說是DeepSeek的延續。
現在媒體上一個流行的說法是,DeepSeek是“建議者”,Manus是“執行者”。
這個說法我是認同的。
從Manus的官方演示視頻來看,它可以扮演HR的角色,為你篩選候選人的簡歷,你只需要上傳包含簡歷的壓縮文件,它就可以「解壓文件——打開文檔、逐頁閱讀——形成報告」,最終以報告的形式呈現在你眼前。
它也可以扮演股票經理的角色,為你形成股票對比報告,你只需要告訴它你要分析的股票,它就可以「通過API調用訪問股票數據——編寫量化分析和可視化呈現代碼——形成可視化分析報告——根據進一步指令創建網站頁面」。
我們可以看到,在這個過程中,Manus首先仍然是一個“建議者”,它會分析文本、對比數據,也會形成觀點,甚至報告。
不過,與DeepSeek不同的是,Manus可以執行諸如生成圖片、創建網頁、生成網站這樣的“動作”。
這樣來看,Manus確實是一個“執行者”。
不過,Manus并沒有如DeepSeek一樣用技術創造力來改變大模型的產業走向和格局。
02 我們都在期待AI Agent
就過往的大模型進化來看,多模態大模型已經具備文本、圖像、代碼三大生成式AI能力。
正因如此,在2024年,我們看到了多模態大模型的涌現,看到了文本、圖像、代碼已經成為通用基礎大模型的三大標配能力,我們甚至看到了Sora、Vidu這樣的視頻生成模型的涌現。
在大模型具備了這些基礎能力后,這才有了2024年年底Claude 3.5 Sonnet引入的computer use能力,智譜AI的AutoGLM的手機“自動駕駛”能力。
就手機自動駕駛而言,在2024年,榮耀前任CEO趙明就曾在周鴻祎直播間演示過“一句話點咖啡”的能力。
在那次演示中,趙明對著手機(的智能語音助手)說“點三杯美式咖啡”,手機就會自動完成「打開APP-搜索-下單」步驟,趙明只需要在手機上點擊確認下單就能完成整個操作過程。
這樣的大模型能力被榮耀集成到了2024年10月發布的MagicOS 9.0系統中,趙明發布會上豪言稱,“手機駛入了‘自動駕駛’時代。”
這樣的手機“自動駕駛”能力在隨后很快成了AI手機的標配,并在今年的CES和MWC上為眾人熟知。
看過手機“自動駕駛”能力演示的朋友,不難發現,Manus展現出的數據分析、模型應用、API調用能力與這類computer use、手機自動駕駛有著諸多相似之處。
在Manus官方演示視頻中,Manus任務執行邏輯也是在重復執行三個動作:思考中、使用終端、編輯文件,這樣擬人的動作,像computer use一樣完成了一個程序員的編程工作。
并將這樣的工作流以可視化界面展現了出來。
我更相信,Manus這樣由一個優秀的軟件開發團隊開發出的AI Agent,是真正擁有產品化能力的AI Agent涌現之前的一個中間形態。
就像computer use和手機自動駕駛一樣。
我也相信,2025年一定會有各種各樣讓人意想不到的AI Agent出現,這些AI Agent很可能會改變一代人的專業技能和生活方式。
這樣的改變,讓我們既惶恐,又期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.