淺友們好~我是史中,我的日常生活是開撩五湖四海的科技大牛,我會嘗試用各種姿勢,把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友,不妨加微信(shizhongmax)。
納米 AI:紅衣大叔的新戰刀
文|史中
(零)紅衣大叔又抽出了 40 米大刀
最近半年,我聽到“AI”這個詞,感覺越來越憤怒。
點開頭條公眾號:某 28 歲 AI 大神被挖走,年薪上億;某廠搞出最新模型,股票長虹。
點開抖音小紅書:各路天才選手用 AI 生成的視頻段子像泥石流一樣往臉上呼。
點開得到小宇宙:一眾大佬說不會 Vibe Coding 就等于文盲+殘廢。
點開微信釘釘:發現我自己的活兒竟不會用 AI 干一點兒。。。
關掉手機屏幕,映出一張不知所措的臉。
AI 已來,只是分布不均。 這種不均,是我和馬斯克的總資產有 3000 億美元的那種不均。
我猜你和我一樣,心里隱隱覺得不公平,但轉念一想又天經地義:畢竟 AI 這么難,人家玩得轉,活該賺大錢。
但這,正是房間里的大象!
如果一個時代的門檻比《只狼》還高一百倍,高到只有極少數天才壟斷創新,并且心安理得地拿走絕大多數時代紅利,這叫什么偉大的時代?
面對高聳的門檻,產品創業者眼前只剩兩條路:
第一,抽身觀望,泡沫破裂時別血濺了我愛馬仕的長衫;
第二,躬身入局,抽出 40 米大刀,沖到 AI 的門檻前面一頓狂砍,解救被時代圍困的普通人。
周鴻祎選擇后者,一點兒都不意外。
遙想紅衣大叔第一次抽出 40 米大刀,還是在十幾年前。當時普通人買不起殺毒軟件,也看不懂專業界面,360 就是用“免費+傻瓜”的大刀砍掉了網絡安全的門檻,結束了人人(被迫)與毒共舞的時代。
而這一次,他的大刀叫:納米 AI。
最近,紅衣大叔幾乎每周都做一場直播,就是在給你我這樣的普通人手殘黨安利納米 AI。
你也許看過直播,但沒注意在畫面另一端還有個“藍衣大叔”,他不是來給直播間配色的,而是納米 AI 的產品負責人,也是我們今天故事的主講人:梁志輝。
“人不能開引擎,人只能開汽車!”梁志輝的吐槽開門見山。
在他看來,各種大模型就像引擎:
引擎性能再好、再便宜,你也不會買回家自己攢汽車吧? 專業人士在發動機周圍做一整套傳動系統,做好底盤車架,再包一層帥氣的鐵皮,經過 10086 個步驟做成量產車,才能真正讓這個技術走進千家萬戶,定義一個時代。
納米 AI 的目標就是:做出一輛開起來最簡單的車。
簡單到啥地步呢?
“你會在微信群里口噴嗎?將來只要一個人會用微信,就能調動一群 AI 幫你完成復雜任務!”梁志輝說。
我懷疑他在內涵某些老板。但講真,如果有朝一日每個牛馬都能翻身當老板,對“賽博牛馬”呼來喝去就把班兒給上了,這畫面還真挺誘人呢!
要理解納米 AI 具體如何實現“口噴即干活”,咱得先科普一下當今 AI 的“最強組織模式”:
“大模型”,就像一個眼神清澈的賽博畢業生; 教會它特定的技能,再塞給它一些工具,它的眼神就沒那么清澈了,成了一只賽博蜜蜂,也叫“智能體”。 面對復雜任務,需要好多個智能體協作,它們組成的業務部門就叫“蜂群”。
話說,納米 AI 的師傅們,最近半年做了很多智能體和蜂群,例如:說一句話就有一群 AI 幫你生成大電影;說一句話就有一群 AI 給你生成專業的調研報告。
但在我看來,納米 AI 提供的最鋒利的想象力,不在某個智能體或蜂群,而是“想要啥智能體就能有啥智能體的能力”!
沒錯,它們還做了一個“360 智能體工廠”。你口噴就能創造智能體,還能口噴把一堆智能體變成蜂群!
說到這里,圖窮匕見:納米 AI 正在揮舞的大刀,不只是在砍AI 使用的門檻,同時也在砍AI 生產的門檻。
梁志輝算了下,這半年來,官方團隊拼死拼活才做出了 200 多個智能體,而在智能體工廠里,普通用戶做出的智能體/蜂群已經超過了恐怖的 10 萬個。
理解了這些,你或許能體會我的激動:一個*普通人*可以玩懂 AI,并且享受 AI 紅利的恢宏時代正在緩緩降臨。
而如今的一切,都源自一顆小小的種子。
梁志輝
(一)搜索:蜂群里的一只蜜蜂
2023 年春天,ChatGPT 爆火,那是本輪人工智能開始邪門的起點。
評論家首先為之瘋狂,他們高呼:“模型即產品”的時代到了!
但曾經手造了幾個億級 DAU 的梁志輝和同事們一起試過 ChatGPT 后,有種“有句話不知當講不當講”的感覺。
先不說激發模型的能力需要極其精準而冗長的提示詞,就單說一個問題,靠模型自己就無法解決,那就是——幻覺。
深度學習之父辛頓認為:幻覺是智能的副產品。注意,是智能的副產品,而非僅僅是“人工智能”的副產品。(參考)
模型的本質是對世界的“有損壓縮”(),它在還原世界的時候,就必然會經歷反向“生成”的步驟,所以它們本質上全是幻覺。
大眾意義上的“幻覺”,只是恰好生成內容和現實中的強證據存在邏輯矛盾而已。
那么,怎么讓模型生成的內容和現實世界盡量不矛盾呢?
AI 您動動發財的小手,自己搜一下再說不就行啦?!
看到了嗎?搜索,是大模型進化成智能體的路上擎起的第一個工具,它無異于原始人的火炬。
實際上,英雄所見略同。 就在老師傅技術驗證的過程中,主打搜索的 AI 產品 Perplexity 竄紅,梁志輝他們直拍大腿,決定火速研發!
你可能覺得,“讓模型查搜索引擎”應該三五個人七八條槍就能搞定。
錯!作為智能體家族老大哥,搜索智能體的難度在于“開模”——定義出模型使用工具的*基本范式*。
一個模型使用工具好不好,效率如何,標定了智能體的能力基線,直接影響后來“蜂群”的工作效果!
回到當下,老師傅其實沒想這么深遠,他們無畏地上路了。。。
剛出發就直接進坑了。
當時的 360 搜索引擎,是給人用的,不是給 AI 用的。
啥區別呢?很多,這里我挑一個最本質的說下:
人在查看網頁時,大腦會根據排版、字號、顏色等等多個模態進行“權重判斷”,也就是哪些話要重點看,重點想,哪些話要略過。 所以,給人用的搜索引擎只要把網頁合理排序展示出來就行,信息冗余點兒不礙事。 AI 在查看網頁時,只能依靠文字本身的內容來判斷權重。 所以搜索引擎給到 AI 的內容,必須盡量去掉無關的文字,最好再對網頁的內容進行一次總結抽象。信息越精煉越好。
這么說吧,一個 AI 搜索功能,直接把搜索引擎團隊的師傅給拉下水了。。。
2023 年冬天,梁志輝寫了一個規劃書,建議把搜索團隊和 AI 團隊進行架構合并,老周全力支持,眼神殷切,搜索引擎團隊瑟瑟發抖。
而后幾個月,搜索引擎團隊把底層索引機制全部拆開,挨個升級。新的引擎能夠對每一個網頁的語義都進行向量計算,它給出的信息,不僅和用戶的真實意圖更對應,還更簡短。
2024 年 1 月,360 AI 搜索,也就是納米 AI 的前身正式上線。
在 2024 年 10 月的榜單上,360 AI 搜索全球排名超過了 Perplexity。
如果說如今的納米 AI 是一個蜂群,那么“AI 搜索”就是其中的一只蜜蜂,而且是只相當能打的蜜蜂。
多說一句,現在 AI 界的師傅已有共識:AI 產品要想好,三大支柱少不了——搜索、瀏覽器、編碼能力。
在當時“搜索到底重不重要”還沒定論的情況下,這群人就已經沖著一根支柱跌跌撞撞走去了。這可以說是一種幸運,但更是一種嗅覺。
正因做搜索,老師傅無意間走上了一條超長的雪坡。
故事是這樣的:
隨著納米 AI 逐漸火爆,很多用戶開始上強度,拿各種偏門、專業的題目來“刁難”它。
難題一多,老師傅很快注意到一個問題:大模型使用搜索引擎查詢到的東西,有時會相互矛盾。
于是,“搜索小蜜蜂”就不能傻傻地直出答案,而要在生成答案之前多加一道工序:選邊站。
選過邊的小伙伴都知道,站隊是個很耗費腦力的工作,它必須得做很多判斷,例如:哪個信源更權威?哪個說法更自圓其說?哪個說法和上下文能印證?
而在選邊站之前,起碼還得有一道工序:感知查詢到的資料里是不是存在矛盾。
是不是感覺事情變復雜了?
敲黑板!這里我們要引入一個重要的概念:任務復雜度。
任務越復雜,“搜索小蜜蜂”查到矛盾信息的可能性就會增加,也就更需要更多*工序*去做感知、驗證、深入調查,保證最終結果質量。
于是,一個水靈靈的問題擺在老師傅面前:
怎么才能正確地計劃所有工序,穩定地執行多道工序呢?
這句云淡風輕的追問,召喚著一場洶涌的技術突破。。。
(二)腦海里的“小窗地圖”
一個任務復雜不復雜,咱們基本能靠直覺判斷。
你問:周鴻祎是男是女?這是個簡單的任務。 你問:根據 2025 年美國各個行業對中國稀土的依賴程度,判斷一下它對于中國芯片卡脖子的政策未來會有什么變化。這就是個復雜的任務。
但做工程不能靠直覺,必須追問到底:究竟是什么因素決定了任務的復雜度?
跟我一起想象:
一個像血管支脈一樣的迷宮,大模型從原點出發,每一步都要在諸多岔路中選擇一條,最終的目標就是找到出口。 每一步面對的支脈越多,就越難選對正確的岔路,這對應著橫坐標:“任務的開放性”。 從起點到出口經歷的步數越多,走出迷宮就越難,這對應著縱坐標:“任務的步驟數”。
橫縱坐標一乘,面積越大,任務的復雜度就越高。
但是!以上只是站在“全知視角”的示意圖。
大模型在執行某個具體工序的過程中,是不知道任務總體有多復雜的。
玩游戲的同學很容易理解這個比喻:
大模型周圍存在一個“戰爭迷霧”,它只能處理眼前的岔路,不知道自己出發了多久,也不知道出口在多遠的未來。(其實人生也是如此。)
這會導致一個嚴重的問題——迷路。(用文藝的話說就是:走得太遠,AI 會忘記自己為什么出發。)
所以,為了讓復雜的工序得以一步步正確推進,大模型必須在視野角落建立一個“小窗地圖”,每時每刻都提醒自己從哪來到哪去,總體任務是什么,現在進行到第幾步。
這個“小窗地圖”,就叫“規劃”。
正所謂:“凡事預則立,不預則廢”嘛!
說回 2024 年,納米 AI 老師傅評估了一下市面上大模型的規劃能力,結論是:不太行。
問題很棘手:一邊是廣大人民群眾讓納米 AI 解決復雜問題的殷切希望,一邊是 AI 無法自主規劃復雜任務的廢柴現狀。
老師傅冥思苦想,找到一條“妥協路線”:誰說規劃必須自己做?也可以遵循套路嘛!
你大概做過旅游計劃。
如果你擅長,就根據實際情況親自定計劃,肯定玩得又盡興,花錢又少; 如果你不擅長,就報一個旅行團,跟著別人規劃的標準路線走,也可以嘛!
梁志輝他們絞盡腦汁,把需求分門別類,手搓了好多“工作流”,例如:有幫你做研究報告的,有幫你寫小紅書文案的,有幫你做旅游攻略的。。。
工作流的每一個步驟上,都掛載具體的思考方式,再配好相應的工具。
本質上,相當于這個任務的全貌(也就是復雜度)已經被人為規定了,大模型只負責在流水線上一步一步執行下去就行了。
就像醬↓↓↓
然而,這樣做代價是巨大的:
梁志輝回憶,當時遇到復雜一點的工作流,整個團隊要寫兩三個月的代碼。
在賽博空間里,筑起一堆極其復雜的“腳手架”。
每個腳手架都被螺絲擰死,大模型在通道里面按部就班地推理,跟八股文一樣沒有自由發揮的空間,用戶稍微提出非分要求,AI 就選擇狗帶。
現在回望,2024 年冬天,是納米 AI 最幽暗的一段時光。
老師傅每天都在尋找各種新的細分需求,然后從頭到尾一遍遍焊接工作流的腳手架,到最后真是焊不動了呀。。。
就在最痛苦的時候,他們看到了援軍的煙塵。
(三)“四自遞遞”與“三只小豬”
2025 年春天,DeepSeek 橫空出世。
普通用戶只是看到它回答問題前會自己“窮嘟囔”,可梁志輝他們看到的是:模型的自主規劃能力終于上了一個大臺階。
沒過幾天,Manus 又刷屏了。看到這里你會明白,Manus 正是利用了模型剛進化出的自主規劃能力,再配上各種工具而形成的一個智能體。
今天看來,以 DeepSeek 和 Manus 為代表的產品奠定了一個 AI 蜜蜂的“工作范式”。
我愿稱之為“四自遞遞”:
1、干活之前先自主制定規劃; 2、干的過程中自主決定使用什么工具; 3、自主發現工作中的矛盾和瑕疵; 4、自主判斷什么時候該結束思考。 5、從原始信息開始,把每一次思考的結果不斷填入模型的上下文迭代思考,傳遞再傳遞,最終得出答案。
卸掉腳手架,真是一身輕松↓↓↓
雖然蜜蜂在“戰爭迷霧”里行進,但因為有清晰的規劃,每一步有清晰的反思,還是能找到比較好的答案。
不過,梁志輝他們嘗試之后發現個問題:當時主流的國產模型在迭代次數方面是短板,最多思考 20 步。超過之后 AI 的“思想負擔”就迅速變重。
換句話說:那個“小窗”太小,裝不下大地圖。。。
于是納米師傅決定:博采眾長,成一家之言。
他們找來幾個在迭代任務上表現出色的國際模型,對自家的智腦模型進行強化蒸餾。
效果拔群!做出的模型竟然能迭代 99 步左右仍然不犯迷糊。
不知你發現了沒,一開始我還在講“搜索”,后來我悄悄把這個詞換成了“任務”。
沒錯,你如果能讓一個智能體“如如不動”迭代 99 步,它就不只能做搜索,而是能完成更豐富的創作任務了。
你可以如此理解:搜索只是任務的一種,搜索智能體也只是任務智能體的一個子集。
納米 AI 不知不覺從“搜索智能體”進化成了“創作引擎”。
意識到這一點,老師傅仿佛中了一道閃電,這幸福的閃電告訴他們的,他們也準備告訴每一個人。
他們決定,讓納米 AI 秀一下肌肉,完成一個復雜任務。
“咱們就用一句話做一個電影,講《三只小豬》的故事,如何?”團隊有人提議。
這個任務很有深意,咱們簡單拆解一下,從一句指令到最終成片大概需要五步:
1、從關鍵詞出發,查詢《三只小豬》的故事梗概; 2、寫出《三只小豬》的腳本; 3、根據腳本畫分鏡; 4、根據分鏡圖片輸出各段動態視頻; 5、把鏡頭拼接在一起,加上包裝做出成片。
以下就是納米 AI 完成任務全部流程↓↓↓
這個任務的起點極低:甚至不需要完成九年義務教育的人都能給出完整指令:
這個任務的終點極高:要知道一個人類團隊從編寫劇本、畫分鏡,到草稿到繪制完成至少需要 10 人天的勞動。
這么大的高度差,其實都是這只“賽博蜜蜂”靠自己規劃,又靠自己一步步徒手攀巖上去的。
“四自遞遞”的范式,就是這么兇猛。
納米 AI 發布會上,紅衣大叔展示《三只小豬》作品,是我路轉粉的時刻。現在回顧,很多新用戶注意到納米 AI,也都是從《三只小豬》開始。
下面就是成片,你感受一下↓↓↓
AI 怕出名豬怕壯,舞臺之上納米 AI 爆火,舞臺后面的梁志輝團隊卻被架在了燒烤架上。
他們發現,依靠現有的技術,無論換什么姿勢,都沒辦法讓一個“賽博蜜蜂”思考超過 100 步。但用戶才不管這些,他們瘋狂給納米 AI 發來復雜度超越 100 步的任務,而且“變態需求”的比例還在迅速攀升。
老師傅像被霸總逼到墻角,這個變態的客,不接也得接。
他們胡思亂想:既然一只蜜蜂不夠用,咱要不,養一群蜜蜂試試?
但很快又被自己的想法嚇到了,要讓一堆智能體組成“蜂群”,難度并不亞于管理一群真人,需要哪些工程框架?模型能不能支撐?一切都無法預料。
前面是漆黑一片的深淵,看看左右的友商,有人往下探探腳,有人對深淵喊一喊,就是沒人敢縱身一躍。
梁志輝決定:你們不跳,我跳!
這是一些用戶的問題和任務。
(四)蜂群之戰
人類的公司,其實是蜂群現成的仿生學教材。
老師傅從中學到的重要一課就是:層級。
他們為蜂群設計了三層架構:
最高層,是“蜜蜂 CEO”,它負責把人類這個董事長布置的任務做規劃,拆解成不同的子任務。 中層,是“蜜蜂經理”,它負責認領一個子任務,立下軍令狀,保證給 CEO 交付滿意的結果。 下層,是“蜜蜂牛馬”,也就是之前咱們說的智能體,宏觀戰略不用它思考,有意見保留,它只負責想辦法把分配到手里的任務完成好!
這個班味兒十足的架構,怎么說呢,是真?有效率。。。
它的效率來自于兩方面:合+分。
所謂合,就像會議室。
有些任務沒辦法拆分,例如之前提到的《三只小豬》視頻任務,先要查詢故事,才能擴寫故事,才能生成分鏡,每一步都依賴前一步,沒辦法“跳步”。
老師傅索性搞了個“智能體協作空間”。它就像一個大會議室,任務就擺會議桌上,賽博經理指揮一圈蜜蜂你一下我一下進行操作,封閉開發,效率自然大大提升。
所謂分,就像格子間。
有些任務是可以拆分的,例如《三只小豬》任務的分鏡生成后,下面就是依據每一個分鏡來生成視頻。
但每一段視頻之間其實是(相對)獨立的。賽博經理把它分配給多只蜜蜂,拿回工位分頭干,不就相當于并行處理了嗎?
這樣一來,整體任務完成的時間會大大縮短。
現在,所有的壓力都給到這個 CEO。。。
面對一個具體的復雜任務,究竟要以怎樣的方式對手下的蜜蜂排列組合呢?
這里,一個終極命題出現了:
由于蜂群總體的可能性是每個蜜蜂面對的可能性的乘積,算下來復雜度已經是天文數字,幾乎沒有 AI 能夠短時間內找到最優路徑。
就像“一個人應該如何過好一生”這種天問,本質上已經是一個偏好問題,不存在標準答案了。
面對極端復雜問題,如果放手交給 AI 自主規劃,有時結果不遂用戶的偏好;如果完全規定套路,又難以適配各種變化,
思來想去,他們來了個“兩頭堵”:
既可以通過“連線”的方式規范協作流程;也可以通過“拉群”的方式讓 AI 自己決定協作流程。
比如,“一句話生成大片”是個很多人都用得到的功能,老師傅嘗試了很多種套路之后掌握了一套“最佳實踐”,索性就把這種組合方式用連線的方式固化下來,開放給用戶直接去用↓↓↓
比如,你想讓 AI 根據你自己具體的情況提供一些面試建議,就可以拉幾個你信任的智能體進群,直接下命令,讓它們現場研究現場寫報告↓↓↓
梁志輝告訴我,把這么多智能體在一起,先不說連線還是拉群,首先面臨的難題其實是:“成功率”。
你可能玩過那個“傳水”的團建游戲。人蒙眼站成一排,把自己桶里的水倒給下一個人。這中間,每個人都會撒出一些水,到最后就所剩無幾。
而且但凡有一個豬隊友,把水全撒到外面,整個 Mission 就 Failed 了。。。
簡單的數學:如果一個任務需要 100 步,每一步的成功率是 90%,那么最后的成功率就是 0.91??≈0.002656%。
反過來算,如果需要一個任務最終成功率是 98%,那么每一步的失敗率就要低到萬分之二(0.02%)。
這是極為變態的要求。
老師傅嘗試了很多方法,連打帶罵調教這些賽博蜜蜂,效果都不太好。最后他們發現,答案就在燈火闌珊處:“知人善任”。
不同模型適合不同蜜蜂的體質,他們索性接入了全中國 16 家主流模型,給每個模型安排最合適的角色,如果失敗率還是壓達不到萬分之二,就讓模型廠商去改模型。。。
“其實模型廠商很愿意去改模型,一來我們是大客戶,二來我們提供的都是真實用戶需求,這對模型進化來說是非常珍貴的。”梁志輝說。
就這樣折騰幾個月,成功率真的穩定在了 98%,蜂群舞起來了!!
說到這,你心里可能會升起一個大疑問:光成功管啥用,干出來的活兒到底好不好啊?
這。。。是另一個神坑。
(五)創作非兒戲
同樣是你,給你一個鏟子和給你一個挖掘機,干活兒的效果是不一樣的。
每個蜜蜂干活的質量,也極為依賴于它手中的“工具”。
幸虧,從最早做搜索智能體時對搜索引擎進行深度改造開始,老師傅一直在積累經驗。
所以此時,他們的目標很明確:蜂群之中每一只蜜蜂都要能根據具體任務選擇正確的工具,每一個工具都要像之前那個 AI 搜索引擎一樣強大而穩定。
話說,都有啥工具呢?
比如,從分鏡到視頻要用到“圖生視頻工具”; 生成一個新聞播報員要用到“數字人工具”; 讓人物說話要用“聲音對口型工具”; 視頻剪輯包裝要用到“剪輯工具”; 還有更基礎的搜索引擎工具、地圖工具等等。。。
目前業界已經形成標準,這些工具都通過一個叫做 MCP 的協議被大模型使用,所以也叫 MCP 工具。
“今天市面上大概有 16000 個 MCP 工具,可是絕大部分都是玩具。”
梁志輝毫不客氣。
舉一個實際的例子:我有一款 A 相機,現在想拍人像,想知道哪款鏡頭比較好。這時,蜂群中有一只蜜蜂會去查詢小紅書上大家怎么說,它就必須用到——小紅書內容抓取工具。
這事兒如果讓人來做,真的不難。
打開小紅書,搜關鍵詞,掃一眼屏幕,就能知道這個帖子的內容,有多少人點贊轉發,評論區在討論啥,信息就抓到了呀。
但這事兒給 AI 來做,可是要跨越千山萬水。
AI 必須得有一個電腦用來跑瀏覽器吧? AI 要想查詢小紅書,得有個賬號登錄吧? AI 要想理解一段視頻在說啥,得有圖像理解能力吧?得會語音轉文字吧? AI 得理解頁面布局,知道點贊、轉發、評論都在哪吧?
以上每一步,但凡走不通就拿不回來信息。但凡沒理解準,拿回來的信息就是錯的。如此,其他小蜜蜂干得再勤奮,也是在浪費算力。
為了做好這個工具,他們專門開發了 AI 能方便使用的瀏覽器,又給瀏覽器準備了虛擬機沙箱環境,還針對小紅書的頁面布局做了專門的解析模塊,甚至為了讓工具能大規模穩定運行,連底層的 MCP 服務系統都幾乎重寫了一遍↓↓↓
“小紅書”還只是一個工具,老師傅為各個蜜蜂量身定做或修改過的工具,算起來有上百個。
這些工作全都做在暗處,如果不說,一般用戶肯定不知道。但梁志輝很有信心,他們一用納米 AI,就能*感覺*出來。
時至今日,創作早已不是兒戲,而是很多人賴以吃飯的家伙,如果一個 AI 不能幫助創作者*穩定地達成目標*,最終是不會有人買賬的。
但實話說,在現有的條件下,即便有最強模型+最強智能體組成的蜂群,也很難一次創作成型。
就拿“一句話生成視頻”這個官方制作的蜂群舉例。
一個 90 秒的影片,大概需要 20 個鏡頭,其中但凡有一個鏡頭出現人物一致性錯誤,或者出現三頭六臂,或者出現解說混亂,都沒辦法用。
好的 AI 蜂群,需要具備“Redo”的能力。
梁志輝把這件事兒稱為“反悔”,他們設計了兩種反悔能力:即時反悔和延時反悔。
啥是即時反悔?
就是在每一個子任務執行的過程中,經理都會進行質檢,判斷剛剛生成的視頻里有沒有“明顯瑕疵”,例如出現敏感畫面、人物畸形之類的肯定不行。
如果存在問題,那就不往下走了,直接返工重做。
啥是延時反悔?
就是在全片生成之后,交給人類審看。人發現某個不滿意的地方,還可以追溯回去,讓負責這個任務的蜂群返工重做。
比如下面這張看上去像剪映的界面,就是一個“P視頻”的系統,你如果對某個片段不滿意,可以直接上手修改它的提示詞,替換原有畫面,直到滿意為止。
同理,人物口播、旁白、配樂也都可以修改。
梁志輝的想法很實際,他確信在未來相當長的時間內,AI 都沒辦法 100% 獨立完成任務,這也就要求人必須以某種(簡單的)方式“在回路”。
由此看來,這個編輯界面是一個完美的隱喻,它是并不完美的人工智能和同樣并不完美的人類智慧相互咬合的接觸點。
藉由這種相互攙扶,人機才能各自成為左右腳,向那些宏大的、也許永遠沒有答案的命題里一步步邁進。
(六)當蜂群滲入人生
“納米 AI 的終極目標是什么樣?”我問。
“我們想挑戰 AI 應用的上限。具體到每一次的挑戰方向不好提前預測,其實都是用戶需求推動的。所以,我最怕的是用戶不用。”梁志輝笑。
一瞬間,我意識到有趣的問題:很多人都在說“用戶”,但當他們說“用戶”時,心里想的其實并不是同一群人。
梁志輝所謂的用戶,特指那些在 AI 上“沒有經過特別訓練”,也“沒有特別天賦”的數量眾多的普通人。
之所以要面對這樣的普通人,是因為他們身上有“金礦”——他們不僅面對著巨量的“解決問題”的場景,甚至面對巨量的“定義問題”的場景。
中國是一個產業體系最完整的國家,此刻在看這篇文章的人,可能分布在極為廣泛的垂直行業,做著彼此難以理解的工作內容,面對著復雜又具體的難題。
舉一個小例子:
在醫院里,醫生問診之后,需要把剛才問到的信息,結合醫學常識寫成一個標準格式的報告。
這會耗費醫生大量的時間,降低問診效率。
本質上它是一個可以被智能體蜂群解決的問題;
但真正困難的是,納米 AI 的老師傅不一定知道這個問題的存在。即便知道,隔行隔山,也很難精確描繪解決問題的流程。
這也是他們開發“智能體工廠”的核心邏輯。
梁志輝告訴我,在智能體工廠里,用戶不需要任何代碼能力,用自然語言的方式就能給智能體描述它的職責,通過拖拽就能安排“賽博蜜蜂”的協作順序。
然后,一個“特種蜂群”就誕生了。
如果你對它們的工作不滿意,只需要調整協作順序,調整崗位描述,就能改進他們的能力;如果還不滿意,你就可以“人在回路”,在蜂群工作的基礎上完善一下就好了。
這并非空想,實際上已經有醫生用“智能體工廠”做出了輔助寫診斷報告的蜂群,并且投入使用。
在 360 的老本行網絡安全領域,也有很多同事用納米 AI 做出了專業蜂群,使用各種安全產品做網絡安全運維。
除此之外,還有各行業的老鐵們做了發票報銷蜂群、宣傳片制作蜂群、競品分析蜂群。。。
觀其本質,“定義問題”這件事情終于從行業精英的壟斷權力成為了普通職業人的日常。面對問題的同時,你可能已經離解決問題很近了。
正如前述,各行各業的用戶已經在納米智能體工廠上做出了超過 10 萬個智能體和蜂群。
每個蜂群,至少對應一個“崗位職責”。
坦白說,以目前的 AI 水平,無法覆蓋所有崗位的所有職責,但梁志輝提出一個評價蜂群價值的客觀的指標:相應人類崗位的月薪。
隨著技術演進,期待蜂群能替代的崗位月薪越來越高,意味著它的技術含金量越強,價值也就越大。
這個未來的降臨,似乎還需要 AI 補齊一個能力,也就是三個支柱中的最后一根——編碼。
雖說現在大模型已經具備一定的編碼能力,可以搭個網站之類。但梁志輝覺得這遠遠不夠,AI 在工作中使用的工具,絕大多數還需要人類幫它們編寫。
相比 AI 的燃燒算力,人類顯然是拖后腿的豬隊友。
他期待有一天,模型可以根據需要現場編碼任何工具,觸達任何系統。
只有這樣,蜂群才有機會深入工業產線,進行實時調參,分析數據,優化排產;有機會深入游戲領域,實時 3D 建模、渲染出動畫;有機會深入影視制作,自動分析畫面內容,個性化剪輯。
未來,智能體之間的協作靠實時生成的上下文,模型工作靠實時編程的工具,人類編碼越來越薄,人類介入越來越輕,AI 反而能像水一樣滲入更多的場景。 這才是 AI 應用真正爆發的時刻。
梁志輝說。
弱小和無知不是生存的障礙,傲慢才是。
今天的 AI 并不完美,但未來不能靠一邊說風涼話一邊等待而降臨。
大模型,正如鋼鐵。
人們很早就發明了冶鐵技術,可這遠非創新的終點。
隨后幾千年,人們鍛出了鐵犁與鐮刀,鑄造了鎧甲和戈矛,發明了齒輪與鋼筋,組裝了輪船與火箭,喚醒了機器人,至今一切仍在蓬勃。。。
那是留給一代又一代夢想家的舞臺與追光。
告別老師傅,我突然想起 8 年前,一篇名叫的文章在網絡上流行。
我確信,人們想念的并不是某個具體的名字。人們想念的,是在歷史的輪回里,每一次站出來與高聳的技術壁壘對峙,抽出 40 米大刀的那個人。
但得蜜成功用足
不辭辛苦與君嘗
再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦對了,如果喜歡文章,請別吝惜你的“在看”或“分享”。讓有趣的靈魂有機會相遇,會是一件很美好的事情。
Thx with in Beijing
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.