![]()
![]()
“盡可能用簡單的方式,去解決一個當(dāng)下比較有挑戰(zhàn)的問題。”
作者|王博 周悅
“這么大發(fā)量一看就是假導(dǎo)。”“你是‘真人nanobot’吧?”
一前一后兩句話,分別是小紅書網(wǎng)友對黃超和任旭濱的調(diào)侃。
黃超是香港大學(xué)數(shù)據(jù)科學(xué)研究所及計算與數(shù)據(jù)科學(xué)學(xué)院助理教授、博士生導(dǎo)師;任旭濱是黃超的學(xué)生,目前在香港大學(xué)讀博,同時他還是超輕量級個人AI助手nanobot開源項目的作者。
黃超的研究方向涵蓋大模型、AI Agents和圖機器學(xué)習(xí),研究成果在Google Scholar上被引用超過16000次。但更為人熟知的是黃超團(tuán)隊推出的多個具有相當(dāng)影響力開源項目,包括nanobot、LightRAG、DeepCode、CLI-Anything等。截至目前,nanobot已經(jīng)獲得了超過15萬次的下載量,并且在GitHub上已獲得超過3.8萬的Stars,團(tuán)隊打造的HKUDS GitHub開源平臺也形成了豐富的AI Agent生態(tài),累計吸引超過9千的followers。黃超本人也是一位小紅書博主,粉絲超過4萬。
站在流量的風(fēng)口浪尖,贊譽和質(zhì)疑幾乎同時涌向了這個團(tuán)隊。
他們嘗試用4000行左右的代碼打造nanobot,實現(xiàn)了OpenClaw這種百萬行代碼量級項目的核心功能;他們推出開源項目ClawWork,將AI助手轉(zhuǎn)變?yōu)檎嬲腁I同事,完成工作任務(wù)并創(chuàng)造經(jīng)濟(jì)價值,在11小時內(nèi)賺取了15000美元。
我們很好奇:他們是如何做到的?團(tuán)隊為什么對開源有如此執(zhí)念?這波OpenClaw(俗稱“龍蝦”)熱潮改變了什么?
在2026中關(guān)村論壇年會“人工智能主題日”的Party Nights活動上,我們見到了黃超和任旭濱,并和他們在北京AI原點社區(qū)錄了一期視頻播客。
和小紅書網(wǎng)友的調(diào)侃不同,任旭濱對“假導(dǎo)”黃超的感受是“非常有活人感”,而黃超則認(rèn)為“真人nanobot”任旭濱并不像bot(機器人),相反他會給團(tuán)隊帶來很多“啟發(fā)與靈感”。
談及OpenClaw熱潮,黃超認(rèn)為“焦慮和機會并存”,OpenClaw要從“好玩”變成“好用”,不能只靠模型變強,更需要規(guī)劃、記憶、工具鏈和軟件接口層(CLI)的適配,與開源社區(qū)共同把生態(tài)補足。
而面對贊譽和質(zhì)疑,他們更在意的始終是按團(tuán)隊的研究品味,把值得做的項目開源出來。
“盡可能用簡單的方式,去解決一個當(dāng)下比較有挑戰(zhàn)的問題。說到底,就是大道至簡。”黃超說。
本文為「甲子光年」對話黃超、任旭濱《嗨點小圓桌》視頻播客文字實錄,由「甲子光年」編輯整理,有刪改。
![]()
「甲子光年」對話黃超、任旭濱
1.從OpenClaw到nanobot:“活人感”很重要
甲子光年:你們怎么看從今年年初開始的這波“龍蝦”熱潮?
黃超:我覺得這波熱潮,核心其實是一個詞——“活人感”。過去很多Agent更像工具,大家默認(rèn)它只是幫你提效、幫你完成任務(wù)。
但OpenClaw不太一樣,它讓人開始重新期待Agent不只是工具。它也可以更像一個會主動互動、陪你一起做事的個人助手,類似電影鋼鐵俠里的“賈維斯”。它把大家對Agent的期待往前推了一步。
![]()
黃超
任旭濱:我覺得OpenClaw的理念非常好。它讓Agent可以跑在本地,擁有更多電腦權(quán)限,去做很多云端Agent做不到的事。另外,它是開源的,程序員和普通用戶都可以下載到本地使用,把Agent開放給了更多人。
甲子光年:黃超老師,你有一個很有意思的判斷:OpenClaw帶來的,技術(shù)革新倒在其次,更重要的是Agent交互模式上的啟發(fā)。這種啟發(fā),或者說變化是什么?
黃超:最大的變化還是主動性。以前用戶和Agent的關(guān)系比較被動,先輸入需求、寫prompt,再由它幫你完成任務(wù)。現(xiàn)在不太一樣了,像“龍蝦”這類產(chǎn)品,它會主動來找你,問你有沒有新的代辦,有沒有事情可以繼續(xù)做。
第二個變化是,過去我們得把需求寫得很具體,Agent才能執(zhí)行。現(xiàn)在很多時候,給它的是一個比較模糊的目標(biāo),至于中間怎么拆解、怎么調(diào)用工具,很多都可以交給Agent自己決定。
所以它給整個生態(tài)的啟發(fā)是,交互變得更靈活了。系統(tǒng)也正在從固定workflow(工作流),慢慢轉(zhuǎn)向一個“真正的Agent”。
甲子光年:OpenClaw出來后,很多人很興奮,但是隨后一些人又陷入了焦慮,覺得是不是自己的工作會被替代,你覺得現(xiàn)在FOMO(害怕錯過)的情緒嚴(yán)重嗎?我們應(yīng)該如何面對這一項又一項新的技術(shù)?
黃超:我覺得完全不焦慮其實很難,尤其我們自己就在做Agent感受會更明顯。
你越去探索它的邊界,就越能感受到它能力提升得有多快,也越能感受到,它確實可能替代一部分原本由人完成的工作。
但如果只看“龍蝦”現(xiàn)在這個階段,我覺得它更多還是個人助手,距離真正高強度、穩(wěn)定打工還有一段路。
當(dāng)然,隨著生態(tài)繼續(xù)發(fā)展,它很可能會從“個人助手”慢慢走向真正的合作者。我覺得它的確可能會替代一些工作,尤其是編程甚至科研本身這類智力密集型工作。
但另一面,它也在帶來新的機會。以前很多事情需要很強的代碼能力才能做出來,但現(xiàn)在借助Agent,很多人都更容易把想法變成現(xiàn)實。
這其實是一種技術(shù)平權(quán),歸根結(jié)底,焦慮和機會是并存的。
甲子光年:在這波“龍蝦”熱潮里,你們發(fā)布了超輕量級個人AI助手nanobot,旭濱在這個項目中貢獻(xiàn)很多,你能不能通俗解釋一下nanobot是什么?它和OpenClaw有什么區(qū)別?可以幫助我們做什么?
![]()
nanobot,圖片來源:GitHub
任旭濱:最開始其實很簡單,我們發(fā)現(xiàn)OpenClaw的代碼太多了,也不太好安裝。
我們就想,能不能把它最核心的邏輯,用一種更簡單、更像“教科書范式”的方式實現(xiàn)出來,就做了nanobot。
它的底層運行邏輯和OpenClaw是接近的,OpenClaw能做的絕大多數(shù)事情,nanobot基本也都能做到。比如,寫代碼、報告生成、行業(yè)調(diào)研、文檔整理、做PPT。
某種意義上,它是OpenClaw的一個輕量化實現(xiàn)。
![]()
任旭濱
甲子光年:OpenClaw有100多萬行的代碼,而nanobot目前只有4000行左右,比OpenClaw少99%的代碼行數(shù),基本上可以實現(xiàn)OpenClaw 80%的功能,這是怎么做到的?
任旭濱:核心還是抓住了本質(zhì)。
對Agent來說,本質(zhì)其實就是那個循環(huán):上下文管理、環(huán)境交互,以及讓大模型去控制Agent幫用戶完成任務(wù)。完成這些,不一定需要那么多冗余代碼。
如果架構(gòu)設(shè)計更合理,代碼復(fù)用做得更好、模塊之間更解耦,同時整體更容易理解,其實可以把Agent做得很輕。
因為本質(zhì)是一樣的,所以在功能實現(xiàn)上,最后可以做到比較接近。我覺得至少在代碼層面,OpenClaw在設(shè)計上有點過于復(fù)雜,有一些地方可能沒有特別收斂,導(dǎo)致有一定的冗余。
甲子光年:nanobot在GitHub上獲得了大量關(guān)注,你有沒有分析過,為什么它會這么受歡迎?
任旭濱:一個原因是開源社區(qū)里很多人喜歡這種簡單、輕量化的代碼,也認(rèn)同這種思路,他們會覺得一個Agent需要更清晰、可控的架構(gòu)。另一個原因是,代碼更少之后,做二次開發(fā)會方便很多,可以更容易在這個基礎(chǔ)上做自己的Agent。
黃超:我和旭濱的感受是一樣的,nanobot的關(guān)注度遠(yuǎn)遠(yuǎn)超出預(yù)期。
最開始我們其實更想把它做成一個教程式的項目,用輕量的代碼,把OpenClaw背后的核心邏輯拆解開給大家看。
但沒想到,這種輕量化設(shè)計本身就很有意思,結(jié)果反而把很多原本分散在社區(qū)里的高手、開發(fā)者都吸引出來了,大家開始一起在nanobot上共建、共創(chuàng)。
甲子光年:在開發(fā)nanobot的過程中,最讓你感到意外的是什么?另外,有多少代碼是和AI一起vibe coding出來的?
任旭濱:最讓我意外的有兩個點。第一,Agent的自主能力很強。給它一個任務(wù),它一開始可能不會做,但在大模型驅(qū)動下,它會不斷自己嘗試、找辦法,最后把事情完成。第二,是社區(qū)的活躍度。很多平時不一定被大家看到的程序員、極客,會很積極地參與進(jìn)來,一起共建nanobot的生態(tài)。
至于代碼,最早期第一版還是手寫為主。但后來我發(fā)現(xiàn),只要整體邏輯和架構(gòu)已經(jīng)比較清晰,AI其實能很好理解我的意圖。后期更多是人和AI協(xié)作,用模型生成代碼,再由我們審閱、調(diào)整架構(gòu)和細(xì)節(jié)。
甲子光年:旭濱,有網(wǎng)友稱你為“真人nanobot”,你喜歡這個稱號嗎?
任旭濱:哈哈,我還挺喜歡的。可能讓大家記住我叫任旭濱,不太容易,但是讓大家愿意把 nanobot跟我關(guān)聯(lián)起來,我還是挺高興的。
我和nanobot一樣,幾乎都是在“不間斷工作”,而且善于把一些復(fù)雜的知識給輕量化。
2.從“助手”到“同事”:Agent怎么賺錢?
甲子光年:你們還有一個開源項目是ClawWork,將AI助手轉(zhuǎn)變?yōu)檎嬲腁I同事,完成工作任務(wù)并創(chuàng)造經(jīng)濟(jì)價值。你們給出的數(shù)據(jù)是,利用10美元的本金,11小時內(nèi)賺取了15000美元。我很好奇,它是怎么賺錢的?
黃超:ClawWork其實是一個仿真實驗,但它完成的每一項任務(wù),都是現(xiàn)實生活中真實存在的任務(wù)。
這個實驗基于OpenAI發(fā)布的GDP Evolve數(shù)據(jù)集。它收集了四個行業(yè)、總共220項任務(wù),包括法律、醫(yī)學(xué)、藝術(shù)創(chuàng)作等各類工作。每一項任務(wù)都對應(yīng)一個真實報酬,這個報酬是根據(jù)現(xiàn)實世界里的價格整理出來的。
當(dāng)時我們就在想,既然大家都在討論怎么把“龍蝦”從助手變成真正能打工的角色,那為什么不讓它先在這個數(shù)據(jù)集上“打一輪工”?
我們就讓nanobot、類似“龍蝦”的Agent,在這220項任務(wù)上去執(zhí)行,衡量方式也很直接看它最后一共能“賺”多少錢。
結(jié)果是,在11個小時里,它完成的任務(wù)對應(yīng)的總價值超過了1萬美元。
![]()
ClawWork Agent Flow,圖片來源:GitHub
甲子光年:所以這是一個模擬賺錢的過程,而不是真正真金白銀賺到了這筆錢?
黃超:對,任務(wù)是真實的,但賺錢是在數(shù)據(jù)集構(gòu)建的仿真環(huán)境里完成的。
甲子光年:現(xiàn)在很多人也在討論,OpenClaw出來之后,更多是賣課的、賣設(shè)備的、幫別人安裝部署的人賺到了錢,真正靠Agent本身賺到錢的人似乎還不多。類似OpenClaw這樣的產(chǎn)品,究竟怎么才能產(chǎn)生帶來真正的收益?怎么讓“龍蝦”變成一個真正的“打工人”?
黃超:在現(xiàn)實生活中,很難直接讓Agent在各個行業(yè)里去真實賺錢并做標(biāo)準(zhǔn)化評估。這個數(shù)據(jù)集提供了一個仿真環(huán)境。
至少說明,在某些任務(wù)上,Agent已經(jīng)具備了很強的“打工能力”,像代碼、報告生成、行業(yè)調(diào)研、文檔整理、做slides這類任務(wù),潛在掙錢能力已經(jīng)很強。
甲子光年:nanobot和ClawWork之間是什么關(guān)系?
任旭濱:ClawWork更像是我們搭建的一個生態(tài),用來評估這些能干活的Agent到底能達(dá)到什么樣的表現(xiàn)。不管是nanobot,還是其他類似的Agent,都可以把ClawWork當(dāng)成一個載體,在上面做測試和評估。
甲子光年:最近“One Person Company(一人公司,OPC)”的概念很熱,但還有一種趨勢是多Agent系統(tǒng)。我看到小紅書上也有人問你“OPC和nanobot的區(qū)別”,你覺得未來AI更強化“個體”,還是會形成“AI組織”?
黃超:我覺得這兩種形態(tài)都會很重要。
如果用一個比較直觀的類比,個體可以理解為一臺設(shè)備,比如一臺PC。
nanobot更像是在這臺設(shè)備上運行的一套能力,讓這個“個體”變得更智能、更自動化。集群更像一個生態(tài),把很多終端設(shè)備連接在一起,讓它們協(xié)同去完成更大的任務(wù)。
從這個角度來看,Agent其實也會走向“集群化”。未來每個人都可能擁有很多個nanobot,這些Agent不再是單兵作戰(zhàn),而是可以形成一個團(tuán)隊,去完成更復(fù)雜的任務(wù)。
我覺得離真正“打工”已經(jīng)很快了,接下來幾個月,它就能開始承擔(dān)很多日常任務(wù),越來越成熟。
任旭濱:Agent這個領(lǐng)域發(fā)展得特別快。我們在迭代nanobot的過程中,會很明顯感覺到,它的能力是在不斷躍遷的。從早期比較單點式的Agent,到現(xiàn)在開始走向Multi-Agent,未來甚至可能會進(jìn)一步走向自我進(jìn)化。
我覺得大概在半年左右的時間里,它就有可能在很大程度上減輕我們?nèi)粘9ぷ髦械呢?fù)擔(dān)。
甲子光年:nanobot下一步的規(guī)劃是什么?你們接下來最想補的生態(tài)短板是什么?
黃超:nanobot肯定還是會持續(xù)迭代。
它本身可以看作一個比較輕量的系統(tǒng),用來支撐Agent的運行。在planning(規(guī)劃)、memory(記憶)、整體效率、token使用效率這些方向都會繼續(xù)優(yōu)化,讓它更輕量、更高效。
更重要的是生態(tài)。現(xiàn)實生活中,大量工作其實是圍繞軟件展開的。很多人每天花大量時間在這些工具上,但這個過程本身是低效的。我覺得未來一個很重要的方向,是讓nanobot更好地使用現(xiàn)實世界里的各種軟件。
如果接下來能把Agent操控整臺計算機這一層真正打通,讓它可以直接操作這些軟件,它離真正打工就會更近一步。
3.軟件世界要開始為Agent改寫接口
甲子光年:既然聊到了Agent使用軟件的問題,那就要提到你們的另一個開源項目——CLI-Anything。這個項目在Github上有2.9萬顆星,被討論得越來越多。僅一行命令就能讓任意軟件接入OpenClaw、nanobot等Agent框架,你們?yōu)槭裁磿鲞@一個項目?
![]()
CLI-Anything,圖片來源:GitHub
黃超:這個項目背后的一個核心啟發(fā)是:未來的軟件不一定主要是給人用的,軟件更重要的使用者,很可能會是Agent。
對人來說,我們更愿意使用那些讓自己感覺順手、甚至有點愉快的GUI(圖形用戶界面)軟件;但很多操作交給Agent去做是最好的。
但現(xiàn)在讓Agent去操作軟件,很多時候還是只能走GUI這條路,也就是像人一樣去看屏幕、點坐標(biāo)、一步一步操作界面。這種GUI Agent的問題其實很明顯。
甲子光年:為什么你們覺得CLI(命令行接口)更像Agent的原生工作語言?
黃超:因為GUI Agent有一些問題。
第一,它慢。因為它每一步都要先理解當(dāng)前屏幕截圖,再判斷應(yīng)該點哪個位置,整個過程本質(zhì)上依賴多模態(tài)理解,所以推理鏈條會比較長。
第二,它不夠準(zhǔn)。尤其是在電腦這樣的大屏幕上,要去完成一些很精細(xì)的點擊任務(wù),其實并不容易,所以準(zhǔn)確率往往也會受到影響。
第三,它的token消耗會很高。因為這里面涉及大量的圖像理解。很多時候,可能只是讓AI幫我們點一杯咖啡,最后消耗掉的token成本,已經(jīng)快接近那杯咖啡本身了。
這種方式看起來很炫,但不一定真正實用。我們覺得,GUI Agent不一定是當(dāng)下最“Agent Native(原生)”的形態(tài)。
之前我們其實容易陷入一個思路,總想讓AI像人一樣去做事。但后來我們意識到,人類熟悉的方式,不一定是AI最有效率的方式。
我們的判斷是,CLI這種模式可能更接近Agent Native,AI通過代碼去交流,本身就是一種更準(zhǔn)確、更快速的方式。
甲子光年:那在CLI-Anything的實現(xiàn)過程中,最大的難點和突破點分別是什么?
黃超:我覺得它其實是一個技術(shù)上并沒有那么復(fù)雜的項目。
因為很多時候,我們做Agent會越來越有一種感覺,很多真正關(guān)鍵的東西都符合“大道至簡”的邏輯。沒必要把一個問題想得特別復(fù)雜。
很多時候,人反而容易把簡單問題復(fù)雜化。但做Agent不應(yīng)該這樣,更重要的,反而是把復(fù)雜問題盡量簡單化。
從這個角度來看,CLI-Anything其實就是抓住了一個很明確的痛點:一方面是當(dāng)下軟件生態(tài)本身的使用方式,另一方面是Agent未來要和軟件更高效適配的趨勢。
它的核心突破點,并不在于技術(shù)本身有多“重”,而是在于它找到了一個很關(guān)鍵的接口層。
簡單說,就是它為Agent創(chuàng)建了一套可以直接和軟件生態(tài)溝通的CLI接口。抓住了這個點之后,很多事情反而就變得順了。
甲子光年:你怎么看待“未來所有軟件是不是都要變得對Agent更友好”這件事?GUI是不是會變得不那么重要?
黃超:我覺得也不能這么說。因為現(xiàn)在其實還有很多人在繼續(xù)做GUI Agent,所以很難說GUI不重要。
但如果從我自己的角度出發(fā),當(dāng)我讓Agent幫我完成任務(wù)的時候,我最關(guān)心的其實還是任務(wù)完成的質(zhì)量和結(jié)果。對于這一類需求來說,GUI可能就沒那么重要。
不過GUI的重要性,背后也不僅僅是交互問題,它還牽涉到整個軟件生態(tài)。很多軟件今天的商業(yè)模式,本身就是圍繞“人來使用軟件、產(chǎn)生流量、形成付費”建立起來的。
GUI不太可能在很短時間內(nèi)被替代。我覺得,未來更可能是GUI和CLI共存。人還是會繼續(xù)使用一些軟件,但很多專業(yè)性的、工作型的軟件,會逐步走向CLI化。
甲子光年:我們之前也試用過一些GUIAgent。除了剛才提到的那些問題,它們還經(jīng)常會碰到驗證碼、風(fēng)控識別之類的面向“真人用戶”的機制。Agent想要去繞過這些限制,本身就會遇到很多問題。那么對于軟件廠商來說,是否要重新思考應(yīng)如何更好地適配Agent?
任旭濱:我覺得黃老師剛才說得非常對。未來很多軟件都要更多從“效率”的角度出發(fā),去降低GUI層面的復(fù)雜度。
以前很多軟件的商業(yè)邏輯,某種程度上是希望用戶在里面停留更久,所以GUI會做得比較復(fù)雜。但未來這個邏輯可能會變化。對用戶來說,能不能幫他節(jié)省更多時間、提升更高效率,可能會變成更重要的付費理由。
我們也看到,其實很多大廠內(nèi)部已經(jīng)在把一些專業(yè)軟件、核心軟件逐步做CLI化。未來也不排除它們會把這些CLI能力通過合適的接口開放出來,讓每個用戶自己的Agent都可以接上去。
4.一支高校開源團(tuán)隊的方法論
甲子光年:你們團(tuán)隊已推出很多有影響力開源項目,背后有沒有一條邏輯主線?
黃超:我們一直在做的其實是同一件事:怎么讓AI更好地幫我們“打工”。
因為我們自己就在科研一線,最熟悉的任務(wù)就是編程、深度研究,以及一些更偏科學(xué)發(fā)現(xiàn)的工作。
我們最關(guān)心的,不是做一個看起來很新的系統(tǒng),而是能不能把這些真實、繁瑣、重復(fù)的任務(wù)一步步交給AI,讓人從里面解放出來。我們團(tuán)隊一貫的偏好是喜歡做輕量級系統(tǒng)。
甲子光年:黃超老師,你最早是從推薦系統(tǒng)、圖學(xué)習(xí)、信息檢索一路做過來,我想知道后來你為什么會進(jìn)入大模型、RAG、Agent這些方向?
黃超:我們組最開始其實也做過推薦系統(tǒng)、圖學(xué)習(xí)這些方向。但慢慢會發(fā)現(xiàn),這類技術(shù)在具體場景里可以做得不錯,要真正泛化到更廣的領(lǐng)域,限制依然很大,尤其受數(shù)據(jù)和生態(tài)約束。
后來我們轉(zhuǎn)向大語言模型,一個很自然的問題就是:大模型要落地,怎么把知識接得更好、成本降得更低。
于是我們做了LightRAG,想用更少的token消耗、更快的訪問和索引方式,去實現(xiàn)一個更輕量的RAG系統(tǒng)。再往后我們又意識到,RAG只是更大系統(tǒng)里的一層,下一步自然就走到了Agent。
甲子光年:旭濱,你是怎么確定自己的研究方向的?
任旭濱:我在本科階段,做過一些研究。后來到了黃超老師組里,一開始是做推薦算法,然后一路做到RAG,再做到Agent。
回頭看,這不是一開始就規(guī)劃好的,更像是一個不斷根據(jù)反饋調(diào)整方向的過程。哪個方向能持續(xù)給出信號和反饋,能讓我們更接近真實問題,我們就往哪邊走。
這個過程有點像一個不斷“梯度下降”的過程,每走一步都會比之前更接近最優(yōu)的答案。
甲子光年:我們經(jīng)常會談到一個詞,叫“學(xué)術(shù)品位”,或者說“研究品位”。那你們團(tuán)隊的學(xué)術(shù)品位是什么?
黃超:如果讓我總結(jié)的話,我覺得我們團(tuán)隊的一個出發(fā)點是:盡可能用簡單的方式,去解決一個當(dāng)下比較有挑戰(zhàn)的問題。
LightRAG也好,nanobot也好,它們背后其實是同一種偏好。我們一直傾向于做輕量級架構(gòu),因為很多事情最后都會回到“大道至簡”。更快、更簡單、更便宜,不只是工程選擇,也是我們判斷價值的標(biāo)準(zhǔn)。
甲子光年:如今,AI技術(shù)和范式變化較快,很多路線沒有收斂。你們?nèi)绾巫分馃狳c,又不盲從熱點?如何判斷一個方向值得投入的?
黃超:關(guān)于熱點,我們不會把它理解成要不要追,而是把它看成一種信號。一個東西之所以會熱,往往說明那里有真實的技術(shù)痛點還沒被滿足。
像OpenClaw之所以引發(fā)討論,本質(zhì)上反映的就是大家對現(xiàn)有Agent形態(tài)并不滿意,都在等一個真正屬于自己的“賈維斯”。所以我們不是為了追熱點而追熱點,而是去看熱點背后到底對應(yīng)了什么問題。
任旭濱:我會把熱點理解成一種外部反饋。它之所以成為熱點,說明很多人真的在意這個問題。
更重要的不是先判斷它熱不熱,而是從我們的能力出發(fā),能不能在里面做出東西、解決一點真實問題。很多時候,機會其實就藏在熱點里,關(guān)鍵是你能不能接得住。
![]()
「甲子光年」對話黃超、任旭濱
甲子光年:我們之前也和很多高校、實驗室交流過,有些團(tuán)隊更像是“各寫各的paper”。但你們更像是在持續(xù)迭代一個產(chǎn)品,或者一個開源項目。你們怎么判斷,一個想法是寫論文就夠了,還是值得做成開源項目?你們怎么理解“開源精神”?
黃超:在我們看來,開源和論文本質(zhì)上都是方法,最終目的都是解決一個真實痛點。我們團(tuán)隊并沒有那么“paper driven(論文導(dǎo)向)”。不是發(fā)完一篇論文,這件事就結(jié)束了。
很多時候,真正累的反而是項目剛發(fā)布的時候,因為從那一刻開始,你要接社區(qū)反饋、持續(xù)迭代、整合PR(拉取請求)。對我們來說,發(fā)布不是結(jié)束,而是開始。
如果一個東西只是適合被總結(jié)成論文,那它寫成論文就夠了;但如果它確實解決了一個當(dāng)下存在的問題,那一篇論文往往不夠,它更適合在開源社區(qū)里繼續(xù)生長。
很多時候,我們會先把技術(shù)做成項目發(fā)布出來,再用論文、技術(shù)報告或者博客補充表達(dá),這是更自然的一條路徑。
在我們組里,我沒有給學(xué)生設(shè)定必須發(fā)論文的要求。我更在意的是,大家能不能做出真正不錯的東西。至于論文,我覺得它更多只是一個產(chǎn)物。
我對開源的理解也是一樣。現(xiàn)在很多技術(shù)還處在百家爭鳴的階段,很多事不是靠一個組織就能獨立做完的,必須跟著生態(tài)、跟著社區(qū)一起往前走。
開源最重要的一點,就是它能讓你真正感知需求、拿到真實反饋,再根據(jù)這些反饋繼續(xù)迭代。發(fā)布只是開源的開始。
任旭濱:以前沒有代碼智能體的時候,論文是一種很高效的知識載體,因為它已經(jīng)被壓縮和總結(jié)過了。
但現(xiàn)在不一樣了。有了代碼智能體之后,如果我們先把項目開源,別人可能用一個下午,甚至喝杯咖啡的時間,就能讀懂我們到底在做什么。從傳播效率來看,開源在很多時候已經(jīng)比論文更快。
對我來說,開源還有一個更重要的意義:它是在表明,你愿意和社區(qū)站在一起。你不是把東西關(guān)起來,而是真的愿意讓別人參與進(jìn)來,一起把它做下去。
甲子光年:你們會特別關(guān)注GitHub上星標(biāo)的數(shù)字嗎?
任旭濱:我們還是會偶爾看一下,至少能知道,社區(qū)現(xiàn)在的熱度大概在哪兒。
甲子光年:你覺得做學(xué)術(shù)和做開源之間矛盾嗎?
黃超:我反而覺得學(xué)術(shù)更應(yīng)該做開源。因為學(xué)界限制更少,不像大廠會受版權(quán)、數(shù)據(jù)和商業(yè)化約束,所以更適合把東西開放出來。
甲子光年:對比海淀和香港這兩片區(qū)域,你們覺得開源生態(tài)有什么不同?
黃超:海淀的特點是生態(tài)更完整,高校、實驗室、企業(yè)、政府都在參與,更像一個把開源能力串起來的連接器。
香港則產(chǎn)業(yè)側(cè)沒那么豐富,但學(xué)界同樣很擁抱開源,比如港大就一直鼓勵把研究成果開出來。未來我會比較期待兩邊有更多合作。
任旭濱:我感受是,香港的開源更多還是學(xué)術(shù)和社區(qū)自發(fā)推動的。而海淀比較特別的是,有政府和企業(yè)一起在搭生態(tài),所以整體會更成體系一些。
甲子光年:如果一個年輕學(xué)生想加入你們組,最需要具備什么?
任旭濱:我覺得有兩點特別重要。第一,真的要會用、敢用AI。現(xiàn)在AI已經(jīng)不是一個可以忽視的效率工具了。
第二,是要有好奇心。以前做研究,更多是在論文里探索;但現(xiàn)在不只是這樣了,你還得去互聯(lián)網(wǎng)里看大家真正關(guān)心什么,真實的痛點到底在哪。
黃超:我特別認(rèn)同旭濱剛才說的一點。用一句特別通俗的話講:能用token解決的事,就盡量不要靠人硬上。
除此之外,我覺得最關(guān)鍵的是自驅(qū)力。我們組里的同學(xué),很多時候不是我在推他們,反而是他們在推我。
如果說加入我們組最重要的標(biāo)準(zhǔn),我覺得第一還是:對科研要有真正的好奇心。不要一上來就太關(guān)心“能不能發(fā)論文”“要發(fā)多少篇論文”。
甲子光年:最后一個問題。如果現(xiàn)在有一個對AI感到焦慮的年輕人正在聽這場播客,你們最想對他說什么?
任旭濱:我最想說的是,不要那么焦慮。
AI Agent首先是在讓很多事情變得更方便。比如代碼智能體,已經(jīng)在很大程度上改變了寫代碼這件事的體驗,就讓寫代碼這件事本身變得更輕松。
一方面當(dāng)然要積極擁抱這些變化。另一方面,也不要讓焦慮占據(jù)太多空間。不要總覺得自己一定會失去什么。
AI的出現(xiàn),本質(zhì)上還是在讓生活變得更快樂、更有可能性。這樣心態(tài)才更容易真正把AI用好,也更容易感受到它帶來的變化。
黃超:我也想給大家一個很直接的建議,AI的門檻,其實沒有大家想象中那么高。
尤其是現(xiàn)在已經(jīng)有了這么多AI工具之后,不管是寫代碼,還是做deep research、行業(yè)調(diào)研,其實都比以前容易了很多。
我們自己做項目時,現(xiàn)在很多時候也不會先把整條鏈路完全想清楚,再開始動手。今天這種方式往往已經(jīng)不太現(xiàn)實了。
更多時候,我們會采用一種類似nanobot的思路,也就是Agent loop(Agent循環(huán))。先想清楚下一步做什么,做完這一步,看結(jié)果,再決定后面怎么走。
我覺得,大家不用一開始就把所有事情想得特別完整。先做下一步,先上手,在做的過程中再不斷調(diào)整、學(xué)習(xí),再去找新的解決辦法。
某種程度上,這就是一種“干中學(xué)”的狀態(tài)。我覺得在現(xiàn)在這個階段,這是更現(xiàn)實、也更有效的方法。
(封面圖及文中未標(biāo)注來源圖片來自:中關(guān)村科學(xué)城公司)
關(guān)于嗨點小圓桌
2026中關(guān)村論壇年會期間,海淀區(qū)“人工智能主題日”場外氛圍活動 “原點 Party Nights”在 AI 原點社區(qū)舉辦。其中音視頻播客 “嗨點小圓桌” 是一檔 “海淀和他的朋友們” 深度對話節(jié)目,邀請主論壇嘉賓、AI熱點人物一同探討AI青年關(guān)心的熱點話題,歡迎大家收聽、觀看。
本場對話音視頻內(nèi)容即將上線
音頻播客:在小宇宙APP搜索「津津樂道」即可收聽;
視頻播客:在微信視頻號搜索「津津樂道播客」即可收看。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.