我一直有個觀點,即 AI 只是技術,并不存在特定的產品,只要用了 AI 就能成立的。AI 產品包括了是否洞察了用戶需求、是否發揮了技術優勢,也包括怎樣與用戶溝通(運營)。這些也都跟 AI 產品背后的團隊氣質有關。
從 ChatGPT 引起科技行業軒然大波已經過去一年了,國產 AI 產品我也試用過了很多,感受比較強烈的還是 Kimi Chat,這是個很不一樣的產品,尤其背后的團隊 Moonshot 也很不一樣。
這個不一樣從名字就開始了,「月之暗面」就是 Pink Floyd 的經典專輯,這個封面可能也是搖滾史上的經典。我自己是黑膠愛好者,也有這張專輯,放在書架上,很喜歡。
技術不是做數學題、不是寫多少行代碼那么簡單;也不是有了好技術,就一定等于有好產品。正好這幾天在用 Kimi Chat(下文簡稱 Kimi)的時候發現他們上線了加油的功能,就趁機以它為載體聊一聊這個話題。
1 需要技術,也需要用戶場景
Kimi 是國產 AI 產品里最受關注的之一,根據我看到的一個統計(similarweb),Kimi 的 Web 端訪問量在 TOP2,一度超過了文心一言。
在 Apple Store 的免費榜里,也曾沖到過 AI Chat 類應用的 TOP3,另外兩家是百度和字節的產品。Kimi 也是「小廠」中最受矚目的一個。
估計很多沒用過的朋友也不太能理解為什么 Kimi Chat 能有這樣的熱度,有的會認為就是投放的效果(當然跟投放有一定關系)。
大模型本身是技術,并不代表用戶場景。跟所有用戶產品一樣,Kimi 也首先滿足了特定的用戶場景。
Kimi 能聯網獲取信息,是搜索引擎的替代品,而且是體驗更好的替代品:在原始網頁基礎上做了初步的整合。
我在之前的文章里聊到過,搜索引擎看似用關鍵詞搜索已經門檻很低了,要找到真正對應的內容,還是有難度的。
如果你去觀察身邊的老人,就會發現,他們壓根不會用關鍵詞去搜索。而是用完整的句子,也就是自然語言表達。
我們隨意在國內最主流的搜索引擎輸入一個詞,從聯想出來的常見輸入語,就能看得出來。
而這些完整的句子,很多時候未必能搜索到最準確的內容,要仰賴分詞技術。對于搜出來的結果,哪些跟搜索語相關,也需要有判斷。這也是為什么之前虛假廣告大行其道,因為很多人會自然地點擊前幾個結果頁面。
還是不要小看互聯網對于多數人的門檻。很多技術出身的朋友恨不得所有人都會寫爬蟲、自己操作腳本去獲取信息,瞧不上看起來沒有什么技術含量的 Kimi,認為不存在需求。這是忽視了人群和場景。
當然,現在的聯網搜索功能,還沒有那么理想。我自己的使用體驗,60% 能得到順暢的結果,不用再切換工具了,在當前的 UI 內就能得到足夠的信息。40% 的情況可能還要去原始網頁看看,或者在搜索引擎繼續搜集材料。
2 需要技術,也需要用戶體驗
用戶體驗,看起來是一個很虛頭巴腦的說法。但正因為它抽象,很多人也就忽視了。體驗實際上是囊括在很多小地方的,很多團隊要做用戶體驗地圖,一張圖拉出來,一百個用戶觸點,每個觸點都值得推敲、值得深究。
我體驗到的 Kimi 的這種小的特點至少包括:
響應快,出字就是比多數別的產品快,等待時間正好在可接受的范圍里。
界面簡潔。這個有點見仁見智,從我的視角看,首頁里塞的東西沒有讓我很反感;頁面也沒有一堆邊欄。
使用方便。多數 AI Chat 產品需要登錄才能使用;有的 AI Chat 產品無法查看信息來源網站;有的 AI Chat 不能讀取網址;...
效果不錯。從最終效果來看,Kimi 已經能在某些情況下替代 ChatGPT(GPT-3.5)了。不要相信別的國產大模型說早就超過 4 了。能在部分情況下接近 3.5 已經是極限,說明在一線水平。
對我而言,Kimi 能在我對某些問題無從下手的時候,提供非常好的引導作用。比如,我對日元貶值的問題感興趣,就可以得到這樣的回答:
再比如,我對不同的標普基金的漲跌情況不同,有比較大的疑問:
在搜集材料時,效率也的確比搜索引擎要高出很多,比如想了解 Zara 歷史上是否有知名的語錄:
在播客「半拿鐵」的創作過程中,我跟瀟磊對 Kimi 的使用率是不低的。瀟磊主講的節目,會用 Kimi 來做全文的摘要整合。
我在之前做的純主觀測評里,Kimi 在搜集信息和整理文稿方面,表現突出。
我在 3 個多月前就發了這么一個貼,說明我不是這兩個月 Kimi 火了才要蹭熱度的:
3 年輕的技術:長文本
在用戶需求和用戶體驗背后,Kimi 有自己更年輕的想法,這個想法就是長文本。
Kimi 是國內第一個提出和推進長文本概念的。在 Kimi 之后,通義千問、文心一言都紛紛加入了戰局,推出了適應長文本的功能。
長文本是對應 RAG 的一種技術概念,RAG 是 Retrieval-Augmented Generation,直譯為檢索增強的生成技術。
簡單理解,RAG 是得到了一個問題(用戶的輸入),可以去數據中進行檢索,把相關的數據做整合,再進行輸出。像是查字典的邏輯。當然 RAG 涉及的并不是單一技術,還包括如何切割數據、提取數據、檢索數據等等。
RAG 在處理明確的問題時效果拔群,比如「今天天氣怎么樣」。在一些嚴肅的場景中,RAG 也能更好地搜尋到信息,比如法律、醫學相關領域。
不過 RAG 有個天然的缺陷,即無論是輸入,還是輸出,文本過長的情況下,就很難有滿意的效果。
長文本相對而言能解決輸入和輸出長度(token 數量)的問題,因為它是用完整的數據建模的,而不是有了輸入再去檢索。讓長文本模型閱讀一本長篇大作、書寫一篇論文、幫助思考和推理,都是可以實現的。
我也終于排隊排上了 Kimi 的 200 萬字長度的長文本功能試用,把多年前的兩本書《從點子到產品》和《產品思維》投喂給它,讓它分辨異同,以及給出用戶場景的案例。從結果的信息看,是相當準確的。
長文本和 RAG 是技術路線的分歧,而選擇長文本,自然就是假定了一個用戶需求的趨勢:用戶并不只是簡單從搜索引擎搜搜東西而已,可能要用大量的文檔里獲取信息,也可能完成大篇幅的創作。
坦白說,目前的大模型的內容生成,對我這樣的內容創作者來說,還沒有達到標準。獲取信息是可以的,但要能夠直接采用,還有距離。文本的細節相對比較粗糙。
不過我搜集了一些投資人、學術界和工業界的觀點,相對一致的是,都認為長文本未來的機會是足夠大的。無非是在多大程度上替代 RAG。
我自己的感受是,如果有技術已足夠成熟的長文本輸入和輸出的用戶側產品,那么就可以覆蓋一個非常好的場景,即垂直知識庫:
博物館可以自建知識庫;
每本書可以有自己的知識庫,有多本書的作者也可以整合成一個知識庫;
個人自己的日記庫,哪里發生了什么,直接講給對方聽;
某地旅游的知識庫,或者當地生活信息的知識庫;
這類產品目前也存在,也有很多開源技術可以用,不過還是話說回來,能夠用開源技術自建模型,和使用體驗優異的用戶產品,門檻高低會直接呈現在用戶的規模和商業價值上。
這是 Kimi 選擇長文本的邏輯,也是一種長期主義的做法。如果只看當下的使用效果,可能 RAG 就足夠了,但要想布局以后,長文本會更有機會。
這是一個年輕的技術,也意味著這是一個有成長機會的技術。
4 年輕的用戶溝通方式
了解大模型的朋友就知道,數據是大模型的核心壁壘之一。而為什么 ChatGPT 的產品路線被大家認同,過去 Google 那種在公司實驗室里養蠱的方式就不再受歡迎,就是因為有了用戶的參與和真實的使用數據,產品迭代就成了有源之水、有本之木。
Kimi 很有意思的地方在于,它也有了特別的社區氛圍。你可能會疑惑:沒有在 Kimi 的官網看到社區啊,哪來的社區氛圍?
我一直認為,社區出現不在于形式,而在于是否有實際的真實成員、以及成員之間的交互。就像某個短內容平臺,每天用戶上億,但用戶之間從不發私信,只是給網紅點贊,就稱不上社區。
Kimi 的社區更多發生在小紅書、即刻這些內容平臺。以我熟悉的即刻為例,就有很多用戶自發分享使用方法(篇幅有限,截取部分):
還有 Kimi 的產品經理自己予以總結和引導(原帖有 31 條,截取部分):
這些是格外有價值的一些傳播。
日常的投放只能做到讓人留下印象,更多只是物料。這些自發出現的 Kimi 的用戶,能夠沉淀很多內容,不光帶動更多人關注 Kimi,還能更好地使用 Kimi,乃至參與到其中。官方在即刻出現這些內容后,也動作很快,不少員工入駐,共同討論。
不止是讓 Kimi 有傳播,不止是一種低成本的營銷策略,也同時能幫助一個 AI 應用層的團隊,去研究有哪些真實的場景和真實的問題。這是通往真正殺手級應用不可或缺的一條路徑。
這種年輕的狀態,背后是年輕的團隊。
5 年輕的團隊沒有包袱
產品的年輕感是個很玄的事情,這背后與團隊的年輕有很大關系。可能是我自己接近中年, 產生了一些偏見,我始終覺得年齡也與能否在新技術要素出現的時候創新,有很大關系。
我這兩年讀各種歷史故事比較多,發現歷史上也不斷重演這種故事。只有沒有歷史包袱的年輕人,才能在新技術要素到來時更沒有負擔。我認識的幾個產品經理就加入了 Kimi,他們在職場上不太成熟,在產品架構上也經驗有限,這在創業的時候反而變成了優勢,前面說的,不管是選擇更有挑戰性的技術,還是選擇更新穎的用戶溝通方式,都是如此。
在 AI 領域也是類似,不同時代的專家,都會被新的專家顛覆。明斯基、麥卡錫這些創立了人工智能的老前輩,就被后來的杰夫·辛頓、楊立昆、本杰奧的技術路線給顛覆了。如今 OpenAI 帶來的技術路線又很不同,Llama 3 又作為后來者引起很多轟動。都在驗證,創新者還是要更年輕。
是挺殘酷的一個認知,畢竟也把我自己劃出了圈。總的來說,我個人更喜歡年輕的團隊一些,很多經歷過移動互聯網,甚至有的經歷過完整 PC 互聯網時代的產品經理,他們主持的項目,我反而可能不太看好。
對于 Moonshot 和 Kimi,值得關注的還有它的創始人楊植麟。對于他的一些介紹,我早先了解的不算多,每次看到標題說「天才少年」「XXX 親傳弟子」就有點祛魅,不愿打開文章細讀。后來多了解了一番,發現背景的確很好。我在這里把水分擠干,寫幾條供參考:
CMU(卡耐基梅隆大學)博士畢業,這是 AI 領域的幾座大山之一;
是年輕學者中 NLP 相關領域被引用論文次數最多的之一;
曾經在 AI 最前沿的公司 Meta 和谷歌大腦任職;
蘋果 AI 負責人 Ruslan Salakhutdinov 曾是其導師;
與楊立昆和本杰奧都共同發表過論文。
如果聽過我在「半拿鐵」的人工智能系列講過的歷史故事就知道,Meta(Facebook)的 AI 實驗室、谷歌的谷歌大腦團隊都屬于 AI 發展歷史上最有影響力的團隊。而楊立昆和本杰奧不僅僅是圖靈獎得主,他們還是新時代 AI 領域的宗師,都屬于深度學習的重要創始人。
6 商業化才能走得更遠
我們都能感受到 AI 還尚未出現互聯網時代的殺手級應用,形態如果是 Chat 好像也別別扭扭。相當于大家跑了幾十米出去,看不到終點,終點是在百米,還是千米,還是半馬,誰都不知道。
考慮到奔跑中的持久度的問題,最關鍵的就是能跑下去,也就是能生存下去,這就回到了開頭提到的商業化。
對于 AI 產品,與很多過去的互聯網產品很大的區別在于,邊際成本還是略高的。前陣子用戶涌入,就一度擠爆了 Kimi 的服務器和算力。而每多一些用戶的使用,Kimi 就要承擔更多的壓力。
現在做產品,商業化是不得不面臨的問題,一來真正能夠靠補貼打開市場、建立網絡效應的產品機會不多了,朱嘯虎的投資風格不再適用了(硅谷那邊叫閃電式擴張,LinkedIn 創始人里德?霍夫曼專門寫了一本書),二來環境也變化了,資本市場的心態也發生變化了。能夠走得更遠的團隊,更要在意當下是不是走得更穩。
Kimi 這次商業化應當是在意料之中的,而且使用的方法很有意思,是盡可能不打擾用戶的方式,跟很多其它產品不同,不會在到處彈窗、或者用到一半要求付費(心理測試那一招,測試免費,拿報告花錢)。
算力不足時,在高峰期也想繼續使用 Kimi ,就可以用「加油」功能,是這樣的:
這是在場景上做了很多思考,找到的順滑切入方法。尤其對于第一種情況,相信是最常見的情況,在算力不足時提供一個選項,就像在很多市場環境中的快速通道策略,比如迪士尼的快速通行證。目前的價格我看了下,大概是處于 1.2-1.5/天 之間的提速價格,對我而言,在急用時也的確給了一個劃算的出口。點擊這個界面上的「換一個」,就能切換不同的價格選擇。
這個情況想必很難覆蓋多數用戶的場景,也不會是商業化比較完全的形態。能看得出來 Kimi 團隊的節制,當下的功能還是為了探索用戶的付費意愿,以及付費的恰當節點。真要是為了賺錢的話,貴互聯網行業有著千百種黑魔法能大幅提升轉化率——只不過就是放棄做品牌了,賺波錢就走。這種商業化的做法,也透露著一種年輕感。
我相信對于有的用戶來說,會有負面的情緒,這也很正常。只不過我作為一個產品人和內容創作者,還是很期待很多產品有更體面和更健康的商業模式。門口免費送包子的店有一天不免費了,我們也不該罵店主沒有良心,不是嘛。
說到最后,結論會是 Kimi 特別優秀,或者 Kimi 必然能成功嗎?也不是。哪怕說了這么多 Kimi 比較好,也只能說在 AI 產品市場里,Kimi 是起步比較快,甩開了一些對手,但終點還是很遠。Kimi 透露出來的年輕感,落在了用戶體驗、技術選擇、用戶溝通乃至商業化上,是件很有意思的事情。這種年輕感,也許能帶 Kimi 走得更遠,也許是一種更長期主義的走法。我也拭目以待。
參考:
半拿鐵 - 人工智能系列
《大模型未來發展:RAG vs 長文本,誰更勝一籌?》質樸發言
題圖由 Midjourney 繪制。Prompt:stars and universe, in rough colored sketching --ar 16:9 --v 6.0
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.