網易首頁 > 網易號 > 正文申請入駐

Kimi 試水商業化，年輕產品如何長期主義？

2024-05-17 21:11:23　來源: 后廠村的劉飛

浙江舉報

分享至

我一直有個觀點，即 AI 只是技術，并不存在特定的產品，只要用了 AI 就能成立的。AI 產品包括了是否洞察了用戶需求、是否發揮了技術優勢，也包括怎樣與用戶溝通（運營）。這些也都跟 AI 產品背后的團隊氣質有關。

從 ChatGPT 引起科技行業軒然大波已經過去一年了，國產 AI 產品我也試用過了很多，感受比較強烈的還是 Kimi Chat，這是個很不一樣的產品，尤其背后的團隊 Moonshot 也很不一樣。

這個不一樣從名字就開始了，「月之暗面」就是 Pink Floyd 的經典專輯，這個封面可能也是搖滾史上的經典。我自己是黑膠愛好者，也有這張專輯，放在書架上，很喜歡。

技術不是做數學題、不是寫多少行代碼那么簡單；也不是有了好技術，就一定等于有好產品。正好這幾天在用 Kimi Chat（下文簡稱 Kimi）的時候發現他們上線了加油的功能，就趁機以它為載體聊一聊這個話題。

1 需要技術，也需要用戶場景

Kimi 是國產 AI 產品里最受關注的之一，根據我看到的一個統計（similarweb），Kimi 的 Web 端訪問量在 TOP2，一度超過了文心一言。

在 Apple Store 的免費榜里，也曾沖到過 AI Chat 類應用的 TOP3，另外兩家是百度和字節的產品。Kimi 也是「小廠」中最受矚目的一個。

估計很多沒用過的朋友也不太能理解為什么 Kimi Chat 能有這樣的熱度，有的會認為就是投放的效果（當然跟投放有一定關系）。

大模型本身是技術，并不代表用戶場景。跟所有用戶產品一樣，Kimi 也首先滿足了特定的用戶場景。

Kimi 能聯網獲取信息，是搜索引擎的替代品，而且是體驗更好的替代品：在原始網頁基礎上做了初步的整合。

我在之前的文章里聊到過，搜索引擎看似用關鍵詞搜索已經門檻很低了，要找到真正對應的內容，還是有難度的。

如果你去觀察身邊的老人，就會發現，他們壓根不會用關鍵詞去搜索。而是用完整的句子，也就是自然語言表達。

我們隨意在國內最主流的搜索引擎輸入一個詞，從聯想出來的常見輸入語，就能看得出來。

而這些完整的句子，很多時候未必能搜索到最準確的內容，要仰賴分詞技術。對于搜出來的結果，哪些跟搜索語相關，也需要有判斷。這也是為什么之前虛假廣告大行其道，因為很多人會自然地點擊前幾個結果頁面。

還是不要小看互聯網對于多數人的門檻。很多技術出身的朋友恨不得所有人都會寫爬蟲、自己操作腳本去獲取信息，瞧不上看起來沒有什么技術含量的 Kimi，認為不存在需求。這是忽視了人群和場景。

當然，現在的聯網搜索功能，還沒有那么理想。我自己的使用體驗，60% 能得到順暢的結果，不用再切換工具了，在當前的 UI 內就能得到足夠的信息。40% 的情況可能還要去原始網頁看看，或者在搜索引擎繼續搜集材料。

2 需要技術，也需要用戶體驗

用戶體驗，看起來是一個很虛頭巴腦的說法。但正因為它抽象，很多人也就忽視了。體驗實際上是囊括在很多小地方的，很多團隊要做用戶體驗地圖，一張圖拉出來，一百個用戶觸點，每個觸點都值得推敲、值得深究。

我體驗到的 Kimi 的這種小的特點至少包括：

響應快，出字就是比多數別的產品快，等待時間正好在可接受的范圍里。
界面簡潔。這個有點見仁見智，從我的視角看，首頁里塞的東西沒有讓我很反感；頁面也沒有一堆邊欄。
使用方便。多數 AI Chat 產品需要登錄才能使用；有的 AI Chat 產品無法查看信息來源網站；有的 AI Chat 不能讀取網址；...
效果不錯。從最終效果來看，Kimi 已經能在某些情況下替代 ChatGPT（GPT-3.5）了。不要相信別的國產大模型說早就超過 4 了。能在部分情況下接近 3.5 已經是極限，說明在一線水平。

對我而言，Kimi 能在我對某些問題無從下手的時候，提供非常好的引導作用。比如，我對日元貶值的問題感興趣，就可以得到這樣的回答：

再比如，我對不同的標普基金的漲跌情況不同，有比較大的疑問：

在搜集材料時，效率也的確比搜索引擎要高出很多，比如想了解 Zara 歷史上是否有知名的語錄：

在播客「半拿鐵」的創作過程中，我跟瀟磊對 Kimi 的使用率是不低的。瀟磊主講的節目，會用 Kimi 來做全文的摘要整合。

我在之前做的純主觀測評里，Kimi 在搜集信息和整理文稿方面，表現突出。

我在 3 個多月前就發了這么一個貼，說明我不是這兩個月 Kimi 火了才要蹭熱度的：

3 年輕的技術：長文本

在用戶需求和用戶體驗背后，Kimi 有自己更年輕的想法，這個想法就是長文本。

Kimi 是國內第一個提出和推進長文本概念的。在 Kimi 之后，通義千問、文心一言都紛紛加入了戰局，推出了適應長文本的功能。

長文本是對應 RAG 的一種技術概念，RAG 是 Retrieval-Augmented Generation，直譯為檢索增強的生成技術。

簡單理解，RAG 是得到了一個問題（用戶的輸入），可以去數據中進行檢索，把相關的數據做整合，再進行輸出。像是查字典的邏輯。當然 RAG 涉及的并不是單一技術，還包括如何切割數據、提取數據、檢索數據等等。

RAG 在處理明確的問題時效果拔群，比如「今天天氣怎么樣」。在一些嚴肅的場景中，RAG 也能更好地搜尋到信息，比如法律、醫學相關領域。

不過 RAG 有個天然的缺陷，即無論是輸入，還是輸出，文本過長的情況下，就很難有滿意的效果。

長文本相對而言能解決輸入和輸出長度（token 數量）的問題，因為它是用完整的數據建模的，而不是有了輸入再去檢索。讓長文本模型閱讀一本長篇大作、書寫一篇論文、幫助思考和推理，都是可以實現的。

我也終于排隊排上了 Kimi 的 200 萬字長度的長文本功能試用，把多年前的兩本書《從點子到產品》和《產品思維》投喂給它，讓它分辨異同，以及給出用戶場景的案例。從結果的信息看，是相當準確的。

長文本和 RAG 是技術路線的分歧，而選擇長文本，自然就是假定了一個用戶需求的趨勢：用戶并不只是簡單從搜索引擎搜搜東西而已，可能要用大量的文檔里獲取信息，也可能完成大篇幅的創作。

坦白說，目前的大模型的內容生成，對我這樣的內容創作者來說，還沒有達到標準。獲取信息是可以的，但要能夠直接采用，還有距離。文本的細節相對比較粗糙。

不過我搜集了一些投資人、學術界和工業界的觀點，相對一致的是，都認為長文本未來的機會是足夠大的。無非是在多大程度上替代 RAG。

我自己的感受是，如果有技術已足夠成熟的長文本輸入和輸出的用戶側產品，那么就可以覆蓋一個非常好的場景，即垂直知識庫：

博物館可以自建知識庫；
每本書可以有自己的知識庫，有多本書的作者也可以整合成一個知識庫；
個人自己的日記庫，哪里發生了什么，直接講給對方聽；
某地旅游的知識庫，或者當地生活信息的知識庫；

這類產品目前也存在，也有很多開源技術可以用，不過還是話說回來，能夠用開源技術自建模型，和使用體驗優異的用戶產品，門檻高低會直接呈現在用戶的規模和商業價值上。

這是 Kimi 選擇長文本的邏輯，也是一種長期主義的做法。如果只看當下的使用效果，可能 RAG 就足夠了，但要想布局以后，長文本會更有機會。

這是一個年輕的技術，也意味著這是一個有成長機會的技術。

4 年輕的用戶溝通方式

了解大模型的朋友就知道，數據是大模型的核心壁壘之一。而為什么 ChatGPT 的產品路線被大家認同，過去 Google 那種在公司實驗室里養蠱的方式就不再受歡迎，就是因為有了用戶的參與和真實的使用數據，產品迭代就成了有源之水、有本之木。

Kimi 很有意思的地方在于，它也有了特別的社區氛圍。你可能會疑惑：沒有在 Kimi 的官網看到社區啊，哪來的社區氛圍？

我一直認為，社區出現不在于形式，而在于是否有實際的真實成員、以及成員之間的交互。就像某個短內容平臺，每天用戶上億，但用戶之間從不發私信，只是給網紅點贊，就稱不上社區。

Kimi 的社區更多發生在小紅書、即刻這些內容平臺。以我熟悉的即刻為例，就有很多用戶自發分享使用方法（篇幅有限，截取部分）：

還有 Kimi 的產品經理自己予以總結和引導（原帖有 31 條，截取部分）：

這些是格外有價值的一些傳播。

日常的投放只能做到讓人留下印象，更多只是物料。這些自發出現的 Kimi 的用戶，能夠沉淀很多內容，不光帶動更多人關注 Kimi，還能更好地使用 Kimi，乃至參與到其中。官方在即刻出現這些內容后，也動作很快，不少員工入駐，共同討論。

不止是讓 Kimi 有傳播，不止是一種低成本的營銷策略，也同時能幫助一個 AI 應用層的團隊，去研究有哪些真實的場景和真實的問題。這是通往真正殺手級應用不可或缺的一條路徑。

這種年輕的狀態，背后是年輕的團隊。

5 年輕的團隊沒有包袱

產品的年輕感是個很玄的事情，這背后與團隊的年輕有很大關系。可能是我自己接近中年，產生了一些偏見，我始終覺得年齡也與能否在新技術要素出現的時候創新，有很大關系。

我這兩年讀各種歷史故事比較多，發現歷史上也不斷重演這種故事。只有沒有歷史包袱的年輕人，才能在新技術要素到來時更沒有負擔。我認識的幾個產品經理就加入了 Kimi，他們在職場上不太成熟，在產品架構上也經驗有限，這在創業的時候反而變成了優勢，前面說的，不管是選擇更有挑戰性的技術，還是選擇更新穎的用戶溝通方式，都是如此。

在 AI 領域也是類似，不同時代的專家，都會被新的專家顛覆。明斯基、麥卡錫這些創立了人工智能的老前輩，就被后來的杰夫·辛頓、楊立昆、本杰奧的技術路線給顛覆了。如今 OpenAI 帶來的技術路線又很不同，Llama 3 又作為后來者引起很多轟動。都在驗證，創新者還是要更年輕。

是挺殘酷的一個認知，畢竟也把我自己劃出了圈。總的來說，我個人更喜歡年輕的團隊一些，很多經歷過移動互聯網，甚至有的經歷過完整 PC 互聯網時代的產品經理，他們主持的項目，我反而可能不太看好。

對于 Moonshot 和 Kimi，值得關注的還有它的創始人楊植麟。對于他的一些介紹，我早先了解的不算多，每次看到標題說「天才少年」「XXX 親傳弟子」就有點祛魅，不愿打開文章細讀。后來多了解了一番，發現背景的確很好。我在這里把水分擠干，寫幾條供參考：

CMU（卡耐基梅隆大學）博士畢業，這是 AI 領域的幾座大山之一；
是年輕學者中 NLP 相關領域被引用論文次數最多的之一；
曾經在 AI 最前沿的公司 Meta 和谷歌大腦任職；
蘋果 AI 負責人 Ruslan Salakhutdinov 曾是其導師；
與楊立昆和本杰奧都共同發表過論文。

如果聽過我在「半拿鐵」的人工智能系列講過的歷史故事就知道，Meta（Facebook）的 AI 實驗室、谷歌的谷歌大腦團隊都屬于 AI 發展歷史上最有影響力的團隊。而楊立昆和本杰奧不僅僅是圖靈獎得主，他們還是新時代 AI 領域的宗師，都屬于深度學習的重要創始人。

6 商業化才能走得更遠

我們都能感受到 AI 還尚未出現互聯網時代的殺手級應用，形態如果是 Chat 好像也別別扭扭。相當于大家跑了幾十米出去，看不到終點，終點是在百米，還是千米，還是半馬，誰都不知道。

考慮到奔跑中的持久度的問題，最關鍵的就是能跑下去，也就是能生存下去，這就回到了開頭提到的商業化。

對于 AI 產品，與很多過去的互聯網產品很大的區別在于，邊際成本還是略高的。前陣子用戶涌入，就一度擠爆了 Kimi 的服務器和算力。而每多一些用戶的使用，Kimi 就要承擔更多的壓力。

現在做產品，商業化是不得不面臨的問題，一來真正能夠靠補貼打開市場、建立網絡效應的產品機會不多了，朱嘯虎的投資風格不再適用了（硅谷那邊叫閃電式擴張，LinkedIn 創始人里德?霍夫曼專門寫了一本書），二來環境也變化了，資本市場的心態也發生變化了。能夠走得更遠的團隊，更要在意當下是不是走得更穩。

Kimi 這次商業化應當是在意料之中的，而且使用的方法很有意思，是盡可能不打擾用戶的方式，跟很多其它產品不同，不會在到處彈窗、或者用到一半要求付費（心理測試那一招，測試免費，拿報告花錢）。

算力不足時，在高峰期也想繼續使用 Kimi ，就可以用「加油」功能，是這樣的：

這是在場景上做了很多思考，找到的順滑切入方法。尤其對于第一種情況，相信是最常見的情況，在算力不足時提供一個選項，就像在很多市場環境中的快速通道策略，比如迪士尼的快速通行證。目前的價格我看了下，大概是處于 1.2-1.5/天之間的提速價格，對我而言，在急用時也的確給了一個劃算的出口。點擊這個界面上的「換一個」，就能切換不同的價格選擇。

這個情況想必很難覆蓋多數用戶的場景，也不會是商業化比較完全的形態。能看得出來 Kimi 團隊的節制，當下的功能還是為了探索用戶的付費意愿，以及付費的恰當節點。真要是為了賺錢的話，貴互聯網行業有著千百種黑魔法能大幅提升轉化率——只不過就是放棄做品牌了，賺波錢就走。這種商業化的做法，也透露著一種年輕感。

我相信對于有的用戶來說，會有負面的情緒，這也很正常。只不過我作為一個產品人和內容創作者，還是很期待很多產品有更體面和更健康的商業模式。門口免費送包子的店有一天不免費了，我們也不該罵店主沒有良心，不是嘛。

說到最后，結論會是 Kimi 特別優秀，或者 Kimi 必然能成功嗎？也不是。哪怕說了這么多 Kimi 比較好，也只能說在 AI 產品市場里，Kimi 是起步比較快，甩開了一些對手，但終點還是很遠。Kimi 透露出來的年輕感，落在了用戶體驗、技術選擇、用戶溝通乃至商業化上，是件很有意思的事情。這種年輕感，也許能帶 Kimi 走得更遠，也許是一種更長期主義的走法。我也拭目以待。

參考：

半拿鐵 - 人工智能系列

《大模型未來發展：RAG vs 長文本，誰更勝一籌？》質樸發言

題圖由 Midjourney 繪制。Prompt：stars and universe, in rough colored sketching --ar 16:9 --v 6.0

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.