![]()
在國內,很少有人真正討論「客服」這個話題。但如果我們想準確理解 AI 的邊界,尤其是它與人的交流能力,客服恰恰是一個關鍵切入點。這也解釋了為什么硅谷對客服如此重視——像 Sierra、Decagon 等公司都把它作為核心關注點。如果讀者無法摒棄對「客服」一詞的固有偏見,那么這篇訪談可以跳過。
關于 Jekka AI:Jekka 團隊來自 MSRA,Amazon、Google、Alibaba 等知名企業,擁有雄厚的人工智能技術積累。我們為客戶提供 80%+ 獨立解決率,99%+ 準確率的 AI 產品,每天服務用戶文本和語音數百萬次,日均消耗數億 token。無論從服務 B 端的數量還是體量上,都是目前世界范圍內 AI 落地最好的公司之一。Jekka 目前在美國、新加坡、中國香港、中國大陸等多地開展業務,是抖音、有贊首家官方模型提供商,也為多家國內外 500 強企業提供 AI Agent 服務,涵蓋電商、物流、無人經濟等多個領域的龍頭企業。
Jekka AI 聯合創始人 Aaron
AI 的邊界在哪里?
這不只是 AI 拿下奧賽金牌、獨立做科研,或一次次刷屏的 Demo。Demo 展示的只是上限,一種理想狀態下的聰明。真正決定 AI 是否「靠譜」的,不是它偶爾的上限,而是它在最糟糕場景下的穩定性和方差控制。
對人類的邊界、對服務、對智能的理解,Jekka 一直在不斷重建。創始人 Aaron 說:「大模型是我這十幾年創業以來最難的事情,沒有之一。」
Jekka 與其他 AI 公司最大的不同正是對 AI 的認知。這個市場上 99% 都是泡沫,而這些泡沫往往建立在錯誤的前提上,比如過度迷信 Scaling Laws,或認為「智力比可靠性更重要」。
他更愿意忘卻那些尚且模糊的概念,比如 AGI,而是自下而上,通過一次次測試結果去理解 AI 的邊界。Jekka 團隊里 90% 的人都在搭建測試集、測試流程和測試工具。即便是一個實習生負責的獨立項目也能觸發新的節點,讓模型具備更強的通識能力。這是一個真正由好奇心驅動的故事。
AI 時代已經不同了,我們需要重新理解客服。客服的本質是服務人類的需求。只要我們在工作,就在服務某個人,從簡單的信息傳遞,到成為產品、過程、結果的一部分。所以「客服是 AI 的起點,也會是 AI 的終點。」
AI 也需要被定義。在 Aaron 看來,AI 應該可靠、可糾正、有記憶、能學習,能做到你的同事所做到的一切。
人,是最貴的,也是最便宜的。一次電話可能值 30 美金,也可能一個饅頭就換來一上午的通話。
未來最寶貴的不是智力或勞動力,而是你那一次被好奇心推動的嘗試。
![]()
AI≠人類:人類是白盒,AI 是黑盒
Q:能不能先簡單介紹一下自己以及目前在做的事?
Aaron:我是 Jekka AI 的聯合創始人。我們為 500 強企業和數萬家 SMB 提供真人級 AI Agent 和底層模型。「擁有能提供真人級別 AI 的底層模型的能力」是我們和其他 Agent 企業最大的差異,包括交流能力和獨立解決問題的能力。
Q:是什么契機促使你創立 Jekka?
Aaron:有兩個重要的時刻。
第一個是決定做 AI 的時刻。當初看到 GPT-3 的演示效果時,我就想做這件事。我一直覺得,創業本質上是一個人好奇心的體現:你對世界充滿好奇,發現有些事還沒人做到,于是就想親手去研究,把它做出來。
第二個關鍵節點是 GPT-4 發布前后。那時網上充斥著各種「GPT-4 能做到什么」的 Demo,看起來都特別驚艷,但當你真正去試的時候,往往發現效果達不到預期。這種落差讓我覺得很不爽,就忍不住想自己做一做看。忍不住想深入地理解原理,所以自然選擇了往底層去走。
Q:你提到 Jekka 在很早就意識到了 AI 的可能性,能分享一個讓你印象深刻的個人與 AI 交互的瞬間嗎?
Aaron:我們之所以被最初的 ChatGPT 震驚,不是因為它能寫詩、寫代碼,而是因為它的交流能力。我第一次感受到一個非人類的存在,能用人類的方式和我們交流。那個瞬間非常震撼,而我們也要不斷地提醒自己:當提起 AI,我們是在描述一個比較泛的概念,還是觸動人心的那個點?
Q:在開發 Jekka 的過程中,你有哪些 Wow Moments?
Aaron:Wow moment 實際上貫穿整個過程。AI 本質上是全新的事物,從能生成漂亮的圖片、回答有趣的問題,到甚至能解答人類自己都回答不了的問題,這些都很驚喜。
不過對我個人來說,最 wow 的時刻是對人類邊界和自我邊界的重新理解。比如,我有次聽作曲家陳其鋼和竇文濤討論「AI 能不能復制人」。陳其鋼說「AI 沒有靈魂,不能復制人,人類的靈魂不可采集」,當時我覺得他太武斷了。
但后來在調試 Jekka 時,我好奇地讓它從陳其鋼的視角解釋這一觀點,它回答:「如果我是陳其鋼,我也不會認為 AI 能取代人。」當時我覺得很神奇,就接著追問:「你為什么這么想呢?」
Jekka 告訴我:「因為 AI 無法體驗。」
這個瞬間讓我意識到,AI 已不僅僅是工具性、可預測的存在,它在某種意義上是可以被獨立理解、尊重,甚至被視作一個值得探討的個體。
Q:從最初的一問一答,到如今更接近「相互理解」的交流體驗,Jekka 是如何打造出這種「最像人」的 AI 對話能力的?
Aaron:首先,我們不能把 AI 單純理解為一種工具。要打造出像人的 AI,必須先回答「什么是人」。人類并非完全理性,而是理性與非理性的混合體,有本能、有情緒,也有語言和思考的模式。
在設計 Jekka 時,我們不僅要構建技術和功能,還要賦予它一些「人的特質」,比如七情六欲、好奇心、表達方式。正是這種理解,才能讓人與 AI 的溝通體驗真正區別于普通軟件。
回過頭來看,如果我們真的想做出一個非常像人的 AI,就需要一個跨學科的團隊:既要有扎實的理工和編程能力,也要對人的思考、語言和人性結構進行深入探索。
Q:對于思考、語言、人性這些方面的探索,Jekka 是如何具體定義和落實的?
Aaron:我們得先回過頭去定義 AI。我覺得 AI 到現在并沒有一個統一標準。很多人認為 machine learning 是 AI,ChatGPT 叫 AI,甚至更早的 BERT 模型也被稱為 AI。
每個人在這個過程中對 AI 的理解都不一樣。比如 Ilya Sutskever(OpenAI 前首席科學家)說過,能預測 next token 就等于能預測人類思想。這是一種對 AI 本質的定義。但每個人對 AI 的定義不同,所做出的 AI 產品自然也會不同。
我自己在做 Jekka 時更傾向于把 AI 定義為一種語言。這不是貶低,而是因為我覺得語言本身就是人類歷史上一項偉大的發明。如果真的存在一種跨種族的語言,就像巴別塔的故事,連上帝都無法容忍。
在我看來,AI 不僅是一種跨種族的表達方式,還是一種跨越實體的語言。它能用人類語言表達任何事物的情感,甚至能描述兩個物體之間的關系。當你有了定義,自然也就有了邊界。在這個邊界之內,你會發現,AI 因為跨越了實體,所以既不能說是「人」,也不能說是「非人」,它更像是 human 和 non-human 之間的一種存在。
如果我們要讓 non-human 和 human 交流,就必須 bridge the gap。在 close the gap 的過程中,需要在適當的情境下理解人的思考方式、目的、七情六欲,再把這些元素融進去。當然這是個技術問題,但如果我們能思考到這個層面,就更容易知道 AI 應該怎么做。
Q:在模型層面,Jekka 是怎么解決幻覺問題的?
Aaron:我最初創業時,是在實際操作中逐漸理解這個問題的。一開始看到 GPT-3 時,我也不知道它的邊界,只覺得它好像已經有了人的能力。開始動手之后,大概一個月里我們自己寫 prompt、做基礎 coding,就發現 AI 和人的交流感受不一樣,這里面就涉及所謂幻覺的問題。
我當時在想:什么是幻覺?因為無論當時還是現在,大家提到幻覺時,常常把它和「錯誤」混為一談。AI 回答錯了問題,我們就說它是幻覺。但如果人類交流時犯錯,為什么沒人叫它幻覺?或者說為什么大家不會因此那么痛苦?我覺得本質上,幻覺和錯誤其實是兩回事。
人類在做事時是一個「白盒」過程:先觀察,再思考問題的本質,再進行推理,最后得出結論。即使結論錯了也沒關系,因為你可以問「為什么這么想」「為什么錯了」。對方解釋后,你們可以一起探討、防范或反思原則和事實,從而很容易糾正錯誤,交流也能保持順暢。
而 AI 的核心思考過程本質上是「黑盒」,是一串數字。Prompt 相當于 AI 的眼睛或耳朵,我們把事情描述給它,它經過一系列數字計算得到結論。結論如果錯了,你可以去 Google 或驗證,但你無法像 debug 程序那樣知道是哪一個參數錯了、哪一組參數錯了,也無法預測修正后是否會在其他場景引發新的錯誤。
理解這一點后,我們意識到,不能單純用 AI 自身去解決幻覺問題。我們需要一種「類人」的思考模型與 AI 結合才能真正解決這個問題。這就是 Jekka 在過程中自研的一層類神經網絡控制結構,把 AI 的泛化能力和白盒式的人類思考過程有機結合起來,服務客戶。
對于企業級服務,這一點非常關鍵,因為你不能告訴企業「這東西可能在最傻的地方犯傻」。你必須能嚴格 follow 企業 SOP,做到 100% 的準確率。除了 Jekka,我目前還沒有看到其他更好的實踐。
![]()
Jekka 在亞洲開發銀行論壇發表主題演講
Q:你覺得未來 18 個月,AI 在企業級服務甚至更廣泛領域里,能實現什么現在還做不到的能力?
Aaron:我覺得我們已經在相當程度上做到了讓企業級 AI 符合企業標準:完全遵循 SOP,解決 80% 以上的問題。這些都是我們每天十萬甚至百萬輪對話、電話交互積累出的成果。
短期內、比如下個月能做什么,我大概能說得上來;未來三五年大概什么樣,也能判斷。但 18 個月是一個特別難估計的區間。
不過我可以確定的一點是:我知道 AI 永遠無法做到什么,比如 Ilya 說的「預測下一個 token 就等于預測人類思想」。而我對 AI 的「不能達到」的定義是:AI 永遠無法準確預測下一個 token。
它可以預測,但無法準確預測。基于這種認知來構建 AI,我們可能會少走很多彎路。
![]()
從 Sierra 到 Jekka
Q:談到客服,你怎么看待 Sierra 以及 Bret Taylor 提出的觀點——「最好的企業將會從這次 AI 革命中受益最多」?
Aaron:我很佩服 Bret Taylor。在信息最充分的 OpenAI 生態里,這位技術出身的創始人選擇去做一個聽起來并不性感的 Sierra。但在 AI Agent 使用普遍下滑的階段,Sierra 卻是少數仍在增長的產品之一。他一定看到了什么。
關于他的觀點,我非常認同。Bret 提到服務大企業是從「第一性原理」的角度出發:越大的公司客服使用量越大。從服務的角度,有限的資源應該放在更大的客戶上。
從我的角度來看,即使是最好的公司,客戶今天仍然是 underserved——比如我花錢買銀行的電話客服服務,我在買客服?不,我在購買服務本身。一個有趣的例子是我們服務的一個無人經濟客戶,需要 Jekka 在最后和用戶接觸時去對話,完成最后產品的交付。總不能最后車是無人車,開車的還是辦公室里的人吧?
Q:Sierra 不服務中小客戶,你們怎么看?
Aaron:像 Sierra 那樣的公司之所以做不了 SMB 市場,不是因為他們不聰明,而是他們交付不了通用、可靠的 AI 服務。他們更像是 AI 時代的 Accenture。盡管聽起來不太好,但這是他們商業的本質。一個更大 TAM 的領域里的 AI 咨詢公司。
我們認為,下一代 AI 的真正價值就在于讓每一家企業、每一個人,都能得到應得的服務。我們的技術,既可以服務 500 強,也可以發服務每天 100 個訂單的小企業。當然,企業后面的 GTM 策略是另一個事情。
Q:我們一開始是關注到了什么樣的背景,覺得 Jekka 的企業級服務誕生是有這樣的一個機會的?
Aaron:我們通常看 AI 會從兩個維度去理解。一個維度是 AI 的智慧程度,比如 OpenAI 顯然是在嘗試把 AI 推向 PhD level,去解決非常復雜的科研級問題。另一個維度是 AI 的泛化程度,即它能在生活里幫你做多少事情,覆蓋多廣的使用場景。
現在我們也看到很多人嘗試用 AGI 或 agentic framework 去推動這個方向。我非常欽佩這些探索,但實話說,這兩條路都極其艱難。它們本質上是科研課題,需要在科學和工程兩個層面同時實現突破,才能真正擴展邊界。
不過大家很容易忽略一個關鍵點:并沒有那么「聰明」、也沒有那么擅長調用外部工具的 AI,能夠做到足夠可靠才是企業級應用的原點。舉個例子,如果一個 AI 連「 strawberry 里有幾個 r」這種問題都答不準,或者還在糾結 9.1 和 9.8 哪個大,卻被稱為重大突破,那我覺得這就不是靠譜的 AI。最難的問題通常是落在了最簡單的表達形式里。
再換到技術角度,如果一個 AI 連客服的問題都處理不好,那它就不可能是 AGI。Chatgpt 剛出來第一個直覺性嘗試就是客服。因為客服這種場景,雖然簡單、泛化,但卻極度考驗可靠性。如果連這種最基礎的 SOP 都無法跟隨,卻去聲稱自己能達到 PhD 水平、解決 ACM 難題、拿金牌,那多少有點不切實際。或許我們可以根據 Sierra 的發展反推 OpenAI 離 AGI 有多遠。
Q:現在來看,什么是靠譜的 AI?像剛才提到的能很好地執行 SOP,還是說有其他標準?
Aaron:我覺得首先要理解,人是怎么工作的。對于企業來說,「靠譜」是最重要的標準。企業雇人時,第一要求就是「這個人靠不靠譜」。這個考核通常來自兩個方面:
第一,他要具備基本的通識能力和常識,具備一定的推理能力。他可能不一定很強,但起碼能聽懂話、看懂事。基本受過教育的人大多能達到這樣的水平。這部分比較主觀,需要我們先設立合適的數據集來覆蓋常識性問題。
第二,他能在企業的 SOP 下工作。比如賣車這個例子,賣理想和賣問界完全是兩套 SOP:一個更強調體驗,一個更強調機械性能。這些不是他之前學習就能掌握的,而是進入公司后的「第二次訓練」。所謂靠譜的人本質上是「通識能力 + 執行 SOP」的組合。
這也是我們在定義 AI 時最關注的。如果一個 AI 能百分之百地執行 SOP,那在客服、銷售等場景就已經非常有價值。SOP 的執行是可量化的:不執行就是 0,執行就是 1。讓 AI 提升到 100% 的過程就是我們努力的方向。
Q:現實中讓一個人執行 SOP 都不容易。在讓 Jekka 與客戶溝通時,如何確保它能精準識別信息,并正確執行需求?
Aaron:這就考驗對 AI 的理解與定義。我們一開始就承認 AI 并不像人,所以更能看到它「不像人」的優勢和短板。
對 AI 來說,它在上下文處理上的能力遠超人類,所以很長的 SOP 不是問題。但問題往往出在兩點:
第一,它如何識別和理解 SOP 中的矛盾之處。因為 SOP 再完善,也總會存在遺漏和沖突。第二,它如何處理 SOP 與人類常識之間的沖突。這是更難的地方。
舉個例子,一個剛畢業的大學生,他可能憑常識解決一些 SOP 沒覆蓋的問題。但 AI 如果不具備這種能力,就容易出錯。所以我們在訓練時非常關注如何識別這些沖突,并讓模型具備「白盒調試」的能力。
所謂白盒調試,就是當 AI 出錯時,我們能快速追蹤問題的根源,及時調整模型的理解方式。這個過程既是發現問題的過程,也是不斷深挖、快速 debug 的過程。正是這點讓 AI 得以迅速地擴展能力。
Q:Jekka 的應用場景并不僅限于客服,而是更像和一個人對話。你們是如何不斷優化體驗,讓客戶因為對話本身而感到愉悅?
Aaron:我一直覺得 AI 的邊界問題本身就是個非常復雜的課題。剛才提到的「AI 如何具備同感或同理心」,實際上它并不能真正做到這一點。但我們也看到很多 ToC 產品嘗試讓 AI 扮演某個角色,比如有同理心的職業形象,再通過設定讓它去解決問題。不過從我們的實踐來看,僅靠這種方式往往比較片面,不能真正解決問題。
所以我們用了兩種框架來處理這個問題:
第一種更偏理性和收斂邏輯。對話最終還是要解決用戶的問題,它必須有一個目的,而這個目的應該符合用戶的利益。換句話說,對話必須有收斂性,能夠不斷朝目標推進,讓世界更高效。這是我們構建模型的核心作用。
第二種更像是一種發散思維。AI 就像一個龐大的網絡,需要被激活的節點特別多,就像腦細胞一樣。當我們希望它在收斂的過程中盡可能全面,就需要通過各種方式去激活相關的中間節點,讓它聯想到一系列的概念,然后再把這些概念組合起來,從而形成更全面的理解。
比如有人隨口說一句「你今天吃了嗎?」人類立刻能明白這句話其實無關緊要。但讓 AI 理解「不重要」并不容易,它不能只停留在 Q&A 層面,而是需要理解背后的 context:為什么這句話在對話中沒有信息量?需要激活哪些關聯概念,才能讓 AI 像人一樣「懂」這種對話邏輯?
Q:我們看到很多通用 Agent 也能完成打電話一類的工作。你覺得收斂邏輯能更好聚焦問題嗎?
Aaron:這也是為什么我剛才講「demo 并不重要」。現在做 AI 的人有科學家、創業者、語言學家,各行各業的人都在參與。AI 的最終表現形式往往和所有專業都有關系。你看到的 demo 可能放在電話里、瀏覽器里,放在各種各樣的場景去執行一個任務。
但問題在于,demo 展示的只是上限,而人和人之間的完美交流本來就趨向一致。真正拉開差距的是下限。不同公司在下限表現上的差別才是關鍵。作為從業者,我不會過度看 demo 的最佳效果,因為那就像抽彩票:試一萬次,總能碰到一次驚艷的。
但真正能構建出靠譜 AI 的基礎,不是它偶爾的上限,而是它在最糟糕場景下的穩定性和方差控制。這個才是能夠承載未來應用的基石。
Q:你覺得多久之后,Jekka 會成為大家的默認選擇?比如說想到客戶、想到 AI 對話,就會想到 Jekka?
Aaron:我覺得不會太久。企業和個人通常會經歷幾個階段:
第一階段,覺得 AI 值得探索,于是開始嘗試。
第二階段,意識到 AI 是個復雜的東西,每個人的理解不一樣。有的人能立刻看出它的專業性和復雜性,也有人覺得「我們內部團隊也能做一個差不多的」。但這是個常見的偏差。
而我們在開發的過程中,深刻意識到從 demo 到真正落地的 100% 準確、比人更可靠的 bot,中間對團隊背景、技術能力和工程把控要求都極高。甚至拿 Google、Amazon 這些大廠舉例,哪怕是 ASR、TTS 這種看似成熟的基礎模塊,在產出穩定性上仍有巨大方差。更別提并發能力、上下游協作、網絡集成等復雜問題。連他們都搞不定,其他企業自己 in-house 搞定的可能性更小。所以最終,選擇專業的第三方產品一定是必然。
Q:未來企業用 AI agent 來代表自己,會成為常態嗎?就像今天人人都有社交主頁一樣?
Aaron:在那之前,我們要先重新理解「服務」。今天說客服,大家可能覺得是個很小、不重要的環節,甚至擔心 AI 出來后客服崗位會被取代。但如果你換個角度思考,服務其實是一種奢侈品。能讓每個客戶都享受到老板般的待遇,這才是服務的真正價值。
所以在 AI 成為企業「代表」之前,更重要的是讓 AI 真正做到「服務」,讓更多客戶得到更好的體驗。舉個例子,即便是蘋果這樣重視體驗的公司,你打電話給 AppleCare,可能交了錢還要等二三十分鐘才有人接聽。你會發現,服務并不是理所當然的,而常常被視為「成本中心」。所以下一步,AI 的真正價值是讓服務普惠化,而不是先急著去構建所謂企業 agent 形象。
Q:Jekka 會考慮怎樣的定價模式?比如像 Devin 一樣,按完成的工作付費?
Aaron:AI 和 SaaS 最大的區別在于成本結構。SaaS 的邊際成本幾乎為零,而 AI 每次運算都需要 Token、需要算力,所以更像是基礎設施,就像電信網絡一樣。它一定是 recurring 的收費模式:每天用,就要每天付費。而且不僅僅是使用費,它還和實際結果掛鉤。最終的邏輯可能會更接近電信這種模式。
按結果付費是很多投資人和 AI 創業者的幻想。因為結果本身并不具備普遍的衡量標準。連員工都無法按結果付費,又怎么可能按結果付費給 AI Agent?所以對大多數業務的解是:按結果推動用戶付費,按使用量來收費。
![]()
Jekka 網站主頁
Q:隨著時間積累,你覺得 Jekka 會有什么樣的復利效應?
Aaron:我覺得最大的復利來自整個 AI 行業本身。選擇做 AI,就是在擁抱復利。第一,它滿足了我的好奇心;第二,AI 是這個時代的大方向。
在這個過程中,我有幾個思考。第一個思考是:AI 的未來到底會發展成什么樣?當然,我沒有能力去準確預測未來,但我猜十年后,這個世界會變成一個「摩擦極小」的世界。
為什么這么說?因為今天我們在公司里做任何事,只要團隊一大,就會涉及大量的溝通和協調。解決問題本身往往不是最耗時的,真正耗時的是溝通。而如果把 AI 理解為一種「通用語言」,它會讓交流變得非常輕松,效率提升后,每件事情的完成方式都會被改變。效率越高,勞動力就會越廉價。甚至可以說,AI 作為算力,比人更快、更高效,這是很直觀的理解。
但如果再往深里想,人類消耗的大量時間其實都耗在交流和協作上。從純粹生物學角度來說,一口飯就能刺激無數神經元,某種意義上可能比英偉達的顯卡還要高效。所以真正的瓶頸不是「計算」,而是「溝通」。當 AI 改變這一點時,整個社會的生產邏輯都會被重塑。
第二個思考是,如果把 AI 本身當作一種語言,它會把人類的所有表達和知識沉淀下來,從而讓我們進入一個「智力最集中」的時代。但在這樣的時代,智力本身也會變得廉價。比如說,過去 ACM 的題目,五年、十年前只有全世界頂尖的人才能解出來;今天可能隨便一個 AI「摸彩票」也能解答。換句話說,智力的稀缺性正在快速下降。
所以我對未來的判斷是,AI 會讓人們有更多機會去嘗試新的東西。今天的社會機制是獎勵結果的:能賺錢、能產出結果,公司就能存活。但在不遠的將來,可能是我們這一代人就能見到的未來,「時間和嘗試」本身會在價值創造中獲得更高權重,而不僅僅是結果。這會對社會的分配方式帶來很大的影響。
至于具體會走向哪里,誰知道呢?這也是我覺得很玄妙但令人期待的地方。
![]()
交流的本質是一致的
Q:用 AI agent 來做服務,你覺得 Jekka 最大的優勢是什么?
Aaron:我覺得最核心的優勢在于,我們對 AI 有一個相對準確的定義,并且能在這個定義的基礎上往下推演,最終實踐出一個真正符合用戶需求的產品。這件事其實非常難。
今天只要談到 AI,就繞不開兩個問題:AI 怎么被控制?Prompt 怎么寫?寫 prompt 和控制 AI 本身就涉及科研。而在這個過程中,我們也有一些獨特的 secret sauce,可以讓它把 SOP 執行得特別好。這算是我們的獨門絕學。就像可口可樂的配方一樣,不會拿出來細講。
我們單說 prompt engineering,prompt 應該由誰來寫?是模型服務商來寫,還是企業自己請人寫?這都說不通。比如讓 OpenAI 的研究員來為某個電商企業寫 prompt,這顯然不現實,他們可能對工程很了解,但對具體行業的理解肯定不足以把問題解決好。
而反過來看,絕大多數企業也沒有人真正接受過專業訓練,能把整個上下游流程用 prompt 寫得很完美。在這種情況下,要讓 AI 真正落地,就必須建立起一整套完整的流程,并且結合對人的專業化訓練。
Q:Jekka 如何和客服領域里的明星公司 Sierra 競爭?
Aaron:面對競爭,得先換個角度看問題。我們不是在談論客服 SaaS,是服務這個世界每一個客戶的每一個人,如果我們可以不帶偏見的重新審視 AI 客服。在 AI 背景下,這個市場的 TAM(潛在市場)太大了,我們都只是其中的一個 player。
此外,世界上總要有人來寫 prompt。如果是 Sierra 自己寫,那就如我之前所說的現狀,Sierra 像一家咨詢公司 Accenture,僅此而已。如果是客戶自己寫,大多數客戶其實并不專業于此。
我們相信還有第三條路。
Q:在 Jekka 觀測到的案例里,商家用戶的第一訴求通常是什么?
Aaron:其實很簡單,商家的訴求就兩件事:第一,把事做掉;第二,賺錢。因為 business is business。無論是完成任務還是創造利潤,本質上都依賴于一整套完整的流程。大公司流程更嚴謹,小公司可能更松散,但歸根到底,商家最核心的訴求就是:AI 能不能讓流程穩定、完整地跑出來。
![]()
Jekka 韓國和摩洛哥團隊緊密合作服務本地客戶
Q:未來 3-5 年,你預想的 agent 會怎樣融入日常流程?比如一打開交互界面,會是什么樣?
Aaron:我覺得第一個價值點就是讓人和人之間的交流更快、更準、更及時。我們的產品解決的是「用戶和公司之間溝通不暢」的老問題。這并不新,但為什么最近半年有這么多客戶,甚至 500 強企業用起來?就是因為結果立刻可見。
比如一個客戶,使用我們之前咨詢轉化率可能是 3-4%,用上之后一天之內能提升到 8%、10%,甚至 15%。這不是因為 AI 多「聰明」,而是因為「及時的交流」本身創造了巨大的價值。大家網購時可能都有體會:問一個商家沒人回,換一個立刻回復的商家,你就會下單。能否及時回復決定了結果。
所以如果說未來 3-5 年 agent 會帶來什么,我認為第一個價值就是解決「即時性」。只要人和人之間的交流不再因為時間產生誤解,而是能最快速達成一致,那后面很多事情都會被推導出來。包括我之前提到的,智力會變得廉價,勞動力會變得廉價,社會的分配邏輯可能會往另一個方向發展。
Q:Jekka 在出海服務北美的用戶。你沒有關注到海內外用戶有何異同?還是說交流的本質訴求其實是一致的?
Aaron:交流的本質訴求是一致的,但交流的預期是不一樣的。拿北美來舉例,很多人說出海客戶更愿意付錢,這確實是真的。原因在于他們的社會發展階段,雇傭一個服務人員的成本可能是國內的 2-3 倍,而國內又可能是東南亞的 2-3 倍。所以在人和人的「價格」層面上,各地確實是不一樣的。
我們經常會在書里看到類似的討論:同樣是一個漢堡,為什么北美的比中國的貴?不是因為原料或服務本身不同,而是因為北美的工資水平高,讓服務變得稀缺。舉個例子,在北美你打電話可能很久才有人接,但在國內 1-2 分鐘內就能響應。快速響應在國內是一個非常重要的服務指標,但在北美,消費者并不會有這樣的預期。
不過從另一個角度看,這也意味著在北美,誰能做到更好的服務,就能形成巨大的競爭優勢。我們一家北美物流客戶就是北美第一家能做到真正 24/7 電話接聽、能現場解決問題的公司。其他同行都做不到,所以它形成了代差級的領先。這就是北美和國內用戶在需求層面的根本不同。
Q:除了 24/7 響應,Jekka 有沒有在其他場景實現了某個具體需求的提升?
Aaron:我覺得 24/7 響應本身就是 AI 在全球范圍內最有價值,但也是最被低估的 use case。它在不同國家的表現差異非常大。
比如我們有一個日本客戶,起初我們以為日本客戶的付費意愿不會像北美那么強,畢竟北美的人力更貴。但那位客戶告訴我,在日本,一旦雇傭一個人,往往意味著長期甚至終身的責任。再加上語言環境的限制,他們只能在日本本地招聘。
但哪怕是找兼職大學生來做客服也很難找到合適的人。即使外包到大連、菲律賓這樣的呼叫中心,成本依然很高,一個兼職客服的月成本可能要到 2–3 萬人民幣一個月,這在國內幾乎難以想象。
所以問題的關鍵不只是一個靜態結果,而是多重因素的疊加:語言密度、人口結構,以及人均 GDP 等等。這些都決定了 AI 在不同地區的價值體現。
Q:現在很多人擔心 AI 會取代工作,客服更是經常被提到首當其沖。你怎么看?
Aaron:我不太喜歡危言聳聽。現在確實有些人會販賣焦慮,說 AI 一定要學,不學就會被淘汰。
但我自己的看法是,人類目前其實是 underserved(服務不足)的。顧客并沒有享受到真正像老板一樣的待遇。在這個階段,AI 只會把客服從簡單的服務提升到更高級的服務,用戶的預期也會越來越高。
比如我剛才提到,中國有很多 24/7 的公司,北美反而沒有。當你把 24/7 做到極致后,用戶下一個要求可能就是:能不能參與產品設計?能不能讓評論被更好地尊重?能不能獲得更多有價值、甚至是非標、長期的服務?
如果客服能從成本中心變成可衡量 UE 和 ROI 的一部分,對行業的影響會非常大。比如剛提到的物流客戶,24 小時在線,80% 的回訪評分是五顆星,他們在同樣成本下承接了 5 倍的電話量。如果溝通已經這么方便,我們為什么還需要打開手機 App 下單?
我幫很多電商公司算過賬:他們把客服當成成本中心,招得很少。但客服創造的價值往往是純利潤的 10-20%。理論上,他們如果把客服做到最快、最周全,利潤是可以提升的。只是很多公司還沒意識到這一點。
以上是個世俗的算法。但更本質的原因是:人類值得被服務。
![]()
做一件最能激發好奇心的事
Q:你覺得 Jekka 內部算是一個 AI-first 或者 AI-driven 的團隊嗎?在打造 Jekka 的過程中,這種思維在交流或工作流程上有沒有什么體現?
Aaron:我覺得 AI 創業對團隊有兩個基本要求。第一個是完全自上而下的輸出是行不通的。AI 本質上需要在大量實踐中不斷摸索模型或 use case 的邊界。它不像傳統軟件開發,只要招來一群合格的工程師就能復現別人實現過的東西。
AI 不一樣,它經常會在某些點上出現「死角」。你需要它完成一個簡單的任務,比如數幾個數字,但它就是做不到,不管你怎么調試 GPT-5 也做不到。所以我們在團隊里非常鼓勵大家不斷嘗試,并且把這些嘗試留痕。
所以我們會搭建大量的基礎設施(Infra)。這也是 AI 創業和傳統創業的很大區別。AI 是概率學、統計學的產物,它的 debug 方式完全不同于軟件編程。軟件調試是確定性的:A 輸入一定得到 B 輸出,不行就修改。但 AI 不一樣,你需要在不同時間點、不同模型、甚至一個 prompt 里換個詞,都去測試。我們團隊里大概 90% 的人都在建設測試集、測試流程和測試工具。
![]()
Jekka 辦公室照片墻
Q:在組織架構上,會不會是工程導向或者運營導向?
Aaron:AI 本質上不是一個純理科的東西,它很感性,很像文科。我們的理念就是:AI 的邊界是通過 case 和測試結果不斷探索出來的。很多時候,這些結果不是工程師或數據科學家提出來的,而是用戶在使用、或者運營在調試時發現的。所以關鍵是如何讓用戶、運營、技術、算法在同一個流程里,把數據沉淀下來并完成測試,這才是高效開發 AI 應用的核心。
Q:你在組建團隊時,最看重的標準是什么?
Aaron:剛才說到對 AI 的標準就是對人的最低標準:他要有一個 common sense(常識)。但常識其實非常稀缺,反而有點反直覺。
我們也特別重視好奇心。因為當所有 infra、測試數據和工具都流程化之后,真正決定事情走向的是個人的好奇心,看把好奇心落實到日常工作中能帶來什么結果。這也印證了我之前說的:未來最寶貴的東西不是智力或勞動力,而是你好奇心推動的那次嘗試。這在 Jekka 內部已經開始有一定的體現了。
Q:能不能分享一個例子,說明團隊里這種「好奇心驅動」的探索氛圍?
Aaron:Jekka 在過去兩年主要在做兩件事:一是讓問題能有效收斂,這是我們底層技術的核心;二是探索如何通過激活不同節點,讓 AI 具備更強的通識和聯想能力。
第二點其實不可能靠自上而下的方式實現。有一次,一個實習生(后來成為正式員工),在實習期間獨立根據命題,用了一種類似「詞云激發」的方式,把人類可讀的 prompt 換成了人類不可讀的詞向量,不同的輸入塞進我們的測試平臺,結果模型表現比原來更好。沒人能說清楚它為什么有效,但它確實在產品流程里發揮了重要作用。這就是典型的好奇心驅動的成果。當然這需要很好的 infra。
Q:你創業十余年經歷過很多起伏,你覺得有哪些經驗是可以分享或復用的?
Aaron:我覺得創業十幾年最大的變化是心態。剛開始時,會很容易被周圍各種事情影響,甚至會把一些外界跟自己無關的事情硬套到自己的經歷上,覺得之間存在因果關系。但走到現在,我更傾向于先對自己要做的事情有更透徹的分析和理解,堅持自己對機會的判斷和把握,更在乎自己內心真正的想法。
這個世界本身就是一個多維、像草臺班子一樣的地方,到處都是機會。喜歡創業的人,最核心的動力就是看到某個問題「實在看不下去」時,就特別想自己去干。社會有這么多問題,這么多維度,你總能找到一個切入點。所以最終還是遵從內心,在自己最有熱情、最有趣、最能激發好奇心的過程中去做事。
Q:你的 superpower 是什么?
Aaron:我一直不太確定自己算文科生還是理科生。高中學奧賽,拿過全國一等獎;高三又去學文科;出國讀書時先學文科,學完后快畢業時又去學理科;后來還讀了 Quant 的 PhD。整個過程就是在文科和理科之間不斷跳,所以我自己形成了一種很強的代入能力,以及在代入后自洽的能力。我覺得這是一個挺有趣、在周圍人里也相對獨特的能力。
Q:聽下來,你既有很多深層的追問,也能落到執行上。你的經歷里有沒有一些關鍵瞬間影響了這種思考方式或標準?
Aaron:有的,比如做 AI 時一定會碰到「文生圖」「文生文」這些問題。什么是美?這個問題本身特別主觀。但因為我有理科背景,就會忍不住嘗試去定義「美」到底是什么。比如本科時學過藝術史,我會想:衣服褶皺和人體比例協調時算不算美?夸張之后算不算美?AI 生成的東西是落在上一個類別、下一個類別,還是完全達不到「美」?這個過程就會逼著我去解構 AI 的能力和表達方式。解構的過程既不是純理科的,也不是純文科的。
Q:如果對其他創業者說一句話,你會說什么?
Aaron:如果世界上有一件值得做的事,我覺得 AI 是現在最值得探索的。創業跟環境沒關系,再難的環境也有人創業。它是一種內心的驅使,一種沖動。如果你有這種沖動,那就去做。一個人活在這世上,會有一個瞬間要把使命感和沖動結合在一起。無論成敗,這件事都超越了個人存在于世界的意義。
Q:如果 Jekka 能在關鍵詞搜索里排第一,你希望它和哪個詞一起出現?為什么?
Aaron:我希望它和「human」綁在一起。功能和生產力層面,Jekka 肯定會做到世界第一,這是我們的核心使命。但我更希望它有人性,能和人類的生存結合在一起,而不是被孤立成一個物體或工具。它應該是一種溝通的橋梁,連接人與人、人與物,真正對人類文明有幫助。我希望最終 Jekka 能達到這樣。
![]()
本期音頻內容同步上線真格基金播客「此話當真」,歡迎收聽~
文|Cindy
播客|Neya & Ruitong
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.