![]()
這才是打工人期待的AI
寫下這段文字時,我正在歐洲出差。來的路上我一直在想:現在的AI,到底是在幫我們,還是在折騰我們?
過去幾年,AI的發展路線大致分兩派:一派是“大力出奇跡”,猛攻大模型和算力;另一派是“精準打擊打工人”,搞得腦力勞動者焦慮情緒拉滿,擔心自己被機器替代。
在這種宏大敘事里,總感覺少了點什么東西。
AI浪潮呼嘯而來,科技博主每天都是“后背一涼”“頭皮發麻”“徹夜難眠”。然而,很多離工作、生活很近的真實痛點,始終沒有被解決。
舉個直觀的例子,這次出差去摩納哥,是為了參加一個國際美容抗衰老大會,途中發生了一件非常尷尬的事情。我在機場和幾位行業里的醫生會和,其中一位熱情地說,前幾天線上開會時跟我聊得特別開心。我在腦子里搜索了半天也沒對上號,只能假裝兩個人很熟。
尷尬產生的原因并不復雜:在之前的線上會議里,他們幾個人是用同一臺設備接入。因為在同一個物理空間里,多個設備同時開麥會產生刺耳的嘯叫。
于是,會議界面永遠只有一個頭像,很難分清誰是誰。
類似的場景讓我深刻感受到,真正值得稱贊的科技進步,或許不是看起來高大上的炫技,而是俯下身去,解決那些被長期忽視的痛點。
這聽起來似乎很不性感,卻是AI應用繞不開、也不應該繞開的一條路。
就在今天,我發現騰訊會議悄悄推出了一個叫「聲鏈」的新功能,剛好精準狙擊了這個痛點。它把過去大公司砸錢買硬件才能享受的音頻體驗,通過AI技術封裝成了一套輕量化的軟件方案。中小企業打開就能用,拾音音質和嘯叫困擾,被溫和、低成本地解決掉。
或許,這才是大家真正期待的AI。
![]()
拍攝于摩納哥
![]()
嘯叫這顆隱形“炸彈”
被聲鏈拆掉了
我的行業特性決定了,經常要和不同的人開線上會議。其中有兩個最讓人心煩的瞬間:一個是信號不好,聽不清對方在說什么;另一個就是嘯叫,那種刺穿耳膜的聲音非常破壞溝通心流。
嘯叫產生的原理很簡單:多個人同在一個空間開線上會議,你對著電腦說話,聲音通過網絡傳到同事的電腦揚聲器,又被你的麥克風收了回去。循環往復,信號不斷被放大,最后就變成了尖銳爆鳴。
大公司的解法,通常是在會議室配置比較貴的專業設備,但這樣的成本支出對于中小企業并不友好。于是,更常見的做法成了“肉身妥協”——同處一室的人,永遠只能用一臺電腦接入會議。
這種妥協背后,是一連串非常破壞體驗的連鎖反應。
比如,大家圍著一臺電腦,離得遠的同事收音很受影響,最后只能像擊鼓傳花一樣,誰說話就把電腦推給誰。更可怕的是參會人互相不熟,頂著一個頭像很容易分不清誰是誰。過后看轉寫紀要也是一樣,身份就像開盲盒。這又會觸發另一個隱藏Bug,導致會后的AI總結無法很好地發揮作用。
每一個人的每一次發言,都是AI理解和分析這場會議的關鍵“原料”。如果AI無法清晰、準確地“聽到”每個人的發言,就難以根據每個人的真實意圖,高質量交付總結梳理等任務。
硅谷有一個非常火的概念叫做Context Engineering(上下文工程),AI和Agent工具好用與否,模型本身很重要,但真正決定最終輸出質量的,是它能看到多少Context(上下文)。一個不起眼的嘯叫問題,其實也在制約著AI的能力上限。
不僅如此,協作也成了一個大麻煩。同處一室的其他人如果想共享屏幕,只能手忙腳亂地把PPT發到主設備上,或者被迫中斷會議,換另一臺設備接入。這么一打斷,非常破壞溝通氛圍,顯得很局促。
還有一個細節,不知道大家注意到沒有。幾個人圍在一臺電腦前,微信彈消息都不好意思點開,每到這時候氣氛都很微妙。
就算關系再好,也不代表可以共用一臺電腦。
過去很長一段時間里,大家習慣了忍耐這種不完善的體驗,但可以忍耐不代表不應該被解決。如今,隨著AI應用邊界的外溢,騰訊會議選擇用一種更加優雅的方式,直接從根本上斷掉這個物理難題。
這次推出的「聲鏈」,是一種同會議室下多設備聯合拾音系統,這項技術目前是國內首發。簡單來說,就是把一個會議室里的多個設備組網,變成一整個拾音系統。
![]()
組網完成后,跨設備AI回聲消除技術就開始發揮作用。AI先對每個設備收集到的音頻進行回聲消除,傳輸到主設備完成混音對齊,然后再上行到會議系統。在這個過程中,系統可以智能切換麥克風、自動識別發言人,多人同時開麥也能獲得清晰、流暢、無干擾的音頻體驗。
這代表著,從此中小企業也可以隨時隨地享受專業會議體驗,每一寸辦公空間都可以被激活,茶水間、工位等區域,都可以作為臨時開會場地。
從商業角度,啃這種硬骨頭投入產出比并不高。但騰訊會議還是愿意去做,并且有能力去做。從技術準備到最終的產品落地,他們默默打磨了很久。在這個凡事圖快的時代,這種愿意花“笨功夫”的精神,顯得難能可貴。
其實會議原本就應該是這樣,想開麥,就開麥。某種意義上,這不是一個簡單的功能更新,更是底層邏輯的轉變——從人向工具妥協,變成技術為人服務。
或許過不了多久,隨著聲鏈的普及,大家就會徹底忘記“同時開麥會引發嘯叫”這段歷史,也會慢慢遺忘騰訊會議的工程師們為了跑通這個功能,在背后做了多少努力。
但這恰恰是技術最迷人的歸宿——隱形。用戶不需要聽懂那些晦澀的名詞,他們感受到的,只是終于不用再幾個人憋屈地擠在一個小屏幕前,終于可以大大方方地在自己的電腦上看資料,終于能在會后的紀要里清晰地看到每一句發言對應著誰的名字。
科技是手段而非目的。當科技默默退到幕后,它留給我們的,才是最純粹的體驗,和最樸實的價值。
![]()
技術下沉與體驗升級:
一場面向中小企業的普惠
前幾年,大家都喜歡把“科技向善”掛在嘴邊。這兩年很少有人提了,過快的速度漸漸抹平了科技原本應該有的厚度與溫度。但在這個AI飛速狂奔的時代,我仍然認為“向善”這個詞很重要,甚至比過去更加重要。
科技向善不,一定非得是什么驚世駭俗之舉,它也可以是另一種微小、卻無比真實的摸樣。比如:讓一家預算有限的小公司,也能好好地開一場會。
有意思的是,騰訊會議愿意去啃「聲鏈」這塊不那么性感的硬骨頭,似乎源于一種天然的、以人為本的底層能力。很多人可能不知道,騰訊會議旗下的公益慈善基金會,一直推行著一個叫做“天籟行動”的項目。這個項目把平臺技術和能力,免費開放給助聽器廠商等伙伴,幫助聽障人士解決“聽不清”的生存難題。
這讓我們看到,技術的意義從來不是用來劃分階層,而是用來填平溝壑。
大公司和中小企業在會議體驗上,同樣存在著一堵墻。對于千千萬萬的中小企業、初創團隊來說,靠硬件來構建完美的會議空間并不現實。在過去,這道體驗鴻溝似乎是理所當然——預算決定了體驗質量。
但「聲鏈」的出現,用軟件方案打破了這面隱形的墻。
它讓每一家普通的中小公司,無論是在沒有專業設備的會議室,還是聯合辦公空間,或者是茶水間里,都能擁有高質量的會議體驗。在“開好一場會”這件最基礎也最核心的商業行為上,中小企業終于能夠和大公司站在同一起跑線。
這種技術下沉印證了一個商業常識:真正好的科技產品,不應該只服務于預算充足的頭部客戶,而應該像我們生活里的水、電、煤一樣,成為每一個普通人、每一家企業都能輕松獲取、無感使用的基礎設施。
中小企業是商業毛細血管中最具活力的部分。當技術愿意俯下身來,去解決他它們最日常、最瑣碎的痛點時,這種技術普惠所釋放出的生產力,遠比幾句宏大的口號更加動人。
![]()
尾聲
過去這一年,幾乎所有科技公司都在談“顛覆”。面對這些令人眼花繚亂的信息,普通人感受到的往往不是興奮,而是焦慮,是疲憊。
回過頭來看騰訊會議這次上線的「聲鏈」,它不僅是一個消除嘯叫的聲學補丁,也在無形中促成了一種“發言平權”。這種溝通上的自由,給后續的AI應用打下了很好的基礎。當系統能把每句話、每個觀點精準記錄并對應在每個人頭上,就相當于給AI提供了低風險、不出錯的上下文語料。
「聲鏈」從AI技術中來,又賦能著后鏈路的AI應用。
回到開頭的那個話題,我們真正需要的到底是什么樣的AI?
讓機器去干機器該干的臟活累活,讓AI踏踏實實地為人所用,這才是中小企業和普通打工人最樂意買單的科技。
內容作者:關珊月
編輯:鄭晶敏
總編:沈帥波
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.