在這個由數據和算法狂飆突進的AI時代,我們習慣了與Siri、小愛同學對話,習慣了生成式AI妙筆生花。然而,在這片喧囂的數字大陸之外,有一個群體被折疊在“溝通的孤島”——他們因中風、漸凍癥、喉癌切除等原因失去了發聲的能力。
我國是中風發病大國,存量患者達2800萬,其中三分之一伴有言語障礙后遺癥。對于他們而言,最平常的“你好”或“我愛你”,都成了奢侈的渴望。傳統電子喉只能發出單調的機械音,不僅難以聽清,更剝奪了患者原有的聲音特質與尊嚴。
當前,AI浪潮席卷千行百業,但大多數焦點仍停留在算力、大模型或具身智能的競賽上。有一家成立僅兩年的公司——北京芯智睿聲科技有限公司(以下簡稱“ 芯智睿聲”) 卻選擇了一條更安靜、更具人文溫度的技術路徑: 用“石墨烯+AI”為千萬失語者重建聲音。他們推出的全球首創可穿戴智能人工喉,不是冷冰冰的機器替代,而是一片薄如發絲的“創可貼”,通過納米級傳感器感知喉部肌肉振動,再經AI還原出患者患病前獨有的音色與情感。
![]()
這不僅是硬科技的突破,更是對“人何以成為人”的一次溫柔回應。我國僅聾啞人群就有近2780萬,占總人口近2%,理論上每50人中就會遇到一位,我們卻極少在生活中感知到他們的存在。原因是,溝通的壁壘將他們封閉在各自的圈子里。“這個需求一直都在,而且很大。之所以我們看不到,是因為之前沒有能解決問題的技術。”聯合創始人兼CEO王宇峰說。
正是這份“看見”,驅動他們研發出這款非侵入式可穿戴智能人工喉,讓那些因喉切、中風、漸凍癥而失語的人們,能重新發出屬于自己的、帶有情感和語調的聲音。
這位畢業于清華的典型理工男,話語間沒有浮夸的修飾,卻字字透露出技術人獨有的務實與堅定。他認為,AI最偉大的價值不是炫技,而是作為工具去解放那些被身體禁錮的生產力與靈魂,他堅信,“科技的溫度,在于讓每一個微弱的聲音都被清晰地聽見。”
是用戶真實的呼聲,讓我看清了這個“真需求
:Q
王總您好,我們注意到芯智睿聲雖然公司在2024年6月才成立,但您在清華其實已經有十年的團隊積累,能講講那段經歷嗎?
王宇峰:沒問題。我們本質上就是清華的一個科技成果轉化項目,技術源頭都在清華。我本碩都畢業于清華,課題組原本的研究方向就是智能傳感設備,在傳感器方面有多年積累,非常清楚它的性能邊界,也一直在尋找合適的應用場景。直到大模型爆發,我們發現,把傳感器和大模型結合起來,就能讓它在功能上更加貼近實際應用,特別是在幫助語音障礙人群進行語音修復和重建方面,讓他們可以和外界順暢交流。
:Q
現在AI這么發達,咱們通過AI是怎么把準確率提到90%這樣一個水平的?
王宇峰: 大模型爆發確實是個非常好的契機。從直觀層面講,語音障礙者講話,雖然外人聽不清、聽不懂,但長期和他生活的家人或護工,卻能大概猜出他的意思。這說明,他講的話雖然變了形,但存在大量規律。而大模型最擅長的就是抓取規律,做非線性擬合。只要抓到用戶發音的規律,就能將信號匹配成他想表達的內容,進行高精度還原。
從技術細節講,我們對聲學信號有多年的研究積累,知道如何對生理信號進行特征提取和建模,再把這些和現在主流的Transformer或Conformer等深度學習網絡架構結合起來,借助它們強大的擬合能力來總結規律,效果就非常好了
:Q
創業家里人是什么態度呢?
王宇峰:這確實是一個取舍的問題。我也有大廠經歷,但發現在大廠方向往往是確定的,個人能起到的作用相對有限。如果我看到一個方向,覺得它非常有未來且特別有意義,就更傾向于選擇后者。我們這個方向就是典型,技術上具有創新性,同時又有很強的公益屬性。你想想,我國光是中風后遺癥存量患者就有2800萬,其中三分之一有構音障礙;聾啞人群據統計也有2780萬。這是什么概念?平均每50個人里可能就有一個。但為什么我們平時很少見到他們?因為他們被困在家里,社交半徑極度受限,久而久之甚至會產生心理問題。如果我們的設備能幫他們恢復交流能力,這其實也是在解放生產力。
:Q
那有沒有哪一個瞬間,讓你下定決心“這件事我必須做”?
王宇峰:可能很難歸結為某個瞬間,這是一個逐漸堅定的過程。我們把原型機做出來后,受到了很多媒體關注,但最觸動我的是收到了大量來自患者和家屬的反饋。他們最關心兩件事:一是我的情況你們能解決嗎?二是你們的產品哪里能買到?這告訴我們,這是真正的需求。科技工作者最怕的就是自己臆想的需求。當看到那些數字,想清楚背后意味著什么,我就覺得這件事值得做。它既有巨大的社會公益意義,這么大的體量,在商業上也完全可以形成閉環。
![]()
:Q
能看到這波創業者,清華的會特別多,作為清華畢業生,您怎么看待這個問題?
王宇峰: 我們學校的校訓“自強不息,厚德載物”,我覺得特別好。自強不息就是說,生活中、創業中總會遇到各種困難,但只要認定了目標,就一定不要停止。厚德載物在我這里的理解,就是做任何事不僅要追求商業成功,也要看這件事是不是真的有意義,對多少人有意義,要站在社會層面的角度去考量。
和北大的創業者也經常有接觸,上學的時候,我們其實就隔著一條街。跟他們交流,可以形成很好的互補。他們看問題的角度可能更特別,思路更開闊。我們清華人可能是認準一個方向,腳踏實地,用很多具體方案去攻克它。北大的人呢,可能會給我們提供很多新思路,讓我們去審視在其他領域還有沒有擴展空間,或者和別的方向能不能產生結合。兩邊各有特點,結合起來其實很有力量。
一片”創可貼“背后的技術攻防戰
:Q
芯智睿聲的設備是貼在喉嚨上的,它有石墨烯傳感器、麥克風、AI算法,這三者具體是怎么分工協作的?
王宇峰: 我們的石墨烯傳感器是一個柔性應變傳感器,貼附在喉部時,能感受講話時頭頸部肌肉的運動和振動,主要采集100赫茲以下的低頻信號,比如口型變化。麥克風采集的是高頻段的聲音信號,主要是80到8K赫茲。這兩者形成互補,而不是簡單的1+1=2。有了這些物理信號后,我們的AI模型就要對它們進行特征提取和解碼,把這些持續的波形和表達內容對應起來。特別是對于一些發聲很弱的患者,麥克風信號微弱,此時柔性傳感器采集的肌肉運動信號就至關重要,權重會更高,這讓我們的適用范圍比傳統設備廣得多。
:Q
那這款設備最核心的特點是什么?
王宇峰:除了多模態互補帶來的高準確率,最關鍵的是在用戶體驗上,我們能還原用戶患病前的“原聲”。只需要提供患病前大概3秒鐘的音頻或視頻,就可以克隆他的音色。這點非常重要,因為很多人患病后,不僅是講話不清楚,音色也會發生巨變,可能以前很有磁性的聲音變得很尖細。這對病人是很大的心理落差,會產生社交羞恥感,導致他們不愿開口。我們的技術,是在幫他們重建信心,讓他們能重新自信、自由地表達,而不僅僅是發出聲音。
:Q
咱們主打的一個點是“無感”,這具體體現在哪?
王宇峰:“無感”首先是非植入的,我們只需要貼付。而且傳感器厚度只有50微米,大概是頭發絲的一半,非常輕薄,貼上后做頸部運動都幾乎沒感覺。它可以反復使用,但我們建議隔一段時間換一片,因為作為柔性材料,長時間使用后性能會有一定漂移。不過成本控制得很好,用戶每天的使用成本大概在兩塊錢左右,甚至比一些連續血糖監測儀的耗材成本還要低。
![]()
:Q
目前市面上做這類產品的公司不多,大廠也幾乎沒進場。如果有人想抄,咱們最“抄不走”的優勢是什么?
王宇峰:這不是一個單點突破,而是環環相扣的壁壘。首先是柔性傳感器本身,但更核心的是對聲音相關生理信號的深刻理解。你得先知道哪些生理信號最能反映發聲意圖,才能針對性地設計傳感器,并調整后端的大模型結構。這是從清華實驗室開始,經過了非常長周期的積累。另一個巨大的護城河是數據。我們要采集的不是正常人說話的數據,而是語音障礙者的病理數據。他們精力體力有限,配合意愿也更低,需要我們反復溝通、解釋意義,采集過程極其耗費心力,是真正的“臟活累活”。這種端到端的積累,別人即使看到,也很難在短時間內跨越。
:Q
我看咱們也獲得了很多獎項,比如入選了工信部的“人工智能醫療器械創新任務揭榜掛帥”,還有在“中關村國際前沿科技大賽”拿了獎。這些榮譽對咱們意味著什么?
王宇峰: 工信部揭榜掛帥那個項目,門檻非常高,全國只有一百多家入選,我們是其中之一,聯合了清華大學和華中科技大學附屬同濟醫院共同申請。這是工信部和國家藥監局、國家衛健委等多部門聯合發布的,在人工智能醫療器械領域是最重要的一個板塊項目。在這個項目里,我們不僅做了人工喉,還在吞咽可穿戴監測設備上做了布局,因為吞咽障礙和構音障礙往往是伴生的。這充分說明了我們的技術得到了國家層面的認可。
:Q
咱們的創業團隊是一群什么樣的人?
王宇峰:要做這么一個有挑戰性的全新項目,一定會有一個leader,但僅靠他一個人絕對沒辦法支撐起這么大體量的事業。我們現在公司規模不大,15位全職員工里有14位是工程師,碩博占比超過40%,麻雀雖小五臟俱全,從軟件、硬件、固件到外觀結構設計,全鏈條都覆蓋了。每次取得里程碑,整個團隊都會在一起做總結和慶祝。因為團隊才是最重要的,尤其是在這個AI時代,AI雖然帶來了知識平權,但人永遠是最關鍵的。每次慶祝,都是對團隊緊密合作的肯定,也是讓大家蓄力去提出新目標的過程。
尋找同頻的伙伴,在快與慢之間走穩路
:Q
創業這么難,有遇到什么具體的困難嗎?
王宇峰:我們一直在克服各種困難。技術上,剛才提到的數據采集就是最大的挑戰。融資上,對初創公司來說,尋找適配的伙伴非常重要,要找“Smart Money”。我們要找真正理解我們的技術、認可我們愿景,并愿意陪同長跑的資本。只有找到最合適的,他們在我們遇到困難時才會有耐心,甚至能帶來供應鏈、人才等金融屬性之外的資源,形成良性循環。
:Q
咱們的產品現在進展到哪一步了?
王宇峰: 因為我們走的是二類醫療器械注冊,正在走監管流程。目前工程樣機已經定型,完成了摸底檢測和迭代,預計今年Q2正式提交請檢,之后還要經過臨床和報證兩個階段,拿到注冊證后就可以上市銷售了。上市最早也得明年。很多試用過這款產品的患者,都急切的希望能夠使用。我們也很著急,但是確實需要一個過程。
:Q
那我們未來打算在哪能買到它?
王宇峰: 我們雖然是醫療器械,但屬于消費醫療屬性,無需醫生做植入手術,也不像助聽器那樣需要專業技師適配,所以天然具有直達終端用戶的屬性。渠道上我們會多元化布局:一是跟政府和殘聯、腦協合作推廣;二是傳統的醫院院內銷售,這既是背書也是患者集散地;三是新興渠道,比如跟保險公司、體檢中心合作;四是我們最看重的,直接面向終端用戶,通過線上電商結合線下藥店加盟或體驗店的形式。價格上,我們會推出不同的產品管線,并探索和公益基金合作,進入殘聯的輔助器械名錄,爭取補貼,力爭讓所有真正有需要的人都能用得上、用得起。
:Q
目前AI醫療賽道普遍存在“技術好、融資難、落地慢”的困境。咱們未來如果進行大規模融資,能保持初心不變嗎?
王宇峰: 這又回到了“Smart Money”上。如果急于求成,拿了短視資本的錢,他們退出的條件和對回報周期的耐心,很可能跟我們的發展節奏錯配。明明再堅持一年就能迎來爆發,但對方可能要求你馬上變現,這會影響企業根基。所以,無論是從理想主義還是現實主義角度,堅守初心最關鍵的一點,就是找到和我們真正同頻的投資人,能夠長期陪伴,理解我們的愿景,并在困難時給予耐心和資源支持。
從醫療康復到人機交互的星辰大海
:Q
咱們的技術也可以做延展,未來還想在哪些方向努力?
王宇峰:我們最看重的擴展其實是在未來消費電子領域。你看現在的輸入方式,無非是觸屏和語音。但語音交互在圖書館、工位等場景會吵到別人,還涉及隱私問題。隨著智能眼鏡這類可穿戴設備發展,觸摸屏沒地方放,更需要新的交互方式。我們的技術如果延伸過去,就能實現“弱聲”甚至“無聲”的交互。你只需要動口型,或者極小聲說話,別人聽不見,但設備通過捕捉肌肉運動就能明白你的指令,這會是繼觸屏和語音之后,一種全新的交互范式。
:Q
您覺得咱們的技術未來可以和具身智能有融合嗎?
王宇峰: 當然,這是個很有前瞻性的問題。具身智能現在流行“大小腦”概念,“大腦”負責決策,大模型已經能幫我們做很好的規劃了。但問題往往出在“小腦”的執行層面。比如大腦說要喝水,小腦就得精準控制機械臂完成抓取、抬起、送到嘴邊這一系列動作。現在很多執行層面還是靠視覺CV技術,但它有弊端,比如無法判斷力度。如果我們能進行及時的觸覺傳感和反饋,效率會大大提升。我們的柔性傳感器,未來可以像電子皮膚一樣,低成本部署在關節節點上,為機器人的動作提供反饋信號,讓抓取更準確高效。
![]()
:Q
現在這款設備主要支持什么語言?能聽懂方言嗎?
王宇峰: 目前主要針對普通話人群,可以帶口音,比如四川人講的“川普”或者廣東人講的“廣普”,都沒有問題。但如果直接講純方言,比如粵語、閩南語,目前還比較困難,因為這需要收集專門針對那種方言的語料庫來訓練模型。但底層技術原理、硬件和模型架構都是相通的,方言支持都在我們的規劃路徑中。海外市場初期會優先從英文、西班牙文、法文這幾個覆蓋面最廣的大語種開始做起。這同樣面臨兩個核心問題:一是要采集相應語種的語音障礙患者數據來訓練;二是產品必須通過當地對醫療器械的監管審批。
:Q
那對于一些極小眾的語言,使用人數很少,可能商業上很不劃算,您怎么看待這個問題?
王宇峰:這涉及取舍和優先級。如果公司內部資源足夠支持,我當然愿意去做,這有很強的公益屬性。但我們的目標還是先惠及最廣泛的人群。對于小語種,可以考慮與外部合作,比如當地的殘聯、政府組織,如果他們覺得這件事很重要,我們可以以政府立項的形式去推進,或者和基金會合作做定向的捐贈和立項。條條大路通羅馬,不一定只能靠企業自身單打獨斗。
:Q
如果讓您展望一下,您老了之后回顧這段創業經歷,最大的成就感會來源于哪?
王宇峰:我希望能看到真的有人在使用我們的設備,并且是基于我們提出的理念和技術思路不斷迭代,最終真正造福了這個群體。當然,如果等我老了他們還在用我這一代設備,那我會感覺有點“悲涼”,因為那說明技術沒有進步。
:Q
最后想問一個感性的問題,創業過程中,有沒有什么讓您特別動容的瞬間?
王宇峰: 有一次我們給一位聾啞人試用,她的小朋友是不會手語的,所以平常母子之間沒法順暢溝通。用了我們的設備之后,這位體驗官就可以跟孩子交流了,能說出那些以前用簡單手語無法表達的細膩情感。那一刻,你會發現技術不再是一堆代碼和硬件,它真的變成了一座橋。這也是支撐我們,哪怕歷經再多繁瑣與困難,也要走下去的終極動力。
喻國明
隨著人工智能技術的快速迭代,大模型的能力邊界不斷拓展,智能體作為大模型的重要應用模式,正憑借其在規劃決策、記憶、工具使用等方面獨特的創新性和實用性,引領著一場產業變革。
為貫徹實施《國家人工智能產業綜合標準化體系建設指南(2024版)》,中國移動通信聯合會正式啟動三項團體標準研制工作:
●《人工智能智能體能力要求》(計劃號:T/ZGCMCA 011-2025)
●《人工智能智能體內生安全技術要求》(計劃號:T/ZGCMCA 023-2025)
●《人工智能智能體互操作性接口規范》(計劃號: T/ZGCMCA 024-2025)
現誠邀數據服務企業、醫療機構、科研院所、高校、檢測認證機構等全產業鏈行業機構及研發工程師、項目經理、應用專家等專業人士共同參與標準編制。
期待您的積極參與,讓我們攜手共進,共同引領人工智能產業的發展方向!
聯系人:李貞琦
聯系方式:18519753675(同微信)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.